【数学建模论文学习笔记】基于历史数据的蔬菜类商品定价与补货决策模型

发布于:2025-07-29 ⋅ 阅读:(17) ⋅ 点赞:(0)

本文内容大部分出自于基于历史数据的蔬菜类商品定价与补货决策模型--《数学建模及其应用》2024年02期,只修正了论文中的一些笔误,并在一些读者可能不容易理解的地方做了一些补充解释,如果觉得不错的话还请支持原作者。

这篇论文解答的题目是2023年高教社杯全国大学生数学建模竞赛的C题,题目内容如下:

在生鲜商超中,一般蔬菜类商品的保鲜期都比较短,且品相随销售时间的增加而变差,大部分品种如当日未售出,隔日就无法再售。因此,商超通常会根据各商品的历史销售和需求情况每天进行补货。
由于商超销售的蔬菜品种众多、产地不尽相同,而蔬菜的进货交易时间通常在凌晨 3:00 -4:00,为此商家须在不确切知道具体单品和进货价格的情况下,做出当日各蔬菜品类的补货决策。蔬菜的定价一般采用“成本加成定价”方法,商超对运损和品相变差的商品通常进行打折销售。可靠的市场需求分析,对补货决策和定价决策尤为重要。从需求侧来看,蔬菜类商品的销售量与时间往往存在一定的关联关系;从供给侧来看,蔬菜的供应品种在4 月至 10月较为丰富,商超销售空间的限制使得合理的销售组合变得极为重要。
附件 1 给出了某商超经销的 6 个蔬菜品类的商品信息;附件 2 和附件 3 分别给出了该商超 2020 7 1 日至 2023 6 30 日各商品的销售流水明细与批发价格的相关数据;附件 4 给出了各商品近期的损耗率数据。请根据附件和实际情况建立数学模型解决以下问题:
问题 1 蔬菜类商品不同品类或不同单品之间可能存在一定的关联关系,请分析蔬菜各品类及单品销售量的分布规律及相互关系。
问题 2 考虑商超以品类为单位做补货计划,请分析各蔬菜品类的销售总量与成本加成定价的关系,并给出各蔬菜品类未来一周(2023 年 7 1 - 7 日)的日补货总量和定价策略,使得商超收益最大。
问题 3 因蔬菜类商品的销售空间有限,商超希望进一步制定单品的补货计划,要求可售单品总数控制在 27-33 个,且各单品订购量满足最小陈列量 2.5 千克的要求。根据 2023年6 24 - 30 日的可售品种,给出 7 1 日的单品补货量和定价策略,在尽量满足市场对各品类蔬菜商品需求的前提下,使得商超收益最大。
问题 4 为了更好地制定蔬菜商品的补货和定价决策,商超还需要采集哪些相关数据,这些数据对解决上述问题有何帮助,请给出你们的意见和理由。

问题一

研究对象为蔬菜各单品和品类的销售量,而附件2仅提供了三年内各单品蔬菜的销售流水数据,因此要先对该数据进行预处理。首先需要观察分析原始数据,检查是否有缺失值、异常值等,并进行相应的处理。其次,需要将附件1和附件2的表格进行匹配,对数据进行加总,分别获得各单品和各品类蔬菜的日销售量、周销售量等数据。之后,才能对蔬菜各单品、品类的销售分布和相互关系进行分析。

针对不同品类蔬菜的总体分布规律及相互关系,可以首先从总体的角度把握数据, 如进行假设检验、模拟拟合和可视化分析等操作;之后再从周销量、月销量和年销量的角度分别详细分析其分布规律及相关系数

总的来说,该论文将问题一拆解为了以下几个问题:

  • 各品类销售量的分布规律两两之间的关系——K-S检验判断两品类销售量是否是相同的分布
  • 各品类销售量的两两之间的相互关系——用皮尔逊相关系数判断两品类销售量是否线性相关,用相关系数热力图可视化所有的两两相互关系
  • 各品类销售量自己在3\times365天里的分布规律——用ARIMA模型拟合
  • 各品类销售量在一周/一年/三年的分布规律——柱状图、折线图、某一年的热力图
  • 各单品的分布规律——先作出6个品类的月/年销量比例折线统计图,每张图上有几十条该品类的单品的折线,发现折线太多了难以分析,故选取总销量占比不低于1%的31个单品,作出它们的相关系数热力图并聚类分析

设各单品蔬菜的上四分位点、中位数、下四分位点为Q_{3}Q_{2}Q_{1}, 记四分位距IQR=Q_{3}-Q_{1},该指标反映位于中间的50%的数据的离散程度。定义正常分布区间为: \left[Q_{1}-1.5 × I Q R, Q_{3}+1.5 × I Q R\right]

超出该区间的视为异常值。

之后,求得去除异常值之后日销量的平均值,并用该平均值替换异常值,从而获得异常值处理之后的单品蔬菜日销量数据。可以从花叶类蔬菜周销量随时间变化的图中, 看出替换异常值前后的效果变化。如下图所示,用黑色线条来描绘替换异常值之前的数 据,用绿色线条来描绘替换异常值之后的数据。可以发现替换异常值之后,周销量数据明显变得更加平滑。

K-S检验

使用K-S检验的方法分别检验各蔬菜品类两两之间的销量是否属于同一分布。本节从日销量和月销量的角度,分析了各品类蔬菜销量分布之间的关系。首先,将各蔬菜品类每日的销售流水加总,获得各蔬菜品类每日的销售总量,之后分别两两组合进行K-S 检验,共进行15次检验。

检验步骤如下(以花叶类蔬菜与水生根茎类蔬菜的日销量分布为例):

Step1)提出假设

原假设H_0:花叶类蔬菜与水生根茎类蔬菜的日销量样本来自于同一分布。

被择假设H_1:花叶类蔬菜与水生根茎类蔬菜的日销量样本来自于不同分布。

Step2)构造检验统计量

D_{n}=max\{f_{n}(x)-g_{n}(x)\}

其中, f_{n}(x)g_{n}(x)分别为花叶类蔬菜日销量和水生根茎类蔬菜日销量的经验分布函数。经验分布函数的定义为:

F_n(x)=\frac{1}{n}\Sigma^n_{i=1}\bold{1}_{x_i\leq x}

Step3)计算并分析结果

通过R语言代码,得到以下结果:

如图所示,K-S 检验的p-value小于0.001,因此有充足的把握拒绝原假设


网站公告

今日签到

点亮在社区的每一天
去签到