当前位置: 首页 > news >正文

【数学建模论文学习笔记】基于历史数据的蔬菜类商品定价与补货决策模型

本文内容大部分出自于基于历史数据的蔬菜类商品定价与补货决策模型--《数学建模及其应用》2024年02期,只修正了论文中的一些笔误,并在一些读者可能不容易理解的地方做了一些补充解释,如果觉得不错的话还请支持原作者。

这篇论文解答的题目是2023年高教社杯全国大学生数学建模竞赛的C题,题目内容如下:

在生鲜商超中,一般蔬菜类商品的保鲜期都比较短,且品相随销售时间的增加而变差,大部分品种如当日未售出,隔日就无法再售。因此,商超通常会根据各商品的历史销售和需求情况每天进行补货。
由于商超销售的蔬菜品种众多、产地不尽相同,而蔬菜的进货交易时间通常在凌晨 3:00 -4:00,为此商家须在不确切知道具体单品和进货价格的情况下,做出当日各蔬菜品类的补货决策。蔬菜的定价一般采用“成本加成定价”方法,商超对运损和品相变差的商品通常进行打折销售。可靠的市场需求分析,对补货决策和定价决策尤为重要。从需求侧来看,蔬菜类商品的销售量与时间往往存在一定的关联关系;从供给侧来看,蔬菜的供应品种在4 月至 10月较为丰富,商超销售空间的限制使得合理的销售组合变得极为重要。
附件 1 给出了某商超经销的 6 个蔬菜品类的商品信息;附件 2 和附件 3 分别给出了该商超 2020 7 1 日至 2023 6 30 日各商品的销售流水明细与批发价格的相关数据;附件 4 给出了各商品近期的损耗率数据。请根据附件和实际情况建立数学模型解决以下问题:
问题 1 蔬菜类商品不同品类或不同单品之间可能存在一定的关联关系,请分析蔬菜各品类及单品销售量的分布规律及相互关系。
问题 2 考虑商超以品类为单位做补货计划,请分析各蔬菜品类的销售总量与成本加成定价的关系,并给出各蔬菜品类未来一周(2023 年 7 1 - 7 日)的日补货总量和定价策略,使得商超收益最大。
问题 3 因蔬菜类商品的销售空间有限,商超希望进一步制定单品的补货计划,要求可售单品总数控制在 27-33 个,且各单品订购量满足最小陈列量 2.5 千克的要求。根据 2023年6 24 - 30 日的可售品种,给出 7 1 日的单品补货量和定价策略,在尽量满足市场对各品类蔬菜商品需求的前提下,使得商超收益最大。
问题 4 为了更好地制定蔬菜商品的补货和定价决策,商超还需要采集哪些相关数据,这些数据对解决上述问题有何帮助,请给出你们的意见和理由。

问题一

研究对象为蔬菜各单品和品类的销售量,而附件2仅提供了三年内各单品蔬菜的销售流水数据,因此要先对该数据进行预处理。首先需要观察分析原始数据,检查是否有缺失值、异常值等,并进行相应的处理。其次,需要将附件1和附件2的表格进行匹配,对数据进行加总,分别获得各单品和各品类蔬菜的日销售量、周销售量等数据。之后,才能对蔬菜各单品、品类的销售分布和相互关系进行分析。

针对不同品类蔬菜的总体分布规律及相互关系,可以首先从总体的角度把握数据, 如进行假设检验、模拟拟合和可视化分析等操作;之后再从周销量、月销量和年销量的角度分别详细分析其分布规律及相关系数

设各单品蔬菜的上四分位点、中位数、下四分位点为Q_{3}Q_{2}Q_{1}, 记四分位距IQR=Q_{3}-Q_{1},该指标反映位于中间的50%的数据的离散程度。定义正常分布区间为: \left[Q_{1}-1.5 × I Q R, Q_{3}+1.5 × I Q R\right]

超出该区间的视为异常值。

之后,求得去除异常值之后日销量的平均值,并用该平均值替换异常值,从而获得异常值处理之后的单品蔬菜日销量数据。可以从花叶类蔬菜周销量随时间变化的图中, 看出替换异常值前后的效果变化。如下图所示,用黑色线条来描绘替换异常值之前的数 据,用绿色线条来描绘替换异常值之后的数据。可以发现替换异常值之后,周销量数据明显变得更加平滑。

K-S检验

使用K-S检验的方法分别检验各蔬菜品类两两之间的销量是否属于同一分布。本节从日销量和月销量的角度,分析了各品类蔬菜销量分布之间的关系。首先,将各蔬菜品类每日的销售流水加总,获得各蔬菜品类每日的销售总量,之后分别两两组合进行K-S 检验,共进行15次检验。

检验步骤如下(以花叶类蔬菜与水生根茎类蔬菜的日销量分布为例):

Step1)提出假设

原假设H_0:花叶类蔬菜与水生根茎类蔬菜的日销量样本来自于同一分布。

被择假设H_1:花叶类蔬菜与水生根茎类蔬菜的日销量样本来自于不同分布。

Step2)构造检验统计量

D_{n}=max\{f_{n}(x)-g_{n}(x)\}

其中, f_{n}(x)g_{n}(x)分别为花叶类蔬菜日销量和水生根茎类蔬菜日销量的经验分布函数。经验分布函数的定义为:

F_n(x)=\frac{1}{n}\Sigma^n_{i=1}\bold{1}_{x_i\leq x}

Step3)计算并分析结果

通过R语言代码,得到以下结果:

如图所示,K-S 检验的p-value小于0.001,因此有充足的把握拒绝原假设H_0:花叶类蔬菜与水生根茎类蔬菜的日销量样本来自于同一分布。

关于p-value的更多介绍可以参考以下链接:

对于p值(p-value)和显著性水平的理解 - 知乎

p值-p_value计算方法 - 知乎

http://www.lryc.cn/news/602825.html

相关文章:

  • 1688 item_search_shop 接口参数说明与测试指南
  • 源代码管理工具有哪些?有哪些管理场景?
  • MGER综合实验
  • 椭圆曲线加密(ECC)实战:从原理到区块链应用
  • 机器学习(重学版)基础篇(算法与模型一)
  • 热斑漏检率↓78%!陌讯多模态算法在无人机光伏巡检的轻量化实践
  • PBR技术
  • 利用软件定义无线USRP X410、X440 电推进无线原型设计
  • 5.Linux ssh远程登录配置及sftp,scp命令
  • 排序算法 (Sorting Algorithms)-Python示例
  • 一个高效的阿里云漏洞库爬虫工具,用于自动化爬取和处理CVE数据
  • AW2013 LED驱动芯片 工作方式介绍
  • 阿里云Ubuntu 22.04 ssh隔一段时间自动断开的解决方法
  • 解决 nginx 加载css文件时无效问题、解决 nginx 加载css文件识别成 text/plan 的问题
  • github copilot接入openai-compatible模型以及去除安全限制的方法
  • 嵌入式开发学习———Linux环境下数据结构学习(四)
  • UV安装并设置国内源
  • golang--函数栈
  • 学习lxml库:Python XML/HTML处理利器
  • 微型化IMU如何突破无人机与机器人的性能边界?
  • Vue 工程化
  • Facenet(MTCNN+InceptionResnetV1)人脸考勤项目(有缺点,但可用)
  • 前端实现PDF在线预览的8种技术方案对比与实战
  • 【kafka】消息队列
  • 专题:2025医药生物行业趋势与投融资研究报告|附90+份报告PDF、原数据表汇总下载
  • 4、如何生成分布式ID?
  • C++入门自学Day2-- c++类与对象(初识2)
  • Deepseek + browser-use 轻松实现浏览器自动化
  • “本地计算机上的 mysql 服务启动后停止,某些服务在未由其他服务或程序使用时将自动停止”解决方式
  • Linux系统之Ansible安装与入门