痛点与挑战
作为调味品的生产厂商,该公司对接处于不同生命周期阶段的各类经销商,销售场景复杂,销售模式多样。随着业务的飞速发展,供应链相关流程上的生产计划、销售计划、物流计划等均需要及时且精准地被满足。
为了合理安排生产计划,该公司需要借助一定的手段来预测在未来一段时间内每周到经销商的销量。传统的预测方法存在以下两大挑战:
1) 由于经销商周销量数据稀疏度较高,手工难以找到普遍规律,传统手工预测方法准确率非常不可观,亟待提升。
2) 随着业务量的增加,传统手工预测成本指数级增长,已无法有效应对多经销商、多SKU、多产品类型及不断变化的外部环境因素的销售场景,需要部署自动化预测工具来解决这一难题,实现未来几周到经销商销量的自动预测。
如果不及时升级预测策略和方式,供应链上的各类计划将无法及时应对,最直接的影响是很容易造成库存积压或缺货的情况,造成企业的资源浪费、各项成本增加。
目标:实现到该公司经销商销量预测的准确率提升及预测模型的自动化实现。
解决方案
该调味品公司数据存储在AWS S3存储桶内,使用亚马逊云科技模型构建组件SageMaker读取存储桶内的每日销售数据,结合业务对数据进行处理获取建模需要的各个字段,在SageMaker中尝试构建回归模型建立各个影响因素和销量之间的关系,进而根据模型预测未来的销量,将模型部署到AWS Endpoint,实现持续预测和生产监控。
解决方案具体步骤如下:
1. 数据读取:读取AWS S3存储桶中的销量数据到AWS SageMaker Studio中已经建立的Notebook脚本中。
2. 数据ETL:结合业务理解对数据进行预处理,包括数据清洗、变量筛选、缺失值填充等,接着将数据ETL处理成模型可读取的结构化宽表,格式为第一列为目标变量(销量)、其他列为所有影响目标变量的因子(年份、月份、周、销量等),宽表已汇总成预测粒度,即年份、周、经销商。
3. 特征工程:结合业务理解和建模经验生成衍生变量,并结合因子分析和变量重要度排序,进行特征筛选。
4. 数据集划分:将处理好的数据根据时间轴和验证集长度划分训练集和验证集,选定合适的评估指标。
5. 模型训练和模型选择:设置合适的参数训练模型,或设置超参数优化作业进行参数自动调优,得到模型评估结果最好的超参组合作为最终的模型。
6. 模型部署:将最优模型部署到AWS Endpoint上。
7. 模型预测:生成未来几周的因子数据,调用Endpoint进行模型预测,预测未来几周该调味品公司到经销商的销量。