痛点与挑战
默克致力于创新型制药、生命科学以及前沿功能材料技术, 以技术为客户创造价值。本次项目着眼于其生殖医学领域,产品为IVF相关的5种,每种产品对应不同的客户群体、销售情况及市场份额。随着产品在市场使用量的不断变化未来销量也有所不同,默克亟待找到合理的预测逻辑来预估每种产品未来的OP,以指导生产和销售等供应链流程。
主要挑战:
1. 手工预测可考虑的因素有限制,难以捕捉全局影响,需要专业的模型结合大量可用数据进行AI智能预测,实现高准确率的周期数和产品销量预测。
2. 随着业务量增加,数据量急剧上升,加上业务对预测需求的及时性,需要实现预测模型的自动化上线预测。
如果不及时升级预测策略和方式,供应链上的排产计划将受到影响,进而影响销售和库存,造成企业的资源浪费、各项成本增加、收益降低等。
预测目标:
• 周期数预估:基于影响周期数的因素预估未来24个月IVF相关的促排周期数和移植周期数。
• 产品销量预测:基于IVF相关产品的历史销售数据(SKU、销售区域、医院情况、周期数、时间特征等)、总体市场情况及产品的市场份额,构建销售预测模型来预估未来产品销量。
解决方案
模型的实现架构如下图所示,包含两大阶段,一是Sagemaker上的模型开发和调试,二是Lambda上的模型调度。两大阶段涉及到的数据流、模型构建和模型调度均在默克内部的AWS VPC中实现,外网无访问权限。
亚马逊云科技上的模型运行机制如上图所示,可从4个方面进行描述:
1. 数据输入和ETL
通过Hive定期抽取DB中的历史周期数和产品销量数据,进行ETL处理,处理后的模型宽表导入S3。
2. 模型构建、训练和推理
在SageMaker Studio中实现模型预处理、特征工程、模型构建和部署。
3. 模型调度
S3中的文件触发Lambda进行模型调度,调度起SageMaker中的模型重训练和模型预测,预测结果写回RDS数据库。
4. 模型安全性和可靠性配置
AWS SSO控制用户访问RDS数据库的加密策略,AWS IAM通过用户的权限设置其访问策略,Amazon CloudWatch通过监控各组件的运行记录操作日志和指标变化信息,实现用户行为监控,达到安全性和可靠性配置。