AWS客户案例-默克IVF周期数和销量预测

痛点与挑战

默克致力于创新型制药、生命科学以及前沿功能材料技术, 以技术为客户创造价值。本次项目着眼于其生殖医学领域,产品为IVF相关的5种,每种产品对应不同的客户群体、销售情况及市场份额。随着产品在市场使用量的不断变化未来销量也有所不同,默克亟待找到合理的预测逻辑来预估每种产品未来的OP,以指导生产和销售等供应链流程。
主要挑战:
1. 手工预测可考虑的因素有限制,难以捕捉全局影响,需要专业的模型结合大量可用数据进行AI智能预测,实现高准确率的周期数和产品销量预测。
2. 随着业务量增加,数据量急剧上升,加上业务对预测需求的及时性,需要实现预测模型的自动化上线预测。
如果不及时升级预测策略和方式,供应链上的排产计划将受到影响,进而影响销售和库存,造成企业的资源浪费、各项成本增加、收益降低等。
预测目标:
• 周期数预估:基于影响周期数的因素预估未来24个月IVF相关的促排周期数和移植周期数。
• 产品销量预测:基于IVF相关产品的历史销售数据(SKU、销售区域、医院情况、周期数、时间特征等)、总体市场情况及产品的市场份额,构建销售预测模型来预估未来产品销量。

 

解决方案

模型的实现架构如下图所示,包含两大阶段,一是Sagemaker上的模型开发和调试,二是Lambda上的模型调度。两大阶段涉及到的数据流、模型构建和模型调度均在默克内部的AWS VPC中实现,外网无访问权限。

AWS上的模型运行机制如上图所示,可从4个方面进行描述:
1. 数据输入和ETL
通过Hive定期抽取DB中的历史周期数和产品销量数据,进行ETL处理,处理后的模型宽表导入S3。
2. 模型构建、训练和推理
在SageMaker Studio中实现模型预处理、特征工程、模型构建和部署。
3. 模型调度
S3中的文件触发Lambda进行模型调度,调度起SageMaker中的模型重训练和模型预测,预测结果写回RDS数据库。
4. 模型安全性和可靠性配置
AWS SSO控制用户访问RDS数据库的加密策略,AWS IAM通过用户的权限设置其访问策略,Amazon CloudWatch通过监控各组件的运行记录操作日志和指标变化信息,实现用户行为监控,达到安全性和可靠性配置。

关于<默克>

 


默克创建于1668年,主要致力于创新型制药、生命科学以及前沿功能材料技术, 并以技术为驱动力,为患者和客户创造价值。在中国,默克主要从事制药、生命科学和化工业务,并为客户提供从创新型的处方类药品、非处方类药品到生命科学领域的解决方案,工业用途的效果颜料和化学品。
本项目涉及在生殖周期每一阶段辅助IVF的5种产品的销量预测: 果纳芬®,艾泽®, 乐芮®, 思则凯®, 雪诺酮®, Pergoveris™,以及全国整体市场上潜在IVF人群数。

成果与收益

1. 实现全自动化模型调度和预测:实现了与默克DB的自动对接,使用Lambda实现自动模型调度,在每月数据采集完成后自动执行模型预测。
2. 预测准确率提升:与手工预测相比,模型销量预测的准确率大大提升,提升排产规划精准度,优化供应链管理。