AWS客户案例-Bayer图像欺诈检测

痛点与挑战

为了提高声誉,提高销售业绩,维护客户关系,拜耳每年都会拨出大量的预算用于销售,开展营销活动,如学术会议等。
目前存在很多销售人员未参与活动,为了报销制造虚假数据(即餐费、参会人数、演讲费)和图片(即会议照片、集体照片),制造欺诈事件骗取营销补贴。
为了识别这种欺诈行为,Bayer需要借助一定的手段来识别销售提交上来的图片是真实拍摄的还是从另外一张照片上重新拍摄得到的,传统审核的方法存在以下挑战:
1) 样本量较大,公司抽样检查,覆盖面不全。
2) 每月公司会花费大量的人力资源进行检查照片的真实性,造成人力资源浪费。
目标:实现Bayer销售活动图片自动化检测,高效率识别欺诈行为。

 

解决方案

Bayer数据存储在AWS的S3存储桶内,使用AWS模型构建组件SageMaker读取存储桶内的销售真实拍摄的照片和翻拍的照片,结合业务对数据进行处理获取建模需要的数据格式,在SageMaker中尝试构建分类模型识别图片的类别,并将模型部署到AWS Endpoint,实现持续自动化识别欺诈行为。
解决方案具体步骤如下:
1. 数据读取:读取AWS S3存储桶中的Bayer的图片数据到AWS SageMaker Studio中已经建立的Notebook脚本中。
2. 特征工程:提取像素矩阵、设定圆形半径和像素点的个数、计算LBP码、分块统计直方图形成特征向量。
3. 数据集划分:将处理好的数据按8:2的比例划分训练集和验证集,选定合适的评估指标。
4. 模型训练和模型选择:设置合适的参数训练模型,或设置超参数优化作业进行参数自动调优,得到模型评估结果最好的超参组合作为最终的模型。
5. 模型部署:将最优模型部署到AWS Endpoint上。
6. 模型预测:调用Endpoint里的模型,对新的图片识别是原始图片还是翻拍图片,以实现快速识别欺诈行为。

成果与收益

实现了自动化预测:部署在AWS Endpoint上的模型在任何时候都可以被调用,进行自动化预测,大大降低了Bayer手工识别的成本,预测结果直接存储到AWS S3中,Bayer相关业务人员可直接下载查看相关预测报告。
模型识别准确率:模型预测准确率达到95%,召回率达到90%。
模型的自动化实现和效率的提升给Bayer带来了极大的工作效率。

 

解决方案架构图

关于<bayer>

 


拜耳作为一家跨国公司,在医药保健和农业领域具有核心竞争力。公司致力于通过产品和服务,帮助人们克服全球人口不断增长和老龄化带来的重大挑战,造福人类。同时,集团还通过科技创新和业务增长来提升盈收能力并创造价值。拜耳致力于可持续发展。在全球,拜耳品牌代表着可信、可靠及优质