简体中文 | 启智OpenI | Gitee | Github
😉近期更新😉
- 发布本项目部署文档: 发布项目部署文档Demo版,便于开发者能更快部署本项目进行体验;
- 发布体验桌面: 基于QPT发布ColugoMum的体验桌面, 可供开发者进行体验;
- 代码bug修复: Pipeline部署方式下检索库更新后需重启服务;
- 精度大幅提升: 自采集数据集测试精度高达99.10%, RP2K数据集测试精度高达96.97%;
- 部署方式优化: 预测速度提升65%, 基于CPU整体流程控制在0.9s左右;
- 产品功能升级: 增加库存信息管理功能, 提供一键式数据可视化分析平台.
🧁项目背景🧁
目前在零售行业的实际运营过程中, 会产生巨大的人力成本, 例如导购、保洁、结算等, 而其中, 尤其需要花费大量的人力成本和时间成本在识别商品并对其进行价格结算的过程中, 并且在此过程中, 顾客也因此而需要排队等待. 这样一来零售行业人力成本较大、工作效率极低, 二来也使得顾客的购物体验下降.
随着计算机视觉技术的发展, 以及无人化、自动化超市运营理念的提出, 利用图像识别技术及目标检测技术实现产品的自动识别及自动化结算的需求呼之欲出, 即自动结账系统(Automatic checkout, ACO). 基于计算机视觉的自动结账系统能有效降低零售行业的运营成本, 提高顾客结账效率, 从而进一步提升用户在购物过程中的体验感与幸福感.
适用场景
袋鼯麻麻——智能零售结算平台致力于为大型线下零售体验店提供基于视觉的零售结算方案.
痛点问题
- 结算效率要求极高: 在零售场景中, 若顾客购买的商品较多, 采用传统的条形码结算, 效率较低, 顾客购物体验较差;
- 不同商品相似度极高: 比如同一种饮料的不同口味, 就很可能拥有非常类似的包装. 而且即便对于同一件商品, 在不同情况下所获得的商品图像都往往存在相当大的差异;
- 品类更新极快: 商超零售场景下, 新品通常以小时级别速度更新迭代, 每增加新产品时若仅靠单一模型均需重新训练模型, 模型训练成本及时间成本极大.
🍑实现功能🍑
"袋鼯麻麻——智能零售结算平台"具体实现在零售过程中对用户购买商品的自动结算. 即: 利用PaddleClas团队开源的图像识别PP-ShiTu技术, 精准地定位顾客购买的商品, 并进行智能化、自动化的价格结算. 当顾客将自己选购的商品放置在制定区域内时, "袋鼯麻麻——智能零售结算平台"能够精准地定位识别每一个商品, 并且能够返回完整的购物清单及顾客应付的实际商品总价格. 而当系统有新商品增加时, 本系统只需更新检索库即可, 无需重新训练模型.
本项目为轻量级通用图像识别系统PP-ShiTu提供了扎实的落地应用案例, 对新零售行业中无人零售视觉化智能解决方案提供了非常好的基础和思路, 尤其针对解决多类别、小样本、高相似和更新频繁的特殊图像识别场景痛难点提供了可参考的示范, 极大地降低零售行业实际运营过程中巨大的人力成本, 提升零售行业无人化、自动化、智能化水平.
🍎整体架构🍎
🐻技术路线🐻
袋鼯麻麻——智能零售结算平台 基于PaddleClas作为主要的功能开发套件, 利用其开源的PP-ShiTu进行核心功能的开发, 并通过PaddleInference将其部署于Jetson Nano, 并基于QPT打包.exe打通Windows系统, 开发一套符合实际应用需求的工业级智能零售结算平台.
PP-ShiTu是一个实用的轻量级通用图像识别系统, 主要由主体检测、特征学习和向量检索三个模块组成. 该系统从骨干网络选择和调整、损失函数的选择、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型裁剪量化8个方面, 采用多种策略, 对各个模块的模型进行优化, 最终得到在CPU上仅0.2s即可完成10w+库的图像识别的系统.
整个图像识别系统分为三步(详情见PP-ShiTu训练模块):
(1)通过一个目标检测模型, 检测图像物体候选区域;
(2)对每个候选区域进行特征提取;
(3)与检索库中图像进行特征匹配, 提取识别结果.
对于新的未知类别, 无需重新训练模型, 只需要在检索库补入该类别图像, 重新建立检索库, 就可以识别该类别.
数据集介绍
【The first one】:Products-10K Large Scale Product Recognition Dataset
【The second one】:RP2K: A Large-Scale Retail Product Dataset for Fine-Grained Image Classification
袋鼯麻麻——智能购物平台基于上述两个数据集, 结合爬虫, 对此两种数据集进行适应性处理.
商品部分list
东古酱油一品鲜
东古黄豆酱750G
东鹏特饮罐装
中华(硬)
中华(软)
乳酸菌600亿_2
乳酸菌600亿_3
乳酸菌600亿原味
乳酸菌600亿芒果
乳酸菌600亿芦荟
...
目前处理后的数据集已在启智社区和飞桨AIStudio开源.