多商品重叠,人工智能如何计数?
该研究是基于复杂场景的多商品检测任务
在日常购物时,我们不妨畅想一下未来的场景:无需结算台,因为消费者取下产品的过程中,就可以完成自动结算;也无需货架管理员,因为智能货架管理技术可以实时动态监测商品数量变化,并完成数据分析。不过,要实现这种智能化消费方式变革的核心难点在于解决目标检测计数联合任务领域中的遮挡问题。
近日,中国科学院软件研究所智能软件研究中心发布了目前为止最大的零售场景目标检测计数联合任务数据集——Locount,为解决零售场景下目标检测领域严重遮挡问题提供了重要基础。相关论文在国际人工智能会议(AAAI2021)上发表。
该研究发现,现在的目标检测任务通常使用一个矩形框来预测单个目标的位置,因为传统目标检测数据集的遮挡比例较少,尤其缺少多个目标之间严重遮挡的情况(例如多个目标重叠比例超过90%)。“可偏偏在零售场中却普遍存在这种情况,商超货架内的商品通常在上下和前后两个方向上有所重叠。”论文通讯作者、中科院软件所副研究员张立波告诉《中国科学报》,传统的表示方法无法适用于商品零售场景,因为同一类别商品重叠摆放会存在严重遮挡的现象,在实际使用中也无需精确定位每一个实例目标。
于是,研究团队提出了一种同时进行对象定位和计数的新任务。“具体来说,如果多个目标是相互严重遮挡且属于同一个类别,新的任务为预测出该目标簇中所有目标框合并的最小包围框及对应的实例数量。”张力波解释。
传统目标计数(a)和目标检测;(b)数据集中采样的标注图片;(c)传统的检测标注应用到本项研究的数据集的呈现形式;(d)新的检测标注方式在本项研究的数据集上的呈现方式
而为了实现这一新任务,研究团队经过近2年的广泛收集及测试研究,设计出了迄今为止最大的零售场景目标检测计数联合任务数据集——Locount,填补了现实场景中检测和计数联合训练问题的空白。
张立波介绍,该数据集包含了190多万个商品实例标注信息,涵盖了140种商品类别。其中每个标注框包含了同类商品实例及其数量,与其他商品类型数据集相比,具有明显优势。
Locount数据集中的商品分类
此外,为了评估不同算法在该任务上的性能,研究团队还设计了一种新的评价标准,以反映算法出现目标丢失、对同一实例的重复检测、错误检测、错误计数等情况。
这项研究认为,传统方法和常见的深度学习网络还无法很好地解决Locount提出的新挑战。为了能更好地研究复杂和密集场景下,尤其是目标高度重叠时的检测和计数问题,张立波希望更多开发人员能够借助Locount数据集,探索出更准确、高效的任务解决思路和方法。同时,这一数据集也可以为现实场景中长尾分布、少样本学习等多个潜在的研究方向提供基础支持。
相关论文信息:
https://isrc.iscas.ac.cn/gitlab/research/locount-dataset/-/blob/master/AAAI2021_CLCNet.pdf
数据集下载地址及密码:
https://pan.baidu.com/s/13JJAHz2VXD0KewdcemfsXQ#list/path=%2F fyze