让机器看懂世界 深兰科技斩获CVPR 2019 细粒度图像分类挑战赛冠军

2019-06-18

众所周知,计算机视觉技术推动了人工智能巨大发展,让机器可以看懂世界。在科学研究中,传统的图像分类常见侧重于区分通用的类别,然而对于着重区分物体部分和属性的细微差别应该怎么办呢?
细粒度图像分类技术为其提供了有效解决方案。

深兰科技DeepBlueAI团队获 CVPR 2019 FGVC挑战赛冠军

近日,由FGVC举办的CVPR 2019 Cassava Disease Classification挑战赛公布了最终结果,深兰科技DeepBlueAI团队荣获冠军。
图片1.png

此次挑战赛共有来自全球88个团队参与,提交了超过1300份方案。深兰科技DeepBlueAI团队参赛的是FGVC6中的Cassava Disease Classification挑战赛,是一个根据木薯的叶子区分不同种类的木薯疾病的任务。

FGVC全称Fine-Grained Visual Categorization(细粒度图像分类),代表了细粒度图像分类在某个细分领域的挑战,本次参与者需要使用主办方提供的9436张标记和12595张未标记图片进行训练数据。目标是学习一个模型,使用训练数据中的图像将给定的图像分类为这4个疾病类别或健康叶子的类别。

针对本次参赛训练样本较少问题,深兰科技DeepBlueAI团队除了利用交叉验证和传统的数据增强方式,还使用了RandomErasing和Cutout的方式,降低过拟合的风险并提高了模型鲁棒性,使用了Mixup和label smoothing的训练策略,将Top1准确率提高近一个百分点,使得计算损失函数时有效抑制过拟合现象。同时团队还利用SE_ResNeXt50、SE_ResNeXt101、SENet154以及DenseNet201按照归一化后权重的融合,最终以0.95的阈值筛选出一半的数据作为添加到训练集的伪标签数据,通过实验证明了在训练集中添加伪标签后模型的泛化能力有显著提升,最终成功完成Cassava 病变细微差别区分任务并获得冠军。

细粒度图像分类技术大量落地应用

对于细粒度图像分类技术研究及应用用途,简单来说普通的分类问题只专注于区别出目标的大类,比如猫和狗,花和树等。但是细粒度图像分类需要识别并区分非常精细的子类别,例如工业监测中相似类别的区分、表面粗糙度的区分。

以深兰AI工业监测应用为例,细粒度图像分裂技术已经实现了零件表面粗糙度超标识别,机加毛刺识别,机加接刀痕识别,线切割过切识别,以及零件碰伤,折叠,机加后殘余黑皮,开裂,机加工崩刀痕等等复杂环境下的监测识别。

另外,细粒度图像分类研究方法还可以应用在高速公路上识别不同车辆的型号、在城市管理中识别不同车辆违规停放、在野外识别不同物种、在商店购物时识别不同的商品,细粒度图像分类在这些任务里面都扮演着极为重要的角色。

深兰科技自2014年由归国博士团队创建以来,一直以“人工智能 服务民生”为理念,致力于人工智能基础研究和应用开发。旗下深兰科学院五大院所一直重视基础技术研究,科学院通过参加一些顶级挑战赛不断培养和提高研究员自主解决问题的能力,强化深兰扎实的技术能级,构建深兰浓郁学术氛围,为推动人工智能技术应用和落地提供了坚实基础。

细粒度图像分类技术的研究只是深兰科技在人工智能领域众多基础性研究中的一个缩影,正如之前深兰在 PAKDD 2019 AutoML3+挑战赛获得冠军研究的终身机器学习AutoML技术一样,深兰都会将此类技术应用在各个产品和解决方案当中,让人工智能技术真正的落地服务民生。

图片2.png
另外,本次除了在FGVC挑战赛获得冠军之外,深兰科技DeepBlueAI团队还在同期CVPR 2019 WAD 的两项任务赛事中(目标检测迁移学习、目标跟踪迁移学习挑战赛和大规模检测插值探索赛)获得第2名和第3名。WAD是国际上以自动驾驶视觉为核心的顶级评测大赛,以数据规模大、难度高著称,每年CVPR WAD挑战赛都能吸引全球业界和学术界的多路顶级团队参与。

关于CVPR

CVPR中文名称为国际计算机视觉与模式识别会议,是IEEE一年一度的学术性会议,会议的主要内容是计算机视觉与模式识别技术,是世界顶级的计算机视觉会议之一(另外两个是ICCV和ECCV)。在各种学术会议统计中,CVPR被认为有着很强的影响力和很高的排名。目前在中国计算机学会推荐国际学术会议的排名中,CVPR为人工智能领域的A类会议。