登录会员系统用户名  密 码     
|
当前位置:首页 >> 业界动态 >> 业界动态
新方案解决AI目标检测难题
2021/3/18 15:55:11    新闻来源:中国仿真学会仿真算法专业委员会

AI如何像人眼一样,识别真实世界中较为复杂的图像内容,甚至是高于人眼的识别力,从而可以在办公室、野外等各种复杂环境中代替人眼工作,是人工智能不断探索的一项关键技术。近日,中科院软件研究所(以下简称软件所)智能软件研究中心在目标检测与识别领域提出了一系列新的问题解决方案,相关研究成果发表在人工智能领域国际会议CVPR 2020ECCV 2020ACM MM 2020

目标检测与识别是人工智能领域一个重要的基础问题,但如何提高AI图像识别的准确率,还存在很多困难。比如,肉眼所见非常相近的物体之间,计算机傻傻分不清怎么办?论文通讯作者、软件所副研究员张立波解释,这是由于AI难以对极其相似的目标所属类别进行细粒度的辨别。

针对这一难题,软件所团队提出了一种二分类深度神经树的细粒度识别模型。这是一种由粗分逐渐到细分的方法,把神经网络分成不同的节点,在不同的节点上利用卷积网络进行特征学习,定位出具有判别力的区域特征。这一方法可以加强不同分支对图像细粒度特征的提取。

张立波表示,在目标检测的实际应用场景中,还会面临一个常见的问题,那就是训练集与测试集样本分布不一致影响模型表现。比如在道路车辆检测应用中,用来训练目标检测模型的数据集与使用模型进行测试的数据集可能是在不同城市背景、不同天气环境、不同分辨率下采集的,这就会导致实验室的训练数据与测试数据之间出现域偏移。

于是,他们提出了一种新的迁移学习方法,来提高域转换的效果。这种方法将特征图用不同大小的窗口来提取均值特征,获得特征金字塔,然后用软注意力机制在不同金字塔特征之间的动态选择,来指导最终的域转换。

"除此之外,在一类视频采集过程中,如果目标物过小,背景又很杂乱,会给检测、计数带来极大的挑战,比如无人机场景就面临这一问题。"

张立波介绍,软件所团队设计了一种新的基于特征金字塔的注意力网络来处理目标检测和计数任务。他们利用了背景和目标之间的弱监督信息,融合不同尺度的特征图,获得更丰富的特征表示。同时,前景模块考虑了全局和局部外观的目标,以方便准确定位。

相关论文信息:

https://isrc.iscas.ac.cn/gitlab/research/acnet

https://isrc.iscas.ac.cn/gitlab/research/sematree

地址:北京市海淀区学院路37号工程训练中心637室 电话:010-82317098 传真:010-82317098 
中国仿真学会 版权所有 电子邮箱:cassimul@vip.sina.com
京ICP备17016611号-1; 技术支持:北京中捷京工科技发展有限公司(010-88516981)