加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研进展

自动化所在视觉物体检测与识别领域取得系列进展

2019-11-04 自动化研究所
【字体:

语音播报

  近日,中国科学院自动化研究所智能感知与计算研究中心研究员张兆翔及其团队借鉴脑神经机制与视觉认知机理,在视觉物体检测模型与方法上取得一系列进展,共有5篇文章被ICCV2019录用,1篇文章被NeurIPS2019录用,1篇文章被JMLR 期刊收录。本次着重介绍基于三叉戟网络(Trident Networks)的物体检测。

  物体检测是计算机视觉与模式识别领域的核心问题,一直以来受到学术界与工业界的广泛关注。当前物体检测最大的难点是如何对场景中多种尺度的物体进行有效表征,进而进行更为高效、更为准确、更为鲁棒的物体检测。

  在二维透视成像中,近大远小是一个常见的现象,如图1所示。这一透视关系,帮助人类视觉系统形成对三维空间的感知。但对于基于二维图像的视觉感知任务而言,近大远小会导致相同真实大小的物体根据远近不同,因而在成像平面上形成不同尺度的物体。这将对视觉感知任务提出挑战。具体来说:(1)这会导致信息的衰减,二维图像捕获的信息随距离二次衰减,因而30米外的物体在图片上可能只有15米外相同物体1/4的像素;(2)卷积神经网络具有局限性。由于卷积操作在二维平面上采用相同大小的滑动窗口进行计算,同一卷积操作无法同时对尺度差异较大的物体进行响应。

  针对传统卷积神经网络的局限,张兆翔及其团队首次提出 Trident 网络结构。首先通过不同膨胀系数的卷积支路实现对不同尺度的物体的识别,然后通过权重共享实现对不同尺度相同物体的一致性刻画。研究人员还提出了一种在测试阶段只需要一条卷积支路的快速 Trident 网络,快速 Trident 网络保持了与传统检测器骨干网络相同的计算量,大幅提升了该方法的实用性。

  该Trident方法可以与不同基础网络结构结合,并在 COCO 数据集上取得大幅度提升。该文作为Oral文章在ICCV2019发表。

  据悉,ICCV2019近期在韩国首尔召开。ICCV的全称是国际计算机视觉大会,是计算机视觉与模式识别领域的顶级会议。本次会议,张兆翔及其团队共有5篇论文被接收,其中2篇为oral3篇为poster

打印 责任编辑:叶瑞优

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

    编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)
    编辑部邮箱:casweb@cashq.ac.cn