近期,中国科学院空天信息创新研究院研究员付琨团队和国际摄影测量与遥感协会(ISPRS)合作,构建了一套目前全球规模最大的遥感图像细粒度目标识别数据集(FAIR1M),并面向全球公开发布。
从数百万平方公里范围的卫星图像中快速精准地定位、识别感兴趣的目标,是遥感数据智能解译领域的核心难题。随着空天信息和人工智能技术的持续发展,近年来,已有越来越多的遥感图像数据集相继发布,但仍然缺乏大规模和精细化标注的实例,算法模型的准确性、实用性、智能化程度也待进一步提高。
所谓细粒度目标识别,是指在目标检测的基础上,识别出目标的具体型号与类别,例如不只识别出飞机目标,还能识别出飞机型号(如波音或空客)。该数据集有效推进了高分辨率遥感图像解译算法由目标检测向细粒度识别发展,可作为遥感智能解译领域的基准数据集,可供从事地理信息、图像处理、遥感测绘、人工智能等相关领域的专业人员研究使用。
该数据集含15000余幅分辨率优于1米、尺寸从上千到上万像素不等的图像,具有100多万精细化标注、多角度分布的目标,场景覆盖全球上百个典型城市、乡镇,以及常用机场、港口等,其中来自我国自主产权高分系列卫星的数据占比超过80%,标注结果均经权威判读专家确认。
根据遥感应用的实际需求,该数据集将目标(包含飞机、船舶、车辆、球场和道路等)进行类别细分,包括37个细粒度类别。例如,依据型号将飞机细分为波音式(波音737、747、777和787等)、空客式(空客220、321、330和350等)以及国产式飞机(C919和ARJ21等);将船舶细分为液货船、干货船、渔船、邮轮、拖船和工程船等;对于车辆、球场和道路等要素也分别按照功能、尺寸等细分至多个类型。
同时,考虑到不同时间拍摄的遥感图像中蕴含更为丰富的目标关联信息,该数据集还提供了针对同一区域、不同时相的数据,是一套多时相、多分辨、多要素的遥感图像标准化样本集。
该数据集建设过程中得到了国家高分辨率对地观测系统重大科技专项支持,由厦门大学、德国卡尔斯鲁厄理工学院等国内外高校联合参与,并于2021年2月被遴选为国际摄影测量与遥感协会科学创新项目(2021年度全球共7项),成为该协会高分辨率卫星图像目标识别研究的公开标准数据集。
目前,空天院和国际摄影测量与遥感协会等合作构建的数据集网站已开放下载功能,详情可参阅网站(http://gaofen-challenge.com)。此外,该网站将提供配套的数据集基准测试与排行榜服务,并计划于2021年6月面向全球开放。
图1 数据集类别示意图
图2 各类别实例数量直方图
图3 目标场景示例图