加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研进展

研究提出基于弱监督学习的冷冻电镜颗粒挑选新方法

2024-03-13 生物物理研究所 自动化研究所
【字体:

语音播报

生物大分子的结构与功能随着细胞生理状态的变化而不断进行动态调整。原位结构生物学是在接近自然生理状态下研究生物大分子结构和功能的科学。原位冷冻电镜技术(Cryo-ET)以高分辨率和在接近生理条件下观察样品的特点,成为原位结构生物学研究的关键手段。原位冷冻电镜的技术流程涉及样品制备、数据采集、电子断层重建、颗粒挑选、粒子平均等步骤。生物大分子的颗粒挑选即定位识别是关键环节之一。受限于Cryo-ET图像的极低信噪比和重建伪影等因素,成千上万个目标颗粒的手动挑选耗时费力。而现有自动挑选方法的应用受到人工标注量高、计算成本高和颗粒质量不理想等方面的限制。

3月7日,中国科学院生物物理研究所蛋白质科学研究平台生物成像中心与自动化研究所多模态人工智能系统实验室合作,以人工智能技术赋能原位结构生物学,提出了基于弱监督深度学习的快速准确颗粒挑选方法——DeepETPicker。相关研究成果以DeepETPicker: Fast and accurate 3D particle picking for cryo-electron tomography using weakly supervised deep learning为题,发表在《自然-通讯》(Nature Communications)上。

DeepETPicker仅需少量人工标注颗粒进行训练,即可实现快速准确三维颗粒自动挑选。为了降低人工标注量的需求,DeepETPicker优选简化标签来替代真实标签,并采用更高效的模型架构、更丰富的数据增强技术和重叠分区策略以提升小训练集时模型的性能;为了提高颗粒定位的速度,DeepETPicker采用GPU加速的平均池化-非极大值抑制后处理操作,与现有的聚类后处理方法相比提升了挑选速度数十倍。为方便用户使用,该团队推出了操作简洁、界面友好的开源软件,以辅助用户完成图像预处理、颗粒标注、模型训练与推理等操作。

科研人员在冷冻电子断层扫描图像中使用DeepETPicker挑选颗粒的整体工作流程,包括训练阶段和推理阶段。在训练数据的准备阶段,研究优选了弱标签TBall-M来代替真实掩模以减轻人工标注负担。在模型架构的设计方面,研究引入坐标卷积和图像金字塔到3D-ResUNet的分割架构以提高定位的准确性。在模型推理阶段,DeepETPicker采用重叠断层图分区策略,避免了因边缘体素分割精度不佳而产生的负面影响,进而结合MP-NPMS操作加速了颗粒中心定位过程。

该研究在多种冷冻电子断层扫描数据集上,将DeepETPicker与目前性能最优的颗粒挑选方法进行性能评估对比,采用六个定量指标全面评价颗粒挑选的质量。结果表明:DeepETPicker在仿真数据集与真实数据集上均可实现快速准确的颗粒挑选,且综合性能优于现有的其他方法;生物大分子结构重建得到的分辨率达到采用专家人工挑选颗粒进行结构重建的同样水平。这体现了DeepETPicker在原位高分辨率结构解析中的实用价值。DeepETPicker有望为采用原位冷冻电镜技术的原位结构生物学研究提供支持。

研究工作得到中国科学院战略性先导科技专项(B类)、国家自然科学基金、国家重点研发计划等的支持。相关技术已获得中国发明专利授权。

论文链接

在冷冻电子断层扫描图像中使用DeepETPicker挑选颗粒的整体工作流程

打印 责任编辑:侯茜

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

    编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)
    编辑部邮箱:casweb@cashq.ac.cn