加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研进展

中国科大建立新的蛋白质从头设计方法

2022-02-10 中国科学技术大学
【字体:

语音播报

  近期,中国科学技术大学教授刘海燕、副教授陈泉团队采用数据驱动策略,提出一条全新的蛋白质从头设计路线,相关成果2月9日以“用于蛋白质设计的以主链为中心的神经网络能量函数”为题发表于《自然》(Nature)杂志。

  蛋白质是生命功能的主要执行者,其结构与功能由氨基酸序列所决定。目前,能够形成稳定三维结构的蛋白质几乎全部是天然蛋白质,其氨基酸序列是长期自然进化形成。在天然蛋白结构功能不能满足工业或医疗应用需求时,想要得到特定的功能蛋白,就需对其结构和序列进行设计。目前,国际上报道的蛋白质从头设计工作主要使用天然结构片段作为构建模块来拼接产生人工结构。然而这种方法存在设计结果单一、对主链结构细节过于敏感等不足,限制了设计主链结构的多样性和可变性。蛋白质从头设计中最困难的问题是如何充分地探索蛋白质主链结构空间,发现新颖的、“高可设计性”主链结构,目前还缺乏相关的系统性解决方法。 

  中国科大相关团队长期深耕计算结构生物学方向的基础研究和应用基础研究。刘海燕、陈泉团队十余年来致力于发展数据驱动的蛋白质设计方法,经过长期不懈努力,建立并实验验证了给定主链结构设计氨基酸序列的ABACUS模型,进而发展了能在氨基酸序列待定时从头设计全新主链结构的SCUBA模型。SCUBA采用一种新的统计学习策略,基于核密度估计(或近邻计数,NC)和神经网络拟合(NN)方法,从原始结构数据中得到神经网络形式的解析能量函数,能够高保真地反应实际蛋白质结构中不同结构变量间的高维相关关系,在不确定序列的前提下,连续、广泛地搜索主链结构空间,自动产生“高可设计性主链。

  理论计算和实验证明,用SCUBA设计主链结构,能够突破只能用天然片段来拼接产生新主链结构的限制,显著扩展从头设计蛋白的结构多样性,进而设计出不同于已知天然蛋白的新颖结构。“SCUBA模型+ABACUS模型”构成了能够从头设计具有全新结构和序列的人工蛋白完整工具链,是RosettaDesign之外目前唯一经充分实验验证的蛋白质从头设计方法,并与之互为补充。在该研究中,团队展示了9种从头设计的蛋白质分子的高分辨晶体结构,它们的实际结构与设计模型一致,其中5种蛋白质具有天然蛋白质中尚未观察到的新型拓扑结构 

  Nature审稿人认为,“与现有方法不同,现有方法要么使用参数方程来描述预定义螺旋结构的空间,要么基于片段组装的方法依赖于已知蛋白质片段。SCUBA方法原则上允许人们探索任意主链结构,然后填充序列,允许人们设计比自然界中观察到的更广泛的蛋白质几何结构”,“蛋白质从头设计仍然具有挑战性,本工作中六种不同蛋白质的高分辨率设计是一项重要成就,表明此方法工作良好”,“本研究中报道的成功设计数量之多令人印象深刻,并提供了强有力的证据,证明了基础技术是鲁棒的。所采用的基于神经网络的能量项是新颖的,因为它们刻画了更传统的统计方法无法企及的多维特征,该方法具有足够的新颖性和实用性”。 

  该研究为工业酶、生物材料、生物医药蛋白等功能蛋白的设计奠定了基础。研究工作得到科技部、国家自然科学基金委和中科院的资助支持。 

  论文链接

  用SCUBA模型进行蛋白质设计的原理。a:SCUBA主链能量面上的极小对应了蛋白质的可设计主链结构,即特定氨基酸序列下的最低自由能结构;b:SCUBA中用神经网络表示的统计能量项;c、d:用近邻计数(NC)-神经网络(NN)方法从蛋白质结构原始数据中学习解析能量函数的方法框架

从头设计蛋白的高分辨晶体结构(天蓝色)与设计模型(绿色)比较

打印 责任编辑:程博

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

    编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)
    编辑部邮箱:casweb@cashq.ac.cn