院况简介
1949年,伴随着新中国的诞生,中国科学院成立。
作为国家在科学技术方面的最高学术机构和全国自然科学与高新技术的综合研究与发展中心,建院以来,中国科学院时刻牢记使命,与科学共进,与祖国同行,以国家富强、人民幸福为己任,人才辈出,硕果累累,为我国科技进步、经济社会发展和国家安全做出了不可替代的重要贡献。 更多简介 +
院领导集体
创新单元
科技奖励
科技期刊
工作动态/ 更多
中国科学院学部
中国科学院院部
语音播报
来自天然蛋白的目标结构(天蓝色)与相应从头设计蛋白的晶体结构(绿色)叠合图 课题组供图
中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作,开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。经过实验验证,ABACUS-R的设计成功率和设计精度超过了原有统计能量模型ABACUS。相关成果7月21日发表于《自然—计算科学》。
近期有多项研究表明,用深度学习进行氨基酸序列设计,能在天然氨基酸残基类型恢复率等计算指标上超过能量函数方法。但目前已正式发表的工作中,对相关方法的实验验证结果远未达到能量函数方法的成功率。
据介绍,利用ABACUS-R进行序列设计的方法有两部分。第一部分是一个多任务预训练的编码—解码器网络,用于对单个氨基酸的结构和化学环境进行隐空间编码,再解码为包括中心残基氨基酸类型在内的多种真实特征;第二部分是把该编码解码网络迭代应用于目标主链的每个氨基酸残基,直到获得最大程度自洽的全序列。
在理论验证的基础上,团队尝试用实验表征了ABACUS-R对3个天然主链结构重新设计的57条序列,其中86%的序列可溶表达并能折叠为稳定单体。实验解析的5个高分辨晶体结构与目标结构高度一致。与此前报道的从头设计蛋白相似,ABACUS-R从头设计的蛋白表现出超高热稳定性,去折叠温度大多可达100℃以上。
总的来说,相较于ABACUS模型,ABACUS-R序列设计具有更高的成功率和结构精度,进一步增强了数据驱动蛋白质从头设计方法的实用性。ABACUS-R还可用于序列设计以外的其他任务。
相关论文信息:https://doi.org/10.1038/s43588-022-00273-6
扫一扫在手机打开当前页
© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn
© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn
© 1996 - 中国科学院 版权所有
京ICP备05002857号-1
京公网安备110402500047号
网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话:86 10 68597114(总机)
86 10 68597289(总值班室)
编辑部邮箱:casweb@cashq.ac.cn