主要职责
中国科学院贯彻落实党中央关于科技创新的方针政策和决策部署,在履行职责过程中坚持党中央对科技工作的集中统一领导。主要职责是:
一、开展使命导向的自然科学领域基础研究,承担国家重大基础研究、应用基础研究、前沿交叉共性技术研究和引领性颠覆性技术研究任务,打造原始创新策源地。 更多+
院况简介
中国科学院是国家科学技术界最高学术机构、国家科学技术思想库,自然科学基础研究与高技术综合研究的国家战略科技力量。
1949年,伴随着新中国的诞生,中国科学院成立。建院70余年来,中国科学院时刻牢记使命,与科学共进,与祖国同行,以国家富强、人民幸福为己任,人才辈出,硕果累累,为我国科技进步、经济社会发展和国家安全作出了不可替代的重要贡献。 更多+
院领导集体
科技奖励
科技期刊
科技专项
科研进展/ 更多
工作动态/ 更多
工作动态/ 更多
中国科学院学部
中国科学院院部
语音播报
近日,中国科学院合肥物质科学研究院研发出基于表型感知对比学习的抗体语言模型BCRInsight。该模型通过对海量序列的自监督学习,实现了对复杂免疫信号的深度解码,在抗体结合位点预测和B细胞亚群分析等任务上均达到当前最佳性能。
B细胞受体(BCR)免疫库蕴含丰富的生物学信号,决定抗原识别的特异性,记录B细胞激活、成熟及演化过程。传统方法难以解析抗体序列的复杂语义,单细胞测序技术成本高昂,因此亟需研发低成本、高效、可深度提取复杂生物语义的新型计算工具。
研究团队构建了基于12层Transformer编码器、约8600万个可训练参数的深度学习框架BCRInsight。与传统仅依赖掩码的语言模型不同,团队引入表型感知对比学习策略,在8000万条人类BCR序列的大规模数据集上完成预训练。在输入设计上,模型将氨基酸序列与基因注释等元数据,进行类似自然语言处理中“句子对”的联合编码。
实验显示,BCRInsight展现出优异的泛化与表征能力。在B细胞亚群分析中,模型能够从高度复杂的bulk BCR-seq数据中低成本地反卷积出B细胞亚群组成比例,准确率超越现有模型;在抗体结合位点预测测试中,其AUROC达0.962,性能优于九种先进方法。在未接触任何三维结构监督信号的条件下,该模型凭借自注意力机制感知蛋白三维结构,聚焦于决定抗原识别的关键HCDR3环区及结构支撑位点。
这一研究为实现从阅读免疫语言到编写免疫语言的跨越,以及指导疾病特异性抗体的人工设计与优化提供了支撑。
相关研究成果发表在Briefings in Bioinformatics上。

BCRInsight模型框架
© 1996 - 中国科学院 版权所有 京ICP备05002857号-1
京公网安备110402500047号 网站标识码bm48000002
地址:北京市西城区三里河路52号 邮编:100864
电话: 86 10 68597114(总机) 86 10 68597289(总值班室)








