加快打造原始创新策源地,加快突破关键核心技术,努力抢占科技制高点,为把我国建设成为世界科技强国作出新的更大的贡献。

——习近平总书记在致中国科学院建院70周年贺信中作出的“两加快一努力”重要指示要求

面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构。

——中国科学院办院方针

首页 > 科研进展

科学家发布材料合成大语言模型MatChat

2023-11-01 计算机网络信息中心
【字体:

语音播报

材料合成路径预测是物质科学领域的重要课题。近年来,大语言模型的崛起以及预训练-微调方法的应用,使得通用大语言模型的理解能力在各垂直领域展现出潜力,但在材料领域缺乏相关的应用和研究。

近期,中国科学院计算机网络信息中心人工智能部和物理研究所SF10组合作,通过使用来自400多万篇论文中提取的35675个无机材料固相反应合成过程,数据处理13878条高可信度合成路径描述数据,对开源大语言模型LLaMA2-7B进行微调训练,研发了专注于无机材料合成路径预测任务的大语言模型——MatChathttp://chat.aicnic.cn/onchat)。目前,该模型已上线运行并开放使用。

该模型基本具备材料合成领域知识的生成和推理能力。经实验验证,该模型在预测合成复杂的无机材料时,具备超过ChatGPT的性能表现。受限于数据集的数量和质量,该成果仍需要更多的语料以满足不同材料设计的需求,但展现出大模型在材料领域的创新潜力和应用空间,为材料研究和创新带来了新的启发和思路。

相关研究成果发表在《中国物理B》(Chinese Physics B。研究工作得到中国科学院网信专项应用示范项目的支持。

论文链接

平台

代码

MatChat模型部署平台对话实例

打印 责任编辑:侯茜

扫一扫在手机打开当前页

© 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

地址:北京市西城区三里河路52号 邮编:100864

电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有 京ICP备05002857号-1 京公网安备110402500047号 网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864

    电话: 86 10 68597114(总机) 86 10 68597289(总值班室)

    编辑部邮箱:casweb@cashq.ac.cn

  • © 1996 - 中国科学院 版权所有
    京ICP备05002857号-1
    京公网安备110402500047号
    网站标识码bm48000002

    地址:北京市西城区三里河路52号 邮编:100864
    电话:86 10 68597114(总机)
       86 10 68597289(总值班室)
    编辑部邮箱:casweb@cashq.ac.cn