
国产人工智能大模型DeepSeek引发全球关注
来源:科技日报【字号:大 中 小】
今年1月,中国人工智能企业“深度求索”(DeepSeek)正式发布开源大模型DeepSeek-R1。其凭借极低的训练成本,以及在数学推理、代码生成等任务中比肩国际领先水平的突出表现,引发全球AI领域震动,为全球人工智能大模型发展提供了一条低成本、高效能的“中国路径”。
DeepSeek-R1的核心竞争力源于其对算力效率的系统性革新。其通过纯强化学习的训练方式,首次证明无需海量标注数据也可实现顶尖推理能力,使训练成本大幅下降。同时,DeepSeek-R1还能够自主生成和验证推理步骤,实现自我反思和校正,展现出强大的智能水平。
此外,DeepSeek以开源姿态主动打破技术垄断,开放模型架构、训练工具及数据处理全流程,允许开发者自由调用与二次开发,吸引全球数十万开发者参与生态共建。今年9月,DeepSeek-R1相关成果登上《自然》杂志封面,成为全球首个经过权威同行评议的主流大语言模型。
DeepSeek的成功证明,通过算法优化与工程创新,即使在有限的算力条件下,模型同样可达到顶尖性能。DeepSeek的发展道路不仅为全球贡献了全新的技术路径,更有望推动全球AI竞争从“算力竞赛”转向“效率革命”,重塑以技术创新为核心驱动力的AI产业生态。
(责任编辑:侯茜)
© 1996 - 中国科学院 版权所有 联系我们 地址:北京市三里河路52号 邮编:100864
京ICP备05002857号-1
京公网安备110402500047号 网站标识码bm48000002