头图+摘要 头图+摘要

国产人工智能大模型DeepSeek引发全球关注

发布时间:2025-12-29

来源:科技日报【字号:

今年1月,中国人工智能企业“深度求索”(DeepSeek)正式发布开源大模型DeepSeek-R1。其凭借极低的训练成本,以及在数学推理、代码生成等任务中比肩国际领先水平的突出表现,引发全球AI领域震动,为全球人工智能大模型发展提供了一条低成本、高效能的“中国路径”。

DeepSeek-R1的核心竞争力源于其对算力效率的系统性革新。其通过纯强化学习的训练方式,首次证明无需海量标注数据也可实现顶尖推理能力,使训练成本大幅下降。同时,DeepSeek-R1还能够自主生成和验证推理步骤,实现自我反思和校正,展现出强大的智能水平。

此外,DeepSeek以开源姿态主动打破技术垄断,开放模型架构、训练工具及数据处理全流程,允许开发者自由调用与二次开发,吸引全球数十万开发者参与生态共建。今年9月,DeepSeek-R1相关成果登上《自然》杂志封面,成为全球首个经过权威同行评议的主流大语言模型。

DeepSeek的成功证明,通过算法优化与工程创新,即使在有限的算力条件下,模型同样可达到顶尖性能。DeepSeek的发展道路不仅为全球贡献了全新的技术路径,更有望推动全球AI竞争从“算力竞赛”转向“效率革命”,重塑以技术创新为核心驱动力的AI产业生态。

(责任编辑:侯茜)

关闭页面