《自然》表示,2025年1月,DeepSeek突然发布其强大且低成本的R1大模型,这立刻让世界意识到“美国在AI领域并非遥遥领先”。

引发这场震动的,是低调且极少公开露面的创始人——梁文锋。

《自然》称,R1作为推理型大语言模型,擅长将复杂任务(如数学和编程)分步骤解决。

在同类产品中,该模型率先以开放权重形式发布,意味着该模型可免费下载并进行二次开发,且成功带动了中美多家企业陆续发布自有开放模型。

有AI专家指出,R1在诸多能力上可与美国顶尖模型比肩,而其训练成本却远低于竞争对手,甚至只有对手的十几分之一。

据了解,今年9月,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文登上《自然》的封面。

本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。

《自然》评价道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部