“Vibe Coding”之父Andrej Karpathy揭橥了一篇年度总结《2025 LLM Year in Review》,列出2025年大年夜模型行业最重要的6大年夜技巧成果,写得异常通俗易懂:

1. RLVR(可验证嘉奖强化进修)

本年以前,大年夜模型的主流练习筹划,就那三样——

1️⃣Pretraining(预练习),爬完全网数据,学会怎么猜测;

2️⃣SFT(监督微调),找人给模型供给参考谜底,推动过拟合;

3️⃣RLHF(人类反馈强化进修),模型生成多个谜底,人类打分,让它开悟;

比较之下,我会认为OpenAI有点走偏了。

而RLVR的普及,吞掉落了本年的大年夜多半算力消费,并为应用者新增了「让模型思虑更久一点」的质变按钮,OpenAI的o1开创了这条路线,到o3则是真正的拐点。

2. 锯齿状的智能

本年开端意识到,大年夜模型并不是智能生物,它更像是一种被呼唤来的鬼魂。

人类的智能,是为了在恶劣的天然情况里生计下来而持续进化的,但大年夜模型的智能,是为了模仿人类措辞、在做数学题时拿到嘉奖、为了在基准测试里考高分而设计的,所以这让大年夜模型出现出「薛定谔的聪慧」——

这是我在推特上随口创造的一个词,没想到火得不可,此处应有掌声。

一方面可以懂得最难的奥数题,另一方面连一个单词里有几个r都数不清楚。

所以基准测试的意义确切不大年夜了,所有公司都在刷题,甚至把练习都放在特定的数据集上,这么搞下去,AGI来不了。

3. Cursor

比这款产品的成功更有价值的是,本年有很多AI原生办事开端标榜本身是「xx行业的Cursor」,这意味着大年夜模型在应用层的渗入渗出已经开端了。

将来的搭配可能是如许的——大年夜模型厂商负责教导出具有广泛才能的大年夜学生,而Cursor如许的公司则负责把这些大年夜学生培训成可上岗的练习生。

Cursor跑通的贸易逻辑,是为垂直市场封装大年夜模型这学生意,像一个产品经理的角色,负责把技巧变成即插即用的临盆力对象。

4. Claude Code

Claude Code是迄今为止最让人佩服的Agent,它运行在本地设备里,理论上来说,你能用键盘和鼠标做什么事,它也能做到。

OpenAI太想把一切都塞到ChatGPT里了,乃至于Codex、Agent等新技巧都偏向于放到云端,而不推敲本地安排。

你们都把Nano Banana当成一个牛逼的图片模型,但在我眼里,他是大年夜模型「GUI化」的雏形,直接通向人类与AI交互的图形界面。

在通用对话框里完成一切当然很有AGI的感到,但实际是,我们依然处在一个模型才能不算稳定、高低限差别巨大年夜的中心时刻,端到端的智能体可能是更优解。

这不是说本地和云端哪边更好的问题,用户的数据仍然重要存放在本地——代码、密钥、高低文、临盆情况这些——Anthropic搞对了优先级,把Claude Code放进了一个优雅的敕令行界面里,摆脱了只能用浏览器拜访的困境。

能干活的大年夜模型,就应当变成如许的「田螺姑娘」。

5. Vibe Coding

Vibe Coding让编程不再只是少数专业法度榜样员的特权,任何不懂代码的人都能驾驭编程才能为己所用,这就叫「权力归于人平易近」。

和以前的技巧革命不合,这一次,通俗用户能从大年夜模型里获得的益处要远远高于专业人士和大年夜型公司,代码临盆的便宜化,让我们实现了软件自由。

举个例子,我为了找一个Bug,专门经由过程Vibe Coding写了一个法度榜样,而它在完成任务之后,就可以被扔掉落了,像一张放弃的餐巾纸。

这会彻底动摇软件工程师的职位请求。

RLVR供给的新筹划,是让模型去做存在标准谜底的复杂数学题,得出成果后再去查对谜底,经由过程这种明白的试错,模型开端演变出了推理才能。

6. Nano Banana

大年夜模型基于说话文本,所以天然爱好对话格局,但人类不是如许的,人类是爱发出「太长不看」这种怪叫声的生物,与费时辛苦的文本相比,我们更爱好经由过程视觉花费信息。

这也是Dos被Windows代替的过程。

将来的大年夜模型,会从本身的舒适区走出来,转而用人类喜闻乐见的格局来输出信息,比如图表、简报、动画、网页这些,Nano Banana是第一个把信息处理和图像表达融合起来的模型。

这是2025年最难以置信的标记性事宜,没有之一。

总之,这是一波未平、一波又起的一年,大年夜模型的能干和愚蠢都远超出了我的想象,这个行业连10%的潜能都还没有发掘出来,要做的工作还有很多,记得系好安然带。

来源:https://weibo.com/1560906700/5245960041007703

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部