
这一筹划基于一套名为 ENPIRE 的“智能体调剂框架”(agent harness)——它像一层软件外壳,包裹在大年夜模型外部,使 AI 编程代理人可以或许调用各类对象,并具备记忆、高低文治理、束缚控制和反馈轮回等才能,从而可以主动筹划、履行、评估和迭代机械人练习义务。 英伟达表示,这一框架由 GEAR Lab 团队结合卡内基梅隆大年夜学和加州大年夜学伯克利分校研究人员合营开辟。
尽管仍有不足,英伟达显然正在加码其所谓“物理 AI”的宏大年夜愿景。 借助 AI 海潮带来的充分现金流,公司在多个机械人项目上持续投资:本年 5 月底,英伟达宣布与中国机械人企业优必选竞争敌手优尼特(Unitree)合作,为研究机构供给一款“通用人形机械人参考平台”,用于通用 AI 机械人研发。 本年 6 月初,黄仁勋在韩国进行密集拜访,与现代汽车集团履行会长郑义宣会见,评论辩论若何扩大年夜 AI 机械人的范围化制造;现代此前已收购了以四足“机械狗”Spot 有名的美国波士顿动力公司,并正在推动双足人形机械人 Atlas 的贸易化。
ENPIRE 框架今朝包含四大年夜核心模块:一是为机械人义务供给主动复位与成果验证;二是主动优化机械人控制策略;三是在多台实体机械人上并行评估不合策略;四是经由过程分析日记、浏览论文、改进练习基本举措措施和算法代码来处理练习中的掉败案例。 研究团队在 6 月 16 日公开了一篇技巧论文,具体介绍了该体系的实现细节和实验成果。
在实验中,研究人员分别引入了三类主流 AI 编程代理人:基于 OpenAI Codex 与 GPT‑5.5 的代理、基于 Anthropic Claude Code Opus 4.7 的代理,以及基于月之暗面(Moonshot AI)Kimi Code K2.6 的代理。 这些代理人会以团队情势自力提出不合的算法改进筹划,在真实机械人上开展练习实验,然后保存能进步整体成功率的变革,并赓续轮回迭代。
成果显示,在 ENPIRE 的调剂下,AI 编程代理人可认为多种机械臂操作义务主动设计出有效的自我改进策略:在标准的 Push‑T 桌面操作义务中,机械人须要将 T 形积木精准推到目标区域;在其他义务中,机械人则被请求整顿针盒中的小针、系紧并剪断塑料扎带,或将 GPU 插入主板插槽并在每轮实验后拔出复位。 在多项义务上,体系最终实现了 99% 的成功率,个中在插针与整顿义务上,AI 驱动的练习筹划甚至比由人类介入的“前沿人类介入式办法”更快达到近乎 100% 的成功率。
实验还注解,增长代理人数可以明显加快进修过程:在 Push‑T 义务上,8 个代理人构成的团队只用了 2 小时研究时光就将成功率推到 99%,而 4 人团队须要 3 小时,单一代理人则接近 5 小时才达到一致程度。 不过,研究人员也留意到,多代理协作的效力并非线性晋升,代理人数量增长后,更多时光被消费在互相总结和沟通思路上,而非真正调剂机械人履行练习。
研究团队同时指出了当前体系的若干局限:在很多时光段,机械人被闲置在实验台上,等待 AI 编程代理人读取日记、编写和调试代码,或者等待底层说话模型响应。 此外,在并行练习方面,代理人有时并没有充分应用现有算力资本,导致实验吞吐量低于理论上限。 从成本角度来看,代理人数和练习频次的增长也意味着明显更高的 token 消费,与当前多家 AI 办事供给商推敲进步按 token 计价的收费方法之间存在直接接洽关系。
英伟达 AI 负责人范骏(Jim Fan)在社交平台上形容,如今实验室的一部分已经可以在夜间“自我改进”,研究人员只需早上查看练习申报即可懂得机械人在前一晚的进展。 他半开打趣地表示,幻想状况下“大年夜家都去度假,黄仁勋都不会发明”,并称团队筹划将相干成果开源,让任何人都可以在家里搭建本身的“自运行机械人实验室”。
在这条路径上,ENPIRE 以及背后的 AI 编程代理人团队被视为通往“自驱念头器人实验室”的关键构成部分,它们测验测验将人类专家在试错、调参和浏览文献上的大年夜量工作交给 AI 完成,让研究人员更多扮演“早上核阅日报”的角色。 跟着相干代码和框架的开源,将来类似的自立练习体系是否会在高校、企业甚至小我爱好者中普及,将成为不雅察“物理 AI”落地速度的重要窗口。

发表评论 取消回复