据介绍,Vera 是英伟达首款为 Agentic AI 工作负载量身定制的自研 CPU,重要面向须要在大年夜范围情况下运行智能体的 AI 实验室、云办事商以及企业客户。 官方定位显示,这颗芯片将重点承担智能体编排、对象调用(tool-calling)、强化进修(RL)练习与推理、数据分析、智能体沙箱情况治理以及长高低文状况治理等关键义务。

在规格方面,Vera 基于英伟达自研的新一代 Arm 架构 Olympus 打造,集成 88 个自定义核心,并经由过程 NVIDIA Spatial Multi-Threading 实现 176 线程并行才能。 芯片供给 1.8 TB/s 的 NVLink-C2C 一致性内存互连带宽,最高支撑 1.5 TB 体系内存,是上一代 Grace 的 3 倍,同时借助 SoC 模组化 LPDDR5X 实现 1.2 TB/s 内存带宽,并支撑机架级机密计算才能。 英伟达声称,在数据处理、紧缩以及持续集成/持续交付(CI/CD)等关键义务上,Vera 比拟 Grace 可实现约 2 倍机能晋升,而在满载状况下的单核机能也晋升约 50%,并保持极高的机能功耗比。

英伟达副总裁(负责超大年夜范围与高机能计算营业)的 Ian Buck 亲自将首批 Vera CPU 机柜“送货上门”至四家核心伙伴,凸显这款产品在公司计谋构造中的重要性。 首站是位于旧金山 SoMa 区的 Anthropic 办公室,随后 Vera 机柜被送达 OpenAI 位于 Mission Bay 的总部,第三站则是 SpaceXAI 在帕洛阿尔托的办公室,埃隆·马斯克在现场接过了硬件。 在周一,Buck 又访问甲骨文的 AI 客户卓越中间(AI Customer Excellence Center),向 Oracle Cloud 交付了首批 Vera 机架,实现了 Vera 在四家行业领军企业中的“首轮落地”。

英伟达方面表示,今朝交付的这些机柜仅是将来几个季度大年夜量出货中的“小试牛刀”。 跟着 Agentic AI 概念升温,市场对 CPU 在智能体编排与推理侧的需求正在快速增长,而专为此类工作负载优化的 Vera 已经在行业内激发强烈兴趣。 就在上周,有消息称 CoreWeave、Meta 与阿里巴巴已经锁定 Vera 作为早期大年夜客户,而此次完成首批交付的甲骨文同样位列早期采取者之中。

得益于对 LPDDR5X 内存的周全采取,Vera 单平台最高可扩大至 1.5 TB 内存,这也意味着在大年夜范围安排后,全球 LPDDR5X DRAM 供给链将面对新一轮重要局面。 分析指出,在将来几年内,Rubin 与 Vera 的大年夜范围铺开可能会使数据中间对 LPDDR 系列内存的需求跨越智妙手机等传统花费类终端,从而重塑全部存储家当的产能分派格局。

在体系形态上,Vera 既会涌如今面向推理与 Agentic AI 的自力 LPX 办事器中,也将担当 Rubin NVL72 机柜中的主机处理器角色,为 GPU 集群供给高带宽、低延迟的数据与控制平面支撑。 英伟达称,经由过程 CPU 与 GPU 的深度协同设计,这一“极致协同(extreme co-design)平台”将大年夜幅晋升 Agentic AI 工作流的吞吐效力和资本应用率,让下一代智能系一切在推理速度、决定计划才能与能效之间取得新的均衡。

在产品路线图层面,Vera 不仅将作为自力 CPU 出货,还将成为英伟达下一代 Rubin 平台的核心构成部分。 Rubin 被定义为英伟达当前最先辈的 AI 平台之一,目标峰值算力可达 50 PFLOPS,合营 Vera CPU 可在体系级实现比 Blackwell 时代更高的整体机能晋升。 按筹划,搭载 Vera 的 Rubin 平台将在本周下半段启动面向 AI 客户的首批发货,首批机架的量产也即将开端。

跟着 Vera 正式进入量产阶段,而 Rubin 平台也即将在将来数月周全上线,英伟达在数据中间 CPU 与 AI 体系平台两个维度同时发力。 在 GPU 已经紧紧占据高端 AI 练习与推理市场主导地位的背景下,Vera 的推出被视为英伟达补齐“通用计算+智能体编排”短板、周全强攻 Agentic AI 时代的关键一步。

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部