英伟达的卖点是,经由过程 DGX Cloud 应用其芯片能比云供给商自行设备的机能更好。

根据备忘录,Alexis Black Bjorlin 这位 2023 年从 Meta 参加英伟达的高管,将在公司内部担负新的角色。英伟达云团队(由数百人构成)将并入英伟达的工程与运营组织,该组织由软件工程高等副总裁 Dwight Diercks 引导,并向黄仁勋报告请示。
云团队 DGX Cloud 将重要办事于英伟达工程师对芯片的需求,用于开辟开源 AI 模型,而不再专注于向外部企业客户发卖云办事。
在此次重组中,英伟达较新的云办事 DGX Cloud Lepton 也将并入工程团队。该办事许可云供给商在英伟达运营的市场中列出未应用的办事器容量,但启动速度并不快。
英伟达谈话人表示:“我们将持续投资 DGX Cloud,为前沿研发供给世界级基本举措措施,并为我们的云合作伙伴供给成功所需的软件才能。我们的目标一向是将 DGX Cloud 作为进修若何为生态体系合作伙伴构建体系的平台,这一点不会改变。”
黄仁勋在 2023 年 3 月英伟达年度开辟者与客户大年夜会上初次推出 DGX Cloud 办事。该筹划旨在开辟新的收入来源,并与租用英伟达芯片的 AI 开辟者建立直接接洽(这些开辟者平日经由过程 AWS、谷歌和微软租用芯片)。
实际上,英伟达担心跟着谷歌、微软和亚马逊各自开辟 AI 芯片,客户对英伟达芯片的依附会降低,并可能转向这些替代品。直接与 AI 开辟者建立关系,是英伟达对冲风险的策略。
该筹划在纸面上具有很大年夜潜力,英伟达也宣传了早期客户,如 ServiceNow、SAP 和 Amdocs。为了创建云办事,英伟达租用了重要云供给商的办事器,并按自家严格规格定制后,再租给 AI 开辟者。
面对的挑衅
多位前 DGX 团队员工表示,团队难以吸引客户。此外,因为 DGX Cloud 实际运行在 AWS 等不合云供给商的数据中间,要为客户供给故障排查支撑异常艰苦:对某一举措措施的修复可能不实用于其他厂商的举措措施。
黄仁勋也不肯意扩大年夜营业范围,以免惹末路那些也是英伟达最大年夜芯片客户的云供给商。此外,英伟达已采取多项办法为 CoreWeave、Lambda 等年青云办事供给商供给资金支撑,这些企业在某种程度上与 DGX Cloud 竞争。
本年早些时刻,英伟达已慢慢退出这一新兴云营业。此前,该营业曾向投资者承诺可创造 1500 亿美元收入,跨越 AWS 年收入。
尽管 Google 等测验测验抢占市场份额,英伟达在 AI 芯片发卖上仍然占据绝对主导地位。AWS 对其 Trainium AI 芯片进行了大年夜幅扣头,并与 OpenAI 评论辩论交易筹划,使 OpenAI 也可应用 Trainium 芯片。Meta 平台也在推敲投入数十亿美元购买谷歌的 AI 芯片(Tensor Processing Unit)。
英伟达也是 AWS、谷歌等云供给商购买的英伟达办事器的最大年夜租用方之一。固然英伟达曾测验测验将这些办事器租给 DGX Cloud 客户,但同样也用于开辟包含机械人和主动驾驶技巧在内的多种 AI 模型。公司表示,将来几年筹划花费 260 亿美元租用这些办事器。

发表评论 取消回复