12月18日,上海世博中间,火山引擎原动力大年夜会现场人山人海。
谭待表示,截至本年12月,豆包大年夜模型日均Tokens应用量已冲破50万亿,居中国第一、全球第三;跨越100家企业在火山引擎上累计Tokens应用量跨越一万亿。
大年夜会宣布的豆包大年夜模型1.8、豆包视频生成模型Seedance 1.5 pro等一系列模型,一如既往,不负浩瀚不雅众的等待。
一位火山引擎人士向雷峰网泄漏,在火山引擎内部,To B和To C底层的基本模型是一套,这在内部被称为基模共建。也就是说,在C端体验比较好的产品,B端用户也可以或许直接应用,这进一步晋升了火山引擎B端用户的体验感。
作为云计算范畴的后来者,火山引擎正乘着大年夜模型,成为行业弗成忽视的角色。在这背后,火山引擎都做对了什么?
AI云时代,Tokens 调用量正成为核心度量标准
大年夜模型海潮来袭两年,MaaS正成为云厂商争夺的核心市场,是新的基本举措措施。而Tokens,更是成为衡量大年夜模型家当落地的关键标尺。
在Force原动力大年夜会上,谭待坦言:“每一次Force大年夜会,我们都邑来颁布豆包大年夜模型日均tokens的数据。因为模型只有在被调用的时刻才能发挥价值,越有价值的模型调用的次数也就越多。”
Tokens的消费往往真实反应企业在产品落地过程中实际应用量。换言之,MaaS时代,Tokens的消费更能反应一家云计算厂商在市场的占领率。
以前,人们提到云计算无外乎IaaS、PaaS、SaaS,立异几乎停止,根本没有颠覆性进级,集中于优化成本,以更高效、更弹性、更经济的方法经由过程互联网交付。
2023年,以ChatGPT为代表的大年夜说话模型带来了生成式AI的革命,为云计算的进级带来全新的驱动力。
练习和运行大年夜模型须要前所未有的海量算力,直接刺激了云基本举措措施的进级需求,云的核心价值从“供给计算资本”改变为 “供给智能才能” 。
在MaaS的办事下,用户不再须要从零开端练习模型的天价成本。换言之,用户无需从零开端练习天价成本的模型。
AI不再只是云上的一种办事,而成为了云平台的“大年夜脑”和“新操作体系”,MaaS(模型即办事)的火热成为AI云时代的标记特点。
所谓MaaS,是指云计算厂商将本身练习好的、或从合作伙伴获得的大年夜模型,经由过程API、精调对象、安排平台等情势,供给给企业和开辟者直接调用。
比如,火山引擎的火山方舟平台、阿里云的灵积平台、百度的文心千帆,都是MaaS平台的代表。
作为火山引擎在AI时代的计谋构造,早在2023年,火山引擎就推出火山方舟一站式大年夜模型办事平台,办事涵盖汽车
、智能终端、金融等范畴。尤其是,在汽车、智能终端等范畴,火山方舟的客户已经涵盖90%以上的企业。
一年前的Force大年夜会,火山引擎提出「AI 云原生」概念。与此前行业常说的「云原生+AI」不合,「AI 云原生」加倍强调模型的主导性,将模型作为智能体临盆流程的驱动力。
2025年2月,火山引擎进一步明白,AI云原生的核心是“以模型为中间”。12月18日的Force原动力大年夜会上,谭待表示,我们须要一个全新的面向Agent来设计的新架构。这个技巧架构就是火山引擎一向在倡导的AI云原生架构。在这个架构里,模型是软件的核心,MaaS则是应用模型的最佳方法。经由过程模型和MaaS,火山引擎将算力以tokens的方法转化为了智能。
大年夜模型的出现,将云计算从 “临盆力对象”的云,进级为 “创造力引擎”的云。云计算的竞争,从以前 “资本的战斗” ,演变成为AI时代 “智能的战斗”。
对开辟者而言,他们不再直接操作底层举措措施,而是经由过程API调用强大年夜的模型才能。也是以,企业与开辟者在全部用云过程中消费的Tokens数量,成为反应最终的办事交付量。换言之,在AI云原生的新形态时代,云计算最终是算力换智能的Tokens办事交付。
就像工业时代用“千瓦时”度量电力消费,互联网时代用“GB”度量数据流量一样,AI时代,“Token”将成为度量模型工作量关键指标,成为重要的计费和资本度量单位,精确反应Agent和模型的应用成本,并向用户输送智能。一个行业的Tokens调用量越多,解释这个行业的AI落地过程越快。
谭待表示,回想汗青,我们如今正处在从PC、移动到AI这三个时代的变更之中。PC时代,技巧主体是Web和网站;移动时代则是APP,AI的主体就是Agent。Agent可以或许自立感知筹划和履行,完成复杂义务,软件也在汗青上第一次从被动的对象变成主动的履行者。
不合于传统云计算时代的IaaS、PaaS、SaaS如许的分层筹划IT架构,在AI时代,如许的体系不再完全,我们须要一个全新的面向Agent来设计的新架构。这就是火山引擎一向在倡导的AI云原生架构,在AI云原生架构中,模型是软件的核心,MaaS则是应用模型的最佳方法。经由过程模型和MaaS我们将算力以tokens的方法转化为了智能。同时环绕Agent开辟和Agent运营,云平台和中心件进一步把Tokens组装成Agents,并实现Agent和现有工作流、Agent和Agent之间的智能互通。
为此,火山引擎进级了AI云原生全栈办事:MaaS办事上,推出企业自有模型的推理代工办事、强化进修平台;面向Agent开辟,宣布企业级AI Agent平台AgentKit;面向Agent运营,宣布HiAgent“1+N+X”智能体工作站,让Agent实现大年夜范围落地。
火山引擎Tokens 流向全景: MaaS 的家当落地矩阵
以Tokens调用量来看,最早押中MaaS的云厂商之一,火山引擎,是当下毫无疑问的Top级。
数据显示,2025年上半年,火山引擎MaaS调用Token量占全部中国公有云市场49.2%,与2024年的46.4%比拟,火山引擎的市场份额还在持续上升。
如斯大年夜范围的调用量背后,是火山引擎依托豆包大年夜模型以及火山方舟,为用户供给越来越便利的模型调用平台。
Gartner®宣布的2025年度全球《AI应用开辟平台魔力象限》(下称申报)显示,凭借豆包大年夜模型和火山方舟大年夜模型办事平台 ,火山引擎领跑全球“挑衅者”象限。
这是 Gartner 初次评估全球 AI 应用开辟平台,标记住MaaS市场逐渐走向成熟。Gartner 指出,AI 应用开辟平台供给了须要的对象集,稍有计算机常识的企业开辟者即可借助该平台构建 AI 助手、Agent 和多模态应用。
作为AI云时代的尖兵,火山引擎早在2024年5月便推出AI应用开辟平台——扣子专业版,其低门槛、个性化、及时性、多模态等优势,受到不少传统企业的赞誉。
彼时,雷峰网("大众,"号:雷峰网)在《闷声疾走一年,字节大年夜模型的进阶之路》就曾写道,招商银行搭建“掌上生活”bot,海底捞搭建顾客评价分析模型等应用火山方舟扣子平台的优良案例。
跟着助手类应用、多模态应用逐渐迈向 Agentic AI,火山方舟作为 MaaS 平台环绕“有好模型”到“用好模型”,推出了一系列框架、对象、产品,支撑AI应用更易落地。
本年以来,火山引擎多次进级旗下 AI 云原生套件,优化了从练习、推理到 Agent 开辟的 AI 云原生基本举措措施及解决筹划全链路,赞助企业高效构建模型应用和 Agent。
品德生活购物社区平台得物,经由过程与火山引擎合作,引入火山引擎 Data Agent,优先聚焦“智能看板”和“归因决定计划”两个场景,慢慢实现财务治理场景的 Data Agent(数据智能体)智能进级。
基于两边合作,得物的财务治理效力获得极大年夜晋升,特别是在智能看板搭建和归因决定计划等方面。据得物财务相干负责人介绍,今朝财务团队的工作效力获得了大年夜幅晋升,财务人员手工处理基本工作的耗时缩短了60%阁下。此外,经由过程流程优化与对象进级,得物将数据等待与处理所需的时光缩短70%。
12月18日大年夜会上,火山引擎HiAgent宣布的下一代企业 AI 员工协同进口——AgentSphere(Preview版),为企业打造同一的AI义务调剂进口。AgentSphere还支撑纳管各类三方Agent,企业经由过程Coze、Dify或者高代码搭建的Agent都可以经由过程A2A协定接入,便利企业员工按需选用、高效办公。
IDC《中国大年夜模型公有云办事市场分析,2025H1》调研申报显示,2025年上半年,中国公有云上大年夜模型调用量达 536.7 万亿 Tokens, 较2024 年全年 114 万亿 Tokens 的总量范围增长近 400%。
AI科技评论留意到,同济大年夜学经由过程分山引擎HiAgent平台办事了27000多名在校师生,学生们已经创造了14000多个智能体。跟着HiAgent的进级,信赖AgentSphere(Preview版)会受到越来越多用户的迎接。
在MaaS的家当化落地上,火山引擎的合作客户已经涵盖金融、教导、手机、汽车等常见行业。
并且,以上数据的统计口径不包含自有营业,而是以云厂商对外部客户供给的办事的Token 量为准。
教导方面,火山引擎与北京大年夜学、浙江大年夜学、南开大年夜学等超七成985高校杀青合作,经由过程“模型+平台+解决筹划”的模式,为教导科研客户供给全方位的支撑。
在汽车范畴,火山引擎的合作客户更是覆盖超九成主流车企,包含奔驰、宝马、上汽、特斯拉、比亚迪等,覆盖汽车云、智能座舱、企业应用、汽车出海、具身智能等全流程场景。
三个月前,上汽荣威M7 DMH于9月17日正式上市,全球首发搭载了“豆包·深度思虑模型”,旨在打造一个真正“会深度思虑的AI智舱”。
一位火山引擎人士告诉我们,上汽与豆包的这一项目,实际交付异常快,仅三个多月的时光。据他介绍,一般而言,汽车项目作为To B范畴的交付项目,审核比一些C端应用复杂的多,至少须要6个月以上的周期。
上汽与豆包深度思虑模型的合作进展之所以能这么快,很大年夜程度上也是基于火山引擎此前的深度积聚。
近期,火山引擎与特斯拉的合作受到不少存眷。在2025 年 8 月宣布的全新 Model Y L(六座旗舰 SUV),豆包大年夜模型与 DeepSeek 模型同时经由过程分山引擎 API 实现车机集成。
一位行业人士分析,作为一家异常技巧流的公司,特斯拉的选择或也更为简单。无他,优胜的体验,极致的响应。
特斯拉所以选择火山引擎,与火山的积聚,以及在C端和B端兼具口碑都不无关系,这也表现出特斯拉对火山引擎交互团队专业本质和产品理念的承认。
同时,火山引擎的MaaS平台火山方舟,充分尊敬用户需求,对DeepSeek等大年夜模型产品也异常开放。相干的客户也可以或许经由过程分山方舟调用其他大年夜模型的API接口。
AI 时代,火山引擎凭什么压中 MaaS 机会
一年多以前,火山引擎初次正式对外宣布豆包大年夜模型家族。
彼时,我们在现场就见证了一场小小的「字节式」震动。尽管此前不少圈内人已经听闻字节的大年夜模型或立异低价格,但当彼时火山引擎正式对外宣布价格时,照样令人大年夜吃一惊。
2025年,AI Agent成为大年夜众词汇,受到越来越多存眷。
就当时而言,豆包大年夜模型应用价格低于同业95%以上,快速将模型Token应用价格带入厘时代。很多人认为,这是豆包大年夜模型在“以吃亏换市场”。
彼时,在会后的媒体采访中,火山引擎总裁谭待表示:“用吃亏换收入是弗成持续的,我们从来不走这条门路。敢于订价这么低,是因为我们对优化推理成本的技巧才能很有信念。”
在谭待看来,起首是,字节能做到如许的价格成本;其次是,行业须要这么做,应用的普及须要低成本,只有如许,更多企业才敢于测验测验参加大年夜模型应用。
以此为始,各家公有云厂商都开端在比拼办事的同时,供给相对普惠的成本。越来越多的企业开端在临盆制造场景中应用AI,大年夜模型落地不再遥弗成及,而火山引擎天然成为个中最大年夜的「供给商」。截至2025年12月,豆包大年夜模型日均处理50万亿 Tokens。
12月18日Force原动力大年夜会上,火山引擎进一步立异模型订价模式,推出“AI节俭筹划”,这是业内首个大年夜模型节俭筹划,覆盖火山引擎上所有的按量后付大年夜模型产品,包含豆包大年夜模型家族、各类三方开源模型。AI科技评论获悉,该筹划还设置了阶梯式扣头,用量越多免得越多,最高可节俭 47% 的应用成本。
金融方面,火山引擎已经办事中信证券、国泰海通、华泰证券等8成头部券商,招商银行、平易近生银行等8成体系重要性银行,供给营销、投研、信贷等智能体扶植筹划。经由过程“技巧支撑+场景共建”的模式,火山引擎为跨越200家金融机构供给了技巧支撑与立异解决筹划。
2025年,AI Agent大年夜面积爆发,但从Demo走向大年夜范围落地,仍面对成本、技巧、落地等挑衅,火山引擎为用户打造的一整套AI云原生“新底座”,打破智能体范围化落地的壁垒,让Agent真正走入企业日常临盆体系。
值得一提的是,火山引擎新带来的豆包助手API已经上岸火山方舟,供给豆包App的日常沟通、深度沟通、联网搜刮、边想边搜等文本才能,将来还将陆续开放多模态懂得、深刻研究、内容创作、视频通话等才能,经由过程API让企业开箱即用。火山引擎欲望经由过程豆包助手API可以或许进一步降低AI的立异门槛,可以或许激发更多企业的立异性,为企业打造本身的专属豆包。
移动互联网时代,字节跳动的C端产品几乎所向披靡。五年前,字节跳动决定自建基本举措措施,个中最重要的云底层技巧。
当时,与之伴随的是,OpenAI在2020年前宣布了 ChatGPT3 大年夜说话模型,在AI行业内已经受到颇多存眷。两年多后,ChatGPT3.5宣布,带动了生成式AI的快速成长。
在公有云范畴,MaaS成为将来弗成或缺的主流。依托字节积聚的技巧,火山引擎成为这个时代的新秀。
这种才能,起首表如今字节内部产品上。就字节全部集团而言,火山引擎同时也是对内赋能的,包含豆包、抖音的AI功能等一系列产品交互背后,也有火山引擎的支撑。从C端角度来看,字节的豆包已经取得不错的口碑和用户量,稳稳占据行业第一的地位。
QuestMobile数据显示,三季度,通用AI助手赛道出现出清楚的“一超多强”格局,个中豆包月活环比增长22.2%至1.59亿。
手机等智能终端方面,火山引擎已与全球Top 10手机厂商中的9家建立了深度合作,成为OPPO、vivo、小米等一线手机厂商的首选AI合作伙伴,覆盖跨越5亿台终端设备。
从C端出发,火山引擎天然也能为B端用户带来相对更好的办事。
当然,这绝非意味着,字节的豆包大年夜模型不如其他竞品。相反,赓续增多的日均tokens调用量,就是最好的例证。纵不雅近两年,豆包大年夜模型的迭代进级有目共睹,C端用户的应用数据则是更直接的反馈。只是,不合企业固然会有其自身的一些考量,火山也充分尊敬用户,供给不合的选择。
大年夜模型的迭代仍然处在快速进级中,对果断MaaS路线,存眷tokens指标的火山引擎而言,最好的增长机会或许才方才开端。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复