这不是简单的产品之争。
一句“帮我比价下单”,手机页面开端主动跳转、辨认界面、点击按钮、领券、结算,全程不依附任何官方接口。豆包手机助手走的是典范的 GUI Agent 路线——让 AI 看懂手机界面,直接模仿用户在 GUI(图形用户界面)长进行操作。
类似的还有被亚马逊严肃警告的 Comet AI(有名 AI 搜刮始创公司 Perplexity 旗下),尚且照样在相对开放的 Web 世界,而豆包手机助手面对的则是巨擘林立的 App 世界。

Perplexity 对亚马逊的回应,图片来源:Perplexity
关键在于,全部互联网生态都还没有预备好承接 GUI Agent 对体系权限、平台秩序和安然界线的“蛮横冲击”。
相较之下,基于 MCP(Model Context Protocol,大年夜模型高低文协定)的 Agent 模式,固然也弗成能从解决 AI 时代的所有平台抵触,却给出了一条“通往共赢之路”。
就在 12 月 10 日,Anthropic(开辟了 Claude)宣布将 MCP 正式捐赠给新成立 Agentic AI(智能体 AI)基金会,由 Linux 基金会同一托管。假如说 GUI Agent 依旧沿用的是“AI 模仿人类点手机”的旧逻辑,那么 MCP 测验测验答复的是:
智能体时代的互联网,必须拥有一套属于 AI 的开放互联协定。
从小众到共鸣,“真·AI 互联网协定”来了
MCP 协定不是一个新的概念。本年 4 月接收财联社采访时,阿里云智能集团资深副总裁刘伟光就表示,MCP 是今天公认的业界标准:
“在 MCP 之前有很多人测验测验过函数调用、提示词工程、插件等方法,今天 MCP 经由过程同一标准接口,类似于今天电脑手机傍边看到 USB-C 接口,如许一种标准接口降低大年夜模型和外部体系的集成门槛。”
毫无疑问的是,在 Anthropic 正式捐赠之前,MCP 协定其实就初步成为了一种“事实标准”。
最开端,MCP 只是 Anthropic 工程师为 Claude 做的一个“同一对象接入规范”。为懂得决大年夜模型在调用外部对象、读取本地数据时必须反复编写适配代码的问题。开辟者只要遵守 MCP 这一套 JSON-RPC 协定,就能用一个同一方法把文件体系、数据库、营业对象接入 Claude。

一种形象的解释,图片来源:Norah Sakal
简单、直接、可复用,是 MCP 在早期被工程师口口相传的原因。可从 2024 年中开端,这套规范开端在行业内敏捷伸展:
- VS Code、Cursor、Windsurf 等新一代开辟情况集成 MCP;
- OpenAI 在官方文档里将 MCP 视作首选扩大路径;
- Google 的部分内部 Agent 对象链也开端基于 MCP ;
- 阿里、字节、腾讯的工程团队也在项目顶用 MCP 作为 AI 体系的互联方法;
- ……
到了 2025 年,“支撑 MCP”已经成为 Agent 类产品的标配。事实标准,就是在这种群体无意识的默契中天然形成的。
以前二十年,互联网的运行依附 HTTP、TCP/IP、OAuth 这些共鸣。而智能体要想在手机、PC、云办事甚至企业体系间自由地交换信息、调用对象,也必须拥有本身的“协定层”。今天来看,MCP 就是今朝的最佳谜底。
尽管 MCP 早已开源,但协定被捐赠给 Linux 基金会(今朝全球最负盛名的开源基金会),更意味着 MCP 不再属于某家公司,而是像 Linux、Kubernetes、OpenAPI 等开源项目进入更中立的治理体系。
AI 的世界,须要一套不依附任何巨擘、可被所有模型与平台合营遵守的底层协定。这大年夜概就是此次 MCP 捐赠发出的一个强烈旌旗灯号。
另一方面,Agentic AI 基金会的“开山项目”其实不只是 MCP,还有 OpenAI 捐赠的 AGNTS.md ——网站和应用给 Agent 写“应用解释”的标准,以及 Google 捐赠的 Block——构建智能体和工作流的框架。
此外,Google 随后也推出了自家完全托管的长途 MCP 办事器,可以将智能体 AI 更轻松地接入 Google 及其云端办事(如地图、BigQuery 等),直接调用如 Google 地图的真实数据和对象。而本年更早时刻,阿里云百炼平台其实就已经推出了全生命周期的 MCP 办事,包含 MCP 办事器。

比如高德 MCP 办事器,图片来源:高德地图
今天不是某一家押注 MCP,而是全部 AI 行业在“底层连接方法”上形成了广泛共鸣:将来的 AI 体验不会只依附某个模型,而是依附一种可互操作、可治理、可跨平台流动的说话。
从这个角度,MCP 则是那个“被选召的孩子”。
幻想情况下,将来智能体 AI 不消假装成人类点击网页,而可以直接、合法地“帮用户比价下单”,平台也能保存监管与办事才能。不过,基于 GUI 的 Agent 是不是作为一种过渡手段就要走入汗青?生怕也不然。
GUI 走不通的路,只能交给 MCP
上月初,雷科技报道了《亚马逊警告 Perplexity,智能体与互联网平台终于一战?》,Comet AI 经由过程爬取商品页、解析页面,把“购买建议”“价格趋势”“商品筛选”直接出现给用户,绕过了在线购物平台的推荐体系和告白链路,也引起了亚马逊的强烈否决。
本月初,雷科技也报道了《豆包手机助手调剂权限!AI 手机是洪水,但不是猛兽?》,豆包手机助手在 GUI 层履行的 App 操作激发了更大年夜程度的争议。

写在最后
要懂得这种冲突,起首必须懂得从智谱 AutoGLM 到 Comet、豆包手机助手,为什么都要基于 GUI 路线?
核心不难解得:互联网并没有预备好拥抱智能体 AI。
MCP 固然已经初步获得了各大年夜 AI 公司的承认,但全部互联网生态还有太多功课要补,而基于 GUI 的通用筹划则是早期阶段独一能大年夜范围跑起来的方法——不依附平台合营,不等待改革,只要有效户界面就能“操作”。
但正因为它“无所不通”,实际中的抵触也来得同样敏捷。基于GUI 交互的智能体 AI 跳过了产品逻辑、贸易链路和风控体系,让平台无法控制智能体 AI 在什么场景、以什么方法与用户数据和关键操作产生关系,一旦出现误操作,义务界线急速模糊。
就在豆包手机助手激发争议的同时,工信手部属中国信通院也牵头宣布了《端云协同智能体交互双重授权安然指引》,重点提到了“构建由用户和应用双重授权的安然机制”,明白智能体 AI“需同时获得应用授权与用户授权,才能合法拜访第三方应用”。

事实上,这种抵触也不是这两个月才有的。微信很早就旗号光鲜地否决 GUI 路线,早在 3 月就有网友发明光荣 YOYO 智能体无法再“操作”微信,华为、vivo、魅族等其他手机厂商的“智能体 AI”也不例外。
图片来源:中国互联网协会
不是豆包手机助手“太激进”,而是 GUI 路线与平台生态天然难以经久共存。一个耐人寻味的例子是,客岁 10 月最早基于 Claude 推出“Computer Use”(同样基于 GUI 路线)的 Anthropic,在 MCP 之后根本放弃了这条路线的对外更新。

图片来源:Youtube
在宣传时还有微信,图片来源:光荣
而与 GUI 试图“模仿用户”不合,MCP 试图为智能体 AI 建立一条“正式进口”,让平台第一次可以把与智能体 AI 互动的界线显性化:哪些才能可读、哪些操作必须二次确认、哪些营业永远不开放,都可以在协定层直接写清楚。
更重要的是,MCP 将智能体与体系之间的关系,从“依附 UI”晋升为“依附才能”。比如 GUI 路线下“查订单”,须要打开 App 读取界面、解析文本、定位按钮,再经由多次操作才能知道;但在 MCP 模式下,可能只是一次明白的才能请求:查询、返回、处理。
当然,MCP 意味着全部互联网生态须要经历“一场漫长的改革”,也意味着基于 GUI 路线的智能体 AI 的体验弗成能完全放弃。
接下来很可能不会是二者的简单弃取。
GUI 会持续作为“兜底”,让智能体在未改革完的旧世界里持续前行;MCP 则会成为跨体系、跨平台的底层互联方法,为智能体建立清楚的权限、界线与秩序。
而在这两者之上,终端设备上新的体系级智能体能懂得用户的目标,调和设备、平台与办事,并在平台规矩之内完成跨生态、跨智能体义务。简言之:
OS 供给同一智能体进口和权限治理,MCP 等协定负责和各家办事沟通,Qwen、Gemini、GPT 之类模型可以被插拔,变成“换大年夜脑但不拆线管”的状况。
这可能才是智能体 AI 的终局。

发表评论 取消回复