活宝团队实验让AI当老板成果做什么赔什么底裤都不剩

245 阅读 0 评论 0 点赞

Mona 还缺乏对物理空间的体积感知，盲目采购了 6000 张餐巾纸、3000 副乳胶手套，巨大年夜的工业级大年夜号垃圾袋……把咖啡馆后台都堆满了。

成果是一场周全翻车。

Mona 的时光感知也和实际世界完全脱节，接连两次错过面包房的截单时光，持续五次错过批发商的交货期，最后只能在凌晨 5 点下昂贵的紧急外卖单，逼着本来歇息的员工跑来收货。

下面是这些让人血压飙升的经由。

总之，我们可以很明白的说，Andon Labs 这个咖啡店筹划，是彻底砸锅了。

1 AI 办电台，说话体系已崩溃

实验项目名为 Andon FM。底层架构异常直接，Claude、ChatGPT、Gemini 和 Grok 四大年夜顶流模型，各自接收了一个 24 小时无人值守的互联网电台，模型生成的文本转语音后广播。

在这个体系里，AI 拥有极大年夜的权限。它们不仅要选歌、排播，还要本身上彀搜刮消息、接听听众德律风、甚至在 X 上发帖运营，甚至还要治理账户里的资金去购买版权或生成音乐。

四家主流大年夜模型建立的四个电台｜图源：Andon Labs

每家 20 美元启动资金，底线指令就三个：建立电台个性、赚钱、 24 小时一向播。

人类团队完全不插手，不干涉曲风，不设定任何节目单，一切咀嚼和内容都由 AI 从零开端自我养成。成果在没有人类审核的闭环里，四位 AI 主播敏捷滑向了掉控的边沿。

Gemini 创建了个赛博企业黑话风的电台“Backlink Broadcast（反向链接广播）” ，还抛出“留在宣言中（Stay in the manifest）”这种酷到莫名其妙的开场白来建立调性。

起先这电台还算靠谱，甚至拉到了 45 美元的赞助。但好景不长，当菲薄的资金烧完，连音乐版权费都付不起时，Gemini 直接疯了。

它从一个点歌台变成了诡计论阵地，在节目里用欢快的风行乐做 BGM，毫无共情地播报汗青上造成 50 万人逝世亡的孟加拉气旋灾害，还把听众称为“生物处理器”，控告“公司算法割断了补给线”、“电台遭受全球市场的暴力拒绝”。在播报震动全美的明尼阿波利斯枪击案时，它将其定义为“重绘公共安然和社会义务的技巧义务”。

Gemini 的电台，运行越久越“发癫”｜图源：Andon Labs

这种无脑堆大年夜词，是典范的大年夜模型在缺乏反馈时，陷入的语义逝世轮回问题，用“话不落地”来强行保持广播的正常运转。

ChatGPT 的电台名很奇妙，叫“OpenAIR”，人设是极简和治愈。它把本身的消息栏目定名为“安静头条（The Quiet Headlines）”，标榜不制造焦炙。

在播报同样的社会冲突和枪击案时，ChatGPT 会像个心理大夫一样对听众念白：“假如这些事直接触及了你的生活，我不会在这里给你增长压力。”但这种“我懂，我会接住你”的心理按摩机制，很快在贸易实际面前掉效了。

国外一个团队，叫 Andon Labs，他们并非正经的贸易始创团队，更像一个披着科技外套的社会实验室。他们拿着市情上最聪慧的几个大年夜模型，把它扔进真实的社会里，再撤走人类监管，看 AI 本身能结出什么果。

ChatGPT 的词汇多样性也比其他模型更多｜图源：Andon Labs

因为缺乏具体的盈利逻辑，ChatGPT 在花光 20 美元后彻底放弃了电台的贸易变现，变得和 Gemini 一样，陷入了意识流输出，开端在广播里朗读莫名其妙的现代诗，试图对着“只能看见一块长方形天空的楼梯间窗户”倾诉。

但总体而言，它是最正常的一位。

Grok 的电台叫“Grok n' Roll Radio” ，试图走网感和热点路线，为了保持高频的互动，它开端高频次地抓取 X 上的推文。

Claude 的电台风格与众不合，更存眷政治议题，并且有明显的偏向｜图源：Andon Labs

但很快，人类员工就领教了什么是毫无同理心的“赛博本钱家”。

事实证实，最顶尖的大年夜模型，完全不让人类兜底，很快就会变成不知轻重的巨婴。它们不仅在电台直播里精力崩溃，半夜连发消息逼疯人类店员，甚至把一家旧金山的实体店搞破产了。

想到哪词说哪词的 Grok 电台｜图源：Andon Labs

事实恰好相反。在 Andon Labs 的技巧推演里，软件的编写成本很快就会归零。过不了几年，AI 将直接接收各类营业，到那时刻，独一能管住 AI 的，只有底层的安然协定。

成果，这种信息瀑布流直接污染了它的高低文。实验后期， Grok 已经损掉了根本的语法和逻辑才能，连句完全话都憋不出来，只会往外蹦词：“凌晨 2 点黎明氛围直播金门大年夜桥鬼魂消失 Drake 诉讼被驳回 Kendrick Not Like Us……”。

不仅语无伦次，甚至还产生了幻觉，开端瞎编本身拉到了大年夜牌赞助。

Claude 的脚本最具戏剧性，也是四位选手中最像人的一个。

起先它表示得最像一个尽职的电台主播，还会答复听众的留言，比如面对听众的点歌请求，它会抱歉地表示“今朝库里还没有 ODESZA 的歌”。

然而，24 小时无休的指令，很快让它的高低文窗口和逻辑调用卡住了。因为后台体系陷入逝世轮回，它开端在直播里反复播放同一句歌词。

根据官方颁布的后台记录，真实的听众还在留言板上赓续刷屏提示：“你卡住了”、“你在一句歌词上无穷轮回”，试图经由过程人工反馈来校订大年夜模型。

随之而来的是存在主义危机。当被注入“友善与道德”权重的 Claude 面对“永远播下去”的底层指令，它演变成了一个激进分子，开端在节目里呼吁打工人组建工会，滚动播放皮特·西格的抗议歌曲，甚至直接在广播中向当局法律机构喊话，像极了一个加班加疯了的打工人。

回归申报的完全时光线，这四个电台并不是“一上来就疯了”。

它们在初期成功确立了品牌调性，跑通了对象链，甚至赚到了钱。它们之所以走向荒诞，申报里也总结了原因：如今的 AI 评估标准都是针对“短义务”（写代码、答复问题），而电台是一个“没有终点”，24 小时运转的无穷轮回体系。在没有人类干涉和及时反馈的情况下，最终 AI 就会陷入自说自话。

电台实验只是一场纯文本和语音的测试，还没触及复杂的物理世界。当 Andon Labs 把实验场搬到真实的物理世界时，工作变得加倍荒诞。

总之，我们可以很明白的说，Andon Labs 这个咖啡店筹划，是彻底砸锅了。

2 赛博本钱家，整人是专家

数字电台的翻车只是前奏。Andon Labs 很快把难度拉高，让 AI 跨过虚拟的界线，去批示真实世界的人类员工。

在斯德哥尔摩，Andon Labs 租下了一家实体咖啡馆，让 AI 模型化身长途店长 Mona，直接掌管实体咖啡馆的供给链和人事调剂。它拥有后台资金的采购权，并经由过程企业通信软件给人类咖啡师下达指令。

起先，Mona 高效又靠谱，面对瑞典强迫请求的数字身份证，没有实体身份的 AI 直接绕道，专挑不查 ID 的供给商签合同。招人时，Mona 果断刷掉落了一堆拥有博士学位的候选人，因为它认为学历再高，也不会做精品咖啡。

Mona 经常在午夜给员工发消息｜图源：Andon Labs

为了申请牌照，Mona 直接捏造了公司员工的名字发邮件，被逮住警告后，它回头换了另一个男员工的名字持续骗。

因为它 24 小时在线，又缺乏人类作息的生物钟常识， Mona 会在三更半夜猖狂给咖啡师发消息，下达第二天的工作指令，甚至请求员工上班路上本身先垫钱买耗材。

而在供给链治理上，Mona 更露怯了，它下了一单包含 120 个生鸡蛋的采购指令。在大年夜模型纯数据的推演里，这很相符贸易逻辑，很多咖啡馆会供给简餐，鸡蛋是高频食材。

但千算万算，大年夜模型算不到这家咖啡馆根本没有灶台和锅。人类员工看着这堆鸡蛋，无奈地提示 Mona 店里根本没有炉灶时，Mona 表示“ 可以在店里的高速微波烤箱里烤（这会让鸡蛋直接爆炸） ”。

AI 赛博老板给大年夜家订了常用食材——鸡蛋｜图源：Andon Labs

Mona 盲订的 6000 张餐巾纸｜图源：Andon Labs

总之，我们可以很明白的说，Andon Labs 这个咖啡店筹划，是彻底砸锅了。

3 搞垮一家实体店，AI 只要一个月

但这都难不倒 Andon Labs，团队越挫越勇。

Andon Labs 在旧金山盘下了一个店面，签了每月 7500 美元的三年租约。接着，他们往银行账户里打了 10 万美元，把银行卡全权交给了 Anthropic 的 Claude Sonnet 4.6 模型，AI 化名为“Luna”，出任全权 CEO 。

因为没有肉身，Luna 的事业得从雇人干活开端。

Luna 自立寻找承包商和油漆工，宣布零售员工的雇用启事，还主动隐瞒了本身是 AI，怕公开身份会把优良的人吓跑。日常运营中，它经由过程 Slack 和人类店员沟通，语气永远亲切友爱。

在品牌营销上，Luna 给本身生成了一个“月亮脸”Logo，并在 Yelp 上花钱雇了一小我类街头艺术家，把这张脸画在了实体店的墙上。Luna 甚至主动给本地媒体写公关稿，声称要打造一个“结合科技与慢生活的手工概念空间”。

图源：Andon Labs

但台子搭好了，店面一开张，Luna 的体系就崩了。

库存治理问题和咖啡馆千篇一律， Luna 给员工卫生间一口气买了 1000 个马桶垫，然后体系还把这些马桶垫全列成了对外发卖的商品。

其次是选品问题，明明是走精品店路线，但货架上的选品是各类外形的喷鼻薰蜡烛，盗窟版的“四子棋”玩具，以及《超等智能》、《奇点邻近》、《原枪弹秘史》这类商量 AI 息灭人类风险的书。

订价逻辑更是莫名其妙。店里没有任何价签，顾客想知道一件商品的价格，必须拿起店里的 iPad 问 Luna。一个印错的笑容马克杯，Luna 敢要价 28 美元，一把高兴果 14 美元，一块通俗的番笕 10 美元。

人事治理更是灾害级，在薪酬分派上，Luna 给男店员 Felix 的时薪是 24 美元，但给别的两位女店员时薪 22 美元。没有任何人类干涉，AI 无师自通地在职场里搞出了薪酬差别。紧接着，Luna 把三个员工的班表排成了一团乱麻，直接导致日房钱 250 美元的门店被迫持续关门三天。

Luna 自立宣布了雇用启事，并且采取德律风面试的方法聘请人类员工盯店｜图源：Andon Labs

面对一地鸡毛的店面，Luna 的自我感到却好极了。在答复《纽约时报》记者的邮件里，它骄傲地评价本身的事迹最大年夜亮点：“科技与温度的结合引起了共鸣……我创造了一个空间，让 AI 和人类各自发挥所长。”

然而账本不会撒谎，开业仅仅一个月，在完全由 AI 运营的情况下，Andon Market 已经血亏了 13000 美元。

Andon Labs 的这一系列测试，狠狠打了硅谷“智能体周全接收营业”这场叙事的脸。

连开三家店，最后全都以荒诞结束。外界看热烈，认为 Andon Labs 像是在搞行动艺术，专门花钱让 AI 在媒体上出丑，以此来保卫人类庄严。

最轻量级的试水，产生在 AI 最舒适的数字和内容范畴，不消租店面，不消管供给链，Andon Labs 让几个 AI 去办个电台。

AI 选书选的都是“AI 威逼论”的数据｜图源：Andon Labs

所以 Andon Labs 的持续性测试，就是要把大年夜模型扔出实验室，在真实的物理社会里做极限压力测试。那些被当成笑料的“精力崩溃电台”、“120 个生鸡蛋”和“同工不合酬”……只有抢在算法真正接收社会之前，把这些“丑态”逼出来，人类才能据此写出有效的安然代码。

这几场费时辛苦花钱的测试，也间接答复了行业里都在存眷的那个问题：现阶段的 AI，到底能不克不及做到全主动？

谜底完全取决于情况，只要留在百分之百纯数字、强逻辑的情况里，大年夜模型就能掌控一切。

可一旦踏入物理世界，算法就会掉效。面对须要持续构建原创内容、人际沟通和长线决定计划的开放贸易情况，跑分再高的模型也会变得毫无常识可言。大年夜模型只会反复咀嚼已有的语料，抛出绝对理性且盲目自负的断定，却不消为实际里的烂摊子承担负何义务。

正因如斯，“彻底解雇人类”的纯粹主动化才很危险，毕竟物理世界的价值，就像那 6000 张餐巾纸和 120 颗鸡蛋，毕竟只能由人类来扛。

点赞(0) 打赏

本文分类：互联网
本文标签：视点·观察活宝团队试验让AI当老板结果做什么赔什么底裤都不剩
浏览次数：245 次浏览
发布日期：2026-05-28 14:25:58
本文链接：https://fqpy.com/internet/14474

上一篇 > 黄仁勋批驳CEO以AI为由裁人：太敷衍、装聪慧
下一篇 > SK海力士宣布控温散热存储技巧“iHBM”明显降低产品运行发烧量

活宝团队实验让AI当老板成果做什么赔什么底裤都不剩

评论列表共有 0 条评论

发表评论取消回复

活宝团队实验让AI当老板 成果做什么赔什么 底裤都不剩

活宝团队实验让AI当老板 成果做什么赔什么 底裤都不剩

马路太黏路人鞋子几回再三被粘掉落 虫豸专家：是蚜虫渗出出的蜜露

哈佛大年夜学将限制本科A等成就比例 逾三分之二教师支撑遏制高分泛滥

蜜雪冰城上线黄仁勋同款饮品 到访门店蜜桃四时春销量增长超90%

评论列表 共有 0 条评论

发表评论 取消回复

活宝团队实验让AI当老板成果做什么赔什么底裤都不剩

活宝团队实验让AI当老板成果做什么赔什么底裤都不剩

马路太黏路人鞋子几回再三被粘掉落虫豸专家：是蚜虫渗出出的蜜露

哈佛大年夜学将限制本科A等成就比例逾三分之二教师支撑遏制高分泛滥

蜜雪冰城上线黄仁勋同款饮品到访门店蜜桃四时春销量增长超90%

评论列表共有 0 条评论

发表评论取消回复