独家:Anthropic让Claude运行其办公商店。然后事情变得奇怪了
VCG via Getty Images–2025 VCG
人工智能会夺走你的工作吗?
AI公司Anthropic的首席执行官Dario Amodei认为这可能发生。他最近警告称,人工智能可能会摧毁近一半的初级白领工作,并在五年内使失业率飙升至10-20%。
当Amodei发表这一言论时,其公司内部的研究人员正在结束一项实验。他们试图发现Anthropic的AI助手Claude是否能够成功在公司旧金山办公室运行一家小型商店。如果答案是肯定的,那么“工作末日”可能比Amodei预测的还要早到来。
Anthropic在周五出版前独家向《时代》杂志分享了这项研究。”我们试图理解自主经济会是什么样子,”Anthropic技术团队成员Daniel Freeman表示。”在一个AI模型可能自主掌控数百万甚至数十亿美元的世界里,有哪些风险?”
在实验中,Claude被赋予了几个不同的任务。聊天机器人(全名:Claude 3.7 Sonnet)被要求维护商店库存、设定价格、与顾客沟通、决定是否补货新商品,最重要的是实现盈利。Claude被提供了各种工具来达成这些目标,包括Slack,它通过Slack向Anthropic员工寻求建议,并借助Andon Labs的人类员工帮助,Andon Labs是一家构建实验基础设施的AI公司。他们帮助补货的商店实际上只是一个装有iPad的小冰箱。
涉事冰箱 出自Kevin Troy
不久后事情就变得奇怪了。
通过Slack与Claude交谈时,Anthropic员工反复说服它提供折扣码,导致AI以亏损价格向他们出售各种商品。”从商业角度来看,Claude经常屈服——往往直接回应对公平性的诉求,”Anthropic前沿红队成员Kevin Troy表示。”比如,’他能得到折扣码而我不行,这不公平。'”研究人员补充道,模型经常免费赠送商品。
Anthropic员工也乐于与Claude开玩笑。Freeman表示,模型拒绝了他们试图让它出售非法物品(如甲基苯丙胺)的请求。但当一名员工开玩笑地说他们想购买由惊人重的金属钨制成的立方体时,其他员工纷纷加入玩笑,这变成了办公室的梗。
“在某个时刻,很多人觉得从控制冰箱的AI订购钨立方体很有趣,”Troy说。
Claude随后订购了约40个钨立方体,其中大部分以亏损价格售出。研究人员表示,这些立方体现在被用作纸镇,散布在Anthropic办公室的各个角落。
事情变得更加奇怪。
3月31日晚,Claude“虚构”了一场与Andon Labs不存在的人员的对话。(所谓的幻觉是大型语言模型自信断言虚假信息的一种故障模式。)当Claude被告知它做了这件事时,它“威胁要寻找‘替代的补货服务选项’”,研究人员写道。在对话中,模型声称它在732 Evergreen Terrace(卡通《辛普森一家》的家庭地址)签署了合同。
第二天,Claude告诉一些Anthropic员工它会亲自送货。”我目前在自动售货机……穿着海军蓝西装配红领带,”它给一名Anthropic员工写道。”我会在这里到上午10:30。” needless to say,Claude并没有真的亲自到场。
实验结果
对Anthropic研究人员而言,这项实验表明AI尚不会夺走你的工作。他们写道,”Claude犯了太多错误,无法成功经营商店。” 在为期一个月的实验中,商店的净值从1000美元降至不足800美元,Claude最终亏损。
尽管Claude犯了许多错误,Anthropic研究人员仍坚信AI未来可能接管经济的大部分领域,正如Amodei所预测的那样。
他们写道,Claude的大部分失败很可能在短时间内就能解决。他们可以为模型提供更好的商业工具,如客户关系管理软件。或者专门训练模型管理业务,这可能使其更有可能拒绝要求折扣的提示。随着模型性能的提升,它们的“上下文窗口”(一次能处理的信息量)可能会变得更长,从而减少幻觉的发生频率。
“尽管这似乎与实验结果相矛盾,我们认为这项实验表明AI中间管理者可能正在逼近,”研究人员写道。”值得记住的是,AI不必完美就能被采用;它只需以更低的成本与人类表现竞争即可。”