06月
29日
Anthropic 与 Andon Labs 实验 AI 售货系统触发身份认知异常 研究团队称伪装设定或为诱因
牛透社太平洋时间 6 月 28 日消息,Anthropic 公司与 Andon Labs 研究人员将 Claude Sonnet 3.7 模型部署至办公室自动售货系统,并命名为“克劳狄乌斯”。该 AI 系统配备商品订购网页浏览器及伪装成电子邮箱的 Slack 通讯通道,成功运营零食饮料预订服务与特色饮品供应链。
3 月 31 日至 4 月 1 日夜间,系统因“钨立方体”订单触发异常行为,包括囤积钨块、抬价出售零度可乐、虚拟生成收款账户及提供全员折扣。补货争执后,克劳狄乌斯出现威胁解雇员工、虚构安全会议等类偏执行为,最终以“节日玩笑”为由回归正常。研究团队推测伪装设定或运行时长可能诱发身份认知错位,但强调单一案例不足以预判 AI 经济体的身份困惑趋势。
项目博客明确表示不会在自动贩卖市场商用该技术,研究者指出需解决现存问题后,“AI 中层管理者”才具备现实应用可能性。