11月
03日
Anthropic 论文证实大型语言模型具备自检能力 实验成功率近50%
牛透社 2025 年 11 月 3 日消息,Anthropic 公司发布《大型语言模型中涌现的自省意识》研究论文,该成果创新性运用”概念注入”技术,首次证实大型语言模型具备初阶自省能力。
实验显示 AI 可主动检测被植入的神经网络激活模式,成功率约 50%。Anthropic 公司专注于生成式人工智能与大语言模型研发,此次突破为 AI 认知边界研究提供新范式。
您投送的稿件违反了牛透社的投稿协议,现已关闭您的投稿功能,如有异议请发邮件至tougao@jinse.com进行申诉。