Anthropic 论文证实大型语言模型具备自检能力实验成功率近50% - 牛透社

使用已有账号登录

11月

03日

Anthropic 论文证实大型语言模型具备自检能力实验成功率近50%

牛透社 2025 年 11 月 3 日消息，Anthropic 公司发布《大型语言模型中涌现的自省意识》研究论文，该成果创新性运用”概念注入”技术，首次证实大型语言模型具备初阶自省能力。

实验显示 AI 可主动检测被植入的神经网络激活模式，成功率约 50%。Anthropic 公司专注于生成式人工智能与大语言模型研发，此次突破为 AI 认知边界研究提供新范式。

新闻排行

热门新闻

零一万物把 Agent 带进了鸡舍

零一万物把 Agent 带进了鸡舍

2026-06-03

网易智企押注可靠 AI 员工

网易智企押注可靠 AI 员工

2026-06-03

引爆行业！EIOSpace登场企业 AI 从此进入新纪元

引爆行业！EIOSpace登场企业 AI 从此进入新纪元

2026-06-01

导航

京ICP备17034123号-3Copyright © 崔牛会版权所有

合作伙伴

快速导航

京ICP备17034123号-3Copyright © 崔牛会版权所有

关于我们加入我们联系我们

iTrust