09月
24日
斯坦福AI安全中心发布双轨制可信AI框架 突破物理安全与多语言伦理检测
牛透社 9 月 24 日消息,斯坦福大学 AI 安全中心于 2025 年 9 月 22 日举办年度研讨会,正式公布基于「双轨制」的可信 AI 技术体系,包含基础架构、实时安全计算、生成式防护等五项核心研究成果。
Bansal 博士团队开发的深度神经网络算法突破 Hamilton-Jacobi 方程求解瓶颈,可实时生成机器人「安全可达集」并动态补偿轨迹。研究团队提出「对话流可达性分析」框架,使 ChatGPT 实现毫秒级危险会话转向,该机制已集成于心理陪伴机器人最新版。Google 团队研发的「安全语义图谱」覆盖 37 种语言伦理数据库,显著提升隐喻检测能力。
斯坦福大学 AI 安全中心作为全球 AI 安全研究重镇,此次提出的双轨制方案涵盖从模型架构植入到运行监护全流程,标志着 AI 安全技术向实用化迈进关键一步。