10月
22日
百度文心 X1.1 以 75.51 分登顶 SuperCLUE-CPIF 大模型测评
牛透社 10 月 22 日消息,百度文心 X1.1 在最新中文精准指令遵循测评基准 SuperCLUE-CPIF 中以 75.51 分夺得国内大模型榜首。
该测评涵盖 GPT-5 (high)、DeepSeek-V3.2-Exp-Thinking 等 10 余个国际大模型,着重评估中文复杂指令场景的解析能力。文心 X1.1 基于文心大模型 4.5 架构开发,事实准确性提升 34.8%,指令遵循度优化 12.5%,智能体交互性能增强 9.6%。其多模态融合能力在共享单车客服等场景实现闭环智能化处理。
百度通过「芯片-框架-模型-应用」全栈技术生态深化产业落地,业界认为此举标志我国在 AGI 领域建立自主技术路径。