09月

04日

  • Meta AI 联合 UCSD 发布深度信心推理技术,大模型推理算力成本最高降低 85%

    牛透社 9 月 4 日消息,Meta AI 与加州大学圣地亚哥分校(UCSD)联合发布革新性技术「深度信心推理(DeepConf)」,该产品具备置信度驱动的动态优化路径与四大微观置信度指标体系,主要应用于大语言模型(LLM)复杂推理任务的算力成本优化。

    技术验证显示:离线集约模式在 GPT – OSS – 120B 模型上实现 99.9% 准确率,节省 84.7% 算力开销;在线截断模式使 DeepSeek – 8B 任务精准度提升 5.8%,减少 77.9% token 生成量。企业级部署方案包含安全优先模式(算力节省 50%)和效率优先模式(token 消耗锐减 70 – 85%),适配金融、法律与知识检索场景。

意见反馈
返回顶部