08月
30日
OpenAI 发布多模态语音模型 GPT-Realtime,推理准确率 82.8% 并实现成本优化 20%
牛透社 2025 年 8 月 29 日消息,OpenAI 发布多模态语音模型 GPT-Realtime,该产品具备强大推理能力(BigBenchAudio 基准测试准确率 82.8%)、图像输入支持及强化指令遵循功能(MultiChallenge 准确率提升至 30.5%),主要应用于生产级语音代理、教育课件解说和远程技术支持场景。
该模型集成 MCP 和 SIP 通信协议实现实时交互,通过端到端架构将音频处理成本降低 20%,OpenAI 同步下调 API 价格助力企业高效部署语音代理解决方案。