07月
20日
英伟达发布 Canary-Qwen-2.5B 语音模型,5.63% 词错率破 OpenASR 纪录
牛透社 2025 年 7 月 18 日消息,英伟达发布突破性混合模型 Canary-Qwen-2.5B,该产品以 5.63% 词错率登顶 Hugging Face OpenASR 排行榜,采用 CC-BY 开源协议并具备商业化能力。
模型通过整合语音转录与语言理解功能革新传统 ASR 系统,搭载 25 亿参数架构并基于 234,000 小时多领域英语语音数据训练,RTFx 处理速度达 418。双组件架构包含 FastConformer 编码器与 Qwen3-1.7B LLM 解码器,支持企业级语音转录、音视频知识库构建等场景,深度优化适配英伟达全系列 GPU 并兼容多设备部署。