07月
04日
法国 AI 实验室 Kyutai 开源高性能 TTS 模型,支持流式处理与双语言高保真合成
牛透社 7 月 4 日消息,法国人工智能实验室 Kyutai 开源新一代文本转语音模型 Kyutai TTS,该产品具备流式处理架构(支持 L40S GPU 并行处理 32 个请求/响应延迟 350 毫秒)、双语言高保真输出(英语词错误率 2.82%/法语 3.29%、说话者相似度英语 77.1%/法语 78.7%)及开源生态建设能力,主要应用于虚拟助手、实时字幕生成、在线教育和媒体制作等场景。
Kyutai 作为专注于语音合成技术的人工智能实验室,通过 CC – BY – 4.0 开源协议开放 Kyutai TTS 代码,支持开发者进行模型优化与多语言边界拓展,其流式架构与工业级性能指标已为跨语言人机交互场景提供底层技术支持。