10月
15日
巨人网络AI实验室联合清华SATLab开源全球首个多方言语音合成框架DiaMoE-TTS
牛透社 10 月 15 日消息,巨人网络人工智能实验室与清华大学电子工程系语音合成与处理实验室(SATLab)联合发布全球首个基于混合专家架构的多方言语音合成大模型框架 DiaMoE-TTS,并宣布全面开源其数据、代码及方法论。
该框架突破当前方言语音合成领域的数据依赖瓶颈,基于国际音标(IPA)构建跨方言音系标准化体系,在未使用专有数据情况下达到工业级 TTS 模型水平。其验证涵盖英语、法语及中文广东话、四川话等 7 种语言/方言,实证系统多语种扩展能力。巨人网络 AI 实验室聚焦语音合成技术创新,清华大学 SATLab 长期深耕语音处理领域研究。