09月
15日
小红书智创音频技术团队发布开源多语言对话合成模型 FireRedTTS – 2
牛透社 9 月 15 日消息,小红书智创音频技术团队发布新一代对话合成模型 FireRedTTS – 2,该产品具备双 Transformer 架构、单样本音色克隆及多语言低资源适配能力,主要应用于 AI 播客、虚拟助手等对话生成场景。
小红书智创音频技术团队专注语音合成技术研发,新模型通过离散语音编码器升级实现了自然度与效率双提升,支持中、英、日、韩、法五国语言,其技术报告已在 arXiv 预印本平台开源。