05月
29日
Resemble AI 开源 TTS 模型 Chatterbox 实现 63.75% 盲测偏好率,支持 5 秒语音克隆与 200 毫秒实时生成
牛透社 5 月 29 日消息,Resemble AI 发布开源 TTS 模型 Chatterbox,该产品具备基于 0.5B 参数的 LLaMA 架构、覆盖 50 万小时精选音频语料库的训练数据,支持零样本语音克隆(5 秒参考音频生成个性化声纹)、情感振幅控制及 200 毫秒超低延迟生成能力,并集成 Perth 神经水印技术。
Resemble AI 采用 MIT 开源协议,其盲测数据显示 63.75% 的受试者更青睐 Chatterbox 的语音效果。专业机构 AIbase 指出,该模型开源特性将加速 TTS 技术普及和创新。Resemble AI 同步推出企业级付费 TTS 服务,实施“开源筑基+商业赋能”双轨战略。