Resemble AI 开源 TTS 模型 Chatterbox 实现 63.75% 盲测偏好率，支持 5 秒语音克隆与 200 毫秒实时生成

05月

29日

Resemble AI 开源 TTS 模型 Chatterbox 实现 63.75% 盲测偏好率，支持 5 秒语音克隆与 200 毫秒实时生成

牛透社 5 月 29 日消息，Resemble AI 发布开源 TTS 模型 Chatterbox，该产品具备基于 0.5B 参数的 LLaMA 架构、覆盖 50 万小时精选音频语料库的训练数据，支持零样本语音克隆（5 秒参考音频生成个性化声纹）、情感振幅控制及 200 毫秒超低延迟生成能力，并集成 Perth 神经水印技术。

Resemble AI 采用 MIT 开源协议，其盲测数据显示 63.75% 的受试者更青睐 Chatterbox 的语音效果。专业机构 AIbase 指出，该模型开源特性将加速 TTS 技术普及和创新。Resemble AI 同步推出企业级付费 TTS 服务，实施“开源筑基+商业赋能”双轨战略。

新闻排行

热门新闻