MiniMax 发布新一代语音合成模型 Speech – 02

05月

16日

MiniMax 发布新一代语音合成模型 Speech – 02

牛透社 5 月 16 日消息，人工智能公司 MiniMax 发布全新一代文本转语音（TTS）模型 Speech – 02，该产品具备零样本语音克隆技术和 Flow – VAE 混合架构两项核心技术，主要应用于跨语种语音合成场景。

Speech – 02 在字错率（WER）和说话人相似度（SIM）上刷新行业最高纪录，运营成本仅为竞品 ElevenLabs 的四分之一，语音合成效果较传统方法提升达 37%，并支持中英日韩等 12 种语言。MiniMax 专注于人工智能语音合成领域，其开发的 T2V 框架结合开放式自然语言描述与结构化标签信息，实现音色克隆与语音定制的多功能突破。

新闻排行

热门新闻