05月

16日

  • MiniMax 发布新一代语音合成模型 Speech – 02

    牛透社 5 月 16 日消息,人工智能公司 MiniMax 发布全新一代文本转语音(TTS)模型 Speech – 02,该产品具备零样本语音克隆技术和 Flow – VAE 混合架构两项核心技术,主要应用于跨语种语音合成场景。

    Speech – 02 在字错率(WER)和说话人相似度(SIM)上刷新行业最高纪录,运营成本仅为竞品 ElevenLabs 的四分之一,语音合成效果较传统方法提升达 37%,并支持中英日韩等 12 种语言。MiniMax 专注于人工智能语音合成领域,其开发的 T2V 框架结合开放式自然语言描述与结构化标签信息,实现音色克隆与语音定制的多功能突破。

意见反馈
返回顶部