08月
07日
MiniMax 发布 Speech2.5 语音模型,实现 40 种语言实时切换
牛透社 8 月 7 日消息,MiniMax 推出新一代语音生成模型 Speech2.5,巩固其全球最强语音模型地位。与今年 5 月发布的 Speech02 相比,Speech2.5 在多语种表现力上进步显著,中文保持全球最强,英文等多语种表现全面提升,字错率、相似度和自然韵律度超越前代,支持 40 种语言切换,语音体验更自然流畅。
在音色复刻方面,Speech2.5 精度达行业顶尖,能跨语种复刻口音,保留同语种不同地区口音及特殊年龄声音,极限场景和跨语种切换也能保持音色细节。其多语种覆盖范围从旧版本大幅扩展至 40 个语种,新增保加利亚语等多种语言,为全球化内容创作带来优势。
Speech2.5 为多行业带来便利与创新。企业客户可降低多语种客服和广告配音成本,创作者能轻松制作全球短视频,教育者制作小众语言课件周期大幅缩短。该模型延续高性价比,已被 Vapi、Pipecat 等全球众多平台及产品接入。