02月
11日
蚂蚁集团开源发布全模态大模型 Ming-flash-omni2.0,多项指标超越 Gemini 2.5 Pro
牛透社 2 月 11 日消息,蚂蚁集团发布全模态大模型 Ming-flash-omni2.0,该产品具备视觉语言理解、语音可控生成、图像生成与编辑等关键能力,部分指标超越 Gemini 2.5 Pro,并是业界首个全场景音频统一生成模型,支持在单音轨中同步生成语音、音效与音乐。
您投送的稿件违反了牛透社的投稿协议,现已关闭您的投稿功能,如有异议请发邮件至tougao@jinse.com进行申诉。