阿里开源最强全模态大模型通义千问Qwen2.5-Omni，7B小尺寸可手机部署

03月

27日

阿里开源最强全模态大模型通义千问Qwen2.5-Omni，7B小尺寸可手机部署

3月27日，阿里宣布通义千问系列首个端到端全模态大模型Qwen2.5-Omni-7B正式开源。该模型可实时处理文本、图像、音频和视频输入，并输出文本与自然语音，在OmniBench等多模态测评中全面超越GoogleGemini-1.5-Pro等主流模型，语音生成能力（评分4.51）达到人类水准。

Qwen2.5-Omni采用自研Thinker-Talker双核架构及TMRoPE位置编码技术，实现多模态实时解析与流式生成。仅7B参数的小体积使手机等终端轻松部署，现已在魔搭、Hugging Face开源，支持免费商用。其开源进一步巩固阿里云在AI开源生态的领先地位——通义系列模型衍生版本已超10万，覆盖0.5B至110B全参数范围及全模态能力，推动产业级AI普惠应用。

新闻排行

热门新闻