03月

27日

  • 阿里开源最强全模态大模型通义千问Qwen2.5-Omni,7B小尺寸可手机部署

    3月27日,阿里宣布通义千问系列首个端到端全模态大模型Qwen2.5-Omni-7B正式开源。该模型可实时处理文本、图像、音频和视频输入,并输出文本与自然语音,在OmniBench等多模态测评中全面超越GoogleGemini-1.5-Pro等主流模型,语音生成能力(评分4.51)达到人类水准。

    Qwen2.5-Omni采用自研Thinker-Talker双核架构TMRoPE位置编码技术,实现多模态实时解析与流式生成。仅7B参数的小体积使手机等终端轻松部署,现已在魔搭、Hugging Face开源,支持免费商用。其开源进一步巩固阿里云在AI开源生态的领先地位——通义系列模型衍生版本已超10万,覆盖0.5B至110B全参数范围及全模态能力,推动产业级AI普惠应用。

意见反馈
返回顶部