06月
07日
通义千问发布 Qwen3-Embedding 系列模型,8B 参数版本登顶 MTEB 多语言榜单
牛透社 2025 年 6 月 6 日消息,通义千问发布 Qwen3 – Embedding 系列模型,该产品具备多语言文本理解与代码检索能力,主要应用于文本表征、检索及排序任务。
Qwen3 – Embedding 系列基于 Qwen3 基础模型研发,提供 0.6B 到 8B 三种配置,其中 8B 参数版本在 MTEB 多语言榜单以 70.58 分登顶。架构采用双塔(Embedding)与单塔(Reranker)组合,覆盖 100 余种自然语言及编程语言,通过三阶段训练(弱监督预训练、监督训练、模型融合)平衡泛化性能。模型已在 Hugging Face、ModelScope 及 GitHub 开源,未来将持续拓展多模态语义体系。