04月
29日
阿里巴巴宣布通义千问Qwen3开源!
4月29日凌晨,阿里宣布Qwen3正式发布并全部开源8款「混合推理模型」。
这次开源包括两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参),以及Qwen3-30B-A3B(300亿总参数、30亿激活参数);以及六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。该系列旗舰模型 Qwen3 – 235B – A22B 以 2350 亿总参数量的精简架构实现 220 亿参数激活运行,计算效率较业界标杆 DeepSeek – R1 提升三倍,综合性能超越 OpenAI – o1 等全球顶尖模型
Qwen3 模型支持 119 种语言,并已在包含近 36 万亿个词条的数据集上进行训练。这些词条是它们在“学习”过程中处理的原始数据。100 万个词条相当于约 75 万个单词,而这些数据来自各种教科书、代码片段、AI 生成的数据、问答对和其他来源。
在各种基准测试中,阿里巴巴的 Qwen3 模型取得了令人印象深刻的成绩,击败了美国人工智能公司最近的“高端”模型,例如 OpenAI 的o3-mini 和 o4-mini 模型。