通义千问发布 Qwen3-Next 稀疏大模型推理效率十倍提升实现芯片无关部署

09月

10日

通义千问发布 Qwen3-Next 稀疏大模型推理效率十倍提升实现芯片无关部署

牛透社 9 月 10 日消息，通义千问团队发布 Qwen3-Next-80B-A3B-Instruct 模型，该产品具备 80 亿参数总量/3 亿激活参数的稀疏计算架构、处理 32K 上下文推理吞吐量较 Qwen3-32B 提升逾十倍、训练成本不足前代十分之一等技术突破，主要应用于代码生成、多模态解析及边缘计算场景。

该模型采用 MoE 专家混合架构实现动态任务分发，结合 Hugging Face Transformers 库合并的”参数经济”技术路径，达成芯片无关性部署能力，开发者实测显示其多语种翻译准确率和复杂任务处理精度均突破现有标杆。

新闻排行

热门新闻