09月

12日

  • 阿里巴巴通义千问发布Qwen3-Next架构及80B-A3B系列模型 实现四大核心技术升级

    牛透社 9 月 12 日消息,阿里巴巴集团旗下通义千问项目发布新一代基础模型架构 Qwen3 – Next,并同步开源基于该架构打造的 Qwen3 – Next – 80B – A3B 系列模型。

    此次架构升级包含四大核心创新:混合注意力机制(Hybrid Attention Mechanism)、高稀疏度 MoE 结构、训练稳定化技术优化及多令牌预测机制(Multi-Token Prediction),显著提升参数效率与推理性能。通义千问为阿里巴巴旗下专注 AI 基础模型研发的技术项目。

意见反馈
返回顶部