06月

17日

  • OpenAI 引入 Muon 优化器加速 GPT-5 训练,效率提升 21%

    牛透社 2025 年 6 月 17 日消息,OpenAI 团队或将采用研究员 Keller Jordan 开发的神经网络优化器 Muon 参与 GPT-5 开发训练。实验数据显示,Muon 可将 CIFAR-10 数据集训练时长压缩至原基准的 79%,运算负载增量不足 1%。

    Muon 由 Jordan 于 2024 年 12 月发布,其通过牛顿-舒尔茨迭代法优化神经网络隐藏层参数,在大规模 GPU 集群训练场景中显著提升效率,并已形成完整调优体系。Hyperbolic 联合创始人兼首席技术官 Yuchen Jin 披露,Jordan 凭借相关技术博客加入 OpenAI 团队,该突破或推动人工智能训练效率的底层技术革新。

意见反馈
返回顶部