微软发布 3.3 亿参数小模型 Mu，性能比肩 Phi-3.5-mini，赋能 Windows 智能体 - 牛透社

使用已有账号登录

06月

24日

微软发布 3.3 亿参数小模型 Mu，性能比肩 Phi-3.5-mini，赋能 Windows 智能体

牛透社 6 月 24 日消息，微软发布其最新创新小参数模型 Mu，该产品具备 3.3 亿参数（体积仅为 Phi-3.5-mini 的十分之一）、离线 NPU 笔记本电脑每秒生成超 100 标记、训练规模扩大到 360 万个样本（提升 1300 倍），主要应用于 Windows 系统智能代理的自然语言指令交互场景。

该模型基于纯解码器 Transformer 架构实现三大突破：双重层归一化提升训练稳定性、旋转位置嵌入增强超长序列外推能力、分组查询注意力机制降低内存占用。

此外，Mu 模型还采用了预热稳定衰减时间表和 Muon 优化器等先进训练技术来进一步优化性能。微软使用 A100GPU 对 Mu 进行训练，遵循 Phi 模型开发中首创的技术，首先在数百亿个高质量教育 token 上进行预训练，以学习语言的语法、语义和世界知识。

新闻排行

热门新闻

ERP 卷了 35 年，没人想帮老板算清 “人效” 这笔账

ERP 卷了 35 年，没人想帮老板算清 “人效” 这笔账

2025-07-08

钉钉再造 AI 新生态：平台跑出准确率超 90% 的妇科专业大模型

钉钉再造 AI 新生态：平台跑出准确率超 90% 的妇科专业大模型

2025-07-10

多模态内容生成，为什么是属于中国公司的机会？

多模态内容生成，为什么是属于中国公司的机会？

2025-07-02

IBM：AI 转型的核心目标是消除人工环节，而非优化人机交互

IBM：AI 转型的核心目标是消除人工环节，而非优化人机交互

2025-07-09

生成、并购、竞速：ToB AI 有下半场吗？

生成、并购、竞速：ToB AI 有下半场吗？

2025-07-15

飞书发布知识问答等多款 AI 产品，让企业拥有懂自己的 “豆包”

飞书发布知识问答等多款 AI 产品，让企业拥有懂自己的 “豆包”

2025-07-10

有赞白鸦：AI 的最大意义，是让客户把产品用得更好了

有赞白鸦：AI 的最大意义，是让客户把产品用得更好了

2025-07-02

AI 下半场：拼的不是模型，而是落地

AI 下半场：拼的不是模型，而是落地

2025-07-07

ToB 增长的残酷拐点：会不会用 AI，才是生死线

ToB 增长的残酷拐点：会不会用 AI，才是生死线

7小时前

AI 商业化，Salesforce 做对了什么？

AI 商业化，Salesforce 做对了什么？

2025-07-03

导航

京ICP备17034123号-3Copyright © 崔牛会版权所有

合作伙伴

快速导航

京ICP备17034123号-3Copyright © 崔牛会版权所有

关于我们加入我们联系我们