05月

16日

  • DeepSeek 团队发布 DeepSeek-V3 大模型技术论文 突破硬件扩展挑战与架构优化瓶颈

    牛透社 2025 年 5 月 16 日消息,DeepSeek 团队发布最新大模型 DeepSeek-V3 技术论文,该研究突破大规模 AI 模型训练的硬件扩展挑战并实现架构优化。

    论文基于 2048 块 NVIDIA H800 GPU 集群训练环境,提出三大技术突破:采用 DeepSeekMoE 架构与多头潜在注意力技术,使单 token 内存占用降至 70KB;通过混合专家架构降低激活参数量,训练成本较传统密集模型减少一个数量级,推理时 GPU 利用率达 98.7%;首创”硬件-模型联合优化”范式,为 AI 芯片设计提供模型驱动新方向。相关技术已应用于商业产品并在多行业验证效果提升。

意见反馈
返回顶部