DeepSeek 团队发布 DeepSeek-V3 大模型技术论文突破硬件扩展挑战与架构优化瓶颈

05月

16日

DeepSeek 团队发布 DeepSeek-V3 大模型技术论文突破硬件扩展挑战与架构优化瓶颈

牛透社 2025 年 5 月 16 日消息，DeepSeek 团队发布最新大模型 DeepSeek-V3 技术论文，该研究突破大规模 AI 模型训练的硬件扩展挑战并实现架构优化。

论文基于 2048 块 NVIDIA H800 GPU 集群训练环境，提出三大技术突破：采用 DeepSeekMoE 架构与多头潜在注意力技术，使单 token 内存占用降至 70KB；通过混合专家架构降低激活参数量，训练成本较传统密集模型减少一个数量级，推理时 GPU 利用率达 98.7%；首创”硬件-模型联合优化”范式，为 AI 芯片设计提供模型驱动新方向。相关技术已应用于商业产品并在多行业验证效果提升。

新闻排行

热门新闻