05月
22日
华为数学团队发布FlashComm技术,大模型推理速度最高提升80%
牛透社 5 月 22 日消息,华为数学团队发布革命性技术 FlashComm,该产品具备 AllReduce 通信优化、矩阵并行降维与多流并发引擎三项创新技术,主要应用于大模型推理领域。
技术突破包括:AllReduce 通信效率提升 26%,数据传输量锐减 86%,结合昇腾芯片实现异构任务调度效率达理论极限,最高推理速度增幅达 80%。华为数学团队通过该技术推动智能计算生态向极致能效演进,加速高复杂度 AI 应用的商业化部署。