08月
01日
Deepseek 大语言模型部署专利公开 ,实现算力均衡与硬件效率双提升
牛透社 8 月 1 日消息,杭州深度求索人工智能基础技术研究有限公司(DeepSeek)关联企业申请的 “一种大语言模型的部署方法及系统” 专利正式公开。该技术通过将大语言模型预填充和解码阶段分别部署于高性能计算设备与大内存机器,实现了负载均衡、硬件效率提升和算力闲置减少。
该方案属人工智能领域,可降低系统延迟、提高吞吐量,并增强扩展性与容错性,为高效部署大模型提供创新解决方案。
您投送的稿件违反了牛透社的投稿协议,现已关闭您的投稿功能,如有异议请发邮件至tougao@jinse.com进行申诉。