09月

30日

  • 深度求索开源 V3.2-exp 模型,长上下文推理成本降低近 50%

    牛透社 9 月 29 日 消息,中国人工智能企业深度求索发布全新实验性模型 V3.2 – exp。该产品具备「深度求索稀疏注意力机制」,通过双级筛选系统在保持较小注意力窗口的前提下处理长文本数据,可将长上下文场景的 API 基础调用成本降低近 50% ,主要应用于降低服务器负载与高效长文本处理场景。

    模型通过 Hugging Face 平台开源发布,相关技术细节与学术论文同步发布于 GitHub。此次突破基于对 Transformer 架构的底层优化,标志着中国企业在全球 AI 基础技术创新领域的持续竞争力,其年初发布的 R1 模型曾引发行业关注。

意见反馈
返回顶部