07月

13日

  • Cerebras 发布 Qwen3-235B 模型:13.1 万 token 上下文长度,运行成本骤降 90%

    牛透社美东时间 7 月 8 日消息,Cerebras Systems 发布支持 2350 亿参数量的通义千问 Qwen3 – 235B 模型,该产品采用高效 MoE 架构,上下文长度达 13.1 万 token,运行成本为每百万输入/输出 token 各 0.6 美元,较同类闭源模型降低 90%。

    Cerebras Systems 为 AI 芯片与计算系统开发商,此次突破超长上下文窗口与 235B 参数级模型运行能力,使 Qwen3 – 235B 成为首款支持生产级编码场景并实现亚秒级响应的竞争性产品,其生态版图已扩展至多个重量级合作伙伴。

意见反馈
返回顶部