06月
04日
Cerebras Systems 开放全球最快 AI 推理 API,速度达 GPU 方案 20 倍
牛透社 6 月 2 日消息,人工智能芯片公司 Cerebras Systems 宣布,其推理 API 现已对所有开发者全面开放,取消了此前的等待名单限制。该服务提供每日 100 万个 Token 的免费计算资源配额,推理速度达传统 GPU 方案的 20 倍,运行 Llama4Scout 模型时每秒可生成超 2600 个 Token。
平台集成 Llama4 和 Qwen3-32B 等主流开源模型,开发者通过 API 调用即可快速部署。结合新建数据中心,该服务将为企业级 AI 系统提供基础设施支撑,加速生成式 AI 产业化应用。