06月

27日

  • Inception Labs 发布商用扩散模型 Mercury,推理速度突破 700 token/秒

    牛透社 6 月 27 日消息,美国 AI 初创公司 Inception Labs 发布商用级扩散语言模型 Mercury,该产品具备每秒 700+ token 的推理速度,较谷歌 Gemini 2.5 Flash 快逾两倍,并保持与 OpenAI 的 GPT-4.1 Nano 等模型相当的推理质量。通过创新的扩散架构突破传统自回归模型性能瓶颈,主要应用于实时对话式 AI 交互场景。

    Mercury 现已在 chat.inceptionlabs.ai 官网开放体验,并集成至 OpenRouter、Poe 等平台,收费标准为每百万 tokens 输入/输出 0.25 至 1 美元。该团队此前开发的 Mercury Coder 代码生成模型曾获业界标杆地位,新作将实时响应优势拓展至通用对话领域。

意见反馈
返回顶部