Inception Labs 发布商用扩散模型 Mercury，推理速度突破 700 token/秒

06月

27日

Inception Labs 发布商用扩散模型 Mercury，推理速度突破 700 token/秒

牛透社 6 月 27 日消息，美国 AI 初创公司 Inception Labs 发布商用级扩散语言模型 Mercury，该产品具备每秒 700+ token 的推理速度，较谷歌 Gemini 2.5 Flash 快逾两倍，并保持与 OpenAI 的 GPT-4.1 Nano 等模型相当的推理质量。通过创新的扩散架构突破传统自回归模型性能瓶颈，主要应用于实时对话式 AI 交互场景。

Mercury 现已在 chat.inceptionlabs.ai 官网开放体验，并集成至 OpenRouter、Poe 等平台，收费标准为每百万 tokens 输入/输出 0.25 至 1 美元。该团队此前开发的 Mercury Coder 代码生成模型曾获业界标杆地位，新作将实时响应优势拓展至通用对话领域。

新闻排行

热门新闻