09月

29日

  • 谷歌升级 Gemini 2.5 Flash 及 API,速度与成本效率领跑行业

    牛透社 9 月 26 日消息,谷歌宣布对其大语言模型 Gemini 2.5 Flash 系列(含 Flash Lite 版本)及企业级 AI 语音生成模型 Gemini Live 的应用程序接口(API)进行重大升级。

    关键性能突破包括:Gemini 2.5 Flash Lite 以每秒 887 输出令牌的速度成为第三方评测平台 Artificial Analysis 认证的“速度最快私有模型”,较上一代提速 40%,远超 GPT-5 与 Grok 4 Fast。技术指标中,Flash 系列的 SWE-Bench 验证基准从 48.9% 提升至 54%(+5.1pp),推理与非推理模式得分分别提升 +3 分和 +8 分,令牌使用效率实现单位质量输出减少 20%。定向优化上,Flash 2.5 强化多步骤自动化工作流能力,Flash-Lite 则增强图像理解、翻译等场景的多模态处理能力。

    商业验证显示,新模型在批量处理场景中部署成本减半。价格体系维持性价比优势:Flash 09-2025 预览版输入成本为每百万令牌 0.30 美元,输出为 2.50 美元;Flash-Lite 09-2025 输入为 0.10 美元,输出为 0.40 美元。同时,Gemini Live API 升级包含函数调用成功率提升 100%及拟人化对话功能,家庭平台 Ava 已应用其优化语音助理的噪声处理能力。

意见反馈
返回顶部