谷歌推出 Gemini 2.5 Flash 开发者预览版

04月

18日

谷歌推出 Gemini 2.5 Flash 开发者预览版

美国东部时间2025 年 4 月 17 日，Google 在其开发者平台正式预览发布 Gemini 2.5 Flash 模型，为 AI 工程师和用户提前体验该模型提供了机会。

Gemini 2.5 Flash 是继 2.0 Flash 之后的升级版本，具备更强的推理能力，并引入“思考”机制，可将复杂任务拆解为多步计划后再响应。该模型现已通过 Google AI Studio 和 Vertex AI 上的 Gemini API 向开发者开放。

Google 表示，Gemini 2.5 Flash 是首个支持“混合推理”的模型，开发者可开启或关闭思考功能，并设置“思考预算”，在质量、成本与响应速度之间灵活权衡。预算越高，输出质量越好但处理时间越长；预算为0则拥有最低成本和延迟。

该模型还能根据问题复杂度自动设置合理预算。例如，“谢谢”用西班牙语怎么说这类问题无需深度推理，而编写完整的 Python 函数或小游戏则属于高阶推理任务。

定价方面，Gemini 2.5 Flash 的基础费用为每百万输入 tokens 0.15 美元、输出 0.60 美元，启用思考后费用上升至每百万 tokens 3.50 美元。

在推理任务上的表现显著提升：在人类终极测试“Humanity’s Last Exam”中得分 12.1%，远超 2.0 Flash 的 5.1%。在 LMArena 的 Hard Prompts 测评中也仅次于上月发布的 Gemini 2.5 Pro。

Google 称，Gemini 2.5 Flash 目前在性价比和推理能力方面位居市场领先。

新闻排行

热门新闻

一家SaaS巨头的“中场重启”，AI 时代下的底层叙事

2026-05-20