04月

18日

  • 谷歌推出 Gemini 2.5 Flash 开发者预览版

    美国东部时间2025 年 4 月 17 日,Google 在其开发者平台正式预览发布 Gemini 2.5 Flash 模型,为 AI 工程师和用户提前体验该模型提供了机会。

    Gemini 2.5 Flash 是继 2.0 Flash 之后的升级版本,具备更强的推理能力,并引入“思考”机制,可将复杂任务拆解为多步计划后再响应。该模型现已通过 Google AI Studio 和 Vertex AI 上的 Gemini API 向开发者开放。

    Google 表示,Gemini 2.5 Flash 是首个支持“混合推理”的模型,开发者可开启或关闭思考功能,并设置“思考预算”,在质量、成本与响应速度之间灵活权衡。预算越高,输出质量越好但处理时间越长;预算为0则拥有最低成本和延迟。

    该模型还能根据问题复杂度自动设置合理预算。例如,“谢谢”用西班牙语怎么说这类问题无需深度推理,而编写完整的 Python 函数或小游戏则属于高阶推理任务。

    定价方面,Gemini 2.5 Flash 的基础费用为每百万输入 tokens 0.15 美元、输出 0.60 美元,启用思考后费用上升至每百万 tokens 3.50 美元。

    在推理任务上的表现显著提升:在人类终极测试“Humanity’s Last Exam”中得分 12.1%,远超 2.0 Flash 的 5.1%。在 LMArena 的 Hard Prompts 测评中也仅次于上月发布的 Gemini 2.5 Pro。

    Google 称,Gemini 2.5 Flash 目前在性价比和推理能力方面位居市场领先。

意见反馈
返回顶部