04月

17日

  • OpenAI 发布推理优化语言模型系列的最新成员o3 和 o4-mini

    美东时间2025年4月16日,OpenAI 今天发布了推理优化语言模型系列的最新成员o3 和 o4-mini。

    据了解,o3是旗舰推理模型,它被定位为OpenAI最先进的推理模型,在SWE-bench(代码修复测试)和MMMLU(多学科大学级问题测试)等基准测试中刷新记录。o3强化了“工具使用”能力,可调用外部系统(如代码编辑器、搜索引擎)完成复杂任务,支持图像分析、Python代码运行及自定义API工具调用。

    OpenAI工作人员表示:据外部专家的评估,相较于 OpenAI o1,在真实任务中的重大错误率降低20%。

    另一款模型 o4-mini,属于高校轻量版模型,支持类似o3的工具功能,但模型更小,专注速度与成本效益,适用场景包括数学、编程和视觉任务。

    相较于o3,o4-mini 体积更小,这意味着它支持的任务范围更窄,但可以更快、更经济地完成任务。OpenAI 表示,这种成本效益将使其能够提供比 o3 更高的使用限制。(提供更高使用限额,满足高频需求。)

意见反馈
返回顶部