12月

17日

  • 研究人员发布FrontierScience基准,GPT-5.2在科学推理评估中以77%领先

    牛透社 12 月 17 日消息,研究人员发布 FrontierScience 基准,该产品具备系统评估 AI 科研能力的功能,包含数百道专家验证难题并设立奥林匹克版和研究版模块,主要应用于物理、化学、生物等领域的专家级科学推理能力评估,初步评估显示 GPT-5.2 在奥林匹克模块 77% 与研究模块 25% 中领先其他模型。

意见反馈
返回顶部