12月
17日
研究人员发布FrontierScience基准,GPT-5.2在科学推理评估中以77%领先
牛透社 12 月 17 日消息,研究人员发布 FrontierScience 基准,该产品具备系统评估 AI 科研能力的功能,包含数百道专家验证难题并设立奥林匹克版和研究版模块,主要应用于物理、化学、生物等领域的专家级科学推理能力评估,初步评估显示 GPT-5.2 在奥林匹克模块 77% 与研究模块 25% 中领先其他模型。
您投送的稿件违反了牛透社的投稿协议,现已关闭您的投稿功能,如有异议请发邮件至tougao@jinse.com进行申诉。