06月
09日
六大 AI 模型竞技 2025 高考数学:豆包与元宝并列榜首,OpenAI o3 仅获 34 分
牛透社 6 月 9 日消息,字节跳动旗下豆包、腾讯元宝、阿里巴巴通义、百度文心 X1 Turbo、深度求索 DeepSeek 及 OpenAI o3 六大 AI 模型参与 2025 年新课标Ⅰ卷数学测评。该测评选取 14 道客观题(含单选、多选与填空),总分值 73 分,所有 AI 在无系统提示及网络搜索支持下单次作答。竞技结果显示:豆包与元宝以 68 分并列榜首,DeepSeek(63 分)与通义(62 分)居中游,文心 X1 Turbo 与 o3 表现欠佳,其中 o3 仅获 34 分。
题型模块分析显示,单选题中豆包、通义、元宝均以 35 分领先,多选题环节豆包、DeepSeek 与元宝全胜。业界指出,本次测评揭示 AI 模型在高考数学领域的潜力与局限,相较 2024 年测试,各模型在细节把控、公式运用及逻辑推演方面均实现显著优化,为 AI 数学能力进化奠定重要基准。