六大 AI 模型竞技 2025 高考数学：豆包与元宝并列榜首，OpenAI o3 仅获 34 分

06月

09日

六大 AI 模型竞技 2025 高考数学：豆包与元宝并列榜首，OpenAI o3 仅获 34 分

牛透社 6 月 9 日消息，字节跳动旗下豆包、腾讯元宝、阿里巴巴通义、百度文心 X1 Turbo、深度求索 DeepSeek 及 OpenAI o3 六大 AI 模型参与 2025 年新课标Ⅰ卷数学测评。该测评选取 14 道客观题（含单选、多选与填空），总分值 73 分，所有 AI 在无系统提示及网络搜索支持下单次作答。竞技结果显示：豆包与元宝以 68 分并列榜首，DeepSeek（63 分）与通义（62 分）居中游，文心 X1 Turbo 与 o3 表现欠佳，其中 o3 仅获 34 分。

题型模块分析显示，单选题中豆包、通义、元宝均以 35 分领先，多选题环节豆包、DeepSeek 与元宝全胜。业界指出，本次测评揭示 AI 模型在高考数学领域的潜力与局限，相较 2024 年测试，各模型在细节把控、公式运用及逻辑推演方面均实现显著优化，为 AI 数学能力进化奠定重要基准。

新闻排行

热门新闻