Anthropic 发布 Claude 4 系列 AI 模型，编程任务性能超越 GPT-4.1 并降低任务捷径概率 65%

05月

24日

Anthropic 发布 Claude 4 系列 AI 模型，编程任务性能超越 GPT-4.1 并降低任务捷径概率 65%

牛透社 5 月 23 日消息，人工智能企业 Anthropic 发布 Claude Opus 4 与 Claude Sonnet 4，该系列系其最新一代混合推理 AI 模型，专为编程任务及复杂问题解决场景深度优化。

Claude Opus 4 在客户测试中展现 7 小时自主运行能力，基准测试显示其代码生成及工具应用性能超越谷歌 Gemini 2.5 Pro、OpenAI o3 推理模型及 GPT-4.1 系列，完成任务时“走捷径”概率较前代降低 65%。同步推出“思维摘要”系统与“扩展思维”模式，支持推理过程可视化及工具调用状态切换。目前两款模型已上线 Anthropic API、亚马逊 Bedrock 及谷歌 Vertex AI 平台。

新闻排行

热门新闻