05月
24日
Anthropic 发布 Claude 4 系列 AI 模型,编程任务性能超越 GPT-4.1 并降低任务捷径概率 65%
牛透社 5 月 23 日消息,人工智能企业 Anthropic 发布 Claude Opus 4 与 Claude Sonnet 4,该系列系其最新一代混合推理 AI 模型,专为编程任务及复杂问题解决场景深度优化。
Claude Opus 4 在客户测试中展现 7 小时自主运行能力,基准测试显示其代码生成及工具应用性能超越谷歌 Gemini 2.5 Pro、OpenAI o3 推理模型及 GPT-4.1 系列,完成任务时“走捷径”概率较前代降低 65%。同步推出“思维摘要”系统与“扩展思维”模式,支持推理过程可视化及工具调用状态切换。目前两款模型已上线 Anthropic API、亚马逊 Bedrock 及谷歌 Vertex AI 平台。