Anthropic 发布 Claude Opus 4.7 大语言模型，编程基准测试性能提升近 10%

04月

17日

Anthropic 发布 Claude Opus 4.7 大语言模型，编程基准测试性能提升近 10%

牛透社 4 月 16 日消息，Anthropic PBC 发布其大语言模型系列最新成员 Claude Opus 4.7，该模型在编程任务上表现显著优于前代产品。

Opus 4.7 在 SWE-Bench Pro 编程基准测试中得分 64.3%，较 Opus 4.6 提升近 10%。该模型还配备了检测网络攻击企图的机制，并在视觉推理任务方面有所提升，能够以更高分辨率处理图像。同时，Anthropic 为其 API 新增了 “xhigh” 投入等级和任务预算等成本管理功能，其编程助手 Claude Code 也新增了 “ultrareview” 命令和 “auto mode” 自动化功能。

新闻排行

热门新闻