04月

17日

  • Anthropic 发布 Claude Opus 4.7 大语言模型,编程基准测试性能提升近 10%

    牛透社 4 月 16 日消息,Anthropic PBC 发布其大语言模型系列最新成员 Claude Opus 4.7,该模型在编程任务上表现显著优于前代产品。

    Opus 4.7 在 SWE-Bench Pro 编程基准测试中得分 64.3%,较 Opus 4.6 提升近 10%。该模型还配备了检测网络攻击企图的机制,并在视觉推理任务方面有所提升,能够以更高分辨率处理图像。同时,Anthropic 为其 API 新增了 “xhigh” 投入等级和任务预算等成本管理功能,其编程助手 Claude Code 也新增了 “ultrareview” 命令和 “auto mode” 自动化功能。

意见反馈
返回顶部
iTrust