08月

07日

  • Anthropic 发布 Claude Opus4.1,编程基准得分 74.5%

    牛透社 8 月 6 日消息,人工智能企业 Anthropic 发布旗舰模型 Claude Opus4 的迭代升级版本 Claude Opus4.1,该产品在编程性能、数据分析和安全合规领域实现全方位优化。

    根据官方信息,Claude Opus4.1 的最大亮点在于其惊人的编程性能提升。在 SWE-bench Verified 编程评测中,其表现高达 74.5%。Windsurf 的基准测试结果显示,Opus4.1 的表现比 Opus4 提升了一个标准差,并且将继续按照 AI 安全等级 3(ASL-3)标准部署。

    新模型在拒绝违规请求方面的表现略有提升,无害响应率达到了 98.76%,在极端滥用场景的配合度上降低了约 25%,显示出更强的安全性。Claude Opus4.1 现已面向所有付费用户、Claude Code、API、Amazon Bedrock 和 Google Cloud Vertex AI 开放,价格维持与 Opus4 相同。

意见反馈
返回顶部