Claude 发布 Opus 4.1,更强的编码与推理能力
Anthropic 于 2025 年 8 月 5 日 发布其旗舰混合推理模型 Claude Opus 4.1,作为 Opus 4 的无缝升级,显著提升对复杂多步任务的处理能力和细节追踪准确性,成为专为编程、AI agent 和推理任务设计的首选模型。
Opus 4.1 在 SWE‑bench Verified 编码基准中达成 74.5% 效率(高于 Opus 4 的 72.5%),并在多文件代码重构、大规模 debugging 等场景表现更加精准,Rakuten 团队赞其能定位代码修正点而不引入冗余改动,Windsurf 评测显示其性能提升与 Sonnet 3.7 升级到 Sonnet 4 相似。
该模型支持 200K 上下文窗口,并提供混合模式:即时响应或延展思考,开发者可通过 API 设定思考预算以优化性能与成本。核心应用包括高级 AI agent、自主任务执行、深入研究分析与高质量内容生成等。
Claude Opus 4.1 适用于 Pro/Max/Team/Enterprise 用户,也已接入 Claude Code、Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 平台,同时在 GitHub Copilot 的企业与 Pro+ 套餐中进行公测,未来将替代 Opus 4 模型。
作为 Opus 系列的演进版本,Claude Opus 4.1 属于其 AI Safety Level‑3(ASL‑3) 安全级别,意味着需进行更多红队测试与对齐验证。Anthropic 强调虽然改进有限,但其安全行为仍优于前代,拒绝违规请求的稳定性有所提升。此外,Barron’s 称 Opus 4 奠定了突破 AI 性能上限的重要里程碑,Opus 4.1 延续这些能力改进。