Anthropic推出Claude Sonnet 5，性能逼近Opus 4.8并实现更低价格

模型概览

Anthropic于2026年6月30日正式推出Claude Sonnet 5，定位为最具agentic（自主决策）能力的中阶模型。该模型采用与Opus 4.7相同的新版分词器，单次调用支持最高1M上下文窗口。Sonnet 5已在Claude Code、Claude Platform以及API中上线，默认面向Free、Pro以及企业级套餐用户。

性能对比

Anthropic公布的内部基准显示，Sonnet 5在所有公开评测中均超越前代Sonnet 4.6，并在多项关键指标上逼近旗舰模型Opus 4.8。主要成绩如下：

SWE‑bench Pro（代码生成）：63.2% vs 58.1%（Sonnet 4.6） vs 69.2%（Opus 4.8）
OSWorld‑Verified（计算机使用）：81.2% vs 78.5% vs 未公开
Terminal‑Bench 2.1：80.4% vs 67.0% vs 未公开
Humanity’s Last Exam（工具使用）：57.4% vs 46.8% vs 57.9%
GDPval‑AA v2（知识工作）：1,618 分，略高于Opus 4.8的1,615 分

在低/中等努力层级（low、medium）下，Sonnet 5的质量已经能够匹配此前只能通过更高价位模型获得的水平；在极高努力层级（xhigh）时，成本可能会超过Opus 4.8，但质量提升有限。

价格与性价比

促销期（至2026‑08‑31）：$2 / MTok（输入） / $10 / MTok（输出）
标准定价：$3 / MTok（输入） / $15 / MTok（输出）

相较于Opus 4.8的 $5 / $25，Sonnet 5在相同算力下的费用约为其 40% 左右。对于大多数日常编码、工具调用以及知识检索任务，使用Sonnet 5可以显著降低运营成本。

典型应用场景

多步骤软件工程：模型能够在一次会话中完成 bug 重现、代码修复以及回归验证，适用于内部 CI/CD 流程的自动化。
业务自动化：Zapier 示例显示，Sonnet 5 能够完成 Salesforce 账户分层更新并发送企业级邮件，实现端到端业务编排。
计算机使用代理：保险公司 Pace 将其理赔 intake 流程交给模型，直接在既有系统中完成信息采集与核算。
数据探索：ClickHouse 的实时查询助手使用 Sonnet 5 生成自然语言分析报告，帮助分析师快速获得洞察。

开发者使用指南

调用方式与其他Anthropic模型保持一致，只需在API请求中将 model 参数设为 claude-sonnet-5。示例代码（Python）：

import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
    model="claude-sonnet-5",
    max_tokens=1024,
    messages=[{\"role\": \"user\", \"content\": \"找出 worker.py 中的竞争条件并给出修复方案。\"}]
)
print(message.content[0].text)

采用低/中等努力模式即可获得最佳性价比；如果任务对准确性要求极高（如法律文书、医学诊断），仍建议切换至 Opus 4.8。

市场反响

发布当天，Hacker News 与 X 上的开发者普遍称赞 Sonnet 5 在 价格‑性能比 上的提升，尤其是对高频调用的场景。也有声音指出，在 xhigh 努力层级成本上升后，仍需视具体任务决定是否继续使用。总体来看，Sonnet 5 被视为 Anthropic 在中阶模型市场的关键竞争武器，为用户提供了兼顾 agentic 能力与成本控制的实用选项。