Anthropic推出Claude Sonnet 5,性能逼近Opus 4.8并实现更低价格

模型概览
Anthropic于2026年6月30日正式推出Claude Sonnet 5,定位为最具agentic(自主决策)能力的中阶模型。该模型采用与Opus 4.7相同的新版分词器,单次调用支持最高1M上下文窗口。Sonnet 5已在Claude Code、Claude Platform以及API中上线,默认面向Free、Pro以及企业级套餐用户。
性能对比
Anthropic公布的内部基准显示,Sonnet 5在所有公开评测中均超越前代Sonnet 4.6,并在多项关键指标上逼近旗舰模型Opus 4.8。主要成绩如下:
- SWE‑bench Pro(代码生成):63.2% vs 58.1%(Sonnet 4.6) vs 69.2%(Opus 4.8)
- OSWorld‑Verified(计算机使用):81.2% vs 78.5% vs 未公开
- Terminal‑Bench 2.1:80.4% vs 67.0% vs 未公开
- Humanity’s Last Exam(工具使用):57.4% vs 46.8% vs 57.9%
- GDPval‑AA v2(知识工作):1,618 分,略高于Opus 4.8的1,615 分
在低/中等努力层级(low、medium)下,Sonnet 5的质量已经能够匹配此前只能通过更高价位模型获得的水平;在极高努力层级(xhigh)时,成本可能会超过Opus 4.8,但质量提升有限。
价格与性价比
- 促销期(至2026‑08‑31):$2 / MTok(输入) / $10 / MTok(输出)
- 标准定价:$3 / MTok(输入) / $15 / MTok(输出)
相较于Opus 4.8的 $5 / $25,Sonnet 5在相同算力下的费用约为其 40% 左右。对于大多数日常编码、工具调用以及知识检索任务,使用Sonnet 5可以显著降低运营成本。
典型应用场景
- 多步骤软件工程:模型能够在一次会话中完成 bug 重现、代码修复以及回归验证,适用于内部 CI/CD 流程的自动化。
- 业务自动化:Zapier 示例显示,Sonnet 5 能够完成 Salesforce 账户分层更新并发送企业级邮件,实现端到端业务编排。
- 计算机使用代理:保险公司 Pace 将其理赔 intake 流程交给模型,直接在既有系统中完成信息采集与核算。
- 数据探索:ClickHouse 的实时查询助手使用 Sonnet 5 生成自然语言分析报告,帮助分析师快速获得洞察。
开发者使用指南
调用方式与其他Anthropic模型保持一致,只需在API请求中将 model 参数设为 claude-sonnet-5。示例代码(Python):
import anthropic
client = anthropic.Anthropic()
message = client.messages.create(
model="claude-sonnet-5",
max_tokens=1024,
messages=[{\"role\": \"user\", \"content\": \"找出 worker.py 中的竞争条件并给出修复方案。\"}]
)
print(message.content[0].text)
采用低/中等努力模式即可获得最佳性价比;如果任务对准确性要求极高(如法律文书、医学诊断),仍建议切换至 Opus 4.8。
市场反响
发布当天,Hacker News 与 X 上的开发者普遍称赞 Sonnet 5 在 价格‑性能比 上的提升,尤其是对高频调用的场景。也有声音指出,在 xhigh 努力层级成本上升后,仍需视具体任务决定是否继续使用。总体来看,Sonnet 5 被视为 Anthropic 在中阶模型市场的关键竞争武器,为用户提供了兼顾 agentic 能力与成本控制的实用选项。