Anthropic于7月1日重新上线Claude Fable 5并新增网络安全安全分类器提升防护

模型重新上线

7月1日，Anthropic正式在Claude平台、Claude.ai、Claude Code 与 Claude Cowork 四大入口恢复Claude Fable 5的全球访问。此前该模型因美国政府于6月12日下达的出口管制指令被暂停，导致所有用户均被强制下线。控制于6月30日全部解除后，Anthropic立即恢复服务，同时将Claude Mythos 5的美国组织专属访问同步恢复。

新增网络安全安全分类器

在一次亚马逊安全研究报告披露的“安全分类器绕过”技术后，Anthropic研发并部署了全新的安全分类器。该分类器针对报告中的攻击手法拦截率超过99%，被拦截的请求不会直接拒绝，而是转交给Claude Opus 4.8继续处理，并在返回给用户时标注“已触发安全分类”。此举体现了Anthropic“深度防御”设计理念，但也会在常规代码调试场景产生一定误报。

越狱严重性评分框架

为填补业界缺乏统一越狱评估标准的空白，Anthropic联合Amazon、Microsoft、Google等合作伙伴起草了四维越狱评分框架，分别评估：

能力提升——突破现有工具的程度。
能力广度——解锁的攻击任务种类。
武器化难度——实现攻击所需的人力与资源。
可发现性——技术被外界获取的难易程度。最高严重级别的越狱将在检测到后立即触发预防性缓解，并开启24/7监控。

市场竞争与成本对比

暂停期间，国内厂商月之暗面推出了开放权重的GLM‑5.2。独立测试显示，GLM‑5.2在Semgrep IDOR基准上取得39% F1，优于Claude Code的32%。在成本方面，Claude Fable 5的使用费用为每百万输入代币10美元、输出代币50美元，而GLM‑5.2的公开费用约为每百万代币1.4美元/4.4美元，成本差距显著。

关键要点

7月1日Claude Fable 5恢复全球访问。
新安全分类器拦截率>99%，违规请求转至Claude Opus 4.8。
四维越狱评分框架已与业界巨头共同制定。
GLM‑5.2以更低成本提供相近性能，形成新竞争格局。

Anthropic于7月1日重新上线Claude Fable 5并新增网络安全安全分类器提升防护