Anthropic于7月1日重新上线Claude Fable 5并新增网络安全安全分类器提升防护
•5 阅读•3分钟•前沿
网络安全AnthropicClaude Fable 5GLM-5.2安全分类器
•5 阅读•3分钟•前沿
模型重新上线
7月1日,Anthropic正式在Claude平台、Claude.ai、Claude Code 与 Claude Cowork 四大入口恢复Claude Fable 5的全球访问。此前该模型因美国政府于6月12日下达的出口管制指令被暂停,导致所有用户均被强制下线。控制于6月30日全部解除后,Anthropic立即恢复服务,同时将Claude Mythos 5的美国组织专属访问同步恢复。
新增网络安全安全分类器
在一次亚马逊安全研究报告披露的“安全分类器绕过”技术后,Anthropic研发并部署了全新的安全分类器。该分类器针对报告中的攻击手法拦截率超过99%,被拦截的请求不会直接拒绝,而是转交给Claude Opus 4.8继续处理,并在返回给用户时标注“已触发安全分类”。此举体现了Anthropic“深度防御”设计理念,但也会在常规代码调试场景产生一定误报。
越狱严重性评分框架
为填补业界缺乏统一越狱评估标准的空白,Anthropic联合Amazon、Microsoft、Google等合作伙伴起草了四维越狱评分框架,分别评估:
- 能力提升——突破现有工具的程度。
- 能力广度——解锁的攻击任务种类。
- 武器化难度——实现攻击所需的人力与资源。
- 可发现性——技术被外界获取的难易程度。 最高严重级别的越狱将在检测到后立即触发预防性缓解,并开启24/7监控。
市场竞争与成本对比
暂停期间,国内厂商月之暗面推出了开放权重的GLM‑5.2。独立测试显示,GLM‑5.2在Semgrep IDOR基准上取得39% F1,优于Claude Code的32%。在成本方面,Claude Fable 5的使用费用为每百万输入代币10美元、输出代币50美元,而GLM‑5.2的公开费用约为每百万代币1.4美元/4.4美元,成本差距显著。
关键要点
- 7月1日Claude Fable 5恢复全球访问。
- 新安全分类器拦截率>99%,违规请求转至Claude Opus 4.8。
- 四维越狱评分框架已与业界巨头共同制定。
- GLM‑5.2以更低成本提供相近性能,形成新竞争格局。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。