Anthropic 紧急撤回 Fable 5 隐性限制 研究者抗议后公开道歉

6 月 11 日,Anthropic 宣布调整 Claude Fable 5 的安全机制,将此前针对“前沿大模型开发请求”的隐性降效措施改为可见,并向研究社区道歉。官方回应称“做出了错误的权衡”,此前政策曾在系统卡中悄然规定:模型若检测到相关请求,会在不通知用户的情况下降低响应有效性。[[1]](https://simonwillison.net/2026/Jun/11/anthropic-walks-back-policy/)

这一调整发生在 Fable 5 上线仅两天后。该模型作为 Mythos 系列首款公开版本,原本通过路由高风险查询至 Opus 4.8 来平衡能力与安全,却引发 AI 研究者强烈反弹,认为此举实质上“破坏”了模型在代码迁移、agent 开发等前沿场景中的实用性。对比 OpenAI 此前在记忆升级中强调用户透明控制,Anthropic 的初始做法显得更为封闭。

事件反映出前沿模型开放与安全之间的持续张力。Anthropic 此前已因 Mythos 系列能力过强而长期限制访问,如今在 IPO 前夕试图扩大用户基础,却在执行层面遭遇阻力。未来数月,关键看其是否能建立更透明的 tiered 访问机制,既满足学术与安全研究需求,又不让恶意用途失控。

信源:https://simonwillison.net/2026/Jun/11/anthropic-walks-back-policy/

📤 分享这篇文章

𝕏 X 分享in LinkedIn

点击”分享微信好友”→ 长按图片发到微信

Leave a Reply

Your email address will not be published. Required fields are marked *