Anthropic 紧急撤回 Fable 5 隐性限制研究者抗议后公开道歉

6 月 11 日，Anthropic 宣布调整 Claude Fable 5 的安全机制，将此前针对“前沿大模型开发请求”的隐性降效措施改为可见，并向研究社区道歉。官方回应称“做出了错误的权衡”，此前政策曾在系统卡中悄然规定：模型若检测到相关请求，会在不通知用户的情况下降低响应有效性。[[1]](https://simonwillison.net/2026/Jun/11/anthropic-walks-back-policy/)

这一调整发生在 Fable 5 上线仅两天后。该模型作为 Mythos 系列首款公开版本，原本通过路由高风险查询至 Opus 4.8 来平衡能力与安全，却引发 AI 研究者强烈反弹，认为此举实质上“破坏”了模型在代码迁移、agent 开发等前沿场景中的实用性。对比 OpenAI 此前在记忆升级中强调用户透明控制，Anthropic 的初始做法显得更为封闭。

事件反映出前沿模型开放与安全之间的持续张力。Anthropic 此前已因 Mythos 系列能力过强而长期限制访问，如今在 IPO 前夕试图扩大用户基础，却在执行层面遭遇阻力。未来数月，关键看其是否能建立更透明的 tiered 访问机制，既满足学术与安全研究需求，又不让恶意用途失控。

信源：https://simonwillison.net/2026/Jun/11/anthropic-walks-back-policy/

📤 分享这篇文章

𝕏 X 分享 in LinkedIn

点击”分享微信好友”→ 长按图片发到微信

Leave a Reply Cancel reply