6 月 4 日,Anthropic 发布《When AI builds itself》报告,披露内部数据:截至 2026 年 5 月,Claude 撰写的代码已占公司合并代码库的 80% 以上,较 2025 年 2 月 Claude Code 发布前的个位数大幅提升;工程师季度代码产出较 2021-2025 年平均增长 8 倍。报告指出,AI 已能自主运行实验、修复 bug 并优化代码,任务成功率在开放式场景下从 26% 升至 76%。[[1]](https://www.anthropic.com/institute/recursive-self-improvement)
这一动作发生在 AI 开发从“人类主导”转向“AI 辅助”的加速期。Anthropic 内部调研显示,员工借助模型完成工作量中位数提升约 4 倍,同时模型在固定实验优化任务中从 3 倍加速跃升至 52 倍,远超人类研究员 4-8 小时达到 4 倍的水平。对比 OpenAI 等同行更强调“超级应用”或 IPO 路径,Anthropic 选择公开内部生产力数据,凸显其在安全对齐与能力评估上的独特定位。
与 Meta、Google 等大厂依赖规模化算力扩张不同,Anthropic 的数据表明,模型已在工程与研究执行环节实现“超人”表现,但目标设定与判断仍需人类主导。这既印证了 agent 生产力拐点已现,也为递归自改进(recursive self-improvement)敲响警钟:若趋势延续,全自主 successor 设计可能早于机构准备到来。
未来 6-12 个月,关键观察点在于其他实验室是否跟进披露类似内部指标,以及安全机制能否同步跟上能力跃迁。若 Anthropic 的“非必然但可能更快到来”判断成立,行业协调与暂停选项的讨论将加速。
信源:https://www.anthropic.com/institute/recursive-self-improvement
