Anthropic 最新内部数据显示,AI 代理已从辅助工具转向实质性生产力引擎。2026 年第二季度,该公司典型工程师每日合并代码量较 2024 年增长 8 倍,超过 80% 的合并代码由 Claude 自主编写,仅剩审查与方向把控由人类完成。这一转变始于 2025 年 Claude Code 预览版推出,此前四年代码产出基本持平。
数据对比鲜明:2025 年 5 月 Claude Opus 4 在实验优化任务中实现约 3 倍加速;2026 年 4 月 Mythos Preview 版本已达 52 倍,而熟练人类研究员完成 4 倍加速需 4-8 小时。同期,Claude 代理在开放式 AI 安全研究中,800 小时内回收 97% 性能差距,耗资约 1.8 万美元,远超两人一周的人工表现。OpenAI 与 Google DeepMind 等竞争对手虽也在推进代理,但尚未披露同等规模的内部生产力倍增案例,显示闭源实验室在 agent 落地上的执行落差。
根本驱动力在于模型对长时程、实验闭环的掌控能力提升,而非单纯参数膨胀。这既放大头部实验室的护城河,也让资本更青睐能证明 ROI 的应用层玩家。未来 6-12 个月,关键看这些生产力是否转化为外部产品差异化与盈利。若更多大厂跟进,开发者生态将加速重构;若仅限内部实验,市场对“agent 经济”规模化预期的修正或将提前到来。
信源:https://www.anthropic.com/institute/recursive-self-improvement

