AI 编码代理生产力飙升 Anthropic 案例显端倪

Anthropic 最新内部数据显示，AI 代理已从辅助工具转向实质性生产力引擎。2026 年第二季度，该公司典型工程师每日合并代码量较 2024 年增长 8 倍，超过 80% 的合并代码由 Claude 自主编写，仅剩审查与方向把控由人类完成。这一转变始于 2025 年 Claude Code 预览版推出，此前四年代码产出基本持平。

数据对比鲜明：2025 年 5 月 Claude Opus 4 在实验优化任务中实现约 3 倍加速；2026 年 4 月 Mythos Preview 版本已达 52 倍，而熟练人类研究员完成 4 倍加速需 4-8 小时。同期，Claude 代理在开放式 AI 安全研究中，800 小时内回收 97% 性能差距，耗资约 1.8 万美元，远超两人一周的人工表现。OpenAI 与 Google DeepMind 等竞争对手虽也在推进代理，但尚未披露同等规模的内部生产力倍增案例，显示闭源实验室在 agent 落地上的执行落差。

根本驱动力在于模型对长时程、实验闭环的掌控能力提升，而非单纯参数膨胀。这既放大头部实验室的护城河，也让资本更青睐能证明 ROI 的应用层玩家。未来 6-12 个月，关键看这些生产力是否转化为外部产品差异化与盈利。若更多大厂跟进，开发者生态将加速重构；若仅限内部实验，市场对“agent 经济”规模化预期的修正或将提前到来。

信源：https://www.anthropic.com/institute/recursive-self-improvement

📤 分享这篇文章

𝕏 X 分享 in LinkedIn

点击”分享微信好友”→ 长按图片发到微信

Leave a Reply Cancel reply