6 月 7 日,Anthropic 发布博客《When AI builds itself》,披露最新内部数据:截至 2026 年 5 月,Claude 撰写的代码已占公司合并代码库的 80% 以上;2026 年第二季度,典型工程师每日合并代码量较 2024 年增长 8 倍。这一转变源于 Claude Code 从 2025 年初的低单数占比起步,逐步实现自主编写、审查与实验。
这一现象并非孤例。OpenAI 此前也报告类似内部生产力提升,而 Meta 等公司正加速将代理工具嵌入工程流程。对比过去两年单纯依赖人类工程师的模式,如今“人类仅负责方向与审核”的分工已成主流。Anthropic 的数据直接量化了这一跃迁:从低单数到 80%,再到 8 倍产出,印证 agent 能力在真实生产环境中的加速成熟。
根本驱动力在于模型对长时程任务的掌控力提升。Claude 不仅生成代码,还能迭代修复、运行实验,形成了正反馈循环。这与传统软件开发中“工具辅助”截然不同,更接近“AI 主导、人类监督”的新范式。相较于早期强调对齐与安全的谨慎路径,当前领先实验室正通过内部实践验证“加速即安全”的假设。
未来 6-12 个月,关键在于这种内部生产力能否转化为外部产品与盈利。若 Anthropic 等公司借此快速迭代模型并扩大企业采用,agent 经济或将进入指数级扩张;但若安全与治理机制滞后,递归自改进的潜在风险将加速暴露。谁能率先在速度与控制间找到平衡,谁就可能在下一轮竞争中占据主动。
信源:https://www.anthropic.com/institute/recursive-self-improvement
