6 月 5 日 TechCrunch 报道,AI 代币(token)使用成本正从“加速器”变为“刹车”。Uber 今年 4 月已耗尽全年 AI 编码预算;微软数月前撤销部分开发者 Claude Code 许可;Priceline 某员工透露 Cursor 续约费用暴涨 4-5 倍。FinOps Foundation 执行董事 J.R. Storment 透露,4-5 月多家企业反馈“全年预算已超 3 倍”,对话从“tokenmaxxing”迅速转向“如何设护栏”。Linux Foundation 本周宣布成立 Tokenomics Foundation,目标为 AI 代币建立类似 FinOps 的成本纪律标准。[[1]](https://techcrunch.com/2026/06/05/the-token-bill-comes-due-inside-the-industry-scramble-to-manage-ais-runaway-costs/)
这一转变发生在过去两年“快就是好”叙事之后。早期开发者以高 token 消耗为荣,内部排行榜甚至将 token 用量视作绩效;Jellyfish 数据显示,token 预算最高的工程师 PR 产出翻倍,但成本却高出 10 倍,量与值严重错配。如今算力价格与代理复杂性叠加,单次 agent 循环即可引发失控账单,企业开始在 API 层、上下文压缩和预算硬上限上发力。
与闭源巨头此前“先用再说”的定价策略相比,此轮成本压力更像开源与垂直方案的隐形推手。若 Tokenomics 标准落地,推理效率将成为下一轮竞争核心;若大厂仅停留在内部限额,中小企业采用门槛或进一步抬高,AI 真正规模化落地的时间表或再延后 6-12 个月。
信源:https://techcrunch.com/2026/06/05/the-token-bill-comes-due-inside-the-industry-scramble-to-manage-ais-runaway-costs/
