6 月 5 日 TechCrunch 报道,Uber 等企业已用尽全年 AI 预算,CTO 此前透露“鼓励员工尽可能使用 AI”后,4 月便耗光全年额度;公司随即推出每人每月 1500 美元上限,并上线内部仪表盘追踪 Claude Code、Cursor 等工具消耗。[[1]](https://techcrunch.com/2026/06/05/the-token-bill-comes-due-inside-the-industry-scramble-to-manage-ais-runaway-costs/)[[2]](https://techcrunch.com/2026/06/02/uber-caps-employee-ai-spending-after-blowing-through-budget-in-four-months/)
这一转变发生在 2025 年初“无限订阅”狂欢之后。多家企业发现 API 账单占营收 8-15%,从“token maxxing”转向“需要护栏、如何控制”。初创公司、供应商和新标准机构正涌入,提供追踪、优化和计费工具,市场从无序扩张转向精细化管理。
对比 OpenAI/Anthropic 等闭源模型依赖高 token 定价,垂直小模型或边缘推理正成为替代选项。Uber 的案例显示,早期“用量竞赛”已难持续,资本开支压力正传导至运营层面。
未来 6-12 个月,关键看企业是否能将成本控制转化为真实 ROI。若小模型与混合部署验证成功,AI 采用将从“烧钱实验”转向可量化落地;否则,更多公司可能进一步收紧预算,暴露当前商业模式对大规模 token 消耗的脆弱性。
信源:https://techcrunch.com/2026/06/05/the-token-bill-comes-due-inside-the-industry-scramble-to-manage-ais-runaway-costs/

