AI 代理从实验走向生产,正迫使云厂商重新设计底层架构。过去云服务围绕人类搜索、点击、流媒体的稳定流量设计,如今代理任务会突然爆发、快速闲置,对弹性、持久内存和向量检索提出全新要求。
5 月 28 日,AWS 推出下一代 OpenSearch Serverless,专为代理工作负载优化,可在任务触发时瞬间扩容、闲置时归零。Cloudflare 上月扩展 Agent Cloud,微软 Azure 也更新 Cosmos DB 以支持代理间内存共享。Databricks 和 Snowflake 则将自身定位为企业代理的“记忆与检索层”。这些动作不是小修小补,而是整个互联网流量模型的转向——机器生成的后台流量正在取代人类主导的前台交互。
与传统 SaaS 时代不同,此轮调整直接绑定代理经济落地。谁先把基础设施做到“代理原生”,谁就能在企业部署中抢占先机。未来 6-12 个月,关键变量是成本与稳定性:如果代理调用成本过高或中断频发,企业会退回传统工具;反之,云厂商的估值逻辑将彻底从存储转向“代理运行时”。
信源:https://techcrunch.com/2026/05/28/the-internet-is-being-rebuilt-for-machines/

