代理AI引发算力需求地震级转变
英伟达即将在GTC大会上公布其专为代理AI优化的Vera CPU详细信息,该公司AI基础设施负责人Dion Harris表示:”CPU正在成为发展AI和代理工作流程的瓶颈,这是一个令人兴奋的机会。”
英伟达CEO黄仁勋宣布:”Rubin在正确的时刻到来,AI计算训练和推理需求正在急剧上升。”这一新平台将推理token成本削减至上一代平台的十分之一,使大规模AI部署更加经济可行。
CoreWeave、微软、谷歌、亚马逊AWS等主要AI云服务商预计将在2026年部署英伟达Rubin平台,同时每个主要AI实验室都在评估该平台用于训练未来模型。与此同时,英伟达已从对OpenAI的1000亿美元投资中退出,因为Altman正在探索英伟达AI芯片的替代方案。
值得关注的是,华为预计AI芯片收入将从2025年的75亿美元激增60%至2026年的120亿美元,基于其950PR芯片的现有订单,该芯片上个月才开始量产。
随着智能体AI成为下一个技术前沿,传统GPU与CPU架构之间的平衡正在发生根本性转变,这场变革将重塑整个AI硬件生态系统。
