近期英伟达在 CVPR 大会上推出 Cosmos 3 开源物理世界基础模型,并配套物理 AI 技能库,标志着 AI 从纯软件代理向具身智能的实质跨越。该模型统一视觉推理、世界建模与动作生成,已在公开基准上领先,被定位为机器人与自动驾驶等实体应用的“世界模型”。[[1]](https://blogs.nvidia.com/blog/cvpr-physical-ai-research-agent-skills/)
这一趋势与此前软件代理主导的企业采用形成对比。过去两年,OpenAI、Anthropic 等闭源模型主要解决文本与代码任务,而物理 AI 直接面对现实世界的感知-决策-执行闭环。英伟达此举既巩固其在边缘算力与模拟工具的护城河,也试图在机器人与自动驾驶新战场抢占先机。对比 Cerebras 等推理专用玩家专注云端,英伟达正把 CUDA 生态延伸至物理层。
根本驱动力是算力与数据双重成熟:模拟环境生成海量训练数据后,实体部署成本正快速下降。未来 6-12 个月,关键看 Cosmos 3 及后续迭代能否在真实机器人任务中验证端到端性能。若成功,AI 基础设施投资将从数据中心向边缘硬件与仿真平台分流;若滞后,软件代理仍将主导短期商业化,物理赛道或留给传统机器人厂商与新兴初创。
信源:https://blogs.nvidia.com/blog/cvpr-physical-ai-research-agent-skills/
