马斯克xAI Grok-5视频理解达人类水平 10万小时数据训练引爆多模态AI革命

“Grok-5在视频理解上达到了人类水平,能像人类一样分析复杂情节并生成洞见。”埃隆·马斯克5月3日在X平台发帖宣布,xAI最新多模态模型Grok-5训练于10万小时高清视频数据,基准测试中准确率飙升至98.7%,超越OpenAI的GPT-5视频模块5个百分点。该模型已在xAI的Colossus超级计算机上优化,支持实时视频摘要和情感识别,适用于娱乐、安防和自动驾驶领域。马斯克强调,此突破标志着AGI多模态时代开启,xAI正与特斯拉合作集成至Optimus机器人,提升其环境感知能力。业内专家称,此举将加速全球AI内容生成市场扩张,预计2027年规模达5000亿美元。全球科技股闻讯上涨,NVIDIA股价日内涨3.2%。

展望未来,此模型或将颠覆视频监控与媒体产业,推动AI从文本向视觉智能全面跃进。

📤 分享这篇文章

𝕏 X 分享in LinkedIn

点击”生成分享图”→ 分享图片到微信