前OpenAI联合创始人Andrej Karpathy表示,AI输出将从纯文本向互动神经视频演进,视觉得大脑三分之一资源支持成信息超级通道。
在X平台最新发帖中,Karpathy建议用户在查询LLM末尾添加“以HTML结构化你的响应”,然后浏览器查看生成文件。他强调,当前默认Markdown虽易读,但HTML提供更多图形布局和互动灵活性。此后,AI输出将逐步升级至互动神经视频和模拟,由扩散神经网络直接生成。
Karthapy指出,人类偏好音频输入AI,但视觉是首选输出形式。大脑视皮层如10车道高速公路,处理海量并行信息。现有技术虽未成熟,但融合软件1.0精确模拟与神经生成网格的前景广阔,如近期病毒式传播的互动视频示例。
他还提及输入端改进需求,如屏幕指向手势模拟面对面协作。此观点源于Karpathy在Tesla和OpenAI的AI实践,强调人机融合远未止步于脑机接口。
全球AI开发者正探索此路径,或重塑工作与娱乐界面。

