近日,Google DeepMind 发布 AlphaProof Nexus——一套结合大语言模型与 Lean 形式证明验证器的 AI 系统——在 353 道开放的厄多斯数学难题中,自主解出 9 道,其中一道悬而未决 56 年。每道证明的推理成本仅几百美元,代码已公开在 GitHub。
厄多斯问题是匈牙利数学家 Paul Erdős 留下的开放猜想集合,被视为数学界的”业余珠峰”。
这不是”AI 又赢了”叙事。这是 AI 第一次以可验证方式做出新数学,不是抄袭训练数据。Lean 形式验证器会逐步检查证明的每一步逻辑——数学界承认这种证明,因为可验证就是数学的硬通货。
对比 OpenAI 模型在 IMO 拿满分但研究界拒收:没人能验证它没在训练数据里见过。DeepMind 用形式证明直接绕开”幻觉之争”,把 AI 输出推到”可数学审计”级别。
这件事的真正含义是研究的生产函数被改写了。诺贝尔级问题的边际成本从”一个研究团队 + 三年”变成”一次 API call + 几百美元”。学界过去 70 年的资源分配逻辑面临洗牌。
真正的护城河不是参数规模,是”可验证基础设施”。OpenAI 没有,Anthropic 没有,只有 DeepMind 在押注。未来 12 个月看其它实验室跟不跟进——跟不上的,等于把整个科学发现赛道让给 Google。
信源:https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/
