数学界的高地又被AI攻陷了?初创公司Axiom宣称其AxiomProver系统已解决至少四个长期悬而未决的数学问题。这个被称为"AI数学家"的系统本质上是将大语言模型与Lean等自动定理证明器缝合,通过神经符号混合架构生成并验证证明。但截至目前,这些"解决方案"既未公开详细技术报告,也未经过数学界的同行评审验证。
先把欢呼声收一收。Axiom的声明存在明显的可验证性缺口:解决了4个问题,但尝试了多少次?这些问题是开放研究难题还是竞赛级别的套路题?更重要的是,这些证明是否已完成形式化验证并提交期刊?没有这些细节,“破解未解难题"更像是PR话术而非学术事实。
技术层面,AxiomProver代表了一种务实的垂直化路径——不跟OpenAI拼通用对话,而是深耕形式化数学证明这一狭窄领域。这种"LLM+形式化工具"的架构确实代表了AI for Science的演进方向,但它目前仅能处理代数、组合数学等可完全形式化的领域,对依赖几何直觉或创造性跳跃的数学问题仍束手无策。
产业影响是真实的。如果验证属实,这将证明专用AI模型在特定认知任务上可以超越通用大模型,直接冲击Mathematica等传统计算机代数系统的市场。更重要的是,它验证了"神经符号AI"在真实研究中的可行性,6-12个月内我们必将看到DeepMind或OpenAI推出竞争性产品。但Axiom选择闭源,这意味着它正在与Lean/mathlib等开源社区争夺资源,可能倒逼学术机构加速开发开源替代方案。
数学证明容不得水分,Axiom需要被证明。未来半年是关键观察期:独立数学家能否复现这些结果?系统能否持续解决新的开放问题?形式化语言(Lean/Coq)是否会因此成为AI训练的标准接口?
真正的突破不在于解决了四个具体难题,而在于是否建立了人机协作证明的新范式。在此之前,保持怀疑是最理性的态度。毕竟,宣称容易,验证难。
本文由 AI 辅助生成,仅供参考。