陶哲轩宣布“等式理论计划”成功，人类AI协作，57天完成2200万+数学关系证明

科技 2024-11-24 17:20 广东

来源：量子位 | 公众号 QbitAI

鱼羊一水发自凹非寺

57天，人类和AI合作搞定了4694个等式之间22028942个蕴含关系！

大神陶哲轩激动宣布：等式理论计划，成功。

“等式理论计划”，由陶哲轩本人在2024年9月25日发起，目的是探索按蕴含关系排序的原群（magma）等式理论空间。

特别的是，在这个项目里，陶哲轩不仅集合了人类数学家的力量，还把AI工具纳入了合作者的范围，包括ChatGPT、Claude和GitHub Copilot。

项目发起当日就正式启动，仅仅9天，项目进度就达到了99.866%。

而现在，在2200万+个需要证明的蕴含关系中，8178279个已被证实，13855193个已被证伪，仅有162个还悬而未决。

按陶哲轩的说法，就是离“宣布完全成功”基本只是“时间问题”：

因此，我们现在已经开始着手撰写论文了。

什么是“等式理论计划”

还是先来扒一扒陶哲轩这回究竟是整了个什么样的活儿。

简单说，“等式理论计划”是指：

采用”数学家+AI（包括自动定理证明系统和大模型）+证明辅助语言Lean”这样的协作方式，构建一个展示4694个magma等式（最多四次使用magma操作）之间所有蕴含关系的 “蕴含图”。

首先，这个计划的最初灵感源于陶哲轩本人对“去中心化”研究方式的畅想。

传统上，大部分数学研究项目都由少数专业数学家（通常1~5名）进行，每个人都对自己的部分更专业，且彼此可以相互验证。

不过也是因为存在验证环节，组织更大规模的数学项目（尤其是需要涉及公众贡献），一直具有挑战性。

而现在，通过AI工具以及Lean这样的证明辅助语言，数学项目的大规模协作变得可能。

打前阵的就有开源社区寻找梅森素数的成功尝试，在这个代号GIMPS的志愿项目中，任何拥有强大PC或GPU的人都可以加入寻找梅森素数。

虽然证明助手这样的AI工具在这个项目里用得还不多，但表达的精神是类似的。

因此，在开展等式理论计划之前，陶哲轩就打算搞一个实验：

在一个数学项目中，聚齐专业/业余数学家、AI工具、证明辅助语言Lean等，一同干大事！

受去年MathOverflow上一个等式问题的启发，这一次，陶哲轩将目光瞄准了代数领域中的magma。

当时的问题是酱婶儿的：

交换恒等式和常量恒等式之间是否存在等价关系？

抛开具体问题不谈，这里主要想说明magma涉及等式之间的关系。

简单来说，magma是一个代数结构，它由一个集合和一个在该集合上定义的二元运算组成，但不要求满足任何额外的代数性质，如结合律、交换律等。

我们常见的有关magma的等式包括：

而等式理论计划，就是要找出magma中不同等式之间的等价、推出和非推出关系。

就拿上面这11个等式来看，最终的关系图be like：

可以看出，常量公理等式（1）蕴含了其他所有等式，即如果1成立，那么其他等式也自动成立；而反身公理等式（11）由于最宽松（x=x），几乎所有的magma都满足这个公理。

回到计划本身，陶哲轩等人在初始阶段集中研究了那些只包含一个方程的magma定律，这些方程最多包含四个magma操作（即二元运算）。

举个例子，如果我们有一个magma（M，∗），其中M是元素的集合，∗是定义在M上的二元运算。

则一个“最多四次使用magma操作”的表达式如下：

a∗b（一次操作）
(𝑎∗𝑏)∗𝑐(a∗b)∗c（两次操作）
𝑎∗(𝑏∗(𝑐∗𝑑))a∗(b∗(c∗d))（三次操作）
((𝑎∗𝑏)∗𝑐)∗(𝑑∗𝑒)((a∗b)∗c)∗(d∗e)（四次操作）

其中𝑎,𝑏,𝑐,𝑑,𝑒都是集合M中的元素，每次∗的使用都算作一次magma操作。

这样的等式定律有4694个，由于每个定律都可能蕴含其他4693个定律（一个定律不能蕴含自身），因此总共有4694*(4694-1) = 22,028,942个可能的蕴含关系需要被证明或反驳。

这里的蕴含关系包括“蕴含”和“反蕴含”，其中“蕴含”关系又涉及到两种类型：

已证明的蕴含：在Lean中已经过验证
推测的蕴含：尚未在Lean中验证，可能由人或计算机生成

更多项目细节，陶哲轩在项目日志中，留下了非常详细的记录——

9天进度99.866%，大模型有用但“表现低于预期”

简单总结“等式理论计划”的进度，就是一个字：快。

陶哲轩本人都说：

这个项目的进度远超我的预期。

有多快？

仅仅48小时，很大一部分蕴含关系就已“解决在望”。

项目启动第5天，项目参与者们已经从最初的约2200万条蕴含关系中解决了大量简单蕴含，只剩下约300万的数量尚待解决。

项目启动第9天，随着首次重大重构的完成——合作者们改进了magma的运算符号，以使Lean代码的编译速度显著加快，以及一些研究问题的推进，项目完成度一举从87%跃升到了99.866%。

第19天，项目进度来到99.9963%。陶哲轩在他的博客文章中提及，写论文的事已经提上日程，并且可能包含数十名作者。

GitHub显示该项目有45位贡献者：

到了11月21日，也就是项目第57天，随着主项目最后一个未解决的蕴含关系被搞定（待验证），“等式理论计划”目标已宣告达成。

论文可以正式开写了。

陶哲轩透露，论文的框架早已拟好，但后续还需要大量工作来对其进行更新，并转换为可以提交的形式。

日志中也详细谈到了大模型工具发挥的作用。

在第一天，陶哲轩就对GitHub Copilot大加赞赏：

GitHub Copilot在处理日常任务时非常有用，比如输入需要证明的新Lean定理，或者更新蓝图来整合最新的PR结果。

他具体举了个例子：要将Lean转换为LaTeX，把Lean代码粘贴为注释，开始敲LaTeX，GitHub Copilot就会自动补全剩下的内容。

不过，陶哲轩也坦率表示，大模型们在项目中的表现“低于预期”，更多的时候，数学家们用到的还是“经典AI”，比如自动定理证明器Vampire等。

他还提到：

项目的参与者非常多元化，包括处在职业生涯各个阶段的数学家和计算机科学家，学生和业余爱好者。Lean在整合人类和机器生成的贡献方面表现出色。机器生成的部分在数量上是贡献的最主要来源，不过，许多自动生成的结果最初是人类在特殊情况下得出的，之后被进一步推广和形式化。

具体到项目中，GitHub Copilot的主要作用还是加快代码的编写，而Claude则被用来帮忙创建可视化工具，比如这个“等式浏览器”：

ChatGPT则更多扮演激发数学家们灵感的小助手角色。

对陶哲轩来说，ChatGPT能帮他快速掌握通用代数的一些细节。

而lyphyser、Daniel Weber、Fan Zheng和Bhavik Mehta这几位项目参与者，还通过跟ChatGPT的讨论，证明1659这个等式可能具有非平凡的合流性。

主项目里程碑达成，不过“等式理论计划”的其他衍生项目仍在进行中，比如研究在有限原群限制下的类似蕴含图、对蕴含图进行数据分析等等。

陶哲轩也再次强调了这一项目和AI的联系：

希望项目中的蕴含关系能够作为未来AI数学工具的基准测试。

除了陶哲轩之外，项目的主要维护人还有意大利数学家Pietro Monticone和Shreyas Srinivas。

两位都是Lean重度爱好者。

△Shreyas Srinivas主页

Pietro Monticone还和他特伦托大学的同事们一起搞过指数3的费马大定理的Lean版证明。

GitHub：
https://github.com/teorth/equational_theories

参考链接：
[1]https://mathstodon.xyz/@tao/113522452070896956
[2]https://teorth.github.io/equational_theories/

[3]https://terrytao.wordpress.com/2024/10/12/the-equational-theories-project-a-brief-tour/

阅读最新前沿科技研究报告，欢迎访问欧米伽研究所的“未来知识库”

未来知识库是“欧米伽未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或点击本文左下角“阅读原文”进入。

截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告

1. 牛津大学博士论文《深度具身智能体的空间推理与规划》230页

2. 2024低空经济场景白皮书v1.0（167页）

3. 战略与国际研究中心（CSIS）人类地月空间探索的总体状况研究报告（2024）

4. 人工智能与物理学相遇的综述（86页）

5. 麦肯锡：全球难题，应对能源转型的现实问题（196页）

6. 欧米伽理论，智能科学视野下的万物理论新探索（50页报告）

7. 《美国反无人机系统未来趋势报告（2024-2029 年）》

8. Gartner 2025 年主要战略技术趋势研究报告

9. 2024人工智能国外大模型使用手册+中文大模型使用手册

10. 详解光刻巨人ASML成功之奥妙-241015（94页）

11. CB Insights：未来变革者：2025年九大科技趋势研究报告

12. 国际电信联盟2023-2024年联合国人工智能AI活动报告388页

13. 《人工智能能力的人类系统集成测试和评估》最新51页，美国防部首席数字和人工智能办公室（CDAO）

14. 2024瑞典皇家科学院诺贝尔化学奖官方成果介绍报告

15. MHP：2024全球工业4.0晴雨表白皮书

16. 世界经济论坛白皮书《AI价值洞察：引导人工智能实现人类共同目标》

17. 瑞典皇家科学院诺贝尔物理学奖科学背景报告资料

18. AI智能体的崛起：整合人工智能、区块链技术与量子计算(研究报告，书）

19. OpenAI o1 评估：AGI 的机遇和挑战（280页）

20. 世界知识产权组织：2024 年全球创新指数（326页）

21. 美国白宫：国家近地天体防御策略与行动计划

22. 【CMU博士论文】持续改进机器人的探索，243页

23. 中国信通院：量子计算发展态势研究报告2024年58页

24. 2024年OpenAI最新大模型o1革新进展突出表现及领域推进作用分析报告

25. 【新书】通用人工智能，144页

26. 联合国：《未来契约》、《全球数字契约》和《子孙后代问题宣言》三合一

27. 世界气候组织：2024团结在科学中，守卫地球系统的未来

28. 世界经济论坛《量子技术助力社会发展：实现可持续发展目标》研究报告

29. 人工智能科学家：迈向全自动开放式科学发现

30. 欧盟：石墨烯旗舰项目十年评估报告

31. 美国信息技术和创新基金会：美国的数字身份之路研究报告

32. 麦肯锡：2024能源转型挑战未来研究报告

33. 联合国贸易与发展会议：2024世界投资报告

34. 兰德：评估人工智能对国家安全和公共安全的影响

35. 兰德：2024评估人工智能基础模型市场的自然垄断条件

36. 经合组织：2015-2022 年生物多样性与发展融资

37. ITIF：中国半导体创新能力研究报告

38. 英国皇家学会：数学未来计划，数学和数据教育的新方法研究报告

39. 欧盟：10年人类大脑计划创新评估报告

40. GLG格理集团：2024深度解读半导体行业关键趋势和专家洞见报告15页

41. 华为智能世界2030报告2024版741页

42. 联合国：2024为人类治理人工智能最终报告

43. 达信Marsh：2024全球科技产业风险研究报告英文版27页

44. 鼎帷咨询：2024英伟达人工智能发展战略研究报告149页

45. 【博士论文】大语言模型的测试与评价：准确性、无害性和公平性，223页pdf

46. 麦肯锡：2024世界能源产业展望

47. 世界经济论坛《太空：全球经济增长的 1.8 万亿美元机遇》

48. 世界经济论坛：世界“技术先锋”名单100家公司名单

49. 世界经济论坛：2024绘制地球观测的未来：气候情报技术创新

50. 核聚变技术作为清洁能源供应替代来源的全球发展和准备情况

51. 大模型生成的idea新颖性与人类对比研究报告（94页）

52. IQM ：2024 年量子状况报告

53. 2024十大新兴技术研究报告

54. 2024地球观测 (EO) 洞察带来的全球价值（58页）

55. 2023-2024世界基础设施监测报告

56. 世界银行：2024世界发展报告，中等收入陷阱

57. 2024国际前沿人工智能安全科学报告132页

58. 斯坦福大学2024人工智能指数报告

59. 美国总统科学技术顾问委员会：《利用人工智能应对全球挑战》63页报告

60. 柳叶刀行星健康：2024地球系统安全与健康评估报告

61. 中国未来50年产业发展趋势白皮书III

62. OpenAI o1系列产品原理与安全最新研究报告（80页）

63. 国家互联网信息办公室：国家信息化发展报告2023年110页

64. 埃森哲：2024年风险研究报告-重大颠覆需要持续重塑英文版39页

65. 36氪研究院：2024年中国城市低空经济发展指数报告41页

66. 美国信息技术与创新基金会：《中国在量子领域的创新能力如何》研究报告

67. 理解深度学习500页报告

68. 鼎帷咨询：2024全球人工智能发展研究报告44页

69. 【伯克利博士论文】大型语言模型迈向能够学习和发现一切的机器

70. 《量子技术：前景、危险和可能性》45页报告

71. 英国皇家学会报告：人工智能在科学、技术、工程和数学领域的应用

72. 未来今日研究所：2024世界技趋势报告（980页）

73. 面向大规模脉冲神经网络：全面综述与未来方向

74. 大模型+知识库市场全景报告

75. 《太空力量的理论基础：从经济学到不对称战争》2024最新94页报告

76. CBInsights：2024年第二季度全球企业风险投资状况报告英文版124页

77. 英国科学院：数据管理和使用：21 世纪的治理（2024），99页

78. 兰德智库：展望2045 一项前瞻性研究探讨未来 20 年全球趋势的影响

79. 世界知识产权组织：2024年世界知识产权报告：让创新政策促进发展

80. 全球灾难风险研究所：评估大型语言模型接管灾难的风险

81. 牛津马丁学院：人工智能风险国际科学评估的未来

82. 联合国贸易和发展署：2024世界投资报告

83. 兰德公司：人工智能军事应用的新风险和机遇

84. 英国皇家学会：AI时代的科学发展趋势研究报告

85. 百页风电行业研究方法论：从中国到世界从陆地到海洋-240902，98页

86. 中国信通院发布《大模型落地路线图研究报告（2024年）》

87. 星河智源：2024年无人驾驶技术全景报告35页

88. 星河智源：2024年光刻机技术全景报告37页

89. 人形机器人行业研究方法论：特斯拉领衔人形机器人的从1到N

90. 兰德：展望2045一项关于未来20年全球趋势影响的前瞻性研究报告英文版45页

91. 《军事创新与气候挑战》2024最新152页报告

92. 麦肯锡：2024困难点：驾驭能源转型的物理现实（196页）

93. 《麻省理工科技评论》万字长文：什么是人工智能？

94. 软件与服务行业：从特斯拉智能驾驶看人形机器人发展路径

95. 中国信通院：中国数字经济发展研究报告2024年82页

96. CB Insights：2024年第二季度全球风险投资状况报告 244页

97. 脑启发的人工智能：全面综述

98. 二十年关键技术跟踪报告

99. 中国首部城市大脑系列建设标准（8项）汇编

100. 麦肯锡2024技术趋势展望报告100页

人工智能学家

致力成为权威的人工智能科技媒体和前沿科技研究机构

最新文章

万物智能演化理论（欧米伽理论）的核心观点

美国国家科学院院刊：人工智能的下一个进化，从我们开始

大语言模型技术演进与启示！

涌现的计算方法：从计算力学到层级涌现

走出元宇宙阴影、拥抱开源AI模型，Meta实现“扎克伯格式复兴”

瑞士洛桑联邦理工学院：人工智能中的创造力：进展与挑战

各路大佬纷纷给 AGI 立下“最后期限”，27 岁创始人已经给 AI 准备好「人类最终测试」！

陶哲轩宣布“等式理论计划”成功，人类AI协作，57天完成2200万+数学关系证明

谷歌 AlphaChip 论文再被质疑，DeepMind 驳斥都没做与训练，顺带还揪出了“内鬼”？

复旦大学：《大模型AI智能体的兴起和潜力：综述》

斯坦福大学发布全球人工智能实力排行榜

意识是一种模拟状态，它只能存在于梦中，而不是在物理世界中

步步紧逼谷歌！OpenAI正在研发与ChatGPT集成的浏览器

2秒完成检测，将AI与3D打印相结合，科学家实现小型核反应堆高级监测

从具身到智能，无尽前沿丨智源具身智能峰会观点集锦（上）

从具身到智能，无尽前沿丨智源具身智能峰会观点集锦（下）

Nature：刷新了传统认知！蔡欣童/刘长亮等揭示多巴胺快速波动既不调控运动、也不编码奖赏

Nature :谷歌学术搜索能否在人工智能革命中幸存下来？

AI智能体的崛起，开启人工智能的下一个黄金时代

强化学习之父Richard Sutton：AGI研究的下一个范式

Science:如何理解大模型的智能本质

诺奖得主 Demis Hassabis教皇科学院开讲：AI 是一项令人难以置信的技术，发展模式需重新思考

性能提升在即！吴恩达谈 LLM 新方向：优化智能体工作流

模拟到现实无缝转换！麻省理工学院研究团队提出生成模型LucidSim，破解机器人训练难题！

人形机器人的兴起

Grok-3 与黎曼猜想：人工智能带来的震撼与挑战

斯坦福伯克利重磅发现DNA Scaling Law，Evo荣登Science封面！AI设计DNA/RNA/蛋白质再突破

AI 求解量子多体问题：GPT 理解人类语言，也理解量子语言吗？

真的撞墙？OpenAI 的任务对齐主管：2025年AI会在高阶应用突破，但一般人会感觉停滞

transformer的细节到底是怎么样的？Transformer 连环18问！

牛津大学报告：《无法被AI取代的力量：人类认知的理论驱动力》

吴恩达最新观点：LLM的下一个新兴方向是Agentic AI

Stephen Wolfram与计算的未来：一本带你认识世界的新书

研究人员发明了一种新的逻辑系统，有望提升批判性思维和人工智能的能力

马斯克新官上任再起诉OpenAI！新证据称Ilya七年前就不放心奥特曼了

OpenAI首位投资者《时代》刊文：AI将重新定义「人类的意义」

复旦大学：2024大语言模型的能力边界与发展思考报告

Anthropic创始人访谈：不是因为Altman 与微软合作而离开OpenAI、Scaling Law不会撞墙、未来招聘将放缓

生命的公式？新模型计算了宇宙中及宇宙之外存在智慧生物的可能性

MIT对大模型数理原理的强有力证明

智能时代：大统一理论与万物理论的追求、挑战与突破

黄仁勋对话孙正义：日本的AI新饼、Arm的AI野心与英伟达的东亚新机会

AI寒冬真的要来了！Ilya：I told you so

WHALE来了，南大周志华团队做出更强泛化的世界模型

李彦宏：智能体是AI应用最主流形态，即将迎来爆发点｜百度世界2024

奥特曼专访自曝：OpenAI将实现AGI第三级，一人也能打造10亿独角兽

开源的定义要变了！开源AI标准成照妖镜：Meta、谷歌家大模型只是在假装开源？

Scaling Law撞墙，AI圈炸锅了！OpenAI旗舰Orion被曝遭遇瓶颈，大改技术路线

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

陶哲轩宣布“等式理论计划”成功，人类AI协作，57天完成2200万+数学关系证明

来源：量子位 | 公众号 QbitAI

鱼羊 一水 发自 凹非寺

什么是“等式理论计划”

9天进度99.866%，大模型有用但“表现低于预期”

△Shreyas Srinivas主页

鱼羊一水发自凹非寺