AI解决132年数学难题！Transformer成功寻找新的李雅普诺夫函数，三体问题相关

文摘 2024-10-21 23:59 上海

点击下方卡片，关注计算机视觉Daily

AI/CV重磅干货，第一时间送达

点击进入—>【Mamba/多模态/扩散】交流群

添加微信号：CVer2233，小助手会拉你进群！
扫描下方二维码，加入CVer学术星球！可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料，及最前沿应用！发论文/搞科研/涨薪，强烈推荐！

梦晨发自凹非寺
转载自：量子位（QbitAI）

训练Transformer，用来解决132年的数学世纪难题！

如何判断一个动力系统（如三体问题）是否稳定？Meta和巴黎理工学院团队携手提出Symbolic Transformer，直指这一经典难题的核心：

发现新的全局李雅普诺夫函数。

从牛顿、拉格朗日到庞加莱，无数科学家倾力研究三体问题的长期稳定性，却始终无法给出一个通用的判定方法。

直到1892年，俄国数学家Aleksandr Lyapunov提出了以他名字命名的李雅普诺夫函数：

如果存在一个函数V，其在平衡点处有严格最小值，在无穷远处为无穷大，且梯度始终指向远离系统梯度的方向，则全局稳定性得到保证。

但遗憾的是，李雅普诺夫只证明了这个结论，并没有提供寻找这个函数的方法。

130多年过去了，科学界仍然不知道对于一般的系统该如何寻找李雅普诺夫函数，现有的算法只能求解非常小规模的多项式系统。

换句话说，李雅普诺夫函数的系统化构造方法，依然是一个悬而未决的数学难题。

现在，这一局面有望被AI打破。

研究团队把寻找李雅普诺夫函数构建成一种序列到序列翻译任务，问题和解决方案都表示为符号tokens序列，就能用上原本为机器翻译而生的Transformer模型了。

最终，在8张V100上训练100个GPU时左右的模型，取得了惊人的成绩：

对于前人已解决的多项式系统，模型精度高达84%，大幅领先人类专家的9%和此前SOTA算法工具。
面对随机生成的新多项式系统，模型成功找到了10.1%-11.8%的李雅普诺夫函数，而此前最好的算法工具只有0.7%-1.1%。
重新发现了Ahmadi等在2011年首次给出的一个多项式系统的非多项式李雅普诺夫函数

相关论文已入选NeurIPS 2024，且刚刚在ArXiv公开。

作者Meta科学家François Charto表示，尽管Symbolic Transformer像其他AI模型一样还是一个黑盒系统，但它给出的李雅普诺夫函数是明确的符号表达式，完全可以经受数学证明的检验。

作者巴黎师范数学教授：黑魔法一般的方法

用Transformer解决数学难题，最大的困难是什么？

答案不难想到：缺少数据，特别是在这个场景中，需要动力系统与李雅普诺夫函数的配对数据。

为此，Meta和巴黎理工团队利用了正向和反向数据生成相结合的策略。

正向数据生成，也就是根据多项式系统生成对应的李雅普诺夫函数。

虽然没有通用方法，但如果一个李雅普诺夫函数能表示成多项式的平方和，就有现存工具可以计算。

最终方法分为三步：

先随机生成一个多项式系统，
寻找是否存在平方和形式的李雅普诺夫函数，
如果存在则保留这个多项式系统，不存在回到步骤1

不过这个方法有几个局限。

大多数对象是系统都不稳定，且计算平方和李雅普诺夫函数涉及复杂的搜索，系统规模的增长，对算力和内存需求会呈爆炸式增长，所以这种方法速度很慢且仅适用于小的多项式系统。

于是还需要配合反向数据生成方法，根据答案反向构造问题。

这种方法也存在几个局限，比如AI倾向于偷懒，从任务中学习更简单的子问题，因此也需要做出一些限制。

最终方法大致可以理解成，先随机生成一个满足特定条件的李雅普诺夫函数，再反向构造出与之匹配的动力系统。

最终团队生成了4个数据集：

BPoly，包含100万个反向生成的多项式系统与配对的李雅普诺夫函数，系统中的方程数量为2到5个不等。
BNonPoly，包含100万个反向生成的非多项式系统配对样本，现有算法通常无法处理这种类型的系统，非多项式李雅普诺夫函数的发现尤其具有挑战性
FBarr，包含30万个正向生成的Barrier函数配对样本，并不是严格的李雅普诺夫函数，用于测试模型在寻找不能严格满足李雅普诺夫正定条件的系统中的李雅普诺夫函数。
FLyap，包含10万个正向生成的标准李雅普诺夫配对样本，每个动力系统的李雅普诺夫函数都是非齐次多项式，

最终试验发现，在不同数据集上训练的模型都取得了很好的准确性。

使用Beam Search方法在宽度50时能给低性能模型带来额外7%-10%的提升。

特别是在后向数据训练集中添加少量前向生成数据示例，带来显著的分布外测试性能提升。

将FBarr中的300个示例添加到BPoly中，就能把FBarr准确率从35%提高到89%。另外添加FLyap示例带来的改进较小。

与此前SOTA基线比较，在混合数据上训练的模型取得了最好的效果。

基于Transformer的模型也比SOSTOOL方法快得多。

当尝试求解具有2到5个方程的随机多项式系统时，SOSTOOL的Python版本平均需要 935.2 秒。

Transformer模型在贪婪解码时，一个系统的推理和验证平均需要2.6 秒，而Beam Search宽度为50时，平均需要13.9秒。

研究的最终目标是发现新的李雅普诺夫函数，在随机生成的2-3个多项式、2-5个多项式的数据集中，最佳模型发现了11.8%和10.1%的李雅普诺夫函数，是传统方法的10倍。

对于非多项式系统，模型发现了12.7%的李雅普诺夫函数。

这些结果表明，从合成数据集训练的语言模型确实可以发现未知的李雅普诺夫函数，并比此前最先进的传统算法求解器效果更好。

作者巴黎师范教授Amaury Hayat表示，几年前刚开始这个项目时，作为一个年轻而天真的数学家，他认为如果方法真的成功了，那简直可以算是黑魔法。

几年过去了，见识了AI的诸多成就，我对此已经理性得多了，但依然感觉……（不可思议）。

论文地址：
https://arxiv.org/abs/2410.08304

参考链接：
[1]https://x.com/f_charton/status/1846884416930402633
[2]https://x.com/Amaury_Hayat/status/1846889179780673853

绘图神器下载


后台回复：绘图神器，即可下载绘制神经网络结构的神器！

何恺明在MIT授课的课件PPT下载

在CVer公众号后台回复：何恺明，即可下载本课程的所有566页课件PPT！赶紧学起来！

CVPR 2024 论文和代码下载

在CVer公众号后台回复：CVPR2024，即可下载CVPR 2024论文和代码开源的论文合集

Mamba、多模态和扩散模型交流群成立

扫描下方二维码，或者添加微信号：CVer2233，即可添加CVer小助手微信，便可申请加入CVer-Mamba、多模态学习或者扩散模型微信交流群。另外其他垂直方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。

一定要备注：研究方向+地点+学校/公司+昵称（如Mamba、多模态学习或者扩散模型+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群


▲扫码或加微信号: CVer2233，进交流群

CVer计算机视觉（知识星球）来了！想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料，欢迎扫描下方二维码，加入CVer计算机视觉（知识星球），已汇集近万人！

▲扫码加入星球学习

整理不易，请赞和在看

http://mp.weixin.qq.com/s?__biz=MzU4OTg3Nzc3MA==&mid=2247496493&idx=1&sn=99a375b318f19ac16a7d3fa5d9152dde

计算机视觉Daily

一个专注于计算机视觉开源项目的公众号，涵盖CV、传统图像处理、OpenCV、深度学习、机器学习代码实战和相关资料等内容

最新文章

Mamba作者点赞！清华团队深入分析长上下文建模中的状态崩溃

CVPR 2025 坐等Rebuttal，ICLR 2025和AAAI 2025投稿微信群来了！

突发！AI科学家重返谷歌！

微软亚洲研究院MSRA招聘实习生

AAAI 2025 开奖倒计时！CVPR 2025、ICLR 2025 投稿微信群来了！

重磅发布！最新版《深度学习》书籍开放下载

NeurIPS 2024 | 收敛加快8倍，准确率提升超30%！华科大提出MoE Jetpack框架

今年顶会这情况。。。大家提前做准备吧！

NeurIPS 2024 | 浙江大学提出SINE：通用分割新模型

发一篇CVPR真不难

LeCun团队新作DINO-WM：预训练视觉特征的世界模型，超强规划能力！

博士延毕，师兄终于毕业了。。。

NeurIPS 2024 Oral | 大模型量化新工作！4bit达到新SOTA！

ICLR 2025 分数出炉！附AAAI 2025和CVPR 2025投稿微信群

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

CVPR 2025 正式截稿！ICLR 2025和AAAI 2025投稿微信群成立！

突发！谷歌宣布35岁Keras之父Francois Chollet离职！

面完腾讯算法岗，心态崩了。。。

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

ICLR 2025 分数出炉！附ICLR 2025和CVPR 2025投稿微信群

揭示Transformer重要缺陷！北大提出傅里叶分析神经网络FAN：填补周期性特征建模缺陷

ICLR 2025 即将开分！ICLR 2025和CVPR 2025投稿微信群来了！

这本大模型书籍可以下载了！

即插即用！加速扩散Transformer！Meta提出自适应缓存新方法，视频生成加快2.6倍！

多模态大模型最新研究进展！OpenAI、谷歌、Meta和微软杀疯了！

AAAI 2025 分数出炉！附微信群！

顶刊TPAMI 2024！解耦图神经网络：同时训练多个简单的GNN，而不是一个！

AAAI 2025 即将开奖！附微信群！

Copilot一夜杀死编程助手！GitHub官宣接入Claude和谷歌Gemini！OpenAI沦为备胎。。。

AAAI 2025 投稿微信群成立！

10秒创造一个世界！吴佳俊团队新作实时交互式3D世界生成，比现有技术快100倍！

CVPR 2025 投稿微信群成立！

黄仁勋预言成真了！！

NeurlPS 2024 Oral | 多模态融合检测端到端算法E2E-MFD来了！

CVPR 2025 投稿交流群成立！

Transformer杀疯了！跨模态3D目标检测SOTA！易复现！

NeurIPS 2024 | 免训练！超强！FreeLong：长视频生成框架

CVPR 2025 投稿交流群来了！

LeCun锐评诺奖：出于压力才颁给AI，但两个成果已经完全无用！玻尔兹曼机和Hopefield网络

敲响警钟！首例大模型卷进青少年自杀案？明星AI创业公司面临诉讼。。。

ECCV 2024 | 谷歌提出LookupViT：全新通用视觉Transformer块

ICLR 2025 投稿交流群来了！

OpenAI满血版o1剧透：数学代码能力再破天花板！已开启测试评估！

ECCV 2024 | ClearCLIP：删除两个组件，可以提升语义分割性能！

AAAI 2025 投稿交流群成立！

Apple AI落后两年？库克回应：“不抢首发，只做最好”。。。

异常检测和缺陷检测微信群成立！

AI解决132年数学难题！Transformer成功寻找新的李雅普诺夫函数，三体问题相关

AAAI 2025 投稿交流群来了！

DenseNet作者刘壮官宣！将入职普林斯顿大学助理教授！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

AI解决132年数学难题！Transformer成功寻找新的李雅普诺夫函数，三体问题相关

点击进入—>【Mamba/多模态/扩散】交流群

添加微信号：CVer2233，小助手会拉你进群！扫描下方二维码，加入CVer学术星球！可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料，及最前沿应用！发论文/搞科研/涨薪，强烈推荐！

梦晨 发自 凹非寺转载自：量子位（QbitAI）

作者巴黎师范数学教授：黑魔法一般的方法

后台回复：绘图神器，即可下载绘制神经网络结构的神器！

何恺明在MIT授课的课件PPT下载

CVPR 2024 论文和代码下载

▲扫码加入星球学习

整理不易，请赞和在看

添加微信号：CVer2233，小助手会拉你进群！
扫描下方二维码，加入CVer学术星球！可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料，及最前沿应用！发论文/搞科研/涨薪，强烈推荐！

梦晨发自凹非寺
转载自：量子位（QbitAI）