上智院与集智科学研究中心等联合发布“科学智能十大前沿观察”：探索“AI爱因斯坦”的无限可能

学术 2024-11-11 20:41 北京

导语

在11月11日举办的“2024科学智能创新论坛”上，上海科学智能研究院（下称“上智院“）联合集智科学研究中心（集智俱乐部）、复旦大学、阿里云天池，共同发布了“科学智能前沿观察”。

随着2024年诺贝尔物理学奖和化学奖授予了人工智能（AI）相关研究，科学智能（科学和AI深度融合）及其研究方向引发了从科学家到公众的广泛关注。在与从事科学智能领域前沿研究学者的大量深度访谈基础上，上智院联合合作伙伴，共同概括科学智能新范式，并梳理和凝练了科学智能的十大前沿方向。

“科学智能前沿观察”涵盖AI for Science、Science for AI和科学智能基础设施三个维度，其中，AI for Science的前沿方向包括垂直领域科学大模型、融入先验知识的AI模型、基于LLM模型的科学研究、从提出假设到自动验证的AI科学家、以及复杂世界的多智能体建模；Science for AI的前沿方向则覆盖了物理世界的第一性原理和科学启发的可解释AI新架构；科学智能基础设施前沿方向包括合成数据和新型智能计算。展望未来，面向可信可解释的科学世界模型和上述九个方向共同构成科学智能十大前沿。

上海科学智能研究院院长、复旦大学浩清教授漆远表示，AI与基础科学的深度融合，将开启AI与科学“双螺旋引擎”共振驱动的科学研究新范式。AI for Science和Science for AI，类似DNA和RNA的双螺旋结构，一方面，AI将成为科学研究探索的最前沿；另一方面，科学启发的AI也将成为实现AGI的重要支撑。未来可望有更多的科学智能研究成果问鼎诺贝尔奖。我们联合合作伙伴，发布科学智能前沿观察报告的初心，就是希望推动和支持更多AI和基础研究领域的科学家，深度融合无缝合作，共同探索科学智能的新未来，打造能够自主发现复杂世界未知规律的“AI爱因斯坦”。

科学智能新范式

科学智能（AI X Science）是一个新兴的跨学科研究领域，致力于融合AI与领域科学，其研究方向和驱动力可以形象地表述为“双螺旋引擎”：其一，将AI技术应用于具体领域的科学研究（AI for Science）；其二，将领域学科知识用于AI算法和架构的理解和改进（Science for AI）。

随着大量数据的快速积累和文献的爆炸式增长，人类科学家自身的信息处理能力达到极限，甚至成为研究突破的瓶颈。而越来越多的科学研究领域在面对复杂问题的挑战时也难以利用传统的数学和物理方法。如何将AI运用于垂直的科学领域研究，加速科学发现，扩展科研边界，是AI for Science的核心主题。今年诺贝尔化学奖授予的 AlphaFold2，即是AI算法用于解决科学领域重要问题的研究典范。AI for Science 其他成功研究案例还包括AI可控核聚变、气象模型等等。

不过，虽然已获重大突破，但AI仍然面临数据稀缺、耗能过大、解释性较差等重大挑战。而人类科学家已经积累了各个学科领域的海量知识，如何将科学家的经验和知识，甚至直觉和启发式想法，转化为AI系统的能力，构成了Science for AI研究的重点。Science for AI的典型案例除了已获诺奖的Hopfield网络与受限 Boltzmann 机，也包括受视觉架构启发的CNN网络等。

更进一步，科学智能指向AI和科学更复杂、全面、多维和多向度的深度融合，AI参与到从假设提出到自动验证的科研全流程，并构建包括合成数据和新型智能计算在内的基础设施。

科学研究范式是特定历史时期内科学界普遍接受的理论、方法和价值观的集合，包括科学理论、研究方法、实验设计和数据分析等。科学智能的新范式包括: 第一，构建AI驱动的灰盒模型，将第一性原理和人类先验知识引入AI，形成领域知识启发的AI基础模型，既可数据驱动，也提高了可解释性。第二，从单一尺度走向跨尺度，传统的科学研究大多集中在某个尺度，或两个尺度的互动，而科学智能则同时在多个尺度构建具有深度的科学大模型。第三，从单一模态到多模态，科学智能突破单一模态的局限，可以整合时间序列数据、图像数据或文本数据，建立多模态大模型进行前沿科学探索。最后，科学智能领域有望形成跨学科的统一框架和方法论。

科学智能的无尽前沿

目前，科学智能最多的前沿研究集中在AI for Science领域，又尤以垂直领域科学大模型为代表。大语言模型（LLM）代表了一种新的基础模型范式 —— 通过在海量数据上进行自监督学习，构建具有强大迁移能力的通用模型，再通过微调等技术完成具体任务。能否将基础模型的理念推广到更广泛的科学研究领域，并构建统一的科学基础大模型，来加速跨学科的科学发现进程？虽然目前还没有出现跨学科的统一科学基础模型，但在物质科学、生命科学、医学和气象等领域已经涌现出一批创新性垂直领域科学大模型，以解决特定领域科学问题。

在构建科学大模型的过程中，数据驱动和先验知识的融合是关键。融入先验知识的模型架构，将领域知识融入人工智能模型，可显著提高模型的可解释性，并实现更有效的学习和推理。神经符号（Neuro-Symbolic）AI，结合了神经网络的学习能力和符号AI的逻辑推理能力，其应用AlphaGeometry 即是该方向的一个成功案例。

基于大语言模型（LLM）的科学研究也是热点，探索LLM的科学能力边界，可有效整合和理解跨学科的专业知识体系，有望突破传统方法在知识关联发现上的局限。同时，LLM的出现，尤其是Agent (智能体) 的运用，让AI得以更加高效而顺畅地进入科学研究的全流程，参与从提出假设，到实验验证再到论文撰写的整个科研周期，AI科学家和科学家助手是典型案例。此外，面向复杂世界的多智能体建模运用于宏观经济系统和城市治理，也提供了全新的研究方法和视角。

在Science for AI领域，科学启发的可解释AI新架构正崭露头角， Komogorov -Arnold Networks（KAN）是一个案例。此外，物理世界的第一性原理也是重要研究方方向，泊松流模型是典型范例，其速度比扩散模型提升了10-20倍。

从基础设施的视角看，科学数据不足是制约科学智能发展的核心掣肘。合成数据（Synthetic Data）是解决挑战的科学利器。OpenAI的o1模型运用了大量合成数据，生命科学、物质科学、数学和气象科学领域合成数据的前沿运用也渐成气候。合成数据在推进构建科学大模型方面意义重大。

最后，遵循规模法则（Scaling law），目前AI模型的参数规模和计算需求已经远超现代计算硬件的更新速度、而其能耗和成本也已经到了经济和生态系统难以承载的地步，从而凸显出新型智能计算的前沿和重要意义，基于光学、量子力学的新型高效新型计算架构，以更低的资源消耗和更小的边际成本，为科学人工智能的高速高能效计算开辟新路径。

面向可信可解释的科学世界模型

2024年堪称科学智能“新元年”。通观全局，科学智能发展迅猛，可望引领科学和AI的未来研究突破。

科学智能的挑战和机遇体现在两个方面：第一，AI系统如何运用人类知识，这既包括如何将第一性原理和专家知识融入AI系统，也包括如何提高AI系统的可解释性。第二，AI如何和现实互动并具备实验思维，科学智能需要设计实验，自主与物理世界互动，获取数据，形成世界模型，从而最终实现AGI和“AI爱因斯坦”。

面向未来，可信可解释的科学世界模型是一个可行解决方案。该模型包含两大智能主体：数据驱动为主的AI系统（Data-driven Model），即系统I，融入第一性原理和人类知识的“深思者（Deep Thinker）”，即系统II。从交互机制看，则包括 AI-现实互动（AI-Reality Interaction）界面和人机对齐界面（Human-AI Alignment）。以科学规律为基础、输出结果可靠可信、可泛化、可解释，同时AI与现实世界交互、AI与科学家互动、并最终与人类价值和科学伦理对齐。

可信可解释的科学世界模型

集智研究中心理事长、北京师范大学系统科学学院教授张江表示，“放眼未来，解决人机协同的瓶颈和对齐，同时赋予AI实验思维，可信可解释的科学世界模型是一个可行的解决方案。科学智能需要多元的探索路径，也需要领域科学家和AI科学家的共同努力，在未来科学智能的探索前沿上，相信科学家的直觉和第一性原理依旧是重要支撑。” 据悉，覆盖上述科学智能前沿方向和完整文献解读的《科学智能前沿观察报告》全文将于近期发布。

AI+Science 读书会

详情请见：

人工智能和科学发现相互赋能的新范式：AI+Science 读书会启动

点击“阅读原文”，报名读书会

http://mp.weixin.qq.com/s?__biz=MzIzMjQyNzQ5MA==&mid=2247701383&idx=1&sn=529d56ca42563fc55efd58ab3dc05f7b

集智俱乐部

关注复杂科学与人工智能的前沿进展、书籍资料、工具文献、交叉前沿等，同时也发布集智俱乐部、集智学园举办的各类讲座、课程等活动相关信息。

最新文章

Nat. Commun. 速递：深度学习预测复杂网络系统韧性

双十一限时特惠！加入集智学园VIP，一次性解锁集智平台所有内容资源

AlphaFold3开源了，诺奖AI工具人人可用，开启生物分子设计新时代

上智院与集智科学研究中心等联合发布“科学智能十大前沿观察”：探索“AI爱因斯坦”的无限可能

生物启发的神经形态AI——从昆虫到微型自主无人机丨周三直播·昆虫智能与AI读书会

基于多尺度建模的机器学习正反问题求解｜周四分享·复杂系统自动建模读书会第二季

混沌、吸引子、分形：复杂非线性系统的多稳定性与不可预测性

PRX Life 进展：细胞状态转化中基因调控网络的动力学研究

大模型2.0读书会：融合学习与推理的大模型新范式！

“双11”共议AI Science“双螺旋引擎”！2024科学智能创新论坛议程和嘉宾阵容公布

科普讲座：涌现、因果与人工智能｜集智进校园·香港浸会大学

科学学视角下 AI 对 Science 的影响丨面向未来的科学学读书会

11.11一年一次限时特惠！加入集智学园VIP，一次性解锁集智平台所有内容资源

阻塞相变：无序体系的一阶相变

圆桌讨论：当 AI 遇见细胞复杂系统｜周二直播·生命复杂性读书会

3D视觉运动计算与应用——从昆虫到机器人丨周三直播·昆虫智能与AI读书会

当复杂科学遇见地球系统：气候网络、复杂性与人工智能

长序列预测 & 时空预测万字长文：一文带你探索多元时间序列预测的研究进展！

冯·诺依曼的遗产：寻找人工生命的理论根源

海量时空数据如何改进 POI 推荐系统？对模型、架构与安全的全面综述

如何创造出超越人工智能的生命系统？从自复制自动机到人工生命丨周日直播·《一种新科学》读书会

如何利用数据提高论文影响力？三万篇论文揭示数据中的重组理论

前沿进展：通过层次结构信息和分子动力学模拟发现高活性肽

整合信息指标 Φ 的近似计算｜周六直播·整合信息论读书会

一作解读：数据中的重组理论如何促进科学影响力丨面向未来的科学学读书会

复杂系统的可解释性动力学推断和临界点预测｜周四直播·复杂系统自动建模读书会第二季

社会性昆虫的行为与群体智能丨周三直播·昆虫智能与AI读书会

时空数据的复杂疾病算法研究和临床应用｜周二直播·生命复杂性读书会

诺奖之后，物理学不存在了？——集智科学家解读2024年诺贝尔奖｜周六直播

整合信息论基础理论：IIT4.0 深入研读｜周日直播·整合信息论读书会

爱因斯坦和固体量子论：还原与演生的两条道路

你和ChatGPT理解语言的方式一样吗？从表征对齐角度比较人工神经网络与生物大脑

诺贝尔物理学奖为何颁给机器学习？Physics for AI 综述介绍

科学计算中的符号回归方法｜周四直播·复杂系统自动建模读书会第二季

简单生物如何形成复杂认知？昆虫智能启发群体智能与集群机器人

学术会议预告｜北京邮电大学第五届“系统论、信息论、博弈论”三论融合学术会议

从结合模型与推理的昆虫神经机制研究到轻量化智能算法设计丨周三直播·昆虫智能与AI读书会

扩散模型与演化算法的隐秘联系

Nat. Commun.速递：多任务神经网络预测多体量子态物理性质

信息整合的统一框架：基于信息几何的视角｜周六直播·整合信息论读书会

寻找机器学习的“热力学”：临界相变如何启发机器学习研究？

南京线下：科学学视角的科技劳动力老龄化丨科学学读书会

注册延长！第九届国际认知神经动力学大会 (9th ICCN2024)

分析约 7500 万篇论文揭示：人工智能如何更好地推动科学创新｜集智科学家最新成果

《城市规模法则》：城市研究和空间科学中的异速生长｜新书速递

复杂社会建模与推演：城市应急管理与智能信息传播｜周四直播·复杂系统自动建模读书会第二季

昆虫也有意识吗？昆虫脑的复杂性与意识的进化

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉