转自 | 集智俱乐部
导语:在11月11日举办的“2024科学智能创新论坛”上,上海科学智能研究院(下称“上智院“)联合集智科学研究中心(集智俱乐部)、复旦大学、阿里云天池,共同发布了“科学智能前沿观察”。
随着2024年诺贝尔物理学奖和化学奖授予了人工智能(AI)相关研究,科学智能(科学和AI深度融合)及其研究方向引发了从科学家到公众的广泛关注。在与从事科学智能领域前沿研究学者的大量深度访谈基础上,上智院联合合作伙伴,共同概括科学智能新范式,并梳理和凝练了科学智能的十大前沿方向。
“科学智能前沿观察”涵盖AI for Science、Science for AI和科学智能基础设施三个维度,其中,AI for Science的前沿方向包括垂直领域科学大模型、融入先验知识的AI模型、基于LLM模型的科学研究、从提出假设到自动验证的AI科学家、以及复杂世界的多智能体建模;Science for AI的前沿方向则覆盖了物理世界的第一性原理和科学启发的可解释AI新架构;科学智能基础设施前沿方向包括合成数据和新型智能计算。展望未来,面向可信可解释的科学世界模型和上述九个方向共同构成科学智能十大前沿。
上海科学智能研究院院长、复旦大学浩清教授漆远表示,AI与基础科学的深度融合,将开启AI与科学“双螺旋引擎”共振驱动的科学研究新范式。AI for Science和Science for AI,类似DNA和RNA的双螺旋结构,一方面,AI将成为科学研究探索的最前沿;另一方面,科学启发的AI也将成为实现AGI的重要支撑。未来可望有更多的科学智能研究成果问鼎诺贝尔奖。我们联合合作伙伴,发布科学智能前沿观察报告的初心,就是希望推动和支持更多AI和基础研究领域的科学家,深度融合无缝合作,共同探索科学智能的新未来,打造能够自主发现复杂世界未知规律的“AI爱因斯坦”。
科学智能新范式
科学智能(AI X Science)是一个新兴的跨学科研究领域,致力于融合AI与领域科学,其研究方向和驱动力可以形象地表述为“双螺旋引擎”:其一,将AI技术应用于具体领域的科学研究(AI for Science);其二,将领域学科知识用于AI算法和架构的理解和改进(Science for AI)。
随着大量数据的快速积累和文献的爆炸式增长,人类科学家自身的信息处理能力达到极限,甚至成为研究突破的瓶颈。而越来越多的科学研究领域在面对复杂问题的挑战时也难以利用传统的数学和物理方法。如何将AI运用于垂直的科学领域研究,加速科学发现,扩展科研边界,是AI for Science的核心主题。今年诺贝尔化学奖授予的 AlphaFold2,即是AI算法用于解决科学领域重要问题的研究典范。AI for Science 其他成功研究案例还包括AI可控核聚变、气象模型等等。
不过,虽然已获重大突破,但AI仍然面临数据稀缺、耗能过大、解释性较差等重大挑战。而人类科学家已经积累了各个学科领域的海量知识,如何将科学家的经验和知识,甚至直觉和启发式想法,转化为AI系统的能力,构成了Science for AI研究的重点。Science for AI的典型案例除了已获诺奖的Hopfield网络与受限 Boltzmann 机,也包括受视觉架构启发的CNN网络等。
更进一步,科学智能指向AI和科学更复杂、全面、多维和多向度的深度融合,AI参与到从假设提出到自动验证的科研全流程,并构建包括合成数据和新型智能计算在内的基础设施。
科学研究范式是特定历史时期内科学界普遍接受的理论、方法和价值观的集合,包括科学理论、研究方法、实验设计和数据分析等。科学智能的新范式包括: 第一,构建AI驱动的灰盒模型,将第一性原理和人类先验知识引入AI,形成领域知识启发的AI基础模型,既可数据驱动,也提高了可解释性。第二,从单一尺度走向跨尺度,传统的科学研究大多集中在某个尺度,或两个尺度的互动,而科学智能则同时在多个尺度构建具有深度的科学大模型。第三,从单一模态到多模态,科学智能突破单一模态的局限,可以整合时间序列数据、图像数据或文本数据,建立多模态大模型进行前沿科学探索。最后,科学智能领域有望形成跨学科的统一框架和方法论。
科学智能的无尽前沿
目前,科学智能最多的前沿研究集中在AI for Science领域,又尤以垂直领域科学大模型为代表。大语言模型(LLM)代表了一种新的基础模型范式 —— 通过在海量数据上进行自监督学习,构建具有强大迁移能力的通用模型,再通过微调等技术完成具体任务。能否将基础模型的理念推广到更广泛的科学研究领域,并构建统一的科学基础大模型,来加速跨学科的科学发现进程?虽然目前还没有出现跨学科的统一科学基础模型,但在物质科学、生命科学、医学和气象等领域已经涌现出一批创新性垂直领域科学大模型,以解决特定领域科学问题。
在构建科学大模型的过程中,数据驱动和先验知识的融合是关键。融入先验知识的模型架构,将领域知识融入人工智能模型,可显著提高模型的可解释性,并实现更有效的学习和推理。神经符号(Neuro-Symbolic)AI,结合了神经网络的学习能力和符号AI的逻辑推理能力,其应用AlphaGeometry 即是该方向的一个成功案例。
基于大语言模型(LLM)的科学研究也是热点,探索LLM的科学能力边界,可有效整合和理解跨学科的专业知识体系,有望突破传统方法在知识关联发现上的局限。同时,LLM的出现,尤其是Agent (智能体) 的运用,让AI得以更加高效而顺畅地进入科学研究的全流程,参与从提出假设,到实验验证再到论文撰写的整个科研周期,AI科学家和科学家助手是典型案例。此外,面向复杂世界的多智能体建模运用于宏观经济系统和城市治理,也提供了全新的研究方法和视角。
在Science for AI领域,科学启发的可解释AI新架构正崭露头角, Komogorov -Arnold Networks(KAN)是一个案例。此外,物理世界的第一性原理也是重要研究方方向,泊松流模型是典型范例,其速度比扩散模型提升了10-20倍。
从基础设施的视角看,科学数据不足是制约科学智能发展的核心掣肘。合成数据(Synthetic Data)是解决挑战的科学利器。OpenAI的o1模型运用了大量合成数据,生命科学、物质科学、数学和气象科学领域合成数据的前沿运用也渐成气候。合成数据在推进构建科学大模型方面意义重大。
最后,遵循规模法则(Scaling law),目前AI模型的参数规模和计算需求已经远超现代计算硬件的更新速度、而其能耗和成本也已经到了经济和生态系统难以承载的地步,从而凸显出新型智能计算的前沿和重要意义,基于光学、量子力学的新型高效新型计算架构,以更低的资源消耗和更小的边际成本,为科学人工智能的高速高能效计算开辟新路径。
面向可信可解释的科学世界模型
2024年堪称科学智能“新元年”。通观全局,科学智能发展迅猛,可望引领科学和AI的未来研究突破。
科学智能的挑战和机遇体现在两个方面:第一,AI系统如何运用人类知识 ,这既包括如何将第一性原理和专家知识融入AI系统,也包括如何提高AI系统的可解释性。第二,AI如何和现实互动并具备实验思维,科学智能需要设计实验,自主与物理世界互动,获取数据,形成世界模型,从而最终实现AGI和“AI爱因斯坦”。
面向未来,可信可解释的科学世界模型是一个可行解决方案。该模型包含两大智能主体:数据驱动为主的AI系统(Data-driven Model),即系统I,融入第一性原理和人类知识的“深思者(Deep Thinker)”,即系统II。从交互机制看,则包括 AI-现实互动(AI-Reality Interaction)界面和人机对齐界面(Human-AI Alignment)。以科学规律为基础、输出结果可靠可信、可泛化、可解释,同时AI与现实世界交互、AI与科学家互动、并最终与人类价值和科学伦理对齐。
可信可解释的科学世界模型
集智研究中心理事长、北京师范大学系统科学学院教授张江表示,“放眼未来,解决人机协同的瓶颈和对齐,同时赋予AI实验思维,可信可解释的科学世界模型是一个可行的解决方案。科学智能需要多元的探索路径,也需要领域科学家和AI科学家的共同努力,在未来科学智能的探索前沿上,相信科学家的直觉和第一性原理依旧是重要支撑。”