摘要:以ChatGPT为代表的大模型带来人工智能(AI)的突破性进展,科学家也在积极探索人工智能在科学研究上的应用前景,使得科学研究从实验范式、理论范式、计算范式、数据驱动范式,迎来了AI for Science(AI4S)的第五范式。本文分析当前科研范式变革进展,发现各科研范式之间互相继承和发展并在实践中相互渗透和融合。而人工智能的快速发展使得当前科研范式在思维方式、科研模式、组织模式、科研决策等方面发生重大变化,呈现出复杂系统性思维、平台化科研、开放共享的组织模式以及人机协同的决策模式等新特征。基于当前科研范式变革背景,本文从培养复合型人才、拓展应用场景、完善技术生态、数据安全和共享等维度提出了相应的建议和对策,以便更好地发挥人工智能在科研领域的重要作用。
关键词:人工智能;科研范式;变革;特征
科学研究是破解全球难题的重要手段,随着科学知识生产过程中的实用化趋向,科学研究的对象、功能和方式不断拓展,使得当前科学研究正在面临瓶颈,尽管全社会对科技的重视程度及投入越来越大,论文与专利越来越多,但颠覆性成果却越来越少,当前科学研究急需打破传统思维,推动科学范式的变革。以ChatGPT为代表的大模型技术带来人工智能(Artificial Intelligence,AI)的突破性进展,人工智能越来越多地融入到科学发现之中,帮助科学家产生假设、设计实验、收集和解释大型数据集,并获得仅使用传统科学方法可能无法获得的见解,使得科研范式发生变革性突破。例如,生物医药领域中,人工智能应用于mRNA和蛋白质结构领域,中美科学家开发的算法Linear Design,仅需11分钟就能生成可编码SARS-CoV-2刺突蛋白的最佳mRNA序列;Google公司DeepMind团队开发出的人工智能产品AlphaFold2可根据氨基酸准确预测出蛋白质结构;腾讯人工智能实验室(AI Lab)自研人工智能工具“tFold”有效提升了蛋白质结构预测精度等。
当前科学研究正在迎来人工智能驱动的第五范式,即AI for Science(AI4S),也有学者以“智能科学家”“科研智能化”“智能化科研”等不同的命名来研究这一范式。2020年初,美国能源部发布AI for Science报告,涵盖高能物理、材料科学、计算技术等领域,以促进人工智能在科学上的应用;2022年,阿里巴巴达摩研究院发表的《年度十大科技预测》报告中,AI for Science位居榜首;2023年3月,我国科技部会同国家自然科学基金委员会启动“人工智能驱动的科学研究”专项部署。作为人工智能发展与应用的一大趋势,国内外学术界及业界已对AI for Science形成共识。为更好地把握AI for Science带来的科研范式变革机遇,美国2023年10月成立人工智能与科技人才工作组,2024年4月发布《提高联邦政府的人工智能能力:人工智能人才激增的进展和建议》,旨在推动联邦政府加快聘用人工智能和人工智能赋能岗位人才。欧盟发布“地平线欧洲”第二个战略规划(2025—2027年),提供大量的资金支持人工智能研究项目。因此,亟须厘清人工智能背景下科研范式变革特征和趋势,为进一步提升科技创新的质量与效果,促进我国科技强国建设提供有力支撑。
“范式”理论最初由美国科学哲学家托马斯·库恩于1962年在其著作《科学革命的结构》中提出,2007年图灵奖得主吉姆·格雷(Jim Gray)在《e-Science:一种科研范式的变革》报告中对库恩的“范式”和“科学革命”理论进行了延伸,并将科学研究方法的演变凝练成实验范式、理论范式、计算范式、数据驱动范式四类。随着数据的爆炸式增长以及计算能力的飞速提升,现代科学研究已经从小数据发展到大数据,再到小智能、深度智能的智能数据,人工智能可以处理更高维度、更多变量、更复杂的问题,在Jim四大范式研究的基础上,随着人工智能应用于科学研究,科研范式脱离数据范式,逐渐作为独立的新的范式,即第五范式。
学者们从不同角度研究了第五科研范式的内涵、特征、路径等。杜鹏等认为新科研范式内涵包含三个方面,仿真模拟和数据科学是推动科研范式变革的有效突破口,组织创新则成为推动科研范式变革的基础,而解决系统性复杂问题是推动科研范式变革的主要驱动力。王飞跃等强调第五范式以虚实交互、平行驱动的人工智能技术为核心,以智联网和区块链构建基础,以融入人的价值和知识为手段,以人机共融为特征。Leng等则认为跨学科知识和智能驱动是第五范式的特征。北京科学智能研究院发布的《2023AI4S全球发展观察与展望》提出,模型驱动、数据驱动、数据+模型驱动是AI4S的三条实现路径。从以上研究可以看出,第五范式以人工智能技术及数据驱动为核心,组织变革为推动科研范式变革的基础,以解决系统性复杂问题、人机协同、跨学科知识为特征,四大范式+AI为实现路径。
各科研范式间并非相互独立,而是存在明显的继承和发展关系,并且在具体的研究实践中相互渗透和融合。实验科学为理论科学提供了实验基础和经验数据,理论范式是各科研范式的核心,可以指导实验、计算科学,并通过实验和计算进行验证,而实验和计算会产生大量的原始数据。随着大数据时代的到来,大数据逐步作为理解、发现和探索理论的有力工具,也为实验和计算提供了有力的支撑。AI for science范式下,人工智能有效提升了实验、理论、计算、数据等能力,例如,机器学习可以助力理论的构建,实验、理论、计算和数据范式为第五范式的发展奠定了基础。科研范式也逐渐从“人脑”为主的实验和计算科学、电脑为主的数据科学、过渡到人机协同的人工智能驱动范式。然而,He和Burtsev通过设置三个测试标准(即人工智能应该自动进行发现,无需人工干预;它应该揭示一个具体的数学结构;激发新的研究应该具有足够的重要性),对人工智能进行测试,认为人工智能尚并不能进行理论发现。各科研范式关系见图1。
当前,科学研究在内容、方法、领域都发生了深刻的变化,研究内容正在逐步从“静态、平衡”向“动态、非平衡”的状态转变,从局部现象的研究向系统行为的探索延伸;研究方法逐渐转向定量预测及跨学科的交叉融合,实现了人工智能辅助的数据分析;研究领域也从碎片化的知识向集成化的知识体系转变,开始追求复杂性科学的探索、多尺度关联的研究。这要求科研人员具备更强的系统思维和动态分析能力,能够从整体和全局的角度研究复杂系统的运行规律和演化机制,运用先进的技术手段进行数据挖掘和知识发现,通过复杂性科学的方法和工具进行深入研究。人工智能在科研创新中的应用正在深刻地改变传统的科研范式,对思维方式、科研模式、组织模式和科研决策等方面产生重要影响,出现了新的特征(图2)。
面对人工智能时代下科研范式在思维方式、科研模式、组织模式、科研决策等多层面的变革,考虑到科研范式变革的复杂性及当前科学发展的现实需求,本文主要围绕人才培养、应用场景、技术生态、数据安全和共享提出四点对策建议。
AI for Science作为大量学科交叉,产学研紧密协作的新兴科研范式,需要跨领域人才的深度融合。需要相关从业者既有足够的科学学科背景,又要懂人工智能相关技术,还要具备将科学突破转化为产业创新的工程能力。如AlphaFold2,要求开发者既要了解蛋白质结构相关的生物学知识,又要了解深度学习等人工智能技术,还要有能力将算法软件化并推广到各大药厂与科研机构。因此,要大力培养多学科交叉复合型人才,鼓励科研人员积极利用和学习人工智能工具,高校建立跨学科的人才培养体系,同时,深化AI for Science领域的国际合作,培养更多的人才参与到AI for Science的发展中。
编辑部信息
邮箱:bj@clas.ac.cn
电话:028-85223853
网站:www.globesci.com