点击蓝字
关注我们
人工智能驱动科研的哲学审视
于金龙
(北京航空航天大学 人文与社会科学高等研究院,北京 100083)
作者简介:于金龙(1976—),男,内蒙古赤峰人,副教授,博士,研究方向为科学技术哲学、系统科学哲学。
基金项目:教育部哲学社会科学研究重大课题攻关项目(23JZD006)。
摘要: 当前人工智能与各学科之间的汇聚、耦合特征日趋明显,成为驱动科学研究变革的重要力量,人工智能驱动的科研正在推动新一次的科研范式革命,科研活动将走向数据化、自动化和智能化。从认识论视角,人工智能驱动科研将带来智能涌现、暗知识等新的知识类型,并实现一种基于高维度计算的认知模式;从方法论视角,人工智能驱动科研拥抱不确定性,解决复杂性问题,通过概率模型提供有价值的知识成果,并将开创一种融合人类科学家和人工智能科学家的科学研究模式。
关键词:人工智能驱动科研 涌现智能 人机合作 科研范式革命 新型工业化
一、 问题的提出
党的二十大报告提出,到2035年“基本实现新型工业化”。而新型工业化的关键特征是技术和创新驱动,这归根结底要依赖科研创新。当前,人工智能驱动科研已改变传统科研模式,在材料、生物医学、芯片设计等领域取得了瞩目的成果。为了顺应这一趋势,一些科研单位和政府机构积极推动人工智能驱动的科学研究,例如,康奈尔大学成立了人工智能驱动科学研究所(Cornell University AI for Science Institute,CUAISci),美国国家自然科学基金(National Science Foundation,NSF)部署了人工智能驱动科研专项课题,中国科技部联合自然科学基金委员会启动了“人工智能驱动的科学研究” (AI for Science)专项工作。
目前,国内外学界在这一领域的研究尚处于起步阶段,相关研究较为分散。Wang等指出,人工智能驱动科研可帮助科学家产生假设,设计实验,收集和解释大型数据集,并获得仅使用传统科学方法可能无法获得的见解[1]。Grisoni等提出利用人工智能的“设计—制造—测试—分析”自动化药物发现模式[2]。2024年5月,英国皇家学会(The Royal Society)发布了报告《人工智能时代的科学:人工智能如何改变科学研究的性质和方法》,该报告不仅指出了人工智能在医学、材料、农业等领域的应用和潜力,也指出了跨学科性、可重复性、伦理问题等挑战[3]。2024年1月,《中国科学院院刊》在“大力推进科研范式变革”专题中,邀请多位院士、专家阐述人工智能驱动科研的内涵与实践。例如,王飞跃和王雨桐认为数字人科学家、机器人科学家将与人类科学家平行、并存,今后相当体量的人类科学家工作是“对齐”与“提示”[4]。尽管人工智能驱动科研尚未全面铺开,但其将成为未来科研形态的共识已逐渐达成。
面对这一新的科研范式,相关领域学者在经验层面总结具体科研实践、展望应用前景,这成为该领域当前研究的主流。然而,仅凭经验层面的考察不足以深入理解其变革性意义,因此有必要从哲学角度展开审度。在人工智能驱动科研的哲学研究方面,尚有一些重要问题有待澄清,如人工智能生产的知识性质、认知模式特征、新方法论内涵等。
二、 人工智能驱动科研的范式革命
人工智能驱动科研是在深度学习、生成式人工智能等技术取得突破性进展的背景下被提出的。美国能源部是这一概念的早期倡导者,曾于2019年组织了千余名科学家和工程师研讨所发生的科研变革,在总结报告中引入人工智能驱动科研,以此来表示人工智能技术应用(如机器学习、深度学习、统计方法、数据分析、自动控制等相关领域)带来的下一代方法和科学机会[5]。
(一) 五次科学研究革命
人类的科研活动可追溯至古希腊时期,自然哲学家通过肉眼观察自然现象,运用哲学思辨的方法探究世界的本原,这种基于朴素、直观经验观察的研究范式被称为经验科研范式,以亚里士多德(Aristotle)的自然哲学体系为代表。经过16世纪的科学革命,科学研究脱离哲学母体,将数理逻辑与经验相结合,这被称为理论科研范式,以艾萨克·牛顿(Isaac Newton)力学为代表。然而,随着理论模型变得复杂,往往无法通过解析解决,现代计算机技术带来了仿真模拟范式,即通过对数据进行分析、计算,得出问题的解。在此基础上,图灵奖获得者吉姆·格雷 (Jim Gray)进一步提出科学研究的第四范式,即数据密集型科研[6]。他认为,已发表的文献只是数据的冰山一角,还有很多被收集起来的数据没有被发布。原则上,可以将所有的科学数据与所有的文献统一起来,阅读论文的同时查阅原始数据,从而实现文献和科学数据全部线上共享。
数据密集型科研,强调对科研数据开展全流程的记录、管理和共享,拓展了科学交流的内容,但是并不涉及数据的自动生成或分析。利用人工智能促进科研一直处于该领域的探索前沿。例如,20世纪50年代,基于符号主义进路的人工智能程序DENDRAL可以利用质谱仪中电子轰击分子产生的离子碎片模式作为输入数据,对原子的类型和排列进行连续推断,并从数百或数千个候选化合物中识别该化合物,这不仅是专家系统的原型,也是人工智能在生物医学领域的第一次应用[7]。再如,深度学习算法复兴的标志性成果之一是乔治·达尔(George E. Dahl)于2012年利用多任务深层神经网络预测一种药物的生物分子靶标并以此赢得了“默克分子活动挑战赛”。由于人工智能驱动科研的应用持续涌现,2022年微软全球技术院士克里斯·毕晓普(Chris Bishop)提出,人工智能驱动科研是科学研究的第五范式。
(二) 人工智能预测蛋白质结构的实践范例
人工智能驱动科研最成功的实践范例之一是AlphaFold。AlphaFold可以根据蛋白质的氨基酸序列预测蛋白质的3D结构,催化了生物学的新一轮进步。AlphaFold经历了两次迭代:2018年首次发布的AlphaFold1,在当年的一场竞赛中成功地预测出最难的结构;其下一代产品AlphaFold2,在结构预测方面的准确率远高于其他竞争者;AlphaFold3不再局限于单链蛋白质,还可以预测蛋白质复合物、DNA、RNA等结构。蛋白质是人体的生命基石,其功能由每个蛋白质分子独特的3D形状决定。深入研究蛋白质结构,对治疗疾病、开发新药等具有重要意义。目前,人类已解析了十万种蛋白质的结构,但相较超过2亿的种类总数,这仍只是冰山一角,人类科学家发现一种蛋白质结构有时需要数年时间和数十万美元[8]。
人工智能预测蛋白质结构的原理是利用蛋白质进化史中的生物信息以及与已解结构的同源性。得益于基因组测序的爆炸式增长、蛋白质数据库的丰富,利用生物信息学方法预测蛋白质结构得到长足发展,但是在没有同源结构时,其预测结果的准确性仍远远低于实验结果。AlphaFold采用深度学习算法,对蛋白质序列和结构数据进行训练,可根据氨基酸序列预测蛋白质的三维结构,得到接近实验精度预测蛋白质结构,这解决了一个存在了几十年的科学难题[9]。这将彻底改变蛋白质结构解析领域的研究范式:从只能通过费时费力的传统实验技术解析蛋白质结构转变为低门槛、高精度、高通量地预测蛋白质三维结构的新范式,通过提取和学习高维、复杂的知识,促进对蛋白质物理结构和功能的更深入理解[10]。
三、 人工智能驱动科研的认识论特征
(一) 涌现智能与暗知识
从雪花的分形图案到人类智能,宇宙充满了复杂的现象,复杂系统有助于增进对自然和社会现象的理解和预测。20世纪90年代,不确定性和不可预测性现象引起学者对复杂系统的兴趣,涌现(emergence)、自组织(self-organization)等概念得到重视。1875年,哲学家乔治·亨利·刘易斯(George Henry Lewes)在讨论因果关系时,从哲学角度提出了“涌现”的概念,认为当人们不能追溯各因素如何导致了某个结果,这一过程就是涌现[11]66。涌现现象在不同学科中均有表现,如伊利亚·普里高津(Llya Prigogine)的化学系统耗散结构、曼弗雷德·艾根(Manfred Eigen)的超循环以及生态系统等。涌现是由于多个个体或部分之间的相互作用和复杂的组织结构,产生了整体行为或性质,这些行为或性质不是单个个体或部分所能简单预测或解释的现象,具有不可预测性、非线性、自组织等特征。例如,由沙粒堆成的城堡会出现崩塌现象,而沙粒本身并不会,这种崩塌就是沙粒涌现出来的现象。
人工智能也是一种复杂系统,当参数达到一定规模,将呈现涌现现象。例如,人工智能在与人类进行围棋对弈时,出现人类棋手从未见过的招式,其能从文字、数据材料中得出新颖结论。当前,人工智能已经具备了从人类已有知识、数据中,通过自主学习,产出对人类有用的新知识的能力。从涌现的观点来看,人工智能不是对已有知识的简单组合、整理,而是基于更深层次的“理解”,形成原有知识所不能涵盖的新知识。人工智能的涌现过程,是一种从信息到知识的加工过程,从无序的、低价值的信息中产出有序的、高价值的知识[12]。
然而,机器认知与人类认知存在显著差异,机器不是按照人类的方式来理解、处理信息的。约翰·塞尔(John Searle)的中文屋实验已经表明,即使人工智能在知识产出或行为的表现上与人类无差别,也不能断言机器对其工作任务有真正的“理解”。但是,玛格丽特·博登(Margaret A. Boden)认为,机器至少可以理解指令和机器规则,其借用斯洛曼的观点指出,重要的问题不是“机器什么时候能理解某件事”,而是“一台机器需要做什么事情才能理解” [13]。机器具有独特的认知与理解,这一认知过程是具备创造力的,是一种自发产生新奇事物的行为,没有人可以事先预测结果。因此,机器产生的涌现智能是一种新认知力量,但人类尚不能把握、理解其认知过程。
如果说机器的涌现智能最终呈现的结果是“明知识”,那么还有一些在人工智能信息加工过程中产生的、未输出的中间形态知识被称为“暗知识”(dark knowledge)。杰弗里·辛顿(Geoffrey E. Hinton)在阐述知识蒸馏概念时,提出了“暗知识”概念,其是指隐藏在海量数据中、人类无法感知与描述的事物之间的联系[14]。在深度卷积神经网络的训练或工作过程中,神经网络以分层的方式来学习知识,从浅层到深层的学习过程中,形成的知识抽象程度越来越高。在训练模型的最后一层,由于最终目标是筛选出概率值最高的输出,其他较小概率的输出通常被省略。然而,这些较小概率的输出也可以提供一些额外的信息,这些信息即属于暗知识。例如,一辆汽车的图像通常只有较低可能性被误认为是垃圾车,但这种错误仍然比将其误认为是胡萝卜的可能性高很多倍[15]。人工智能产生的暗知识不仅是机器认知过程中有一定价值的中间产品,也是理解机器如何产生知识的重要参照内容,并占据机器产生知识的大多数。
(二) 从还原论到高维度计算
现代科学的成功源于实验科学的发展,科学场域从自然界进入实验室,虽然科学研究任务仍然是理解和解释复杂的自然界,但还原论方法将复杂的自然现象和系统分解为更基础的组成部分来理解。Quine在《经验论的两个教条》中首次使用了还原论(reductionism)这一概念,并从认识论上指出其含义:每一个有意义的陈述都等同于一些涉及直接经验的逻辑结构,那么每一个陈述,都可以接受证实或信息[16]。哲学中使用的“还原”一词表达了这样一种观点,即如果实体X还原为实体Y,那么Y在某种意义上先于X,或者比X更基本[17]。作为一种科学领域的认知方法,还原论思想在勒内·笛卡尔(René Descartes)的理论中已得到明确表述,其曾建议人们把每个困难分成尽可能多的可行和必要的部分来解决。在还原论的指导下,世界被视为从宏观社会群体到生物、细胞,直至基本粒子的一系列的简化层次。科学认知是将复杂自然还原为单一对象。自然是高维度的存在,其具有多重属性,这些属性之间又形成复杂关联,导致人类认知无法从整体上把握自然。于是,人类尝试从单一维度去理解,产生了“分科之学”,即科学。从这个意义上讲,放弃对自然复杂性的全面理解,基于学科的单一视角开展科学研究,这本质上是一种“降维”。科学家在实验室控制条件下考察研究对象的单一属性,又进一步将认知范围聚焦于有限的操作对象。
尽管在还原论指导下的现代科学取得了巨大成功,但是在面对复杂系统时却出现困境,即复杂系统中表现出的现象和功能无法进行还原解释。例如:在物理学领域,对单个粒子运动规律的解释无法回答波粒二象性;在医学领域,细胞学说无法解释人类意识等。还原论在科学研究中的困境在20世纪初已露端倪,量子物理学先驱保罗·狄拉克(Paul Dirac)在1929年评论:“大部分物理学和整个化学的数学理论所必需的基本物理定律是完全已知的,困难只是这些定律的精确应用导致方程太复杂而无法求解”[18]。要解决复杂系统的问题必须改变还原论认知模式,力求在更高维度上来把握研究对象。正是在这个意义上,诺贝尔奖得主罗伯特·劳克林(Robert B. Laughlin)认为,人们现在正离开还原主义时代,进入涌现时代[11]66。
人工智能具备对高维度问题的求解能力,这将促使科学研究从追求简化模型到依赖复杂系统网络,改变传统的科学发现模式,帮助科学家得到最优解。例如,在蛋白质设计中,氨基酸的种类约为20种,如果氨基酸的长度为100,那么就可能会有20100种蛋白质。在这种情况下,采用人工求解必定时间漫长,由于科学家能力和精力的限制,需要借助专家知识对检索范围进行降维处理,才可能得到满足科学家需求的输出。但是,这也意味着检索和验证工作会忽略大量的可能数据,导致难以找到最优解。而人工智能借助庞大的自动化算法和算力,可以检索、验证更大的数据范围,得到比人类科学家更优的解[19]。
地震预测模型是人工智能高维度计算的另一个成功实践。近三十年,用来预测地震余震的模型基本未改变,传统的地震预测依赖统计模型,传统模型设计之初的意图是根据较少的观测建立可靠的预测。然而,当今地震科学家拥有更灵敏的设备和更大的数据存储能力,地震数据集更大且更详细,而旧的模型很难用于处理现在可用的庞大的地震学数据集。为了解决这个问题,研究人员创建了一个新模型,其能够整合更大的数据集,将每次地震中的各种相关信息都纳入考虑,相较于传统统计模型,这是一个升维的过程;新模型的表现已经显著优于旧模型。随着地震数据集越来越大,模型可以将更精细的细节和增加的数据量转化为更准确的预测。
四、 人工智能驱动科研的方法论特征
(一) 拥抱不确定性
科学实践存在普遍的不确定性,这种不确定性可能来自测量误差、数据噪声、系统动态变化,也可能来自建模者没有考虑到的因素等。从约瑟夫·劳斯(Joseph Rouse)的科学实践哲学观点来看,作为科学知识产生的场所——实验室,其重点是控制不确定性;知识生产过程中的所有参与要素,如操作者、仪器等,都是不确定性的来源,而控制不确定性的工作被约瑟夫·劳斯称为“标准化”(standardization)[20]。标准化是一个使情境中的要素更加稳定和普通化的过程,科学实验工具和仪器就是标准化的结果,某项实验的操作流程也是一种标准化。标准化降低了操作失误、特殊技能等因素的不稳定性,并通过在实验室外部重构实验情境,实现结果的可复现性。但是真实的自然、社会环境充满了复杂的、不可被控制的因素,如果未将这些因素纳入知识生产过程,将导致知识走出实验室之后不可复现[21]。所以以追求确定性为目标的实验室研究在面对复杂性问题时往往表现不佳,而处理不确定性是复杂性科学的常态,也是人工智能驱动科研的优势所在。
人工智能处理不确定性问题的关键是概率统计模型。计算机科学家凯文·墨菲(Kevin P. Murphy)指出,概率论在机器学习中处于核心地位,相较于传统的确定性方法,概率模型提供了一种量化和推断不确定性的框架,能够有效地处理数据中的噪声和不完整信息,并且随着数据量的增加和计算能力的提升,它能够更加准确地捕捉数据背后的真实结构和变化规律[22]。概率模型引入知识生产过程将对科研活动带来以下两个转变。
一是科学发现从追求因果性转向追求相关性。传统科学研究通常依赖于建立假设和验证因果关系来解释现象,研究过程依赖严密的逻辑和标准操作程序。而人工智能驱动科研通过挖掘数据中的模式和相关性来进行分析和预测,即从关注单一因果路径转向了复杂的相关性网络。这种转变在气候科学、医学等领域均有显著体现。例如,研究者通过机器学习算法分析卫星数据、土地覆盖数据库、锋面气象数据等,揭示了更复杂、极端天气模式与事件之间的相关性[23]。这挑战了传统研究的因果链条假设,强调了多因素相互作用对于气候变化的影响,不仅拓展了对现象背后机制的理解,也提高了预测和干预的精准度。
二是知识标准从可解释性转向可预测性。在传统科学研究中,知识标准主要包括可重复性、理论的严密性和实验的可验证性等,其核心是要建立实验现象与理论之间的解释关系,构建研究数据背后的自然一致性,力图还原真实世界的图景。人工智能驱动科研的知识标准向更加实用的方向转变,其目标不是构建真实世界模式,而是根据给定数据,尽可能精确地展示预测能力,发现隐藏在大规模数据背后的模式和规律。科学知识的可解释性标准仍然重要,但对于人工智能驱动科研来说,如果人工智能产出的知识被检验数据反复确认,正如新的地震模型所表现出那种预测能力,那么这种知识可以因其预测表现和效用的验证而被接受,即使科学界仍然无法对模型黑箱作出解释。
(二) 试错与人机合作
卡尔·波普尔(Karl Popper)提出了科学知识的猜想与反驳演进方式,强调科学理论应当具有可测试性和暂时性,科学家要通过不断地试错来逐步靠近真理,其哲学思想与人工智能大模型的工作原理存在一定的关联。以大语言模型为例,其在训练过程中产生的临时知识可被视为一种假设,要依赖上下文和逻辑规则来验证或修正这些假设,通过不断试错来优化输出。例如,在反向传播算法中,神经网络通过计算误差并反向传播这些误差,能够了解每个权重对误差的贡献,进而影响下一轮权重更新,并作出自动调整以提高准确性。模型在训练和使用过程中,会不断积累经验并调整参数,改进文本质量和逻辑一致性。
虽然卡尔·波普尔的猜想和反驳思想,与人工智能反向传播的算法逻辑具有相似性,但二者存在实质性差别——前者是假设驱动,后者是数据驱动。在假设驱动的科学研究中,假设是研究的起点和指导方向。如果事先未形成假设,则研究者无法设计实验,也无法得出结论,因为假设是对复杂研究对象的一种简化,允许研究者只考虑有限的数据和因素,例如,临床对照实验通过控制实验条件,只考察单一药物的临床效果。假设通常是由科学方法和理论指引的,所以也被称为理论驱动的研究。研究者在理论知识和先前研究的基础上提出假设,然后设计实验、采集数据,以验证或反驳假设。而数据驱动的科学研究,通过收集、存储和分析大规模数据集来发现其中隐含的模式、关系和趋势,从而生成新的科学见解。由于产生数据的环境和过程的复杂性,所以研究问题可能没有一个强有力的理论基础[24]。没有了先验信念,这也意味着研究活动不会受到既定思维的束缚,结果是由数据中的关系决定的,从而为产出新见解提供了可能。
但人工智能在推理、评估的可信度方面仍存在一些问题。例如,一个名为ConceptNet人工智能程序包含这样的信息:狗能够吠叫,且可以成为宠物和玩飞盘。但是,该程序无法说明:狗不能喵喵叫、不能养宠物、不能扔飞盘[25]。人工智能很容易出现常识性的错误,这是人类思维通常不会出现的,所以需要人类来检查人工智能输出的候选解决方案,是否有可能存在缺陷、违反常识和科学共识。人类擅长不需要推理的任务,即依赖直觉和无意识来完成任务,这种能力可以帮助人工智能剔除明显错误的想法。为了让人工智能驱动科研的成果更值得信赖,需要人类科学家与人工智能进行合作,建立一套清晰的、人类可验证的规则,确定人工智能产出知识的最低可靠性标准。实际上,人类智能也可类比为一个认识系统,当现有的想法不足以解决现有问题时,人类的神经网络将在给定的环境和随机噪声中产生新想法,通过逻辑检查的想法在有意识地控制下执行,如果成功并重复多次,就会自动化,并离开意识领域[25]。
人工智能和人类智能在科研活动中的认知方式和优势不同,有必要开展人机合作。1990年,飞利浦·基切尔(Philip Kitcher)首次提出认知劳动分工概念[26],试图说明在科学界中最优的认知分工模式是什么,科学家个人之间的知识分裂如何在科学事业中产生统一的知识。由于当代科学的复杂性远远超出了任何科学家个人的体力和认知能力,现代科学需要认知劳动的分工。认知劳动分工理论解决的关键问题是认知资源的最优配置,人机合作实现各智其智,亦是一种认知劳动分工。这样一来,人工智能不仅仅是一种研究手段或工具,还成为了新的研究主体。“人工智能科学家”代表着一种全新的科学实践形式,其虽可能执行与人类科学家不同的科学过程,但有机会超越当前人类的认知局限。
五、 余论
许多科学家对人工智能驱动科研抱有乐观期待,不论是提出“第五次科研范式”还是“人工智能科学家”,其目标是人工智能对齐甚至超越人类科学家。在这种愿景下,日本科学家北野宏明(Hiroaki Kitano)提出诺贝尔图灵挑战赛,即到2050年,人工智能科学家能够做出诺贝尔奖级别的重大科学发现[27]。要实现这一宏伟目标,本研究认为,要在哲学层面理解人工智能驱动科研的变革特征:其一,人工智能驱动科研是一种全新的科研认知模式。从认知过程来看,应将机器知识视为一种新知识类型,并且这种知识的生产并非基于简化、还原认知模型,而是通过对大数据集的高维度计算,实现复杂认知。因此,如果仅将人工智能作为辅助人类科学家的工具,将极大地低估其潜力。其二,人工智能驱动科研以承认并处理不确定性为前提,这与传统的控制不确定性的研究方法有明确差别,由于概率模型的引入,对人工智能生成知识的评价标准需要从传统的可解释性转向可预测性。
然而,也有质疑和批判的声音认为,人工智能驱动科研还面临着缺少大规模科学数据集、结论的偏见问题、黑箱困境等挑战[28]。以黑箱困境为例,神经网络方法揭示了数据相关性,但是其内部工作与现实世界的物理状态或动态系统的抽象都没有明显的关系,人类无法检验其知识产出的逻辑,产生的知识可能是不可靠的,这对科研活动来说是一个重大挑战。例如,Roberts等发现,在62项已发表的关于COVID-19的研究中,没有一项研究具有临床应用的潜力。这要求人类科学家对此作出弥补,通过第一原理、理论模型来寻找机器知识的因果解释,如在人工智能发现某种新药物之后,科学家需要解释其有效性机制[29]。也有学者指出,基于数据驱动的人工智能方法可能过于自信地将复杂的科学问题简化为统计学问题,如过度依赖神经网络并引入大量模糊的参数,这种做法可能不利于科学的深入发展[30]。要言之,需要以新的视角去理解人工智能驱动科研,虽然人工智能尚不能取代人类科学家,但未来有潜力成为人类科研模式之外的一种平行范式,并促进人机合作科研的新格局。
参考文献:
[1]WANG H, FU T, DU Y, et al. Scientific discovery in the age of artificial intelligence [J]. Nature, 2023, 620(7972): 47—60.
[2]GRISONI F, HUISMAN B J H, BUTTON A L, et al. Combining generative artificial intelligence and on-chip synthesis for de novo drug design [J]. Science Advances, 2021, 7(24): 1—9.
[3]ROYAL SOCIETY. Science in the age of AI: How artificial intelligence is changing the nature and method of scientific research [EB/OL]. (2024−05)[2024−07−12]. https://royalsociety.org/-/media/policy/projects/science-in-the-age-of-ai/science-in-the-age-of-ai-report.pdf.
[4]王飞跃, 王雨桐. 数字科学家与平行科学:AI4S和S4AI的本源与目标[J]. 中国科学院院刊, 2024, 39(1): 27—33.
[5]STEVENS R, TAYLOR V, NICHOLS J, et al. AI for science: Report on the department of energy (DOE) town halls on artificial intelligence (AI) for science [EB/OL]. (2020−02)[2024−07−01]. https://publications.anl.gov/anlpubs/2020/03/158802.pdf.
[6]GRAY J. On eScience: A transformed scientific method [C]//TANSLEY S, TOLLE K M. The fourth paradigm: Data-intensive scientific discovery. Washtington: Microsoft Research, 2009: 5—11.
[7]NATIONAL LIBRARY OF MEDICINE. Computers, artificial intelligence, and expert systems in biomedical research [EB/OL]. [2024−07−12]. https://www.profiles.nlm.nih.gov/spotlight/bb/feature/ai.
[8]DEEPMIND. AlphaFold [EB/OL]. [2024−07−09]. https://deepmind.google/technologies/alphafold/.
[9]JUMPER J, EVANS R, PRITZEL A, et al. Highly accurate protein structure prediction with AlphaFold [J]. Nature, 2021, 596(7873): 583—589.
[10]李鑫, 于汉超. 人工智能驱动的生命科学研究新范式[J]. 中国科学院院刊, 2024, 39(1): 50—58.
[11]ALLEN P, MAGUIRE S, MCKELVEY B. The SAGE handbook of complexity and management [M]. London: Sage Publications, 2011.
[12]KIM B, LEE D, KIM D, et al. Generative model using knowledge graph for document-grounded conversations [J]. Applied Sciences, 2022, 12(7): 1—10.
[13]BODEN M A. Escaping from the Chinese room [EB/OL]. (2004)[2024−06−26]. http://faculty.las.illinois.edu/rrushing/395/ewExternalFiles/Boden.pdf.
[14]HINTON G, VINYALS O, DEAN J. Distilling the knowledge in a neural network [EB/OL]. (2015−03−09)[2024−08−19]. https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&doi=b1a04e46d910fd52dba148dd41ddaf80c8265074.
[15]YUAN C, PAN R. Obtain dark knowledge via extended knowledge distillation [C]//2019 International Conference on Artificial Intelligence and Advanced Manufacturing. Dublin: IEEE, 2019: 502—508.
[16]QUINE W V O. Two dogmas of empiricism [EB/OL]. (2000−02−17)[2024−07−10]. https://affect-reason-utility.com/BookDepot/aQuine_TwoDogmas.pdf.
[17]SMART J J C. Sensations and brain processes [J]. The Philosophical Review, 1959, 68(2): 141—156.
[18]BISHOP C. AI4Science to empower the fifth paradigm of scientific discovery [EB/OL]. (2022−07−07)[2024−07−12]. https://www.microsoft.com/en-us/research/blog/ai4science-to-empower-the-fifth-paradigm-of-scientific-discovery/.
[19]陈云霁, 郭崎. AI for technology:技术智能在高技术领域的应用实践与未来展望[J]. 中国科学院院刊, 2024, 39(1): 34—40.
[20]约瑟夫 • 劳斯. 知识与权力——走向科学的政治哲学[M]. 盛晓明, 邱慧, 孟强, 译. 北京:北京大学出版社, 2004: 241.
[21]和鸿鹏, 刘玉强. 面向真实社会的实验:负责任创新的微观解读[J]. 自然辩证法研究, 2018, 34(8): 51—56.
[22]MURPHY K P. Machine learning: A probabilistic perspective [M]. Cambridge, Massachusetts: MIT press, 2012: 1.
[23]BOCHENEK B, USTRNUL Z. Machine learning in weather prediction and climate analyses-applications and perspectives [J]. Atmosphere, 2022, 13(2): 1—16.
[24]MAASS W, PARSONS J, PURAO S, et al. Data-driven meets theory-driven research in the era of big data: Opportunities and challenges for information systems research [J]. Journal of the Association for Information Systems, 2018, 19(12): 1253—1273.
[25]SYCHEV O A. Dark knowledge: Knowledge graphs of what cannot happen or should not be done [EB/OL]. (2020)[2024−07−10]. https://openreview.net/pdf?id=dmEMCnJ-uI.
[26]KITCHER P. The division of cognitive labor [J]. Journal of Philosophy, 1990, 87(1): 5—22.
[27]KITANO H. Nobel turning challenge: Creating the engine for scientific discovery [J]. npj Systems Biology and Applications, 2021, 7(1): 1—12.
[28]KING R, ZENIL H. Artificial intelligence in scientific discovery: Challenges and opportunities [C]//OECD. Artificial intelligence in science challenges, opportunities and the future of research. Paris: OECD Publishing, 2023: 182—183.
[29]ROBERTS M, DRIGGS D, THORPE M, et al. Common pitfalls and recommendations for using machine learning to detect and prognosticate for COVID-19 using chest radiographs and CT scans [J]. Nature Machine Intelligence, 2021, 3(3): 199—217.
[30]杨金龙, 江俊. 拥抱科研新范式——人工智能带来的科研革命[J]. 科学与社会, 2023, 13(3): 11—22.
转载或引用时请注明来源
北京航空航天大学学报(社会科学版), 2024, 37(5): 69-75.
如需下载全文,请点击左下角【阅读原文】
长按二维码识别关注本刊