点击上方蓝字 世界科学,再点右上角三颗痣 设为星标 ,从此你的世界多点科学~
科学智能(AI for Science,AI4S)是当前人工智能(AI)应用发展的一个重点方向。2024年4月29日,美国总统科学技术顾问委员会(PCAST)组织美国领域内权威专家,发布了《赋能研究:利用人工智能应对全球挑战》报告(下文简称《报告》)。该报告提出AI4S发展的“三角”模型,详细分析了AI4S的发展潜力、重点领域和面临的挑战,并为美国总统提供了清晰的建议。
《报告》是美国总统《关于安全、可靠和可信地开发和使用人工智能的行政令》中的一项研究任务。美国白宫围绕人工智能发展的重点方向,不定期发布重要文件,包括:《人工智能权利法案蓝图:让自动化系统服务于美国人民》 《美国国家人工智能研发战略计划》《关于安全、可靠和可信地开发和使用人工智能的行政令》。《报告》作为《关于安全、可靠且可信赖的开发和使用人工智能的行政令》的指定任务,在美国的人工智能政策文件中占有重要地位。
《报告》是首份呈送美国总统的AI4S专案报告。美国能源部、国防部、卫生与公众服务部等部门近年来已陆续发布本领域的AI4S报告。PCAST作为总统最高级别的科学政策顾问团,《报告》内容统筹协调了各部门的研究成果和政策建议,从更宏观、更综合的角度对AI4S的发展机遇和挑战做出了回应。《报告》预计将成为未来美国AI4S政策的基本依据。依据《关于安全、可靠和可信地开发和使用人工智能的行政令》中的要求,《报告》立足于解决重大的全球挑战,解决当前科学研究过程中人工智能技术的应用障碍。《报告》的出台,为美国总统提供了新的科研组织模式和科研流程规范建议,将为美国政府在AI4S领域的下一步决策提供有力支撑。
《报告》的主体内容包括三部分,即AI4S的发展逻辑、发展方向和面临挑战。《报告》提出人工智能支持科学发展的三大关键要素:提升能力、共享资源和规范制度。三大要素在AI4S领域形成了一个互相作用、互相促进的良性循环,为科学研究的快速发展提供了强有力的支持。“提升能力”,指科学家使用人工智能提升科研能力与效率。科学家基于AI4S产生的创新成果能够进一步促进“AI的资源共享”和“科研活动的规范”。“共享资源”,指分享算力、数据、模型等AI4S基础资源。推动AI4S资源的广泛使用,一方面能加快“规范科研活动”的普及速度,同时也能助力更多科研团队“提升能力”,提升整体科研水平。“规范制度”,指科研全流程负责任使用人工智能工具。规范科研活动,有助于保证“AI资源共享”的质量,也在“提升科学家能力”过程中加速高质量成果产出。提升能力、共享资源和规范制度的三角模型
“三角”模型解析了AI4S范式中的技术要素,以及三要素在提升科研效率中的协同作用,为评判AI4S科研工作流程提供了基础的分析框架。基于三角模型,AI4S的发展前景(如表1)主要分为3方面:一是科研能力提升,AI能够协助科学家决策、处理日常任务、自动化实验流程、承担高通量计算模拟、分析复杂数据等任务;二是基础资源共享,多模态科学模型能够进行学科融合、降低科研成本、促进科研机构合作、使AI4S大科学计划成为可能;三是规范科研制度,AI4S需要负责任的科研制度,这些科研制度将整合到科研工作全流程中。
表1 AI辅助科研的十大发展趋势
目前来看,AI并非在所有的科学领域都能够高效应用。《报告》综合评估AI4S对社会经济发展、公共安全、环境保护等关键领域的深远影响,确定了七大核心领域。在生命科学领域推动疾病治疗进展,在气象科学领域减轻极端天气事件的影响,在物理学和宇宙学领域探索新的规律,在集成电路领域增强半导体自动化设计能力,在材料科学研究领域开发超导体技术,在农业和药物设计领域创新应用,以及在社会科学领域利用数据驱动政策制定。
虽然AI4S能够发挥作用的领域不仅限于此七大领域,但是《报告》撰写组认为,这七个领域的科学研究与AI4S范式适配度高,在应对社会与全球挑战方面具有先发优势,预计可获得较大收益。《报告》深入调研美国AI4S科研现状,提出当前发展阶段面临的挑战,并给出相应行动建议。表2 AI在当前发展阶段面临的挑战
鉴于表2中面临的挑战,《报告》提出了5条建议,其中2条是关于资源共享,2条关于制度规范,1条关于能力提升。资源共享方面,《报告》考察了当前美国国会主导的国家人工智能研究资源(NAIRR)项目,该项目在2023至2025年期间的预算高达24亿美元,涉及多个政府机构,如国防部高级研究计划局(DARPA)、美国宇航局(NASA)等共同为获批研究项目分享计算资源、内部AI模型和数据集。《报告》强调,为了支持尖端研究,需要高质量数据和最先进的AI模型。因此,该报告建议在NAIRR的基础上,一是扩大共享人工智能模型评测基准和计算资源,二是进一步对研究项目开放联邦数据集,以促进科研创新和进步。规范制度方面,《报告》指出,人工智能系统在缺乏适当基准指标、验证程序和负责任使用的情况下,可能产生不可靠的输出结果,对科学领域造成潜在危害。为此,《报告》建议:一是制定评估AI模型准确性、可重复性和可解释性的标准,并开发识别数据偏见以及区分合成数据与真实数据的工具;二是在科研全阶段采用负责任、透明和可信的AI使用原则,以管理潜在风险。提升科学家研究能力方面,《报告》强调应新增相关科研项目,激励科研人员完善AI4S的科研基础设施。建议将科学数据标注、科学模型训练等关键环节纳入科研基金项目支持范围,以激励科研人员积极参与AI4S模型配套系统设施的开发研究工作。
面对AI4S领域的广泛应用,“三角”模型可以作为发展的基本思路参考。“三角”模型强调在关键研究领域进行战略布局,促进新兴科研项目的培育,并以优化的科研管理体系为基石,旨在全面提升科研活动的效率。为了进一步提高我国科研的整体实力,AI4S的研究布局可参考《报告》中提出的七大优先发展领域。各省市可依托本地产业基础,有的放矢地推进AI4S的研究与应用。以上海市为例,其战略举措包括但不限于:首先,在生物医药领域,致力于新药创制、基因研究、生物育种等前沿课题的探索;其次,在新材料领域,开展量子材料、超导材料、热电材料、软材料等创新材料的开发、性能预测以及合成路径的设计研究。
在AI4S项目指南方面,增加AI相关基础建设项目。在科研基金项目的支持范围中,建议增加专门针对AI4S基础建设的研究项目。一是将科学数据标注和科学模型训练等关键活动纳入科研基金项目的资助范围。二是研究评估科学模型的基准数据集,以建立评估和比较不同AI4S模型性能的标准化方法。在AI4S制度建设方面,健全智能科研管理体系。在科研管理规范方面,需要根据AI4S范式特征进行相应调整。一是在科研项目规则要求中实施全流程管控,以提升科研工作的效率,并防止人工智能辅助过程中可能出现的错误。二是应确保AI4S科研实践符合伦理标准与安全要求,以促进科研的可持续发展。在AI4S资源共享方面,增加科研设施共享项目。建议参考NAIRR机制,在重点学科与研究方向设立AI4S科研设施共享项目。推动国家学科数据库之间以及与其他数据库进行科研数据、科研模型等资源共享。推动科研云平台、算力云服务平台、数字孪生软件平台等基础设施加强联合,以打破AI4S科研资源壁垒,保证AI4S科研数据成果安全集中,提升AI4S研究生态纵深。-本文作者吴琪为上海市科学学研究所科技与社会研究室博士后、助理研究员;李辉为上海市科学学研究所科技与社会研究室副主任、研究员;本文刊载于《世界科学》杂志2024年第12期“科技传播·智见”栏目-
点击图片或以下方订阅方式选购
月刊定价15元/期
全年订阅价180元
“杂志铺”订阅有折扣~
订阅方式二:
全国各地邮局订阅。邮发代号:4-263
订阅方式三:
机构订阅,请拨打
021-53300839;
021-53300838