转载|对话厦门大学李清彪教授浅议生成式AI在科研领域的应用

学术   2024-11-04 17:24   北京  

人物专访

2024年10月24日,Chemical Synthesis期刊编辑部成员以书面形式采访了第一届华中催化学术会议的报告嘉宾-厦门大学李清彪教授。李教授所作的报告“浅议生成式AI及其在科研和催化研究中的应用”不仅给我们留下了深刻印象,报告现场观众的反响更是热烈。


此次采访中,李教授深入探讨了生成式AI在催化研究中的应用与优势,强调其在科研创新中的潜力。同时他还指出AI当前面临的挑战,并展望了未来生成式AI将推动催化领域发展的趋势与合作模式。




受访专家简介





专家介绍


李清彪,二级教授,中国化工学会会士,现任厦门大学讲座教授,兼任福建省化工学会理事长。曾任集美大学校长、泉州师院校长,曾兼任福建省科协副主席。


研究方向


从事工业催化、生物化工、环境工程、食品工程及其交叉领域的研究工作。通过探索生物质分子对贵金属离子的作用机制,研究生物还原制备贵金属纳米材料及其催化剂的新技术,并应用于烯烃环氧化等化工过程。开发了PTA氧化残渣资源化技术并实现了产业化应用。在高浓度有机废水处理、污泥资源化利用、柚子和海藻的深加工与高值化利用等方面也开展了一些研究工作。


个人成就


主持过国家重点基础研究计划(973计划)项目课题、国家高技术研究发展计划(863计划)项目、科技部重点研发计划项目课题、国家自然科学基金重点项目、国家自然科学基金面上项目、教育部优秀青年教师资助计划项目、福建省科技重大专项、福建省科技计划重点项目、横向课题等科研项目40余项。发表SCI收录论文300多篇,他引11200多次。以第一发明人申请中国发明专利21件,获授权中国发明专利29件、授权美国发明专利1件。研究成果分别获得教育部高等学校科学研究优秀成果奖自然科学奖二等奖、中国石油和化学工业联合会科技进步二等奖和福建省科技进步奖一等奖等,先后被评为全国石油和化工优秀科技工作者、厦门市劳动模范等,2020年,荣获“厦门市陈嘉庚基金会突出贡献奖”。2021-2023年连续三年入选爱思唯尔中国高被引学者”,2023年入选全球前2%顶尖科学家榜单(2023年全球前2%顶尖科学家终身榜单和全球前2%顶尖科学家年度榜单)

访谈内容

Q

请您回顾一下自己的职业轨迹,并详细介绍您在学术研究上的专注领域。同时,我们也很感兴趣,您是在何种契机下关注到AI领域的?

我本科就读于天津大学化工系“化工催化”专业,硕士和博士学位也是在天大获得的。曾在南开大学和香港科技大学从事博士后研究,1993年到厦门大学化工系工业催化教研室工作。曾兼任过厦门大学化工系系主任、科研处处长、校长助理,也分别担任过泉州师范学院和集美大学两所大学的校长。我主要围绕化工和环保领域开展基础和应用研究,在化工过程废弃物资源化、高浓度有机废水处理、贵金属生物吸附和还原、乙烯和丙烯环氧化等方面开展了一些工作,有特色的主要是生物质还原制备贵金属纳米催化剂,旨在通过催化剂制备新路径新方法的探究,获得性能更优的催化剂用于开发化工生产新过程。

我特别关注AI(尤其是生成式AI,简称GAI)可能给教育和科学发展带来的影响。2022年11月30日,Open AI发布Chat GPT之后,作为当时在岗的大学校长,我马上要求学校相关学院和部门的计算机与人工智能领域专家收集整理有关材料报给我,看完资料后,我感觉到对于GAI等新技术应该引起高度重视。2023年9月,在集美大学的开学典礼上,我演讲的题目是“善用AI增智慧,高阶认知促创新”,希望同学们能注重提升高阶素养以适应即将到来的AI时代,之后,随着生成式人工智能热潮席卷全球,更高性能的GAI产品不断迭代而出,不仅给行业企业带来巨大影响,也给教育和科研带来挑战和机遇。基于此,我觉得很有必要让更多人了解GAI,结合自己教学科研和高校管理经验,在更广泛收集信息资料后,整理成相关报告,在全国不少地方,主要集中在高校和学术会议上进行汇报分享(截止目前,这样的讲座和报告已经讲了几十场),当然,更多的还是讲生成式AI对人才培养的影响,对于科研的影响的报告相对较少。

Q

请您精要概括您报告的核心内容。此外,请您阐释生成式AI与传统AI在技术特性和应用上的差异?

我报告的题目是“浅议生成式AI及其在科研和催化研究中的应用”,毕竟我不是AI的专家,只能谈一些皮毛和技术细节之外的事情。这次华中催化会议上的报告,我在简单回顾总结生成式AI的发展历程及其特殊功能和特点的基础上,较为详细地说明了AI如何在很多方面赋能科研创新,进而通过一些具体研究事例介绍了生成式AI和大模型方法在催化、化工研究及其产业中的应用。

相较于传统意义上的AI,生成式AI的厉害之处就是它的“创造和交互等能力”,是“赋智”的能力,会生成、会创造、会推理、会交互!不仅能创造“新东西”,而且非常快速,因此生成式AI的应用就会显得更加迫切和不可忽视!试想,一个午休的时间,它可以帮助我们阅读20多万篇学术论文,并以多模态的方式帮我们整理提炼总结出来,是一种什么样的场景?试想,当你身边有这么一个“东西”,只要通上电,就可以对于百多个“学科”、上千个“专业”的知识无所不知的时候,它还可以帮你编程、帮你思考等等!你身边的这个“辅脑”又将如何颠覆我们的工作和生活?所以在我的报告中,不仅重视说明技术的强大,更强调了生成式AI可能给科研范式带来的冲击和改变,还强调该技术发展的哲学意义,作为一项先进的技术,体现了“生产力”的进步,那么我们现有的生活和工作,包括教学科研相关的操作和管理方式方法等属于“生产关系”层面上的做法是否也应该调整、变化、甚至彻底变革了呢?而这些才是我所关心和希望加快去推动和促进的。

Q

在催化研究领域,生成式AI展现出哪些独到的应用价值?能否提供具体的应用实例,描述它是如何助力科学家们在设计新型催化剂或加速催化过程方面的研究?

催化研究通常涉及动态系统与多变量优化,生成式AI的数据处理及创新能力在催化研究领域就显得尤为重要。与传统方法相比,生成式AI能够基于现有的数据生成新的样本,进行新的创造。这使得生成式AI非常适合应用于探索空间广阔、数据类型广泛、映射关系复杂的催化研究中,它可以极大地提升研究效率与创新性,为催化研究提供强大的工具,这从以下几个方面可以体现出来:首先,应用生成式AI能够快速地“生成”大量新型高效催化剂,比如日本国立材料研究所的科学家通过生成式对抗网络来生成并设计具有高合成氨活性的Rh-Ru合金表面,生成式模型能够自动向着高反应性表面的方向生成新的样本,最终获得了比原始催化剂活性高十多倍的新催化剂;其次,生成式AI强大的跨维度数据关联能力,为催化结构的定制开辟了新的途径。比如中科大江俊团队通过训练神经网络将振动光谱与催化结构、性质相关联,实现了Al快速解谱的功能,更重要的是,通过生成大量光谱作为描述符,利用AI反演催化剂结构和吸附能,成功实现了具有目标吸附能的催化结构的定制。第三,生成式语言模型以一种更易理解的方式为催化研究提供了全新的方案。比如通过文本作为输入,使用生成式模型预测催化结构及其性能;再比如,与大语言模型ChatGPT进行对话获得有关催化研究的具体建议。总的来说,生成式AI在催化剂设计与性能预测、催化反应机理推测、表征数据处理与增强、催化材料高通量筛选、文献数据挖掘助力研究创新等方面都可推进催化研究。

可以说,生成式AI在催化研究的多个方面已展现出来了显著优势,今后有望成为应对当前催化研究挑战的变革性工具。

Q

生成式AI在科学研究领域具有显著优势,但在实际操作过程中是否也遭遇了一些挑战或限制?对于科研工作者和行业从业者而言,他们应该如何应对这些难题?

生成式AI在催化研究中的应用是多维度的,所以面临的挑战也同样是多方面的。不仅包括催化研究者自身知识和技术基础的不足,也包括他们对于学习新技术可能的敏感度和积极性不够之限制,当然,也必然包括一些技术层面上的问题,例如高质量训练集的建立和获取、模型的生成效率和生成质量的平衡、大语言模型存在的幻觉等固有问题,以及其泛化能力与领域专业性之间的平衡难以把握等等,这些都是在具体操作时可能遇到的限制或挑战。

应对这些挑战,既需要了解催化研究的目标和路径方法,也需要理解生成式AI的内涵并掌握使用办法。就目前的情况来看,一方面,大多数从事催化研究的人员对于生成式AI的特定功能、发展现状及趋势缺少足够深入的了解,尤其是把握和驾驭AI的能力;另一方面,生成式AI的专家或研究者一般很少主动去深度关注催化研究领域的内容和细节,因此自然无法量身定制更适合催化研究的生成式AI工具并有效地解决催化研究中的问题。这需要具有AI背景和催化背景的研究工作者更多地一起学习交流,在相互了解的基础上,开展学科交叉的研究,从底层代码算法到顶层功能设计,自下而上地推进,使生成式AI更好地服务于催化研究。而且从双方合作这一点来看,催化研究工作者应该更加积极主动地靠近AI研究者。

Q

展望未来,您对生成式AI在科研特别是催化领域的发展趋势有何见解?您认为它将如何影响和推动这些领域的发展?

生成式AI在科研领域展现出强大的生命力与延展性,不仅可为科研开疆拓土、加快科学发现、形成科学理解的新方式、带来科学假设的新模式、催生模拟实验的新方法,而且将开启AI for science的科研新范式,在此范式下分散式“单打独斗”旧模式已不再适应,依托人工智能建立的“平台”生态将逐步成为支撑新范式的科研模式。这样的平台已经出现,比如:英伟达的“AI+药物研发融合”智能平台 Clara、深势科技的Bohrium®微尺度科学计算云平台、Hermite®药物计算设计平台等微尺度工业设计基础设施、华为的MindSpore大模型平台、百度的PaddleScience基础软件等。Google开发的开源平台TensorFlow,被广泛应用于构建和训练各种人工智能模型,这里不仅开发者,还有由研究人员、创意家和问题解决者组成的社区,能提供各类解决方案或服务。同时,生成式AI也将催生科研合作和组织的新形式,今后的科研小组不仅需要AI领域的专家,有些可能还需要进入新的科研组织模式。当前,国际上由Web3、区块链及智能合约技术驱动的针对基础研究的分布式自主科学(Decentralized science,DeSci)蓬勃兴起,这是一种自下而上、去中心化的科研组织新形式,为人工智能的应用提供了跨领域协作的广阔空间。DeSci通过使用数字工具和基于网络空间的社区资源来资助、组织、培训、规划、协调、调度、收集、分配供需活动。改变了现有科学体系的结构、规范、激励和价值流,为科学发展提供了新组织方式和科研生态。

从今年诺贝尔物理学奖和化学奖的授奖情况,很容易理解和推测生成式AI将对今后科研发展起到越来越重要的作用,甚至是决定性的作用。在催化研究领域,近几年越来越多的文献报道了生成式AI的具体应用,这展示了生成式AI作为一项新兴技术在催化领域的有力探索。当下与未来,随着研究人员对于代表先进生产力的生成式AI的认识和理解,随着越来越多的研究者的重视和介入,随着催化研究的深入和问题难度的提升,随着研究力度的加大、研究工作的加速和各方相互竞争的加剧,生成式AI在催化领域的应用应该会更多地受到重视,首先,生成式AI在创新创造、速度效率方面的优势将被进一步发掘、利用和发展,从而拓宽其在催化科研的应用场景,催生新的催化研究方法;其次,高度领域化、专业化的生成式AI将成为发展方向,使其以一个行业专家的身份深度参与到催化领域研究中;最后,生成式AI有望集成于催化研究中形成新的研究范式,这将带动从教育到科研的学科交叉深度融合,从而反哺生成式AI下一步的突破性进展,形成互利的良性循环。



化工学报
《化工学报》(月刊)是我国化工领域权威性学术期刊,EI、SCOPUS收录,由中国化工学会和化学工业出版社共同主办、化学工业出版社出版。
 最新文章