《自然》:在科研工作中,ChatGPT 能为您做什么?

学术   2024-08-16 16:26   北京  

ChatGPT在2022年11月推出时震惊了世界。这个人工智能(AI)聊天机器人由加利福尼亚州旧金山的OpenAI公司创建,由一个大型语言模型(LLM)提供支持,并根据互联网上发布的大量文本进行训练,通过提供一个能够回答复杂问题、撰写复杂文章和生成源代码的对话式界面,使自然语言处理领域的最新进展得以广泛应用。一个显而易见的问题是:这一工具如何改进科学?

在过去的18个月里,在纽约市非营利组织阿尔弗雷德·斯隆基金会(Alfred P. Sloan Foundation)和加利福尼亚州雷德伍德市陈·扎克伯格基金会(Chan Zuckerberg Initiative)的资助下,米尔顿·皮维多利(Milton Pividori一直在探索如何将这项技术融入到日常工作中,例如进行文献综述、修改和撰写学术论文以及编程代码。米尔顿的目标是评估如何安全地使用这项技术,以产生更好的科学成果并提高工作效率。在此,米尔顿重点介绍一些关键经验。


设计指令


要有效使用聊天机器人,你需要一个好的指令。这听起来可能很浅显,但米尔顿的一些同事经常会因为聊天机器人无法回答一个表述不清的问题而感到沮丧并放弃。这是可以理解的,因为公众一直被灌输这些模型是“智能”的,因此认为它们应该能理解人类提出的任何问题。但事实并非如此,这也是指令工程成为该领域快速发展学科的重要原因。


好的指令设计有很多细节上的差别,但基本原则很简单。

· 明确你希望模型做什么(使用“总结”或“解释”等指令)。

· 要求模型扮演一个角色或人物(“你是一名专业的文案编辑”)。

· 提供真实输入和输出的示例,包括棘手的边角案例,向模型展示你希望它做什么。

· 指定模型应如何回复(“你要向对表观遗传学有基本了解的人进行解释”),甚至是具体的输出格式(例如,便于分析的JSON或CSV文件)。

· 还可以指定字数限制、文本应使用主动语态还是被动语态以及其他要求。


以下是米尔顿和他的合作者们用来修改论文手稿摘要的指令(根据2017年发布的指南而制作)。


你是一名专业文案编辑,在处理科学文本方面经验丰富。请修改下面的手稿摘要,使其遵循研究“背景-研究内容-结论”的框架。(1)研究背景向读者传达论文将填补的研究空白。第一句通过介绍更广泛的领域来引导读者。然后,将背景的范围缩小,直至本研究要回答的开放性问题。一个成功的研究背景可以将研究的贡献与当前的技术水平区分开来,说明文献中缺少什么(即具体研究空白)以及研究的重要性(即具体空白与更广泛背景之间的联系);(2)研究内容部分(例如,“在这里,我们......”)首先介绍用于填补空白的新方法或新途径,然后介绍结果的执行摘要;(3)结论部分解释结果,回答背景部分最后提出的问题。结论可能还有第二部分,强调该结论如何推动更广泛领域的发展(例如,“更广泛的意义”)。


找到合适的任务


在考虑潜在应用时,问问自己这项工作需要多少创造力,如果模型出错会发生什么,工作的哪些方面只有人类才能做出贡献,哪些方面比较机械或者比较无聊。


以学术论文的文献综述阶段为例。这一过程的目标是编制一份精炼的文献清单,并总结其主要观点。这听起来像是聊天机器人助手的完美任务,确实如此,但一开始并非如此。确定研究问题需要创造性思维;你需要仔细阅读论文,找出研究空白,提出假设,并开始思考如何通过实验解决问题。你可能希望尽可能多地了解每篇论文,包括图表和补充材料。聊天机器人可能会遗漏关键信息,更重要的是,可能会妨碍你建立创造性的逻辑联系。

米尔顿和他的合作者们开发了一种工具,将ChatGPT编辑整合到协作写作工具Manubot中。

但是,在这个过程的后期,你的目标将有所不同。此时,你可能想快速“阅读”(即总结)与你的工作不太直接相关的文章。在这种情况下,使用聊天机器人助手风险较小。


米尔顿的团队在使用专业工具(如SciSpace)搜索文章、评估其相关性并与文本“聊天”方面取得了一些成功。但通用工具(如ChatGPT)就不那么有用了。无论选择哪种平台,都要同时使用标准搜索引擎,以最大限度地增加找到的相关论文数量。


多写少读


根据米尔顿的经验,用聊天机器人写作比用它阅读风险更小。让一个法学硕士“阅读”一篇论文,你必须相信它能准确提取出最重要的观点,因为你自己可能都没读过这篇文章。但用它来写作时,你可以完全控制输出结果,并在出现“幻觉”——不合逻辑或不准确的文字——的时候及时发现。


米尔顿表示,当他开始撰写手稿时,他已经知道自己想说什么,但他经常需要帮助来撰写文字。在这种情况下,向聊天机器人提供你所在学科的手稿结构规则会很有用。另一种方法是,你可以先在没有帮助的情况下写作,然后使用聊天机器人修改文本(例如,将“背景-内容-结论”的结构框架应用到段落中),查看聊天机器人的建议并采纳好的建议。在米尔顿还是博士后的时候,他和同事为协作写作框架Manubot开发了一个人工智能编辑器。该编辑器采用以人为本的方法实现写作过程自动化:首先由一个人撰写文本,LLM对其作品进行修改,然后由作者对修改进行审核。该工具使用版本控制服务GitHub来跟踪文本中哪些部分是由模型的使用者贡献的,哪些部分是由模型贡献的——鉴于之前至少有一位《自然》的投稿人被诬陷使用聊天机器人撰写手稿,记录这一点可能非常重要。


在使用聊天机器人编写源代码时,你也可以采用类似的方法:向LLM请求代码来解决问题或修复现有的错误代码。如果你知道你想让代码做什么(创意部分),你就需要编写一个指令,指示模型使用哪种语言和库(机械部分)。然后,运行代码以确定其是否有效。最坏的情况是代码产生了错误的结果或传达了错误的结论。即使你得到了看似正确的答案,你也需要仔细检查代码——为此,你需要理解代码。


这是一个关键点,尤其是对新手而言:如果你不知道如何做某事,我强烈建议你不要使用聊天机器人来帮你做。


随着LLM的能力越来越强,它们可以帮助科学家专注于其工作中具有创造性和挑战性的方面,并卸载对智能刺激较弱的部分。目前的挑战在于识别那些只有人类才能完成的任务,并认识到AI仍然存在的局限性。

原文以Chatbots in science: What can ChatGPT do for you?为标题发表于nature的职业规划专栏。


Copyright © 2024, Springer Nature Limited


ESE期刊公众号为非营利性传播媒介,如信息来源(Springer Nature)认为本文不宜翻译并传播,可留言联系公众号运营者删除。


推荐阅读

· 面向环境可持续的智慧生态城市和人工智能物联网

· 中国污水处理行业温室气体排放特征及减排潜力研究

· 人工智能正在推动环境领域科研范式变革

· 人工智能辅助微生物组信息标注

· PM2.5管控成本的有效性分析——中国省际污染传输的评估视角

· 微塑料的光合微生物修复

· 双酚A在过氧单硫酸盐-氯化物体系中非自由基和自由基诱导降解的动力学和机理研究

· 基于细菌群落生物完整性的水生态健康评价方法

· 亚硝酸盐驱动的厌氧乙烷氧化

高被引论文

以下数据基于Web of Science。

超过200次引用的文章有2篇

https://doi.org/10.1016/j.ese.2021.100107

https://doi.org/10.1016/j.ese.2021.100130


超过100次引用的文章有7篇

https://doi.org/10.1016/j.ese.2021.100134

https://doi.org/10.1016/j.ese.2022.100205

https://doi.org/10.1016/j.ese.2020.100077

https://doi.org/10.1016/j.ese.2022.100167

https://doi.org/10.1016/j.ese.2022.100145


超过50次引用的文章有13篇

https://doi.org/10.1016/j.ese.2022.100180

https://doi.org/10.1016/j.ese.2023.100237

https://doi.org/10.1016/j.ese.2022.100168

https://doi.org/10.1016/j.ese.2022.100165

https://doi.org/10.1016/j.ese.2021.100144

https://doi.org/10.1016/j.ese.2023.100254

期刊简介

在生态环境部黄润秋部长亲自提出和指导下,Environmental Science and Ecotechnology(ESE)于2020年1月正式创刊。ESE由中国科协主管,由中国环境科学学会、哈尔滨工业大学和中国环境科学研究院共同主办。ESE为双月刊,面向全球开放获取(全部论文皆可免费阅读、下载)。


ESE首届编委会由120位全球生态环境研究领域的顶级专家学者构成。哈尔滨工业大学任南琪院士担任主编,中国环境科学学会理事长、生态环境部环境规划院王金南院士和中国环境科学研究院吴丰昌院士担任副主编,俞汉青院士、Danny Reible院士等13位世界顶尖学者担任执行主编和执行副主编。


ESE已入选3个 “一区”,即中科院一区(大、小类)、JCR报告Q1区和中国科协高质量科技期刊T1区。2023年ESE获得首个完整影响因子12.6,最新影响因子为14.0,最新CiteScore为20.4。


期刊官网:https://www.sciencedirect.com/journal/environmental-science-and-ecotechnology



ESE期刊
Environmental Science and Ecotechnology是由中国环境科学学会、哈尔滨工业大学、中国环境科学研究院共同主办,由Elsevier出版发行的开放获取国际学术期刊,最新影响因子为12.6(一区)。
 最新文章