Nature教你如何用ChatGPT搞科研：ChatGPT能为您做什么？

文摘 2024-09-06 07:30 比利时

Milton Pividori花了一年半的时间研究如何在研究中最好地使用 ChatGPT。在此，他重点介绍了三条主要经验。

ChatGPT 在 2022 年 11 月推出时震惊了世界。这个人工智能（AI）聊天机器人由加利福尼亚州旧金山的 OpenAI 公司创建，由一个大型语言模型（LLM）提供支持，并根据互联网上发布的大量文本进行训练，通过提供一个能够回答复杂问题、撰写复杂文章和生成源代码的对话式界面，使自然语言处理领域的最新进展得以广泛应用。一个显而易见的问题是：这一工具如何改进科学？

在过去的18个月里，在纽约市非营利组织阿尔弗雷德-斯隆基金会（Alfred P. Sloan Foundation）和加利福尼亚州雷德伍德市陈-扎克伯格基金会（Chan Zuckerberg Initiative）的资助下，我的实验室一直在探索如何将这项技术融入到日常工作中，例如进行文献综述、修改和撰写学术论文以及编程代码。我们的目标是评估如何安全地使用这项技术，以产生更好的科学成果并提高工作效率。在此，我们重点介绍一些关键经验。

设计您的提示prompt

要有效使用聊天机器人，你需要一个好的提示。这听起来可能很明显，但我的一些同事在聊天工具无法回答一个表述不清的问题时仍然会感到沮丧并放弃。这是可以理解的：公众一直被灌输这些模型是 “智能 ”的想法，因此认为它们应该能理解你提出的任何问题。但事实并非如此，这也是提示工程成为该领域快速发展学科的原因。

好的提示设计有很多细微差别，但基本原则很简单：

明确您希望模型做什么（使用 “总结 ”或 “解释 ”等命令）。
要求模型扮演一个角色或人物（“你是一个专业的文案编辑”）。
提供真实输入和输出的示例，可能包括棘手的 “角落 ”情况，向模型展示您希望它做什么。
指定模型应如何回答（“向对表观遗传学有基本了解的人解释”），甚至是确切的输出格式（例如，便于分析的 JSON或CSV文件）。
还可以指定字数限制、文本应使用主动语态还是被动语态以及其他要求。查看 “Prompt Engineering Cheat Sheet （https://medium.com/the-generator/the-perfect-prompt-prompt-engineering-cheat-sheet-d0b9c62a2bba）”，了解更多技巧。

以下是我们用来修改稿件摘要的提示，是我们根据2017年发布的指南精心制作的。

你是一名专业文案编辑，在处理科学文本方面经验丰富。请修改下面的手稿摘要，使其遵循上下文-内容-结论方案。(1) 上下文部分向读者传达论文将填补的空白。第一句通过介绍更广泛的领域来引导读者。然后，将上下文的范围缩小，直至研究要回答的开放性问题。一个成功的上下文部分可以将研究的贡献与当前的技术水平区分开来，说明文献中缺少什么（即具体差距）以及为什么这很重要（即具体差距与更广泛背景之间的联系）。(2) 内容部分（例如，“在这里，我们......”）首先介绍用于填补空白的新方法或新途径，然后介绍结果的执行摘要。(3) 结论部分解释结果，回答背景部分末尾提出的问题。结论部分可能还有第二部分，强调该结论如何推动更广泛领域的发展（例如，“更广泛的意义”）。

找到合适的任务

在考虑潜在的应用时，问问自己这项任务需要多少创造力，如果模型引导错误会发生什么。任务的哪些方面只有人才能做出贡献，哪些方面比较机械--通常也比较无聊？

以研究项目的文献综述阶段为例。这一迭代过程的目标是编制一份精炼的文章清单，并总结其主要观点。这听起来像是聊天机器人助手的完美任务，确实如此，但一开始并非如此。确定研究问题需要创造性思维；您需要仔细阅读论文，找出研究空白，提出假设，并开始思考如何通过实验解决问题。您可能希望尽可能多地了解每篇论文，包括图、表和补充材料。聊天机器人可能会遗漏关键信息，更重要的是，可能会妨碍您建立创造性的逻辑联系。

Milton Pividori 和他的合作者开发了一种工具，将 ChatGPT 编辑整合到协作写作工具 Manubot中。资料来源：Milton Pividori和Casey S. Greene

但是，在这个过程的后期，您的目标将有所不同。此时，您可能想快速 “阅读”（即总结）与您的工作不太直接相关的文章。在这种情况下，使用聊天机器人助手风险较小。

我们的团队在使用专业工具（如 SciSpace）搜索文章、评估其相关性并与文本 “聊天 ”方面取得了一些成功。但通用工具（如 ChatGPT）就不那么有用了。无论您选择哪种平台，都要同时使用标准搜索引擎，以最大限度地增加找到的相关论文数量。

多写少读

根据我的经验，用聊天机器人写作比用它阅读风险更小。让一个法学硕士 “阅读”一篇论文，你必须相信它能准确地提取出最重要的观点，因为你自己可能并没有读过这篇文章。但用它来写作时，你可以完全控制输出结果，并在出现 “幻觉”--不合逻辑或不准确的文字--时及时发现。

当我开始撰写手稿时，我已经知道自己想说什么，但我经常需要帮助来撰写文字。在这种情况下，向聊天机器人提供你所在学科1 的科学手稿结构规则会很有用。另一种方法是，您可以先在没有帮助的情况下写作，然后使用聊天机器人修改文本（例如，将上下文-内容-结论结构应用到段落中），查看聊天机器人的建议并采纳好的建议。在我还是博士后时，我和同事为协作写作框架Manubot开发了一个人工智能编辑器。该编辑器采用以人为本的方法实现写作过程自动化2：首先由一个人撰写文本，LLM对其作品进行修改，然后由作者对修改进行审核。该工具使用版本控制服务 GitHub 来跟踪文本中哪些部分是由用户贡献的，哪些部分是由模型贡献的--考虑到至少有一位《自然》杂志的投稿人被诬陷使用聊天机器人撰写手稿，记录这一点可能非常重要。

在使用聊天机器人编写源代码时，你也可以采用类似的方法：向 LLM 请求代码来解决问题或修复现有的错误代码。如果你知道你想让代码做什么（创意部分），你就需要编写一个提示，指示模型使用哪种语言和库（机械部分）。然后，运行代码以确定其是否有效。最坏的情况是代码产生了错误的结果或传达了错误的结论。即使您得到了看似正确的答案，您也需要仔细检查代码--为此，您需要理解代码。

这是一个关键点，尤其是对学员而言：如果你不知道如何做某事，我强烈建议你不要使用聊天机器人来帮你做。

随着 LLM 的能力越来越强，它们可以帮助科学家专注于其工作中具有创造性和挑战性的方面，并卸下对智力刺激较小的部分。目前的挑战在于识别那些只有人类才能完成的任务，并认识到人工智能仍然存在的局限性。

参考文献

https://doi.org/10.1038/d41586-024-02630-z

电池材料包括正负极隔膜电解质，固体电解质，电池辅材，电池制造设备（实验室和中试规模），电芯产品，储能产品相关的原始设备制造商请加微信seasonedperk。也欢迎大家分享给相关行业的好友，加好友时请备注所能提供产品。

往期精选

[电池扫盲]一文了解锂离子电池，从宏观到微观

欧美动力电池厂建设现状

欧洲电池产业前景展望

锂离子电池的隔膜材料

锂离子电池隔膜及其在安全方面的作用

卷疯了！还有人不知道电池界的AI革命？抓紧掌握关键技术！