这种颇具争议的工具旨在完成从假设到同行评议的所有工作。
卢聪是加拿大英属哥伦比亚大学的一名博士后研究员,他与其他几名学者,以及引人瞩目的东京初创公司Sakana AI的研究人员一起合作进行了这个项目。2024年9月,该团队在arXiv服务器上发表了关于这项工作的论文预印本。虽然论文预印本包含的讨论有限制和伦理考虑,但该团队也使用了一些相当夸大的用语,称这位人工智能科学家是“科学发现新时代的开端”。
这位人工智能科学家似乎抓住了时代精神,搭上了将人工智能应用到科学研究的浪潮。但一些批评人士认为,海浪不会把任何有价值的东西抛到海滩上。
早在2020年,谷歌DeepMind就推出了机器学习系统AlphaFold,该系统能够以前所未有的精度预测蛋白质的3D结构,令生物学家震惊,开创了“人工智能驱动科学研究”的狂热。(凭借这一成就,DeepMind的研究人员与他人共同获得了2024年诺贝尔化学奖。)生成式人工智能出现以来,越来越多的大公司参与其中。索尼人工智能的科学发现项目负责人塔里克•贝索尔德(Tarek Besold)表示,用于科学研究的人工智能已经重振科学研究界,能够“帮助人类解决这个时代最紧迫的一些问题”。
不过,对此也存在批评。2023年,在谷歌DeepMind发表论文声称发现220万个新晶体结构后不久,两名材料科学家分析了一份这些结构的随机抽样。他们发现:“表明化合物能够满足新颖性、可信度和实用性3方面要求的证据不足。”换言之,人工智能可以快速生成许多结果,但实际上这些结果并不一定有用。
在人工智能科学家这个项目中,卢聪和他的合作者结合与大语言模型和扩散模型相关联的科学主题,对该系统进行了测试。大语言模型驱动类似ChatGPT的聊天机器人和人工智能科学家本身,扩散模型则驱动类似DALL-E的图像生成器。
人工智能科学家的第一步是生成假设。给定它正在研究的模型结构和参数后,它会生成实验创意,并通过运行实验来提高模型性能,同时对每种创意的新颖性和可行性进行评分。该工具在这一步可以进行迭代,生成得分最高的多种创意。然后,它还可以通过Semantic Scholar(一种学术搜索引擎)查找科学文献,了解它的方案是否与现有的研究工作相似度过高。接下来,它会使用一个名为Aider的编程助手来运行实验,并以实验日志的形式记录实验结果。
人工智能科学家的下一步是使用基于技术会议指南的模版,在论文中写下其结果。但卢聪说,该系统很难写出一篇连贯的论文来解释其结果,“写作阶段可能与在实验阶段获得正确的结果一样困难。”他说。因此,研究人员将这一过程分解成了许多步骤:人工智能科学家一次写一部分,并将每个部分与其他部分进行比较,剔除重复和矛盾的信息。此外,它还会通过语义学者再次查找引文,并创建参考文献列表。
不过,其中还有幻觉问题,即人工智能编造内容的问题。卢聪说,尽管他们指示人工智能科学家只能使用实验日志中的数字,但“有时它还是会违背要求”。卢聪说,该模型违背要求的情况不到10%,不过“我们认为10%可能也是不可接受的”。他表示,他们正在研究解决方案,例如给出指令,要求系统将论文中的每个数字链接到实验日志中出现的位置。此外该系统在推理和领悟方面也犯了一些不太明显的错误,这些错误可能更难修正。
这个人工智能科学家甚至还包含了一个同行评议模块,用于评估它生成的论文。卢聪指出:“人们总会担心我们在给自己的作业打分。”所以该团队为评估器建模时,遵循主要的人工智能会议评审指南NeurIPS。该团队发现,总体而言,他们的人工智能评估器比人类评估者更苛刻。
虽然研究人员将人工智能科学家局限在机器学习实验范围内,但卢聪表示,该团队与其他领域的科学家进行了一些有趣的对话。他说,从理论上来说,在可以进行模拟实验的领域,人工智能科学家都能够提供帮助。“一些生物学家说,他们可以用计算机模拟做很多事情。”他说。
针对这种明显的乐观态度,一些对人工智能驱动科学研究运动的批评人士可能会提出质疑。2024年早些时候,加州大学伯克利分校计算机生物学教授詹妮弗•李斯特加藤(Jennifer Listgarten)在《自然•生物技术》上发表了一篇文章,该文章认为,人工智能不会在多个科学领域产生突破。她写道,大多数科学领域根本没有训练模型所需要的大量公开数据。
2024年早些时候,耶鲁大学的人类学家丽莎•梅塞里(Lisa Messeri)和普林斯顿大学的心理学家M. J. 克罗科特(M.J. Crockett)这两位研究科学实践的研究人员在《自然》杂志上发表了一篇文章,表达了他们对“将人工智能产品视为自主研究员”的担忧。他们认为,这样会存在风险,有可能会将研究范围缩小到适合人工智能的问题上,失去能推动真正创新的多样性视角。他们告诉《科技纵览》:“虽然‘人工智能科学家’预示的生产力对有些人可能颇具吸引力,但产出论文和产出知识是不一样的,忘记二者的区别会让我们产出的多,而领悟的少。”
不过,也有人认为,这位人工智能科学家是朝着正确方向迈出的一步。索尼人工智能的贝索尔德表示,他认为这是一个很好的例子,说明当今的人工智能应用面对正确的领域和任务时,是能够支持科学研究的。“这可能会成为为数不多的早期原型之一,这些原型有助于人们建立人工智能应用于科学发现领域的概念。”他说。
卢聪说,该团队计划继续开发这位人工智能科学家,他表示,在寻求提高其性能的过程中,他们有很多可以轻易实现的目标。至于这些人工智能工具最终是否会在更广泛的科学研究过程中发挥重要作用,卢聪说:“我认为时间会告诉我们这些模型的优势。”他表示,在研究人员试图了解多种可能的研究方向时,这些工具可用于研究项目早期界定范围的阶段。
卢聪说,如果改进这些模型,可以达到与“一个扎实的博士三年级研究生”相当的程度,那么对于想要在适合人工智能的领域有所创意的人,会大受振奋。“到那时,任何人都可以成为教授,实施一项研究计划。”卢聪说。
作者:Eliza Strickland
END
更多精彩文章请点击下面“蓝字”标题查看:
《物理与工程》期刊是专注于物理教育教学研究的学术期刊,是中国科技核心期刊,1981年创刊,欢迎踊跃投稿,期刊投审稿采编平台:
http://gkwl.cbpt.cnki.net
欢迎关注
《物理与工程》微信公众号