在当今科技飞速发展的时代背景下,人工智能(AI)与科学研究之间的结合点成为了一个备受关注的焦点。当一个国际研究团队着手创建一个能够处理整个科研过程的“AI科学家”时,他们的目标是设计出一个系统,这个系统不仅能生成有趣的假设,执行实验,评估结果,还能撰写论文。这个项目的背后,是对AI技术在科学研究中潜力的探索,以及对未来科研模式变革的憧憬。
#01
不列颠哥伦比亚大学的博士后研究员Cong Lu和他的同事们,以及来自东京初创公司Sakana AI的研究人员一起,开始了这个充满挑战性的项目。Lu表示,他们最终得到的“AI科学家”相当于一名早期的博士生水平。这个AI工具展现出了“一些令人惊讶的创意”,但好的想法远少于不好的。它在连贯地总结其结果方面也存在困难,并且有时会误解其结果。正如Lu所说:“这有点像一个刚入门的博士生在盲目猜测事情为什么会这样。”而且,就像某些尚未理解伦理规范的学生一样,这个AI有时会在论文中编造内容,尽管研究人员尽了最大努力来保证它的诚实。
#02
这个项目不仅是对AI能力的一次探索,也是对AI在科学研究中应用趋势的一种反映。可以追溯到2020年,Google DeepMind发布的AlphaFold系统,以其前所未有的准确度预测蛋白质三维结构的能力,震惊了生物学界。自此以后,随着生成式AI的发展,越来越多的大公司加入了这一领域。索尼AI公司的高级研究科学家Tarek Besold领导了该公司的人工智能科学发现项目,他指出AI用于科学是“AI社区可以共同努力推进基础技术的目标,更重要的是,也可以帮助人类解决我们时代的一些最紧迫的问题。”然而,这一运动也并非没有争议。一些批评者认为,尽管AI可以快速生成大量结果,但这些结果可能实际上并没有多大用处。例如,在2023年Google DeepMind声称发现了220万种新晶体结构之后,两位材料科学家分析了所提出的结构的一个随机样本,并表示他们发现“几乎没有证据表明这些化合物具有新颖性、可信度和实用性”。
#03
在“AI科学家”的案例中,Lu和他的合作者们只在计算机科学领域对其进行了测试,让其研究与大型语言模型有关的主题,这些模型支持像ChatGPT这样的聊天机器人,同时也支撑着“AI科学家”本身,还包括驱动图像生成器如DALL-E的扩散模型。“AI科学家”的系统的工作流程。来自不列颠哥伦比亚大学
这张图表展示了“AI科学家”(The AI Scientist)的工作流程,这是一种由科学家们研发的、由大型语言模型驱动的端到端科学发现工具。
流程从Idea Generation(假设生成)开始,大型语言模型(LLM)在此阶段生成新的研究想法或计划;接着,Semantic Scholar对这些想法进行Novelty Check(新颖性检查),确保它们并非已知工作的简单复制品;然后,根据新颖性和其他标准对想法进行评分及存档(Idea Scoring/Archiving)。进入Experiment Iteration(实验迭代)阶段,系统基于生成的想法创建实验模板(Experiment Template),并通过大型语言模型和辅助工具(aider)编写必要的实验代码(Code Δ via LLM & Aider)。在这一过程中,实验被执行并且数据被收集(Experiments)。随后,根据实验的结果调整研究计划(Update Plan)。在Paper Write-Up(论文撰写)阶段,使用预先定义的会议指南模板来撰写论文(Manuscript Template),并借助大型语言模型和辅助工具添加文本内容(Text Δ via LLM & Aider)。此外,还会插入实验得到的数值数据和相关图表(Numerical Data/Plots)。最后,所有元素被整合在一起,形成一个完整的论文草稿(Manuscript)。为了保证论文的质量和完整性,整个流程以LLM Paper Reviewing(LLM论文审查)结束,在这一环节中,另一个大型语言模型用于模拟同行评审过程。整个流程通过一系列的迭代和反馈循环来推进科学研究,突显了大型语言模型在科研活动中的核心地位以及辅助工具的重要性。
#04
尽管研究人员将他们的“AI科学家”限制在机器学习实验中,Lu说团队已经与其他领域的几位科学家进行了有趣的对话。理论上讲,“AI科学家”可以在任何可以通过模拟进行实验的领域发挥作用。然而,对于这种广泛的乐观态度,一些批评者提出了质疑。例如,加州大学伯克利分校计算生物学教授Jennifer Listgarten认为AI不会在多个科学领域产生突破。她指出,大多数科学领域没有训练模型所需的大量公开可用的数据。同样,耶鲁大学的人类学家Lisa Messeri和普林斯顿大学的心理学家M.J. Crockett也在论文中表达了对“将AI产品视为自主研究者”的担忧。他们认为这样做可能会将研究范围缩小到适合AI的问题上,并失去推动真正创新所需的多样化视角。
#05
Lu表示团队计划继续开发“AI科学家”,他说还有很多容易摘取的果实等待他们去改善其性能。至于这类AI工具是否会最终在科研过程中扮演重要角色,“我认为时间会告诉我们这些模型适用于哪些场景,”Lu说。或许,这类工具在研究项目的初期阶段是有用的,当时研究者正试图了解许多可能的研究方向——尽管批评者补充说,我们还需要等待未来的研究来看看这些工具是否真的足够全面和无偏见而有所帮助。无论如何,Lu相信,如果模型能够改进到“接近优秀的第三年博士生”的水平,它们就可以成为任何试图追求某个想法的人的倍增器。“那时任何人都可以成为一名教授,并开展自己的研究议程,”Lu说。“这是我期待的令人兴奋的前景。”
#06
“AI科学家”的出现,无疑为我们提供了一个新的视角来看待未来科学的研究模式。
尽管它目前还存在诸多局限性,但随着技术的进步和应用领域的拓展,AI在科学研究中的潜力不可小觑。
未来的路还很长,但正是这些探索和尝试,让我们更加期待科学与技术结合所带来的无限可能。