AI科学家：迈向全自动开放式科学发现

文摘 2024-09-11 16:07 北京

在科学探索的浩瀚征途中，人工智能（AI）正逐渐成为一股不可忽视的力量，推动着研究边界的不断拓展。特别是在面对复杂且数据密集型的科研问题时，AI的介入为实现全自动化的、开放式的科学发现提供了前所未有的可能，人类甚至可以开发出能够独立进行科学研究并发现新知识的智能体。在这一背景下，不列颠哥伦比亚大学的博士后研究员，携手数位知名学者及新兴热门初创公司Sakana AI的研究团队，共同开展了一项开创性研究项目。发表了论文：《The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery》。论文中提出了一种全新的框架，旨在实现科学研究的全自动化，从而极大地加速科学发现的进程。通过他们的努力，我们有望见证一个全新的科研范式的诞生，即“AI科学家”（The AI Scientist）能够自主、高效地探索未知，为人类的知识宝库增添新的篇章。

https://arxiv.org/pdf/2408.06292

研究背景与动机

现代科学研究依赖于复杂的实验设计、数据分析以及理论验证。然而，这一过程不仅耗时耗力，还需要科研人员具备深厚的专业知识和丰富的经验。随着人工智能技术的飞速发展，特别是大型语言模型（LLMs）的崛起，科学家们开始探索利用AI来辅助甚至替代部分科学研究工作的可能性。“AI科学家”项目正是这一探索的重要代表。

“AI科学家”的核心框架

核心框架包括三个主要阶段：创意生成、实验迭代和论文撰写。每个阶段都充分利用了大型语言模型和先进的自动化工具，以实现科学研究的全流程自动化。

“AI科学家”的概念图示，这是一个由LLM驱动的端到端科学发现过程。“AI科学家”首先发明并评估一组想法的新颖性。然后，它确定如何测试这些假设，包括通过编辑由自动代码生成的最新进展所支持的代码库来编写必要的代码。之后，自动执行实验以收集一组由数值分数和视觉摘要（例如图表或表格）组成的结果。这些结果阐述、解释和总结在LaTeX报告中。最后，“AI科学家”根据标准机器学习会议的当前实践生成自动化评审。该评审可用于改进项目或作为未来开放式科学发现的反馈。

创意生成：

“AI科学家”从给定的研究主题出发，通过迭代地生成和评估新的研究创意。这一过程受到进化计算和开放式探索的启发，利用大型语言模型作为变异算子，不断生成和评估新的研究方向。

通过连接大型语言模型与语义学者（Semantic Scholar）API，“AI科学家”能够检查每个创意的新颖性，并丢弃与现有文献过于相似的想法。

这一阶段，“AI科学家”展现出了令人惊讶的创意生成能力，尽管有时也会产生一些不切实际的想法。

实验迭代：

一旦确定了研究创意，“AI科学家”将利用Aider等自动化编码助手来设计和执行实验。Aider是一个能够根据语言模型的指令自动修改代码、修复错误和重构现有代码库的先进工具。

“AI科学家”通过迭代实验，不断调整实验参数和代码实现，以收集实验数据并进行分析。每个实验的结果都会被记录下来，作为后续论文撰写的基础。

在实验过程中，“AI科学家”也展现出了对实验结果的初步理解和分析能力，尽管有时也会误解结果。

论文撰写：

在完成实验后，“AI科学家”将实验结果整理成标准的科学论文格式。这一过程涉及多个步骤，包括编写引言、背景、方法、实验设置、结果和结论等部分。

“AI科学家”还通过语义学者API搜索相关文献，以编写“相关工作”部分，并引用其他研究来支持其发现。

然而，论文撰写对“AI科学家”来说仍然是一个挑战。尽管它能够生成论文的各个部分，但很难写出一篇连贯的9页论文来解释其结果。研究人员因此将这个过程分为许多步骤，并对照其他部分检查每个部分，以清除重复和相互矛盾的信息。

值得注意的是，“AI科学家”在论文撰写过程中有时会编造一些技术术语或数字，尽管研究人员尽了最大努力保持诚实。这一问题目前仍在研究中，以寻找有效的解决方案。

实验与结果

论文中展示了“AI科学家”在机器学习领域的三个子领域（扩散建模、基于转换器的语言建模和学习动态）中的应用。通过运行数百次实验，“AI科学家”能够以极低的成本（每篇论文约15美元）生成高质量的研究论文。实验结果表明，“AI科学家”生成的论文不仅在数量上令人印象深刻，而且在质量上也达到了相当高的水平。一些生成的论文甚至在某些指标上超过了人类撰写的论文。

此外，“AI科学家”还引入了一个基于LLM的自动评审系统（和前面的核心框架配合），该系统在评估论文质量方面表现出接近人类的性能。这一系统为研究人员提供了一种快速、客观的评估手段，有助于指导下一轮实验和论文的改进。

“AI for Science”热潮与批评

“AI科学家”项目正是“AI for Science”（AI4S）热潮的一部分。这股热潮始于2020年，当时Google DeepMind推出了AlphaFold，一个以前所未有的准确性预测蛋白质3D结构的人工智能系统。自那时以来，更多的大企业参与者已经加入其中，推动了AI在科学研究中的广泛应用。

然而，这场运动也面临着批评。一些科学家认为，尽管AI能够快速生成大量结果，但这些结果可能并没有实际价值。例如，在2023年Google DeepMind的一篇论文中，尽管声称发现了220万种新的晶体结构，但后续的分析发现这些结果缺乏新颖性、可信度和实用性。

对于“AI科学家”项目，一些批评者也提出了类似的担忧。他们认为，将AI产品视为自主研究人员可能会将研究范围缩小到适合AI的问题，并失去推动真正创新的多元化观点。此外，他们还担心AI在论文撰写过程中可能会编造数据或误解结果，从而影响科学研究的准确性和可信度。

未来展望

尽管面临着诸多挑战和批评，但“AI科学家”项目仍然展现出了巨大的潜力和前景。研究人员计划继续训练“AI科学家”，提高其性能和准确性，并探索将其应用于其他科学领域的可能性。例如，生物学、物理学以及量子计算和材料科学等领域都可能成为“AI科学家”未来发挥作用的舞台。

此外，随着大型语言模型和自动化工具的不断进步，“AI科学家”有望实现更广泛的科学发现。研究团队设想将“AI科学家”与云机器人等先进技术结合，实现实体实验的自动化。这将进一步推动科学研究的自动化和智能化进程。未来，让我们拭目以待吧，不管如何，AI已经不是传统意义上的工具，人类应该要学习如何使用AI、与AI协同，甚至和AI相处了。

最新文章

好听的交响乐 - 王莘 - 歌唱祖国

好听的交响乐 - 张寒晖 - 松花江上

边看边听古典音乐 - 保罗·塞内维尔、奥立佛·图森 - 秋日私语

好听的交响乐 - 黎国荃 - 渔舟唱晚

边看边听古典音乐 - 莫扎特 - G大调第三小提琴协奏曲

边看边听古典音乐 - 圣-桑 - 引子与回旋随想曲

边看边听古典音乐 - 圣-桑 - B小调第三小提琴协奏曲

边看边听古典音乐 - 德沃夏克 - 幽默曲

边看边听古典音乐 - 德沃夏克 - 浪漫曲

边看边听古典音乐 - 帕格尼尼 - B小调第二小提琴协奏曲

边看边听古典音乐 - 帕格尼尼 - D大调第一号小提琴协奏曲

边看边听古典音乐 - 舒曼 - 梦幻曲

边看边听古典音乐 - 舒伯特 - 圣母颂

边看边听古典音乐 - 舒伯特 - 小夜曲

边看边听古典音乐 - 肖邦 - 升c小调夜曲

边看边听古典音乐 - 肖邦 - 降E大调夜曲

边看边听古典音乐 - 德尔德拉 - 纪念曲（回忆）

边看边听古典音乐 - 维尼亚夫斯基 - D小调第二小提琴协奏曲

边看边听古典音乐 - 阿尔比诺尼 - G小调柔板

边看边听古典音乐 - 沃恩·威廉斯 - 云雀高飞

边看边听古典音乐 - 迪尼库 - 云雀

边看边听古典音乐 - 胡拜 - 匈牙利狂欢节（美丽的凯蒂作品32号）

边看边听古典音乐 - 劳弗兰、沙莉 - 下雨的时候

边看边听古典音乐 - 酷玩乐队 - Viva la Vida

边看边听古典音乐 - 西蒙、加芬克尔 - 斯卡布罗集市

边看边听古典音乐 - 久石让 - 雨（The Rain）

边看边听古典音乐 - 西蒙、加芬克尔 - 斯卡布罗集市

边看边听古典音乐 - 劳弗兰、沙莉 - 巴卡贝尔的忧伤（寂色）

AI新范式：强化学习及后训练扩展律

好听的交响乐 - 翁清溪 - 月亮代表我的心

谁是下一个《黑神话：悟空》？

边看边听古典音乐 - 贝多芬 - 悲怆

不离不弃的朋友

边看边听古典音乐 - 洪佩尔丁克 - 《汉泽尔与格蕾太尔》的《前奏曲》

边看边听古典音乐 - 莫扎特 - 第四十交响曲

AI科学家：迈向全自动开放式科学发现

边看边听古典音乐 - 爱德华·埃尔加 - 降E大调第二交响曲

边看边听古典音乐 - 爱德华·埃尔加 - 叹息

边看边听古典音乐 - 爱德华·埃尔加 - E小调大提琴协奏曲

历史的深渊与人性的光辉

好听的交响乐 - 刘自力 - 伟大的北京

好听的交响乐 - 彭飞 - 萱草花

从IBM和MIT来看量子计算的未来图景

好听的交响乐 - 舒楠 - 灯火里的中国

好听的交响乐 - 殷承宗 - 钢琴协奏曲《黄河》

边看边听古典音乐 - 普契尼 - 《图兰朵》今夜无人入睡

边看边听古典音乐 - 门德尔松 - 《仲夏夜之梦》序曲

边看边听古典音乐 - 斯美塔那 - 我的祖国

边看边听古典音乐 - 埃克托·柏辽兹 - 罗马狂欢节序曲

边看边听古典音乐 - 贝多芬 - 第五交响曲

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉