说这是, 人工智能AI对科学发现的影响的最佳论文! 研究发现让人倍感诧异, 太出乎意料了

学术   2024-11-14 16:32   中国香港  

凡是搞计量经济的,都关注这个号了

邮箱:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

社群群友在群里分享了一篇文章,有群友说这是, 人工智能AI对科学发现的影响的最佳论文。

概要:本文深入研究了人工智能对创新活动的影响,特别是通过观察美国一家大型企业研发实验室中1,018名科学家随机应用新材料发现技术的情况。研究结果显示,在人工智能的助力下,研究人员发现的材料数量激增44%,专利申请量增加了39%,下游产品创新也提高了17%。这些新发现的化合物以其新颖的化学结构,推动了更多革命性的发明。

(上面这个确实是好事,至少证明AI并不是自己重复自己,也不是不能生产新知识,相反能够帮助人类发现新东西。)

然而,这项技术对不同生产力水平的科学家产生了不同的影响:生产力最低的三分之一科学家几乎没有获得益处,而顶尖研究人员的产出却几乎翻了一番。

(这表明,在同一个AI工具面前,大牛可以让生产力翻翻,但普通人几乎没有任何长进,这加大了科学家的不平等。)

文章进一步分析了这些结果背后的机制,发现人工智能自动化了57%的“创意生成”任务,使得研究人员能够将更多精力集中于评估模型生成的候选材料。顶尖科学家利用他们的专业知识,优先选择最有潜力的人工智能建议,而其他科学家则在测试假阳性上耗费了大量资源

(这表明,AI其实完全可以帮你完成那些极具创意性的任务,而你要做的就是判断哪个最具发展潜力,然后开展下去,但普通人往往判断力太差而将大把经历耗费在测试没有多大意义的事情上)

总体而言,这些发现不仅突显了人工智能在提升研究能力方面的潜力,也强调了算法与专业知识在创新过程中的相互补充。然而,调查结果也揭示了这些收益背后的代价:82%的科学家表示,由于创造力的下降和技能未能得到充分利用,他们对工作的不满情绪有所上升
(所以,没有专业知识的加持,人工智能对你也没什么大用途,这两者是相辅相成的;没想到的是,很多科学家用AI后发现自己的创造力下降了,专业知识也没有得到利用,所以开始不喜欢自己的研究工作。)

简要介绍,下面的研究发现非常值得关注:

人工智能对经济发展的影响,不仅在于其改变商品和服务生产方式的能力,更在于其对创新过程本身的强化作用。近年来,深度学习技术的进步在促进科学突破方面展现出巨大潜力,特别是在药物发现和材料科学等领域。这些领域的模型能够基于庞大的现有数据集进行训练。然而,关于这些工具如何在现实世界中影响发明创造的研究还不多见,研发瓶颈、组织摩擦或可靠性问题都可能限制其效果。因此,人工智能对创新速度和方向的影响仍然是一个未知数。同时,人工智能对科学家的影响也存在不确定性,这取决于人工智能是作为人类专业知识的补充还是替代品。

为了探究这些问题,本文通过对美国一家大型企业研发实验室中1,018名科学家的实证研究,考察了人工智能工具在材料发现中的随机应用效果。该实验室专注于将材料科学应用于医疗保健、光学和工业制造等领域,并拥有一支由化学、物理和工程学领域高级学位持有者组成的研究团队。传统上,科学家们依赖于昂贵且耗时的试错方法来发现新材料,设计多种潜在结构并测试其属性。而人工智能技术,借助深度学习的进步,部分自动化了这一过程。模型使用现有材料的组成和特性作为训练数据,预测并生成具有特定属性的新化合物“配方”。科学家们随后对这些候选材料进行评估,选择最有潜力的进行合成。一旦研究人员成功创造出有用的新材料,它们就会被集成到新产品原型中,并继续进行开发、规模化生产和商业化。

自2022年5月起,实验室分三个阶段引入了这项工具。研究团队被随机分配至各个阶段,这样的安排使我们能够通过对比已经使用和尚未使用该技术科学家的表现,来准确评估技术的实际影响。各阶段在教育背景、经验和历史成就等可观测变量上保持了均衡,这验证了随机分配的有效性。本文利用覆盖研发全过程的详尽数据,深入分析了人工智能对材料发现的影响,以及其对专利申请和产品创新的深远影响。

在人工智能的辅助下,科学家发现的材料数量激增了44%。这些新化合物展现出更卓越的性能,这表明该模型不仅增加了材料的数量,还提高了其质量。随着材料数量的增加,专利申请量也随之增加了39%,几个月后,包含这些新化合物的产品原型数量增加了17%。在考虑了投入成本之后,该工具使研发效率提升了13-15%。这些结果带来了两个重要的启示:首先,它们展示了人工智能在增强研究能力方面的显著潜力;其次,它们证实了这些研究成果能够有效转化为产品创新,并未在研发的后续阶段遭遇瓶颈。

人工智能无疑为创新进程注入了新动力,但这些创新成果的新颖性究竟如何?在科学研究中运用机器学习的一个主要担忧是,它可能会加剧所谓的“街灯效应”。由于模型是基于现有知识训练的,它们可能会引导研究方向偏向那些已经有所了解但价值相对较低的领域。然而,本文的研究显示,这项工具在研发的三个阶段都显著提升了创新的新颖性。首先,我采用了De 等(2016)提出的化学相似性方法来衡量新材料的原创性。与现有化合物相比,模型生成的材料展现出了更为独特的物理结构,这表明人工智能开辟了设计空间中的新领域。其次,我发现这导致了更具创造性的发明。接受人工智能辅助的科学家申请的专利更有可能引入新的技术术语,这是变革性技术的领先指标。第三,我发现人工智能改变了产品的性质:它增加了代表新产品线而非现有产品改进的原型比例,推动创新朝着更加激进的方向发展。

进一步分析这项技术的分配效应,我发现它在高能力科学家中获得了不成比例的好处。我根据处理前期间的成果构建了初始生产力的衡量指标,并控制了材料类型和应用,以考虑某些化合物本身更容易被发现的可能性。通过估计每个生产力分位数的单独处理效应,我记录到了能力分布中的显著差异性影响。尽管生产力最低的三分之一科学家几乎没有受益,但排名前10%的科学家的产出增加了81%。因此,90:10的表现不平等性超过了两倍。这表明人工智能和人类的专业知识在创新生产函数中是互补的。

本文的第二部分深入分析了这些成果背后的机制。通过结合科学家活动的丰富文本数据与大型语言模型,并将这些数据分类为不同的研究任务,我发现人工智能显著地改变了发现过程。该工具自动化了大部分“创意生成”任务,将科学家的精力重新分配到评估模型建议的候选化合物上。在没有人工智能的情况下,研究人员几乎将一半的时间用于构思潜在的材料。引入该工具后,这一比例降至不到16%。与此同时,评估候选材料所花费的时间增加了74%。因此,人工智能具有双重效应:它替代了设计化合物的特定劳动,但由于与评估任务的互补性,它在更广泛的发现过程中增强了劳动。

接下来,我揭示了科学家在评估人工智能生成的候选化合物时所展现的技能差异,并探讨了这一工具产生异质性影响的原因。我收集了研究人员测试的材料以及这些实验的结果。顶尖科学家利用他们的专业知识,识别出有前景的人工智能建议,优先研究最具可行性的候选材料。而其他科学家则在测试假阳性上浪费了大量资源。实际上,有相当一部分研究人员的测试顺序几乎与随机选择无异,几乎没有从工具中获得实质性的好处。评估能力与初始生产力呈正相关,这解释了科学家之间表现差异的扩大。这些结果表明,评估模型预测的新研究技能正变得越来越重要,成为人工智能技术的有力补充。因此,我为Agrawal 等(2018)提出的观点提供了证据:随着机器预测的改进,人类判断和决策的价值也随之提升。

为了理解这些判断差异的来源,我对实验室的研究人员进行了调查。调查结果揭示了领域知识的核心作用。擅长评估的科学家认为,他们在类似材料方面的训练和经验是评估过程的关键。与此相对,那些难以评估人工智能建议的化合物的研究人员表示,他们的背景知识对此帮助不大。支持这一解释的证据是,评估能力排名前四分之一的研究人员在其研究材料领域发表学术文章的概率是其他科学家的3.4倍。尽管一些人认为大数据和机器学习会使领域知识变得过时,但这些结果表明,只有具有足够专业知识的科学家才能充分利用人工智能的力量。

我将我的估计结果与一个简单的模型相结合,阐述了组织适应性如何增强该工具的效果。人工智能改变了特定技能的回报结构,提升了判断力的价值,同时降低了创意生成的重要性。因此,调整招聘策略,优先聘用具有强大判断力的科学家,可以显著提升生产力。在我样本数据的最后一个月,这部分数据未包含在主要分析中,实验室解雇了3%的研究人员。与理论预测相吻合,这些被解雇的科学家中有83%属于判断力最差的四分之一。实验室通过增加新招聘,弥补了这些人员的流失,实现了劳动力的净增长。由于研究人员构成的变化,我的估计结果可能低估了人工智能在长期内的影响。

新技术的影响不仅限于提高生产力。它们还可能深刻影响工人的福祉和成功所需的专业技能。在创新领域,这些考量尤为重要,因为它们在一定程度上决定了谁能成为科学家,进入哪些领域,以及他们会投资于哪些技能。本文的最后一部分将通过调查来探讨这些问题。

研究人员对工作内容的满意度减少了44%。这一影响在科学家中相对均匀,表明即使是人工智能的“受益者”也面临着成本。受访者指出,技能未得到充分利用和创造力下降是他们最关心的问题,这突显了适应快速技术进步的难度。此外,这些结果挑战了人工智能主要将自动化那些枯燥的任务、让人类专注于更有意义活动的观点。尽管提高生产力所带来的满足感在一定程度上缓解了这一负面效应,尤其对于高能力的科学家来说,但82%的研究人员总体上感到福祉下降。

使用该工具不仅影响了工作满意度,还改变了材料科学家对人工智能的看法。科学家们对人工智能提升生产力的信心几乎翻倍。同时,对失业的担忧并未改变,这显示了对人类判断力的持续需求。然而,由于研究过程的变化,科学家们预计人工智能将改变在该领域取得成功所需的技能。因此,计划进行再培训的研究人员数量增加了71%。这些发现表明,实际应用人工智能可以显著影响人们对这项技术的看法。调查回应还揭示了一个重要事实:领域专家并未预见到本文所记录的效果。

尽管我的研究集中在材料科学领域,但这些见解可能对那些需要在广阔且明确定义的技术空间中进行搜索的发现过程具有普遍适用性。这些领域的基础原理已经广为人知,但由于复杂性,具体实例的识别仍然非常困难。例如,在药物发现领域,原子键的性质已被充分理解,但可能的化学配置数量庞大,使得问题极其复杂。深度学习模型在从复杂数据中提取特征方面表现出色,具有改变此类研究的潜力。除了材料科学和制药领域,多个经济重要领域也属于这一类,包括结构生物学、基因组学、气候学甚至数学的某些部分。

*群友可在社群直接下载原文PDF。

关于神器1.神器! 统计和金融计算器, 词云和情感分析器强大到无敌!2.找合适的英文期刊发表的神器! 亲测太好用了!3.神器! SSCI分区及影响因子查询, 还有国人发表比例,4.一数学神器诞生! 手写公式和符号, 竟免费转成LaTex,5.学术神器Endnote的最详尽使用方法,6.“各领域顶级外文期刊”菜单栏使用指南, 最新文章和目录浏览!7.NBER20个主题工作论文分门别类, Chronicle,8.不用必悔神器!按最全的细分领域推送该周最新最前沿的经济学工作论文!9.ABS星级期刊目录实时更新网址! 你总能找到最新的期刊分级目录!10.分享直接免费使用的ChatGPT, 确实最强科研神器!11.有用! 怎么一下子找到所有期刊正在征稿的special issues信息呢? 12.你的论文对政策产生了多少影响? 现有一个免费神器给你下结论!13.大神器! 直接显示中英文期刊的等级, 及该期刊在中国顶级大学的认可度!14.必备神器: 各专业领域代表性大语言模型GPT与数据资源!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

7年,计量经济圈近2000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀通过感染优秀而互相成就彼此。


计量经济圈
凡是搞计量经济的,都关注这个号了。
 最新文章