说这是, 人工智能AI对科学发现的影响的最佳论文! 研究发现让人倍感诧异, 太出乎意料了

学术 2024-11-14 16:32 中国香港

凡是搞计量经济的，都关注这个号了

邮箱：econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

社群群友在群里分享了一篇文章，有群友说这是, 人工智能AI对科学发现的影响的最佳论文。

概要：本文深入研究了人工智能对创新活动的影响，特别是通过观察美国一家大型企业研发实验室中1,018名科学家随机应用新材料发现技术的情况。研究结果显示，在人工智能的助力下，研究人员发现的材料数量激增44%，专利申请量增加了39%，下游产品创新也提高了17%。这些新发现的化合物以其新颖的化学结构，推动了更多革命性的发明。

（上面这个确实是好事，至少证明AI并不是自己重复自己，也不是不能生产新知识，相反能够帮助人类发现新东西。）

然而，这项技术对不同生产力水平的科学家产生了不同的影响：生产力最低的三分之一科学家几乎没有获得益处，而顶尖研究人员的产出却几乎翻了一番。

（这表明，在同一个AI工具面前，大牛可以让生产力翻翻，但普通人几乎没有任何长进，这加大了科学家的不平等。）

文章进一步分析了这些结果背后的机制，发现人工智能自动化了57%的“创意生成”任务，使得研究人员能够将更多精力集中于评估模型生成的候选材料。顶尖科学家利用他们的专业知识，优先选择最有潜力的人工智能建议，而其他科学家则在测试假阳性上耗费了大量资源。

（这表明，AI其实完全可以帮你完成那些极具创意性的任务，而你要做的就是判断哪个最具发展潜力，然后开展下去，但普通人往往判断力太差而将大把经历耗费在测试没有多大意义的事情上）

总体而言，这些发现不仅突显了人工智能在提升研究能力方面的潜力，也强调了算法与专业知识在创新过程中的相互补充。然而，调查结果也揭示了这些收益背后的代价：82%的科学家表示，由于创造力的下降和技能未能得到充分利用，他们对工作的不满情绪有所上升。

(所以，没有专业知识的加持，人工智能对你也没什么大用途，这两者是相辅相成的；没想到的是，很多科学家用AI后发现自己的创造力下降了，专业知识也没有得到利用，所以开始不喜欢自己的研究工作。)

简要介绍，下面的研究发现非常值得关注：

人工智能对经济发展的影响，不仅在于其改变商品和服务生产方式的能力，更在于其对创新过程本身的强化作用。近年来，深度学习技术的进步在促进科学突破方面展现出巨大潜力，特别是在药物发现和材料科学等领域。这些领域的模型能够基于庞大的现有数据集进行训练。然而，关于这些工具如何在现实世界中影响发明创造的研究还不多见，研发瓶颈、组织摩擦或可靠性问题都可能限制其效果。因此，人工智能对创新速度和方向的影响仍然是一个未知数。同时，人工智能对科学家的影响也存在不确定性，这取决于人工智能是作为人类专业知识的补充还是替代品。

为了探究这些问题，本文通过对美国一家大型企业研发实验室中1,018名科学家的实证研究，考察了人工智能工具在材料发现中的随机应用效果。该实验室专注于将材料科学应用于医疗保健、光学和工业制造等领域，并拥有一支由化学、物理和工程学领域高级学位持有者组成的研究团队。传统上，科学家们依赖于昂贵且耗时的试错方法来发现新材料，设计多种潜在结构并测试其属性。而人工智能技术，借助深度学习的进步，部分自动化了这一过程。模型使用现有材料的组成和特性作为训练数据，预测并生成具有特定属性的新化合物“配方”。科学家们随后对这些候选材料进行评估，选择最有潜力的进行合成。一旦研究人员成功创造出有用的新材料，它们就会被集成到新产品原型中，并继续进行开发、规模化生产和商业化。

自2022年5月起，实验室分三个阶段引入了这项工具。研究团队被随机分配至各个阶段，这样的安排使我们能够通过对比已经使用和尚未使用该技术科学家的表现，来准确评估技术的实际影响。各阶段在教育背景、经验和历史成就等可观测变量上保持了均衡，这验证了随机分配的有效性。本文利用覆盖研发全过程的详尽数据，深入分析了人工智能对材料发现的影响，以及其对专利申请和产品创新的深远影响。

在人工智能的辅助下，科学家发现的材料数量激增了44%。这些新化合物展现出更卓越的性能，这表明该模型不仅增加了材料的数量，还提高了其质量。随着材料数量的增加，专利申请量也随之增加了39%，几个月后，包含这些新化合物的产品原型数量增加了17%。在考虑了投入成本之后，该工具使研发效率提升了13-15%。这些结果带来了两个重要的启示：首先，它们展示了人工智能在增强研究能力方面的显著潜力；其次，它们证实了这些研究成果能够有效转化为产品创新，并未在研发的后续阶段遭遇瓶颈。

人工智能无疑为创新进程注入了新动力，但这些创新成果的新颖性究竟如何？在科学研究中运用机器学习的一个主要担忧是，它可能会加剧所谓的“街灯效应”。由于模型是基于现有知识训练的，它们可能会引导研究方向偏向那些已经有所了解但价值相对较低的领域。然而，本文的研究显示，这项工具在研发的三个阶段都显著提升了创新的新颖性。首先，我采用了De 等（2016）提出的化学相似性方法来衡量新材料的原创性。与现有化合物相比，模型生成的材料展现出了更为独特的物理结构，这表明人工智能开辟了设计空间中的新领域。其次，我发现这导致了更具创造性的发明。接受人工智能辅助的科学家申请的专利更有可能引入新的技术术语，这是变革性技术的领先指标。第三，我发现人工智能改变了产品的性质：它增加了代表新产品线而非现有产品改进的原型比例，推动创新朝着更加激进的方向发展。

进一步分析这项技术的分配效应，我发现它在高能力科学家中获得了不成比例的好处。我根据处理前期间的成果构建了初始生产力的衡量指标，并控制了材料类型和应用，以考虑某些化合物本身更容易被发现的可能性。通过估计每个生产力分位数的单独处理效应，我记录到了能力分布中的显著差异性影响。尽管生产力最低的三分之一科学家几乎没有受益，但排名前10%的科学家的产出增加了81%。因此，90:10的表现不平等性超过了两倍。这表明人工智能和人类的专业知识在创新生产函数中是互补的。

本文的第二部分深入分析了这些成果背后的机制。通过结合科学家活动的丰富文本数据与大型语言模型，并将这些数据分类为不同的研究任务，我发现人工智能显著地改变了发现过程。该工具自动化了大部分“创意生成”任务，将科学家的精力重新分配到评估模型建议的候选化合物上。在没有人工智能的情况下，研究人员几乎将一半的时间用于构思潜在的材料。引入该工具后，这一比例降至不到16%。与此同时，评估候选材料所花费的时间增加了74%。因此，人工智能具有双重效应：它替代了设计化合物的特定劳动，但由于与评估任务的互补性，它在更广泛的发现过程中增强了劳动。

接下来，我揭示了科学家在评估人工智能生成的候选化合物时所展现的技能差异，并探讨了这一工具产生异质性影响的原因。我收集了研究人员测试的材料以及这些实验的结果。顶尖科学家利用他们的专业知识，识别出有前景的人工智能建议，优先研究最具可行性的候选材料。而其他科学家则在测试假阳性上浪费了大量资源。实际上，有相当一部分研究人员的测试顺序几乎与随机选择无异，几乎没有从工具中获得实质性的好处。评估能力与初始生产力呈正相关，这解释了科学家之间表现差异的扩大。这些结果表明，评估模型预测的新研究技能正变得越来越重要，成为人工智能技术的有力补充。因此，我为Agrawal 等（2018）提出的观点提供了证据：随着机器预测的改进，人类判断和决策的价值也随之提升。

为了理解这些判断差异的来源，我对实验室的研究人员进行了调查。调查结果揭示了领域知识的核心作用。擅长评估的科学家认为，他们在类似材料方面的训练和经验是评估过程的关键。与此相对，那些难以评估人工智能建议的化合物的研究人员表示，他们的背景知识对此帮助不大。支持这一解释的证据是，评估能力排名前四分之一的研究人员在其研究材料领域发表学术文章的概率是其他科学家的3.4倍。尽管一些人认为大数据和机器学习会使领域知识变得过时，但这些结果表明，只有具有足够专业知识的科学家才能充分利用人工智能的力量。

我将我的估计结果与一个简单的模型相结合，阐述了组织适应性如何增强该工具的效果。人工智能改变了特定技能的回报结构，提升了判断力的价值，同时降低了创意生成的重要性。因此，调整招聘策略，优先聘用具有强大判断力的科学家，可以显著提升生产力。在我样本数据的最后一个月，这部分数据未包含在主要分析中，实验室解雇了3%的研究人员。与理论预测相吻合，这些被解雇的科学家中有83%属于判断力最差的四分之一。实验室通过增加新招聘，弥补了这些人员的流失，实现了劳动力的净增长。由于研究人员构成的变化，我的估计结果可能低估了人工智能在长期内的影响。

新技术的影响不仅限于提高生产力。它们还可能深刻影响工人的福祉和成功所需的专业技能。在创新领域，这些考量尤为重要，因为它们在一定程度上决定了谁能成为科学家，进入哪些领域，以及他们会投资于哪些技能。本文的最后一部分将通过调查来探讨这些问题。

研究人员对工作内容的满意度减少了44%。这一影响在科学家中相对均匀，表明即使是人工智能的“受益者”也面临着成本。受访者指出，技能未得到充分利用和创造力下降是他们最关心的问题，这突显了适应快速技术进步的难度。此外，这些结果挑战了人工智能主要将自动化那些枯燥的任务、让人类专注于更有意义活动的观点。尽管提高生产力所带来的满足感在一定程度上缓解了这一负面效应，尤其对于高能力的科学家来说，但82%的研究人员总体上感到福祉下降。

使用该工具不仅影响了工作满意度，还改变了材料科学家对人工智能的看法。科学家们对人工智能提升生产力的信心几乎翻倍。同时，对失业的担忧并未改变，这显示了对人类判断力的持续需求。然而，由于研究过程的变化，科学家们预计人工智能将改变在该领域取得成功所需的技能。因此，计划进行再培训的研究人员数量增加了71%。这些发现表明，实际应用人工智能可以显著影响人们对这项技术的看法。调查回应还揭示了一个重要事实：领域专家并未预见到本文所记录的效果。

尽管我的研究集中在材料科学领域，但这些见解可能对那些需要在广阔且明确定义的技术空间中进行搜索的发现过程具有普遍适用性。这些领域的基础原理已经广为人知，但由于复杂性，具体实例的识别仍然非常困难。例如，在药物发现领域，原子键的性质已被充分理解，但可能的化学配置数量庞大，使得问题极其复杂。深度学习模型在从复杂数据中提取特征方面表现出色，具有改变此类研究的潜力。除了材料科学和制药领域，多个经济重要领域也属于这一类，包括结构生物学、基因组学、气候学甚至数学的某些部分。

*群友可在社群直接下载原文PDF。
关于神器1.神器! 统计和金融计算器, 词云和情感分析器强大到无敌！2.找合适的英文期刊发表的神器! 亲测太好用了！3.神器! SSCI分区及影响因子查询, 还有国人发表比例，4.一数学神器诞生! 手写公式和符号, 竟免费转成LaTex，5.学术神器Endnote的最详尽使用方法，6.“各领域顶级外文期刊”菜单栏使用指南, 最新文章和目录浏览！7.NBER20个主题工作论文分门别类, Chronicle，8.不用必悔神器！按最全的细分领域推送该周最新最前沿的经济学工作论文！9.ABS星级期刊目录实时更新网址! 你总能找到最新的期刊分级目录！10.分享直接免费使用的ChatGPT, 确实最强科研神器！11.有用! 怎么一下子找到所有期刊正在征稿的special issues信息呢? 12.你的论文对政策产生了多少影响? 现有一个免费神器给你下结论！13.大神器! 直接显示中英文期刊的等级, 及该期刊在中国顶级大学的认可度！14.必备神器: 各专业领域代表性大语言模型GPT与数据资源！

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

7年，计量经济圈近2000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

计量经济圈组织了一个计量社群，有如下特征：热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此，建议积极进取和有强烈研习激情的中青年学者到社群交流探讨，始终坚信优秀通过感染优秀而互相成就彼此。

http://mp.weixin.qq.com/s?__biz=MjM5OTMwODM1Mw==&mid=2448123631&idx=1&sn=28a496e72524ae50377c5c9d8bb5ce43

计量经济圈

凡是搞计量经济的，都关注这个号了。

有启发! 将DID双重差分的最新进展整合到模型设定偏差的统一框架中进行解读

说这是, 人工智能AI对科学发现的影响的最佳论文! 研究发现让人倍感诧异, 太出乎意料了

近年来这些关于双重差分法DID的新研究是否改变了学术界的研究方向？

不研究人, 经济学开始研究鸟儿了, DID-TWFE, Bartik IV, 零第一阶段ZFS检验值得参考

这篇TOP5会让川普倍感头痛, 得对这作者恨得要死, 工具变量和机制分析很有看头

产业政策真复兴了! 美国经济学会JEP连续刊发5篇文章支持产业政策, 这样做实证产业政策！

机器学习中的9种常用距离度量方法

做政策评估时, 如何衡量一项政策的空间溢出效应呢？

18种机器学习ML算法对比解析, 及Python操作代码

2024年度国家社科基金重大项目立项名单公示！

川普让DID方法倒退至少1个月, 伍德里奇关小黑屋吃芹菜, 哈里斯爸爸书籍胎死腹中！

TOP刊: 看看这研究设计多精妙! 美国贸易政策真的改变了国际产业链吗? 中国真的被其他国家取代了吗?

TOP5主编实证: 像中国一样的产业政策很好, 得到国际认可! DID, 事件研究, 各种灵活计量模型设计！

TOP综述: “像中国一样的第三产业化”, 不说也知道作者是谁！

《经济研究》终于宣布公布文章附录, 数据和软件代码文件！！！

这TOP5太牛了! 高知左翼与商人右翼, 21个西方国家过去半个世纪政治分化的演变, Y为虚拟变量的面板回归如何做?

重磅! CFPS 2022年数据已经公布了! 最新数据用起来做研究！

TOP刊: 文本分析技术及在经济学和商学中的应用, 一个指南和综述

普林斯顿大学机器学习的250页讲义, 看了后学机器学习变简单多了.

当X与Y在不同数据层面时, 固定效应该如何控制? 控制哪个层面? 可以同时控制么?

数据公布: 中国省份和城市营商环境面板数据库数据库(2017-2024)

Acemoglu诺奖得主如何培养出RDD女王的? 毛咕噜2024最新政治经济学大纲公开！

今晚直播: 山大陈强, 可信度革命后的计量经济学？

重磅! 所有英文期刊ABS ranking 2024刚刚发布！

现代DID: 理解DID近期进展, DID研究绝对领军人物的“DID最新进展分享”

今晚直播: 厦大方颖, 计量经济学训练与经济学实证研究

违反平行趋势就一定可怕吗? 事前趋势不平行是否会影响估计结果的稳健性?

如果存在事前趋势咋办? 如何检测事前趋势, 为什么会有, 会影响研究结论可信度么?

突发! 23位诺贝尔经济学奖得主联名写信, 总统是万万不能得罪诺奖经济学家！

你需要的SPSS数据分析方法全在这里, SPSS中论文写作常用的8种统计方法

可以只控制个体固定效应, 不控制时间固定效应吗?

24年三位诺奖重整的新经济史革命, 到底是啥? 计量学派与新制度学派谁与争锋?

AER史上第一篇旅游业与经济的文章, 旅游人的学术盛宴和狂欢! 旅游中的IV是啥样！

加入时间固定效应后X就不显著了为什么, 怎么办呢？

相信我, 彻底弄懂系列: 内生性检验, 稳健性检验, 异质性检验, 机制检验！！！

手游“原神”被迫当了回工具变量! AEJ副主编加持可能登上TOP5! 如何做同群效应的实证!

曼昆等到66岁才当选, 诺奖得主至今未当选, 看24年计量经济学会士, 确实对亚非拉有照顾！

国内一“财经记者”发表了Econometrica，厉害了这位记者.

AER来了! 香港房地产市场与港府2047年土地租约, 结构估计与DDD, PSM, 交互项机制！

Acemoglu与premier LKQ的会面, 以及给我国开出的政策建议

33年的Stata顶级大佬整理的学者应知的30个Stata图形技巧Tips

顶级大佬说, 这篇AER产生了所有时间段以来人类最重要的工具变量回归, IV回归！！！

最全: 24年诺贝尔经济学奖获得者学术贡献, 个人情况, 学术研究演化全方位总结 (视频+文章)

视频: Acemoglu和Johnson的媒体发布会, 全程高能50分钟

24年3位诺贝尔经济学奖获得者的个人情况以及他们学术研究内容及演化总结

2024年诺贝尔经济学奖: 表彰Acemoglu, Johnson和Robinson"对制度如何形成以及如何影响繁荣"的贡献

2024诺贝尔经济学奖大竞猜! 今年奖励金额维持高位等你来拿！

机制分析: 因果中介分析新进展及软件实现程序详解

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉