张俊林:AI 能不能做出真正意义的创新?

科技   2024-11-05 08:03   北京  
作者:张俊林
原文:https://www.zhihu.com/question/814165911/answer/4771718866
AI的创新能力已获诺贝尔奖认证,诺贝尔理科奖项代表了科学领域重大的突破或创新,虽然今年的诺贝尔物理奖给了Hinton老先生这事情略显抽象(不过我很喜欢Hinton获奖感言里的这句话:“我非常幸运,有很多非常聪明的学生,他们比我优秀得多。他们后来都做了伟大的事情。我特别为我的一个学生解雇了Sam Altman而感到自豪。”),但诺贝尔化学奖给了AI解析与预测蛋白质结构,这实至名归且早有迹象,作为诺奖风向标的“拉斯克奖“在2023年将拉斯克基础医学研究奖授予了谷歌DeepMind的Demis Hassabis博士和John Jumper博士,以表彰他们发明了能够预测蛋白质三维结构的革命性技术AlphaFold。关于AI和创新的关系,这就很说明问题了。

创新的核心在于提出新的想法或概念,这些想法或概念必须同时拥有“创新三性”(From:The Creative Mind: Myths and Mechanisms.):首先是新颖性(New):创新的想法必须是前所未有的,是一个全新的概念或者方法,而不是对现有知识的简单重复。其次是出人意料性(Surprising):创新的想法往往出乎人们的意料之外,它打破了常规思维,挑战现有的假设和信念。第三是有用性(Valuable):创新不仅要新颖和出人意料,还必须具有实际的价值。这意味着它应该能够解决现有问题,提高效率,或以某种方式为社会或个人带来益处。

LLM是否具备创新能力?目前也有一些专门的实证性研究,如果归纳下研究结论,应该是LLM目前在某些学科(计算机算法、生物学等)具备真正意义上的创新性,但面临提出的创新思路趋同、多样性不足的问题。之所以趋同,应与目前各种不同的大模型在训练数据分布、模型结构等各方面基本趋同有关。

研究招募了专家级研究人员对三种情况下的49个想法进行盲评:专家撰写的想法、AI生成的想法,以及由人类专家对AI生成的想法重新排序后的想法,发现AI的想法比人类的想法明显更新颖一些。

有项研究(Can LLMs Generate Novel Research Ideas? A Large-Scale Human Study with 100+ NLP Researchers)测试LLM是否能提出真正新颖、达到专家水平的研究思路。他们设计了一个实验,来测试LLM模型提出研究想法的能力,并和真正的NLP领域专家进行比较。实验请了100多名NLP领域的研究人员来写新想法,并且让他们对研究人员和LLM产生的想法进行盲评。结果发现,机器提出的想法被认为比人类专家的更新颖,但在可行性上稍微差一些,还发现,这些模型在生成想法的多样性方面存在问题。

一般而言,人类研究者在做科学创新探索时,会经过长年专业学习,掌握专业背景知识,发现值得探索的研究问题,针对问题设想各种可能的解决方案,并通过评估程序,为不同的解决方案收集支持证据,得到最大证据支持的假设形成新的科学知识。那么机器能不能模仿人类来做这些事情呢?

AI科学家:从提出想法、写代码、做实验、写论文到论文评审,全流程LLM化

想象一下,假设我们有一个超级聪明的AI助手,它不仅能帮科学家出主意、写代码,还能自己做实验、分析结果,最后还能写出一篇完整的科学论文。“人工智能科学家”(The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery)的目的就是构建这么一个AI研究助理。这个“人工智能科学家”能自己想出新的研究点子,然后动手实现,最后还能自己写论文、自己对论文做评审。这就像是有个永不疲倦的科学家团队,不停地在那儿搞研究,发现新知识。这个系统目前可以用于不同的机器学习领域来发现新想法,比如研究扩散模型、改进语言模型,或者是研究模型学习动态变化规律。而且,完成每篇论文的成本很低,不到15美元。所谓“工欲善其事,必欲利其器”,AI方向的研究生其实可以考虑一下这思路,与其自己吭哧吭哧做各种事,倒不如在自己的研究领域先建立这么一个AI研究助理,效率会差很多。

利用AI来探索人类知识的边界,虽说目前技术还很不成熟,还比较初步,目前看只能说仅生长出了可行的萌芽,但从发展方向来看应是大势所趋。AI相比人类有很多优势,比如人类需要花费数十年时间来接受教育和积累知识,而AI可以在短时间内吸收和处理大量的领域知识。这种能力使得AI能够快速掌握现有的科学知识,并在此基础上进行进一步的探索。再比如AI可以整合不同学科的知识,发现不同领域之间的联系,这在人类科学家中可能较难实现,因为精力所限,人类专家往往只能专注于特定的领域。而且,AI可以24小时不眠不休地工作,而人类科学家需要休息和恢复精力,这意味着AI的探索效率会高得多。

麦克阿瑟曾引用《Old Soldiers Never Die》中的一段歌词:“ 老兵永不死,只会慢慢凋零 ”。人类的创新能力应是最独特、最让人之所以为人的重要依托因素之一,如果将来这件事被AI接管,不知未来多少人会兴奋多少人会感到悲哀。这里再引用麦克阿瑟的一段演讲,或能代表部分人的情绪:

“我的生命已近黄昏,暮色已经降临。我昔日的风采和荣誉已经消失。它们随着对昔日事业的憧憬,带着那余晖消失了。昔日的记忆奇妙而美好,浸透了眼泪和昨日微笑的安慰和抚爱。我尽力但徒然地倾听,渴望听到军号吹奏起床号的那微弱而迷人的旋律,以及远处战鼓急促敲击的动人节奏。我在梦幻中依稀又听到了大炮在轰鸣,又听到了滑膛枪在鸣放,又听到了战场上那陌生、哀愁的呻吟。然而,晚年的回忆经常将我带回到西点军校。我的耳旁回响着,反复回响着:责任,荣誉,国家。”

深度学习与NLP
专注深度学习、NLP相关技术、资讯,追求纯粹的技术,享受学习、分享的快乐。
 最新文章