张俊林：AI 能不能做出真正意义的创新？

科技 2024-11-05 08:03 北京

作者：张俊林
原文：https://www.zhihu.com/question/814165911/answer/4771718866

AI的创新能力已获诺贝尔奖认证，诺贝尔理科奖项代表了科学领域重大的突破或创新，虽然今年的诺贝尔物理奖给了Hinton老先生这事情略显抽象（不过我很喜欢Hinton获奖感言里的这句话：“我非常幸运，有很多非常聪明的学生，他们比我优秀得多。他们后来都做了伟大的事情。我特别为我的一个学生解雇了Sam Altman而感到自豪。”），但诺贝尔化学奖给了AI解析与预测蛋白质结构，这实至名归且早有迹象，作为诺奖风向标的“拉斯克奖“在2023年将拉斯克基础医学研究奖授予了谷歌DeepMind的Demis Hassabis博士和John Jumper博士，以表彰他们发明了能够预测蛋白质三维结构的革命性技术AlphaFold。关于AI和创新的关系，这就很说明问题了。

创新的核心在于提出新的想法或概念，这些想法或概念必须同时拥有“创新三性”（From:The Creative Mind: Myths and Mechanisms.）：首先是新颖性（New）：创新的想法必须是前所未有的，是一个全新的概念或者方法，而不是对现有知识的简单重复。其次是出人意料性（Surprising）：创新的想法往往出乎人们的意料之外，它打破了常规思维，挑战现有的假设和信念。第三是有用性（Valuable）：创新不仅要新颖和出人意料，还必须具有实际的价值。这意味着它应该能够解决现有问题，提高效率，或以某种方式为社会或个人带来益处。

LLM是否具备创新能力？目前也有一些专门的实证性研究，如果归纳下研究结论，应该是LLM目前在某些学科（计算机算法、生物学等）具备真正意义上的创新性，但面临提出的创新思路趋同、多样性不足的问题。之所以趋同，应与目前各种不同的大模型在训练数据分布、模型结构等各方面基本趋同有关。

null — 研究招募了专家级研究人员对三种情况下的49个想法进行盲评：专家撰写的想法、AI生成的想法，以及由人类专家对AI生成的想法重新排序后的想法,发现AI的想法比人类的想法明显更新颖一些。

有项研究（Can LLMs Generate Novel Research Ideas? A Large-Scale Human Study with 100+ NLP Researchers）测试LLM是否能提出真正新颖、达到专家水平的研究思路。他们设计了一个实验，来测试LLM模型提出研究想法的能力，并和真正的NLP领域专家进行比较。实验请了100多名NLP领域的研究人员来写新想法，并且让他们对研究人员和LLM产生的想法进行盲评。结果发现，机器提出的想法被认为比人类专家的更新颖，但在可行性上稍微差一些，还发现，这些模型在生成想法的多样性方面存在问题。

一般而言，人类研究者在做科学创新探索时，会经过长年专业学习，掌握专业背景知识，发现值得探索的研究问题，针对问题设想各种可能的解决方案，并通过评估程序，为不同的解决方案收集支持证据，得到最大证据支持的假设形成新的科学知识。那么机器能不能模仿人类来做这些事情呢？

想象一下，假设我们有一个超级聪明的AI助手，它不仅能帮科学家出主意、写代码，还能自己做实验、分析结果，最后还能写出一篇完整的科学论文。“人工智能科学家”（The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery）的目的就是构建这么一个AI研究助理。这个“人工智能科学家”能自己想出新的研究点子，然后动手实现，最后还能自己写论文、自己对论文做评审。这就像是有个永不疲倦的科学家团队，不停地在那儿搞研究，发现新知识。这个系统目前可以用于不同的机器学习领域来发现新想法，比如研究扩散模型、改进语言模型，或者是研究模型学习动态变化规律。而且，完成每篇论文的成本很低，不到15美元。所谓“工欲善其事，必欲利其器”，AI方向的研究生其实可以考虑一下这思路，与其自己吭哧吭哧做各种事，倒不如在自己的研究领域先建立这么一个AI研究助理，效率会差很多。

利用AI来探索人类知识的边界，虽说目前技术还很不成熟，还比较初步，目前看只能说仅生长出了可行的萌芽，但从发展方向来看应是大势所趋。AI相比人类有很多优势，比如人类需要花费数十年时间来接受教育和积累知识，而AI可以在短时间内吸收和处理大量的领域知识。这种能力使得AI能够快速掌握现有的科学知识，并在此基础上进行进一步的探索。再比如AI可以整合不同学科的知识，发现不同领域之间的联系，这在人类科学家中可能较难实现，因为精力所限，人类专家往往只能专注于特定的领域。而且，AI可以24小时不眠不休地工作，而人类科学家需要休息和恢复精力，这意味着AI的探索效率会高得多。

麦克阿瑟曾引用《Old Soldiers Never Die》中的一段歌词：“ 老兵永不死，只会慢慢凋零 ”。人类的创新能力应是最独特、最让人之所以为人的重要依托因素之一，如果将来这件事被AI接管，不知未来多少人会兴奋多少人会感到悲哀。这里再引用麦克阿瑟的一段演讲，或能代表部分人的情绪：

“我的生命已近黄昏，暮色已经降临。我昔日的风采和荣誉已经消失。它们随着对昔日事业的憧憬，带着那余晖消失了。昔日的记忆奇妙而美好，浸透了眼泪和昨日微笑的安慰和抚爱。我尽力但徒然地倾听，渴望听到军号吹奏起床号的那微弱而迷人的旋律，以及远处战鼓急促敲击的动人节奏。我在梦幻中依稀又听到了大炮在轰鸣，又听到了滑膛枪在鸣放，又听到了战场上那陌生、哀愁的呻吟。然而，晚年的回忆经常将我带回到西点军校。我的耳旁回响着，反复回响着：责任，荣誉，国家。”

http://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247549826&idx=5&sn=0a072db11f7a4452a823d233849ed2b2

深度学习与NLP

专注深度学习、NLP相关技术、资讯，追求纯粹的技术，享受学习、分享的快乐。

最新文章

教育部公布！25考研人数，再降50万！

大模型代肝，自动刷《崩铁》升级材料，Claude操纵计算机还能这么用！

一篇小型语言模型技术最新全面综述

M3DocRAG：文档问答用哪个多模态大模型效果最好？

已公示！“东方理工大学”，来了

聊一聊做角色扮演大模型的经验

绝对顶流！清华博导倾力编写的《图神经网络导论》pdf免费分享

最高9.0分！这16篇最高分ICLR2025论文必看！从生成模型到MOE等

ICLR 高分：深入研究多模态大模型的对齐策略

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

双非二战字节算法岗，拿下70k offer.....

猫猫运动方程，首次被物理学家破解！ |《美国物理学杂志》正经研究

o1的风又吹到多模态，直接吹翻了GPT-4o-mini

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

微调图像大模型的经验分享

昨夜， LLM 已经彻底凉凉了...

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

微软开源角色Agents，直接模拟了整个世界~

2024最新神书-《大模型应用程序构建指南》免费pdf分享

2024最新,李宏毅深度学习教程pdf免费分享！绝对值得反复阅读的神书！

已注销！985新校区，不建了

RAG黑盒被打开了，可视化RAGViz闪亮全场

LLM性能优化中的一些概念扫盲

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

Cursor一不小心把自家的底牌也放出来了~

[送5本]《动手学机器学习》上海交大ACM班总教头团队重磅新作，带你动手学机器学习！

传说中Ilya Sutskever精选论文清单：AI领域40大论文完整版「破解」完成

神书《从零构建大模型》分享，尚未发布，GitHub标星22k！！

LLM性能优化中的一些概念扫盲

暴跌94%，裁员9600人。。。

[送5本]《大语言模型：原理、应用与优化》大模型未来发展方向大揭秘！

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文，明年顶会落户苏州

DRL2022新书-《深度强化学习》免费pdf分享

陶哲轩：计算机通用方法，往往比深奥的纯数学更能解决问题

中央批准：中央候补委员、教育部副部长，任C9大学书记

谷歌2024博士奖学金公布，KAN作者刘子鸣等数十位年轻华人学者入选

上交2024最新-《动手学大模型》实战教程及ppt分享！

考古OpenAI RLHF基石之作：探索RL和RM阶段的Scaling Law

【完整视频】黄仁勋对话软银孙正义：打造AI代理和物理AI，强调企业必须在AI浪潮中找准定位

2024最新版，人大赵鑫老师《大语言模型》新书pdf分享

上交2024最新-《动手学大模型》实战教程及ppt分享！

饶毅：全世界没有一个学校把博士后纳入“非升即走”

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

李飞飞等14位斯坦福微软大牛等撰写《AGENT AI: 综述多模态交互的前沿展望》免费pdf分享

一篇综述告诉你：如何用大语言模型设计算法

SFT洗数据，有多少细节？

LSTM+Transformer王炸创新，荣登Nature...

突发！三星7nm停供！

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉