LLM，一艘方向不对但积重难返的华丽游轮...

文摘 2024-12-16 13:08 江苏

点击下方卡片，关注“自动驾驶之星”

这里有一群奋斗在自动驾驶量产第一线的小伙伴等你加入Introduction

下班回到家，给娃完成了一条龙服务之后，在这个周五的夜晚（拖拖拉拉已经到了周六），终于有时间来回味一下今天下午听的一场学术会议——由上海 AI Lab 组织的浦江AI学术年会。由于会场离公司很近，所以很方便就能参加，难得的机会让自己 think something else.

今天我报名去听的专题论坛叫做“非共识性研究与创新”，这个名字一下子就抓住了我。隔壁的“具身智能”和“AI4Science”论坛被挤得水泄不通，而这里则冷冷清清，中场过来都有座位，我就知道我来对了，这才叫非共识嘛！听完会议之后，脑子里涌现出一些略显悲观的想法，决定记录一下。

SH AI Lab 的付杰老师上来就直言他不觉得现在LLM的路子是对的，现在这样搞出来的LLM根本不懂它为什么能输出某些答案，本质上可能还是靠记忆；交大的何哲陟老师谈论了当代大模型训练系统的计算效率跟人脑巨大差距，来说明目前的训练方式的不科学性，并介绍了一些脑启发式计算方法；上财的滕佳烨老师则利用经济学中的菲利普斯曲线理论在当代的失效，来提醒我们对大模型scaling law等理论进行研究应该避免修正主义；人大的胡迪老师则讨论了他们组对多模态训练中不平衡问题的思考和解决思路，告诉我们在一味堆数据和算力的同时不要忘了仔细审视数据的质量和利用......这些研究许多都挺有趣的，感兴趣的读者可以直接搜他们的学术主页。

(交大何老师的slides，人脑的功率只有20W，但算力比肩万卡集群)

但这不是我想在这里想聊的点，更让我产生思考的，是后续圆桌讨论环节。讨论的一个重要主题就是——自回归模型和scaling law，就是目前的版本答案吗？目前这种LLM的路径，就是通往AGI的正确姿势吗？

其实，我觉得这个问题，放在“非共识性研究与创新”这个论坛里，就是废话，答案是：当然不是。各位大佬分别表达了自己的看法，例如清华的崔鹏老师质疑LLM是否真能理解“数”，因为LLM本质就是一个基于embedding的semantic空间，一个semantic空间主要的作用就是相似性，而数字很难用相似性表达；北大的陈宝权老师提到大模型的学习跟人类学习过程的显著差异；还有老师继续从脑科学的角度来论证目前LLM设计的问题，等等等等....

听到这里，这些大佬们你一言我一语的讨论渐渐地变成了背景白噪音，我陷入了沉思。他们提到的脑启发式设计、人类思考的快与慢两个系统、MoE方法等等，虽然现在学术界讨论得火热，但都是很久很久的课题，都是AI的古早问题了，科学家们早就想尽可能地借鉴人脑神经元的设计来设计神经网络了、最早的MoE思想在1991年就已经被提出了，为什么直到今天，我们依然需要用这些东西拿来做证据，来证明现在大行其道的LLM方法，不是真正通往AGI的方法？难道做LLM的人真的不知道吗？

大家是知道的，也许会有很多外行人随波逐流涌入，但是真正一线做LLM的人必然是知道这条路是不可持续的。更优的技术一直都存在，所以这根本不是哪个技术路线更优的问题，我觉得学术界一直在回避一个残酷而无奈的事实——这些技术路线其实就是被商业驱动并主导的。

GPT3在19年就出来了，它已经足够强大，给一个好的prompt，它就可以完成很多zero-shot任务，但由于它是闭源模型，只有少数人可以研究和体验它，出不了圈；Google在22年就推出了参数量达540B的PaLM，但同样这种模型根本不是普通人/机构能接触的，因此那个时期虽然有大厂在军备竞赛式地推出大模型，但依然给人一种“圈地自萌”的感觉，在NLP学术界根本不是主流，甚至业界的一个共识是要把大模型做小，做到普通企业都能使用。

一切的一切是在什么时候改变的呢？那就是OpenAI发现InstructGPT有巨大的商业化潜力，然后从商业产品的角度对InstructGPT进行了小小迭代，推出了ChatGPT，一下子就击中了人们的心巴。后面的故事我们都知道了，ChatGPT成为了一个史诗级商业化产品，让GPT、decoder、自回归这条路线一夜间变成了正统，几乎所有人都开始沿着这条路子来做大模型，导致今天人们以为只有decoder才能做出这样的事。

但RNN就不能吗，其实也能，RWKV就是例子，但由于没有先发优势，即使从模型角度RWKV可能比GPT更优秀，但100个人都研究GPT怎么着取得的效果也会比你一个人研究RWKV更好，而伴随着滚雪球效应，GPT的先发优势只会越来越明显，然后吸引越来越多的资金和智力投入其中，其他的竞争路线由于机会成本不断加剧，就算理论上能证明比GPT更好，也得不到太多关注，渐渐淹没在主流的浪潮中，只有当主流方案的弊端偶现之时，才有机会露个头。然而，即使GPT的问题在时不时显现，但由于所谓的scaling law的存在，我们的数据依然没有穷尽、算力还在进步，通过堆数据堆算力、打一点补丁、改一改prompt、搞一搞post training，就能把一些弊端暂时掩盖。大家都知道是治标不治本，但是尝试更加根本的解决方案——换模型架构、换底层的训练方式，明显成本太大，因此即使一大堆的论文不断指出长远来看更好的方案，但成本因素、商业利益因素让他们不得不选择“贪心算法”，只选择短期内最优的方案，而这个最优甚至也不是指模型的最优，而是与人相关的最优——能否拉到投资、能否快速吸引更多用户、能否博得更大流量、能否为自己和家庭获得更高收入...

所以下一代的技术路线在哪里？更优的技术是什么？GPT、Transformer的继承者是谁？这些问题，与其从学术角度去思考，不如从商业角度去思考——我们人类到底喜欢什么？ 也许每一个研究机构、课题组，都应该配备一个产品经理，从用户的角度去思考我们需要怎样的产品，然后来反推它背后的技术路线。

不过说起来容易，每一个学者一定都非常希望自己的研究可以落地、可以真正为人类带来价值、变成为大众所用的产品，但真正成功的寥寥无几。ChatBot从来不是新鲜事物，微软小冰、Siri都是很多年就存在的产品，大模型也不是新鲜事物，在ChatGPT出来之前Google无论在硬件还是软件层面都是大模型的统治者，那么ChatGPT是如何产生的？OpenAI他们是如何做出这样一个爆品呢？

虽然大家一直都在喷OpenAI不Open，但这里我不得不为其说一句公道话，OpenAI最open的一点，就是open the window. 学术圈说它不open，主要是说它没有把窗户里的东西掏出来给大家，但单纯打开窗户，让老百姓都来看看他们家都有啥，已经足够重要。它努力把一个科研领域的成果，用商业产品的方式open给大家体验，让大多数人真正意识到目前技术能达到的水平，甚至许许多多的研究人员也是从OpenAI开放ChatGPT的使用之后，才真正开了眼。初期的ChatGPT依旧有各种各样的问题，但是由于开放给了大众，一个不需要说明书的、没有任何玩法定义的大玩具，人民群众的无限脑洞就会自然而然地赋予其无限的活力，这个过程会迅速反哺OpenAI下一步的研究，从而让ChatGPT一两年内迅速迭代，让人们有机会探索更多的玩法，形成一个正面循环。目前的LLM公司，无一不是想走进这样的循环，因为只有这样的循环里才有可能盈利。这就是商业故事的魅力，真正能发扬光大的技术，一定是被人民所喜爱的技术，而不是研究人员自认为好的技术，OpenAI首次把LLM包装成零门槛的接口交给人民，用人类集体的智慧去发掘探索它的价值，而正好LLM在那个时点已经积累了足够的潜力让人们去挖掘，二者一拍即合，促成了今日LLM的局面。

至于说今日LLM的发展是否是一条正确的路子，只能说技术路线一定不是最优的，但目前依然有利可图、人们对此依然有足够的新鲜感和玩法探索空间，人类的贪婪和好奇心决定了我们一定会穷尽所有的数据、所有的算力，而不顾成本地去把LLM干到顶，这是一艘华丽的游轮，但却积重难返无法调头，直至搁浅。虽然我们内心99%地犯嘀咕这个天花板其实很低，但依然对scaling law抱有1%的幻想希望能看到奇迹，这个幻想引诱着资金持续投入，资金的持续投入吸引着大部分研究者投入其中，直到有一天人们把LLM玩够了，当人们终于意识到LLM帮我们写的报告、代码其实根本没有价值的时候，那就是LLM的终点。

(Ilya指出Data快不够了。盗图自袁进辉老师朋友圈)

想到这里，内心涌起一丝虚无主义的悲观，台上的讨论让我觉得即使这些学术大佬在商业化进程里面也非常无力，虽然他们的研究都非常有价值，但是依然无法改变这个会场的冷冷清清。

但同时，这些非共识的研究学者们，又是令人尊敬的，因为他们保留了多样性的火种，为下一次的技术迭代积累宝贵的可能性。

“What magical trick makes us intelligent? The trick is that there is no trick. The power of intelligence stems from our vast diversity, not from any single, perfect principle.”

—— Marvin Minsky

The Society of Mind（1987）

知识星球，新人优惠券来袭，结识一群志同道合的小伙伴一起成长。

下一个风口会不会是生成式AI 与具身智能的时代，我们特意创建了生成式AI与具身智能交流社区，关于大模型，机器人的相关业界动态，学术方向，技术解读等等都会在社区与大家交流，欢迎感兴趣的同学加入我们(备注具身智能)！

自动驾驶之星知识星球主打自动驾驶量产全技术栈学习，并包括: 学习板块，求职面试，有问必答，论文速递，行业动态五大板块！星球内部包括端到端大模型，VLM大模型，BEV 障碍物/车道线/Occ 等的学习资料！

生成式AI与具身智能知识星球，我们相信生成式AI 与具身智能会碰撞出出乎我们意料的内容，本知识形象并包括: 学习板块，求职面试，有问必答，论文速递，行业动态五大板块！星球内部包括生成式AI大模型，具身智能，业界资料整理等的学习资料！

自动驾驶之星是面向自动驾驶&智能座舱量产向相关的交流社区，欢迎大家添加小助手加入我们的交流群里，这里有一批奋斗在量产第一线的小伙伴等你的加入！

👇点个“赞”和“在看”吧

自动驾驶之星

自动驾驶之星，是一个以自动驾驶\x26amp;智能座舱量产交流为主的社区。这里有自动驾驶\x26amp;智能座舱量产第一线的前沿动态，有一群奋斗在自动驾驶\x26amp;智能座舱量产第一线的小伙伴在分享他们的量产经历。期待你的加入！希望每个人在这个浪潮中都能成为自动驾驶之星！

最新文章

大模型月度回顾 · 2024年12月

Robo周报：比亚迪、理想、广汽等推进机器人研发/ 传禾赛裁员数百人/英伟达将推全新机器人芯片...

3D视觉理解GPT4Scene：通过视觉-语言模型从视频中理解3D场景

北航/新加坡国立大学/华中科技提出自动驾驶视觉语言模型的视觉对抗攻击！

腾讯微信团队 & 上交通 & 南大揭秘模型汤，构建与优化，视觉-语言模型的强基准与有效改进策略研究！

端到端智驾半壁江山都来了！2025首场自动驾驶峰会全部嘉宾揭晓，还将拆解世界模型与VLM

博世XC中国高管离职，增加自研力量

CVPR & AAAI | AI创新的交汇点：扩散模型与卷积网络的碰撞效应

VisionPAD:一种以视觉为中心的自动驾驶预训练范式！

告别2024，迎来2025，你准备好了吗！

北大/加州大学提出 OpenAD: 3D物体检测的开放世界自主驾驶基准！

如何高效的将智驾AI大模型软件模块部署到SOC芯片上？

锚定智能汽车赛道，企业如何“破卷”？来ICV CHINA 2025上海智能汽车科技展，抢占市场先机

HSl-Drive v2.0: 更多数据用于自动驾驶场景理解的新挑战 !

AAAI'25 | EGSRAL：3DGS渲染器如何生成带有自动标注的全新视角图像？

具身智能干货最多的社区推荐---入门必看！

「少数派」小马智行：不神化端到端，也不吹商业化

面试题: 大模型中的tokenize方法有哪些？

Robo Weekly：小米汽车接入VLM、Waymo将入日本测试，小鹏公布机器人专利...

武大/中科院/悉尼科技大学/牛津大学/西交大共同提出 DriveMLLM : 自主驾驶中多模态大语言模型的空间理解基准！

自动驾驶与具身智能依然在不断崛起！

面试题：计算softmax为什么要除以根号d?

自动驾驶与具身智能依然在不断崛起！

和量产相关的自动驾驶论文不得不看！

transformer手绘图解（注意力机制的本质）

DriveGPT实现Waymo最佳预测: 扩展自回归行为模型在自动驾驶中规划与预测

NeurIPS & CVPR | 从像素到路径：扩散模型引领自动驾驶新风向

弥补2D拖拽缺陷！南大&蚂蚁等重磅开源LeviTor：首次引入3D目标轨迹控制，效果惊艳

有关对汽车行业想法的记录

Alec Radford：最强本科生，如何成长为OpenAI资深研究员

NeurIPS与AAAI焦点：扩散模型与文本生成的强强联手

12个真实世界机器人任务成功率超OpenVLA 24.17% | EMMA-X：7B具身多模态动作模型

NIPS 2024 最佳论文 VAR 深度解读：下一尺度预测为何能超越扩散模型？

腾讯混元3D-1.0:文本到3D和图像到3D的统一框架！

端到端自动驾驶终极态---VLAM范式路测效果来袭！

新加坡国立大学/清华大学提出 LaVida Drive:用于自动驾驶的视觉-文本交互VLM，具有令牌选择、恢复和增强功能！

面试题: Transformer中为什么要用多个头？

李沐：大模型发展趋势与个人职业选择

无人驾驶公司AutoX新战略

专家对话摘要：「一段式端到端」还不现实

一个智驾行业从业者的思考

某主机厂智驾自研的波澜

论文速览 | Diffusion Forcing：给视频扩散模型的每一帧添加不同强度的噪声

LLM，一艘方向不对但积重难返的华丽游轮...

长城汽车如何应对端到端的下限问题？

用于自动驾驶最优间距选择和速度规划的多配置二次规划（MPQP）

自动驾驶之心举办了一个自动驾驶论坛，邀请各位大佬现场聊聊

Bosch 研究院提出 MTA: 用于BEV感知和描述的多模式任务对齐！

一文读懂：从RAG到多模态RAG

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉