李沐：大模型发展趋势与个人职业选择

科技 2024-08-25 10:01 上海

2024.8.23，李沐学长回交大讲座纪要。李沐学长在讲座中介绍了大语言模型的发展趋势，创业Boson.AI的心得体会，以及个人职业选择（PhD，打工 or 创业）

李沐学长在今天上海交通大学的讲座上，分享了过去两年在大语言模型训练、部署、产品化、和基础架构上的一些实际经验，对大语言模型未来趋势做一些预测，以及个人职业生涯选择上的一些建议；

大语言模型

与传统AI一样，LLM（大语言模型）的三大基础依然是：算力，数据，算法

从硬件上看，摩尔定律依然活着。带宽和存储的增长或许逼近极限，但更低bit数据格式带来了更大的通量和更快的速度。由于显卡规模的增大，水冷散热变得非常必要。由于大语言模型火热带来的高溢价，和老黄关系再好，也不得不加价买卡。新卡每年性能翻倍，但价格是原先的1.4倍。但长期看算力依然是越来越便宜。各种厂商AI加速卡很多，但大多只在推理阶段还算OK，nVIDIA依然垄断了大模型的训练阶段的算力，短期很难找到替代品。

长期看算力的持续贬值，大模型训练成本也会不断下降，所以大模型本身也不是一个能保值的东西，价值会随着时间降低，也某种意义上受摩尔定律的影响。

10-50T token的预训练数据规模已经接近极限（因为全人类的知识量有限，当前数据质量的提升比数量提升更重要）；由于硬件和数据瓶颈，大模型的激活参数在 500B 可能是极限，100-500B 的大模型会是未来主流的大小。

End-to-end和多模态是当前大模型的趋势。由于文本是信息密度最高的，也是最容易获得的。通过文本模型的泛化能力，用文本模态作为多个模态中介是一个很好的方案。

在人机交互产品设计方面，对于单一的简单操作，比如关窗户，用户更倾向于手动点一下按钮，可能会觉得和大模型交互不是那么有意义。而对于一些复杂的任务则并非如此，需要按一系列条件执行一系列任务，交给大模型则更为省事。但长文本的prompt控制也远不如直接说话方便，使用语音更符合用户习惯。

模型层面，语言模态已经比较成熟，能给个80-85分；语音(audio)则是勉强可用，70-80分水平，而视觉(video)则比较薄弱，大概只能给个50分。

应用层面，数据越多的领域，就越能被自动化。当前大模型在简单的文科任务上已经能很好地代替人类。因为文科任务是最能简单快速采集大量数据的。在简单理科任务和复杂文科任务上能力正在突破。而当前想要替代蓝领，还非常遥远。工厂需要投放大量传感器，做好数字化基础设施建设，数据收集和整理方案成熟起来，才有大模型落地的希望。而这一切当前看来还很难，但一旦实现就会是重大变革。

我们在创业中学到了什么？高质量数据和后训练算法的创新，对行业大模型的提升很大。OpenAI的RLHF有点牵强，（RL）这套技术很原始。Llama标数据据说花了5000w美金，和内部人士聊过，感觉数据没标好，算法也没花太多时间，所以开源的Llama还有很大提升空间。

对于不一样的数据，不一样的目标函数，针对性做研发是有意义的。

之前的机器学习范式：先做好Evaluation（评估），再去做其他事情。自然语言非常难评估，但是也非常关键。LLM本质还是ML（机器学习），都吃数据，都需要很好的评估方法，特点都是一致的。

自建GPU集群不会比租便宜很多，利润大头都被nv吃掉了。

职业规划建议

沐神兜兜转转，什么地方都去过，无论是学校，大公司还是创业。在交大6年读完本硕，CMU读了5年PhD，也还在港科有2年科研助理经历。也去过UCB和斯坦福做过访问学者。大厂在百度待过2年（首席架构师），在亚马逊待过7年（资深首席科学家）。加上两年的创业经历。（这些经历时间线上可能有重叠）

沐神总结了一下大厂打工人、PhD，创业的区别。大厂的目标是升职加薪，PhD的目标就是博士毕业，创业的目标就是套现退出；为了达成这些目标，作为大厂员工，就得去解决问题，对其公司目标；读博则是需要找到有价值的科研问题并解决；而创业是要为付费客户解决问题。而这三者需要的动力则是不一样的，而创业需要最强的动力。

作为打工人、PhD、创业者，有着不同的优缺点：

无论哪个选项，都面临着不同程度上的延迟满足：打工一般做出成果，很快便能升职加薪，PhD做出成果可能要延迟几年才能收获认可，而创业通常至少要5年以上才能得到正反馈。

创业是最艰难的，要面临长时间没有正反馈的生活，也要能一直保持着热情。

关于大厂工作、读博、创业，沐神都写过对应的文章，《工作五年反思》《博士这五年》《创业一年，人间三年》，这种定期总结的习惯，也是持续自我提升的一个不错的方法。

QA彩蛋，关于toB：

国内toB环境差，toB相比于美国而言更加难做，这已经是共识。但越艰难也意味着竞争对手会更少，不至于陷入低价值的内卷，早入场也许会更有机会。随着人力成本的不断增加，企业的付费意愿也会相应增加。交付超出用户预期的产品是企业获得竞争优势的关键。

后台回复关键词【进群】

加入大模型/CV/NLP/推荐/算法求职交流群

后台回复关键词【大模型】

获取100+篇『最新大模型』

代码+论文最全整理！

往期推荐

《黑神话·悟空》是用什么编程语言开发的？

黑神话悟空，电脑与 PS5 的画质差别有多大？

大模型微调到底有没有技术含量

大模型二次开发技术选型思路

我为什么不看好LLM——记过去一年实习经历有感

你好，我是对白，硕士毕业于清华，大厂算法工程师，拿过8家大厂算法岗SSP offer。

创业做过无人机、机器人和互联网+教育，保研清华后开始系统接触AI。

我每周至少更新一篇原创，分享AI算法、技术干货和职场感悟。上方关注可加我私信交流，点击蓝字查看我的算法学习之路。

期待你关注我的公众号，我们一起前行。

您的“点赞/在看/分享”是我坚持的最大动力！

坚持不易，卖萌打滚求鼓励 (ฅ>ω<*ฅ)

在看

对白的算法屋

清华大学硕士，大厂算法工程师。写过书，创过业，做过产品，分享技术、快乐、财富与职场。

最新文章

腾讯开源宇宙最强MoE大模型Hunyuan

LLaMA系列一直在假装开源...

姜萍造假实锤！阿里数赛出结果。。。

KAG开源了，知识增强掀翻RAG，性能翻倍

复现 OpenAI o1 的一小步：Steiner 开源模型解析

字节大模型搞推荐，有业务收益了

OpenAI-O1之下，我们技术该何去何从

VB-LoRA高效登顶！仅需0.4%参数量，极限超越LoRA！

万字长文梳理LLM+RLHF的脉络

Google DeepMind最新研究成果来了！模拟人类的思考

大模型算法岗，Kaggle金牌和CCF A一作哪个更有用？

OpenAI终于open了，开源多智能体框架Swarm~

谷歌科学家万字长文：《改变你职业生涯的一篇文章，我如何运用人工智能完成工作》

字节用大模型做推荐了！！

微调大模型前，重写SFT数据？

国产AI大模型登顶全球TOP 1！

现代LLM基本技术整理

红杉专访OpenAI O1团队全文记录

多模态大模型技术点总结

清华微软最新力作：用物理学革新Transformer注意力，精度暴涨30%！

诺尔贝物理学奖，为何授予Hinton？

和Boson李沐等大佬们进行了一场对话！

算法工程师修炼之路

30 天 52% 回报：GPT-4o 量化交易机器人

顶会卷到中学了！人大附中高中生入选NeurIPS

成人站 OnlyFans，42 名员工，创造 66 亿美元营收，超过所有 AI 公司

上交所P0故障

好好聊一聊做Pretrain的经验

山寨版 OpenAI o1 实验记录

突发！高通拟全盘收购 intel 。。。

OpenAI o1 self-play RL 技术路线推演

Qwen2.5感觉成了，热泪眼眶

大模型千卡训练-经验指北

聊一聊大模型六小虎生存现状

字节三面被问 RAG 原理了，要凉…

2024大模型面试八股（含100道答案）

2024年大模型Alignment偏好优化技术PPO,DPO, SimPO,KTO,Step-DPO, MCTS-DPO,SPO

浅谈Role Play：从当红炸子鸡到无人问津

关于 GPT5 训练失败的思考

Yann LeCun：建议学生不要在大模型方向工作？

2024大模型秋招面试被锤大赏！

大模型是一场泡沫？

入坑大模型18个月的反思与贩私

这段时间搞大模型的血和泪

大模型SFT的局限性

天呐! AI 之王 GPT-6 猎户座来了！

大模型的基本功

李沐：大模型发展趋势与个人职业选择

《黑神话·悟空》是用什么编程语言开发的？

黑神话悟空，电脑与 PS5 的画质差别有多大？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉