李沐：“创业就是想逆天改命，想什么退路呢？”

科技 2024-08-15 00:50 上海

作者：李沐，BosonAI 联合创始人

原文标题：《AI 一年，人间三年》，首发于知乎。^[1]

给小伙伴汇报一下 LLM 创业第一年的进展、纠结和反思。

在Amazon呆到第五年的时候就想着创业了，但被疫情耽搁了。到第7年半的时候，觉得太痒了，就提了离职。现在想来，如果有什么事这一辈子总要试下的，就蹭早。因为真开始后会发现有太多新东西要学，总感叹为啥没能早点开始。

名字：BosonAI的来源

创业前做了一系列用Gluon命名的项目。在量子物理里，Gluon是把夸克绑在一起的一种玻色子，象征这个项目一开始是Amazon和Microsoft的联合项目。当时项目经理拍拍脑袋名字就出来了，但取名对程序员来说很困难，我们每天都在纠结各种文件名和变量名。最后新公司干脆就用玻色子（Boson）来命名了。希望大家能get到“Boson和费米子组成了世界”这个梗时会会心一笑。但没料到很多人会看成Boston。

“我来波士顿了，找个时间碰碰？” “哈？可我在湾区呀😅”

融资：签字前一天领投方跑路

22年年底的时候想到两个用大语言模型（LLM）做生产力工具的想法。碰巧遇到张一鸣，就向他请教。讨论之后他反问：为什么不做LLM本身呢？我的下意识退缩：我们之前在Amazon的团队做了好几年这个，得上万张卡，和blabla这么一大堆困难。一鸣呵呵表示：这些都是短期困难，眼光得看长远点。

我的优点是听劝，真就去做LLM了。凑齐了数据、预训练、后训练、和架构各方向负责人的创始团队，就去融资了。运气不错，很快拿到了种子投资。但钱还不够买卡，得去拿第二轮。这一轮领头是一家非常大的机构，做了几个月文档、商讨条款。但在签字前一天，领头说不投了，直接导致了跟投的几家退出。很感激剩下的投资方，还是做完了这一轮，拿到了做LLM的入场券。

今天反思的话，当时蹭着资本市场热情还在，其实可以继续融资，说不定也跟其他友商一样，现在十亿现金在手。当时担心融资太多，会不好退出，或者被架到天上去了。现在想来，创业就是想逆天改命，想什么退路呢？

机器：第一批吃螃蟹的人

有了钱后就去买GPU。问各个供应商，统一回复是H100交货得一年以后了。灵机一动，直接给老黄写邮件。老黄秒回说他来看下。一个小时后超微的CEO就打电话过来了。多付了些钱，插了个队，20天后拿到了机器。很荣幸早早的吃到了螃蟹。

螃蟹吃到怀疑人生，遇到了各种匪夷所思的bug。例如GPU供电不足导致不稳定，后来靠超微工程师修改bios代码打上补丁；例如光纤的切开角度不对，导致通讯不稳定；例如Nvidia的推荐网络布局不是最优，我们重新做一个方案，后来Nvidia自己也采用了这个方案。至今我都不理解，我们就买了不到一千张卡，算小买家吧。但我们遇到的这些问题，难道大买家没遇到吗，为啥需要我们的debug？

同时我们还租了同样多的H100，一样是各种bug，GPU每天都出问题，甚至怀疑是不是这个云上就我们一个吃螃蟹的。后来看到Llama 3的技术报告说他们改用H100后，训练一次模型被打断几百次，对字里行间的痛苦，很是共情。

如果对比自建和租卡的话，租三年成本和自建成本差不多。租卡的好处是省心。自建的好处有两个。一是三年后如果Nvidia技术还遥遥领先，那么它能控制价格使得GPU仍然保值😭。另一个是自建的数据存储成本低。存储需要跟GPU比较近，不管是大云还是小GPU云，存储价格都高。但一次模型训练可以用几TB空间存checkpoint，训练数据存储是10PB起跳。如果用AWS S3的话，10PB一年两百万。这钱用来自建的话，可以上100PB。

商业：感恩客户，第一年收支平衡

非常幸运的，我们第一年收入和支出是打平的。我们支出主要在人力和算力上，感谢OpenAI的财力和Nvidia的瑶瑶领先，这两项支出都挺大的😭。我们的收入来源是给大客户做定制的模型。很早就上LLM的公司大都是因为CEO非常有决策力，他们没被高昂的算力和人力成本吓到，果断的去推动内部团队配合尝试新技术。非常感恩客户给了我们喘气的时间，不然这个几个月我又是奔波在各个投资人那里。

接下来应该会有更多公司才尝试使用LLM，不论是自己产品的升级，还是降本增效。原因是一方面技术成本在降低，另一方面行业领先者（例如我们客户）会陆续放出基于LLM的产品出来，把行业卷了起来。

我们也在关注LLM在toC上的落地。上一波顶流例如c.ai和perplexity还在找商业模式，但也有小十来家LLM原生应用收入还不错。我们给一家做角色扮演的创业公司提供了模型，他们主打深度的玩家，打平了收入和支出，也是厉害的。模型能力还在进化，更多模态（语音、音乐、图片、视频）在融合，相信接下来还会有更有想象力的应用出现。

整体来说行业和资本还是急躁的。今年好几家成立一年多但融资上十亿的公司选择退出。从技术到产品就是一个很长的过程，花2、3年实属正常。算上用户的需求的涌现，可能得花更长时间。我们专注当下在迷雾中探路，对未来保持乐观。

技术：LLM认知的四个阶段

对LLM的认知经历了四个阶段。

第一阶段是Bert到GPT3，感受是新架构，大数据，这个可以搞。我们在Amazon的时候也是第一时间进去做了大规模的训练和在产品上的落地。

第二阶段是刚创业的时候GPT4了放出来，大受震撼。大半原因来自技术不公开了。根据小道消息估算一次模型训练一个亿，标数据成本几千万。很多投资人问我复现GPT4成本得多少，我说3-4亿要把。后来他们中一家真一把投了大几亿出去。

第三阶段是创业的第一个半年。我们做不动GPT4，那就想着从具体的问题出发吧。于是开始找客户，有游戏的、教育的、销售的、金融的、保险的。针对具体的需求去训练模型。一开始市面上没有好的开源模型，我们就从头训练，后来很多很好的模型出来了，降低了我们成本。然后针对业务场景设计评估方法，标数据，去看模型哪些地方不行，针对性提升。

23年年底时，惊喜发现我们的Photon（Boson的一种）系列模型在客户应用上的效果都打赢GPT4了。定制模型的好处是推理成本是调用API的1/10。虽然今天API已经便宜很多，但我们自己技术也同样在进步，仍然是1/10成本。另外，QPS，延时等都更好控制。这个阶段的认知是对于具体应用，我们是可以打赢市面最好模型的。

第四阶段是创业的第二个半年。虽然客户拿到了合同里要的模型，但还不是他们理想中的东西，因为GPT4还远不够。年初时发现针对单一应用训练，模型很难再次飞跃。回过头想，如果AGI是达到普通人类水平，客户要的是专业人士的水平。游戏要专业策划和专业演员、教育要金牌老师、销售要金牌销售、金融保险要高级分析师。这都是AGI加上行业专业能力。虽然当时我们内心对AGI充满敬畏，但感觉是避不开的。

年初我们设计了Higgs（上帝粒子，Boson的一种）系列模型。主打通用能力紧跟最好的模型，但在某个能力上突出。我们挑选的能力是角色扮演：扮演虚拟角色、扮演老师、扮演销售、扮演分析师等等。24年年中的时候迭代到第二代^[2]，在测试通用能力的Arena-Hard和AlpacaEval 2.0上，V2跟最好的模型打得有来有回，在测试知识的MMLU-Pro上也没差很远。

Higgs-V2是基于Llama3 base，然后做了完整的post-training。我们无法像Meta那样花大钱标注数据，所以V2比Llama3 Instruct好，原因应该还是主要来自算法的创新。

然后我们做了个评估角色扮演的评测集^[3]，包含按照人设扮演，和按照场景扮演。怪不好意思是自己的模型在自己的榜单上拿了第一。但模型训练中是没有碰评测用的数据。因为这个评测集一开始就是想自用，希望能真实反映模型能力，所以要避免模型overfit数据集。但做评测的同学想写技术报告，所以放出来了。有意思的是，按角色扮演的测试样本来自c.ai，但他们家的模型能力是垫底的。

第四阶段的认知是，好的垂直模型通用能力也不能弱，例如reasoning，instruction following这些能力垂直上也是需要的。长远来看，通用和垂直模型都得朝着AGI去。只是垂直模型可以稍微偏科一点，专业课高分，通用课还行，所以研发成本稍微低一点，研发方式也会不一样点。

那第五阶段认识呢？现在仍在进行中，希望能很快分享。

愿景：人类陪伴

说来惭愧，我们蒙头做技术，给客户做定制，然后再慢慢想我们自己追求什么愿景。我们去看客户想要什么、我们自己想要什么、未来可能需要什么。我自己的话，多年前我憧憬有个机器人保姆能帮我带娃、陪他们，因为干这个我觉得很难，而且也不太理解娃当前的认知和想法。我希望工作上有个非常厉害的虚拟助手能跟我一起发明新的东西。等我老了也想有很有意思的机器人陪着。我对于未来的预测是，生产工具越来越发达，一个人完成之前一个团队才能完成的事情，导致人类更加个体独立，大家都忙着追求自己的事情，从而更加孤独。

这些综合在一起，我们把愿景定成了“人类陪伴的智能体”。一个情商很高的，智商在线的智能体。算换成现实中的人的话，应该会是一个专业团队。例如你想让它陪你玩，那它是专业策划+演员。陪你运动，那么鼓励师+专业运动教练。陪你学习，那么能把你不懂的讲懂。模型的好处是，它能做长期的陪伴，真的了解你。而且可以“真心为你”。

不过目前技术离愿景还挺遥远。当下技术就能陪着聊聊。很多场景下聊得也不是那么好，内容匮乏，智商情商有时都不在线。都是当下要解决的问题。如果有小伙伴做这一块的海外应用，欢迎联系我们。

团队：有挑战的事情得靠团队

创业之后才真正觉得团队的重要性。在大厂的时候，觉得自己是个螺丝钉，团队成员是螺丝，甚至团队也是个螺丝钉。但创业团队就是一辆车。车小点，但能跑，能载重，转弯灵活，各个角落都能去。公司成立不久的时候，米哈游老蔡来看了眼，看见所有人在一间房子里，他感慨说小团队真好。

不方便的地方当然也是有的，时刻要看有没有油，不好走的路得小心别把车震散架了。每个成员都很重要，没有冗余，一个人不给力，就可能是一个轮胎没气。人也宝贵，走一个人就可能少一个轮胎。

以前我选项目会选自己能主导开发的。但这也意味着问题不是很有挑战性。创业选了个很大的问题去做，只能全靠团队了。别看本文里用了大量的“我”，其实工作都是团队做的。

没了团队，我可能得转行去卖课了。

个人追求：名还是利？

到目前为止我都靠跟着内心的声音做决定，工作后再去读博、去做视频、去创业。创业需要强烈动机的支撑，才能克服层出不穷的困难。这需要对自己的动机做更深入的分析。

动机要么来自欲望，要么来自恐惧。十年前我可能更热衷名利，但到了现在的年纪，觉得金钱的边际效用已经不高，名声带来的情绪价值也已经很小。我深层的动机来自对生命可能没有意义的恐惧。先不说宇宙的浩瀚，就是在人类的历史长河，一个人也只是一粒沙。意外的到来，迅速的消失。地球上生活过一千亿人，绝大部分人不会在历史上留下痕迹。我家家谱上那些人名，我几乎都不认识。

那么一个人的存在的意义是什么呢？小时候曾因为想不清这个问题而抑郁。所以潜意识里，我想去创造价值，获得存在的意义。我选择“上进”，去提升自己的创造价值的能力；选择录长视频和写教材，创造教育价值；选择去写读博、工作、创业的总结，描述里面的纠结和困难，创造事例的价值；选择去创业，团结很多人的力量去创造更大价值。

后记

去年跟宿华在斯坦福散步，他拍着我肩膀说：“跟我说句实话，你为什么想创业呀？”当时候不以为然：

“就是想换个事情做做”。

然后宿华笑了笑。

现在我懂了，因为他经历了创业酸甜苦辣。如果今天再来回答这个问题，我会说：

“我就是脑子抽了”。

但也庆幸当时没想到会那么不容易，所以一头扎进来了。否则，大家看到的可能是「工作十年反思」。我觉得今天我写的故事更有意思些。

「致敬所有创业人。」

最后广告下我司的招聘信息^[4](湾区 + 温哥华)，有做出海应用的小伙伴也请联系: api@boson.ai

参考资料

[1]

原文首发于知乎: https://zhuanlan.zhihu.com/p/714533901

[2]

24年年中的时候迭代到第二代: https://link.zhihu.com/?target=https%3A//boson.ai/higgs-v2

[3]

评估角色扮演的评测集: https://link.zhihu.com/?target=https%3A//boson.ai/rpbench-blog

[4]

招聘信息: https://jobs.lever.co/bosonai

十字路口Crossing

AI 正在给各行各业带来改变，我们在「十字路口」关注变革与机会，寻找、访谈和凝聚 AI 时代的「积极行动者」，和他们一起，探索和拥抱，新变化，新的可能性。「十字路口」是乔布斯形容苹果公司站在科技与人文的十字路口，伟大的产品往往诞生在这里。

最新文章

致AI创业者：2025年，去找这些VC拿融资｜与「暗涌」刘旌复盘一级市场这一年

Devin 对决 Cursor：500美元/月的AI编程工具真的值吗？

字节在跳动，阿里在躁动，AI六小龙被震动｜与「晚点」复盘大模型这一年的激战

「让我们快速到达下一个失败」：AI 时代的增长黑客修炼指南 | 对话王博龙

盘点2024年中国AI领域的创新：从模型到硬件，从应用到越来越多的超级个体

实践Global PMF，打造高效SEO与社媒营销增长体系｜Linkloud Workshop第三期招生

AI 在中国④: “我的面试官不是人？不是人！” | 对谈梁公军：海纳 AI 创始人

十字路口 x Abotify x a16z: 一起在北大斯坦福中心聊聊1000天后的AI世界 | 北京线下聚会

这绝对是你想不到的 2024 年 AI 领域 Top 10｜对谈「赛博禅心」主理人大聪明

找到 PMF 的两位创始人，为什么还在焦虑？| 对谈集思科技、Talk AI

“科技领域最被低估的壁垒是品牌” | 访谈Daniel Gross - 硅谷顶尖的创业者和VC

NotebookLM刷屏后，我们总结了10个用法并重新回答一个老问题：AI如何影响内容？

重回美元 VC，是 1949 年加入国军吗？|对谈孟醒：五源资本新合伙人

AI 设计师指南：我是谁，从哪来，到哪去？| 对谈 Pozzo 与赵晨

AI 在中国②：“10 亿规模的公司了，AI 帮我们收入再涨了 30%” | 暖哇科技与百药师的案例实践与启示

你要一起去日本吗？| Linkloud 先锋加速营第九期招募

在北京，一起聊聊 AI 如何看见爱恨情仇？

AI 在硅谷：热火朝天，沸沸腾腾 | 对谈硅谷徐老师和 Beta University 创始人云飞

在上海，看见硅谷 | 本周六的 toC AI App 聚会，来吗？

AI时代，硬件的现实与狂想｜和怒喵科技李楠聊硬件、营销、硅谷和改变人生的经历

从 Cursor 刷屏说起：为什么 AI Coding 是一个巨大的机遇？

AI工程师指南：我是谁，从哪来，到哪去？｜对谈硅基流动创始人袁进辉与独立开发者idoubi

Y Combinator S24 终于公布了！这次又投了哪些牛逼初创公司？

Runway AI 删除开源模型引关注 | ChatGPT 周活用户破 2 亿 | 阿里重磅开源多模态模型 Qwen2-VL

Midjourney进军硬件领域 | 谷歌推出首个AI游戏引擎 GameNGen

全球最快 AI 推理解决方案：狂飙英伟达 20 倍

爆苹果将推出桌面机器人和 AI 驱动的 iPhone

Meta AI 推出 Transfusion 新方法 | 腾讯游戏推出AI队友 | 日报

「AI把整个硅谷都改变了」｜和前500Startups中国负责人马睿聊SaaS AI 创业、硅谷投资

诗和远方的生活，怎么 AI 先过上了？

「六块腹肌」不是梦： AI 让你美梦成真

a16z发布全球 Top 100 AI 应用榜单，字节跳动大放异彩，约会应用和跨模态应用崛起

“为什么AI Super App还没出现?“ | 十点思考、一道曙光

泡茶、摊饼、咏春拳，AI机器人比我还会养老啊

英伟达也算立功了：助力《黑神话：悟空》

AI在中国：10个企业落地案例带来的商业启示 | 对谈任鑫：AI创业者、投资人

这个AI搜索引擎吸引 1.2 万付费用户，融了1100万美元

今天，我要邀请1万个年轻人用AI写遗嘱

AI产品经理指南：我是谁，从哪来，到哪去｜对谈字节AI产品负责人Vanessa，面试了100位AI产品经理后的心得总结

快手发布新 AI 产品「飞船」，能起飞吗？

李沐：“创业就是想逆天改命，想什么退路呢？”

“有了AI，我要让投资像刷抖音一样简单” | 对谈 RockFlow创始人Vakee

谷歌造了个会打乒乓的机器人，有点猛

第一批90后，已经开始用AI解决爱恨情仇的烦恼了

马斯克又要搞事情？挑战GPT-5的「Grok 2」蓄势待发

“公关稿已死，长播客当道” | 雷军和 Elon Musk的共同选择

Palantir：隐秘的数据分析巨头如何在GenAI时代成功

“就这样被你征服” | 400 万人，被 AI 骂到溃不成军、哭笑不得、却欲罢不能

“创业者最懂创业者”——在黄金时代的十字路口，相遇、交流和决策。

第一批机器人，已经在宝马工厂打工了

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉