「十字路口」年终盘点系列终于来到了 AI 领域最受关注的大模型。
就在我们规划怎么总结 2024 年大模型公司发展的时候,《晚点》发布了一篇题为《中国大模型生存战:巨头围剿,创业难熬》的文章,总结了 2024 年被称为 AI 六小龙的六家企业从一开始受到追捧和关注,到字节发力大模型,阿里积极资本布局以及本身拥有 Qwen 大模型,加上六小龙各自不同的发展策略和人员变动,局面变成了以六小龙为代表的头部 AI 创业公司 v.s. 大公司的竞争。
这篇文章引起了广泛的关注,发布当天在朋友圈、即刻都引起了刷屏。到我们准备上线这期播客的时候,原文阅读量接近 7 万。在我们看来,这篇文章对了解 2024 年中国大模型企业的发展做了详细的注解和分析,所以本周我们邀请了这篇文章的编辑,《晚点》副主编程曼祺[1],一起以文章为主线,聊聊《晚点》在写这篇文章时候的观察,以及继续补充对大模型企业的「前排感受」。
此外,就在我们准备这期内容的时候,阿里的开源模型 Qwen 发布了新的推理模型,Qwen 和另一家中国公司做的大模型 DeepSeek 被外媒评价为 o1 的对标者。我们也在节目中补充了一些关于 Qwen 和 DeepSeek 的信息。
本期播客也是「十字路口」和「晚点聊 LateTalk[2]」的串台,内容也同样发布在「晚点聊 LateTalk」。
微信收听播客:
小宇宙收听播客:
中国大模型生存战:创业难熬还是机遇并存?
🚥 Koji
开始之前,先请曼祺为还没看过这篇文章的朋友们介绍一下文章的主要内容。
👩🏻 程曼祺
各位十字路口的听友大家好。由于之前我在播客中更多是提问的角色,今天可能会多分享一些想法。如有不准确之处,欢迎大家在评论区补充,让我们能形成更完整的讨论。
Koji 提到的这个观察很有意思,因为字节的英文名就是 ByteDance,本身就有「跳舞」的含义。「大象在跳舞」这个比喻来自文章中一位投资人的总结,也很感谢他的这个观察。文章的主题正如标题所说:创业煎熬,巨头围剿。
思考这篇文章后,我认为一个核心的变化是:
从去年到今年这短短时间里,创业公司曾经引以为傲的「组织灵活」「技术团队更强」等优势,在字节的猛力追赶下似乎变得不那么明显了。
字节崛起的速度非常快,这个现象的根源在于技术进化的速度和方向。
目前市场对大模型创业的看法分歧很大。一部分人依然看好,另一部分人则从之前的乐观转向悲观。这个分歧的根源也在于对技术进化速度的判断。这是我们后续讨论可以展开的一个重要框架。
如果技术进化更快,前瞻性的技术判断就变得尤为重要,这可能正是创业公司的优势所在。因为某些技术洞见往往掌握在少数人手中,一些创业公司可能因为某个关键人物的存在而更早看到技术变革。即使中国公司不是全球第一,能更快跟进也是一种优势。
Information 昨天有一篇报道讲到字节的大模型,提到他们内部训练大模型遇到一些困难,还专门派团队去新加坡调查为什么在数学和推理能力上进展不够顺利。相比之下,像月之暗面 和 DeepSeek 这样较小的团队,在推理能力提升上似乎进展更快。OpenAI 在 9 月发布 o1 方向后,短短两个月内,月之暗面就发布了数学模型 k0-math,DeepSeek 也发布了 r1-lite,都强调在数学和推理上有更好的能力。
在「大模型生存之战」这篇文章发布的同一天,我们也发布了一条独家消息:华为诺亚方舟实验室此前有一位研究员加入了月之暗面,专门负责 o1 方向的探索。虽然字节也想挖这个人,但他最终选择了创业公司。此外,我们早前得到消息,今年初杨植麟在内部会议上提到月之暗面今年的技术目标之一是实现多阶段推理。虽然我不确定他当时说的「多阶段推理」是否就是现在的 o1 方向,但从字面意思看有些相似。因为 o1 通过思维链的方式,能更像人类那样一步步思考,可能给出更完整或更深度的结果。他们是否更早看到了这个方向,这个我不太确定。
🚥 Koji
刚才曼祺提到,如果技术进化仍然非常快,创业公司可能更有优势。因为靠少数天才型选手,很可能就能迅速做出突破,拉开差距。
在 OpenAI 发布 o1 之后,我注意到国内有个团队 Monica[3] 发布了自己的技术 Steiner-preview[4]。他们团队有位小天才季逸超,如果大家了解的话,应该知道他是在读高中时就做出了在全球市场都很有影响力的猛犸浏览器。这个 Steiner-preview 也是季逸超的作品,现在在 Monica 里面也可以用到这个推理模型,这是他们自己内部开发的能力。
看到这样的突破时我确实很惊讶。如果这样的突破仍在不断发生,小团队和小公司确实有可能抓住这样的机会。
👩🏻 程曼祺
你说得对,季逸超确实是个小天才,17 岁就做出了猛犸浏览器,很早就开始创业了。
回到刚才的话题,如果技术进化更快,我认为会带来两个重要影响:
第一,创业公司在技术判断上可能会有优势。 第二,「模型+应用」一体化的模式会变得更有价值。
这是去年到今年很多大模型公司都在强调的方向。因为模型能力进化更快,在产品体验上的反应也会更快。如果同时掌握这两个环节,理论上能更快地进行系统协调和优化。
但如果发展朝另一个方向,也就是模型能力增长放缓,可能会出现三个情况:
仅凭模型本身带来的体验差异会变得不明显。作为用户,我们现在就能感受到这一点——豆包、Kimi、通义之间的体验差异并不那么显著。在这种情况下,产品能力就变得更加重要。这恰恰是大厂的优势所在,因为他们已经积累了产品研发的基础设施,更重要的是有流量和渠道。我们的文章也提到,字节的投流效率可能比大多数创业公司都要高,而且抖音从今年 4 月开始已不再接受字节之外的 AI 产品投放。
那些估值最高、融资最多的大模型公司可能会面临来自「轻量级」公司的竞争。这些公司可能只专注做应用,背后调用全球最好的模型 API,或者简单改造开源模型。这些公司在产品层面会形成竞争,而且他们的估值和包袱都小得多。
如果进化速度放缓,显然不利于融资。投资人愿意投资估值很高的大模型公司,很大程度上是看中其拥有最核心的技术团队和最优秀的人才,期待他们在技术竞赛中获得领先。如果这个预期出现疑问,融资自然就会遇到问题。
🚥 Koji
其实说到模应一体,中国有一个神奇的公司叫 DeepSeek[5]。他们不但不做应用,甚至公开表示现阶段都不考虑商业化,不去思考商业模式。
因为他们认为,在当下应该把公司所有和大模型相关的人力、精力、物力、资金全部投入到技术探索中。他们认为任何分散对技术探索的因素,无论是做应用还是探索商业模式、考虑早期盈利,都会稀释和分散精力。
我觉得他们真是一股与所有人都不同的神奇力量。
👩🏻 程曼祺
你说到这个,我想到今年 6 月我们和杨植麟聊天时,他也表达了类似的想法。他说最大的精力要放在技术探索和智能提升上,要去追求智能的极限。
但另一方面,DeepSeek 很特别,可以说他们在资源上也很强大。因为他们自己就是金主——其背后的幻方公司本身做量化交易,收益应该相当可观。
🚥 Ronghui
说到大模型,除了被称为「六小龙」或「六小虎」的公司,还有通义和 DeepSeek。通义是阿里的产品,而 DeepSeek 真的是一家很神奇的公司。我看了一些关于 DeepSeek 的报道,发现他们的创始人在 2023 年就说出了一些颇具预见性的话。
有个说法(虽然他们没有正面回应和证实),当时 2023 年国内拥有超过 1 万枚 GPU 的企业不超过五家。除了几家头部大厂,还有一家叫幻方的量化基金公司。这家公司拥有 1 万枚英伟达 A100 芯片,创始人是梁文峰。
他当时就对媒体表示,最晚明年大厂和创业公司都会推出自己的大语言模型。他还明确表态:不做垂类,不做应用,就专注做研究和探索。最近他们因为被 TechCrunch 报道,在国际上获得了很好的评价。
开源与闭源之争:大模型发展的另一个战场
👩🏻 程曼祺
说到这个,文章发布后有个有趣的反馈。极客公园上有个 ID 叫「凌晨 64」的朋友转发时提到:在国际上讨论中国大模型时,最多提及的是通义的开源系列和 DeepSeek,而在国内,大家关注最多的是 Kimi 和豆包。
这个话题其实涉及一个现在对创业公司造成压力的重要因素:开源对闭源的压力。
那些获得大额融资的头部大模型公司,更多是在讲「我有一个更好的闭源模型」这样的故事。但随着 Meta 和阿里这两家积极推动开源的中美大公司,以及像 DeepSeek 这样特别的公司贡献了很多优秀的开源模型后,确实有很多公司可以直接在开源基础上开展工作。这可能会与大模型创业公司形成竞争,给他们带来压力。
回到核心问题:技术进化的速度。这可能是市场最难回答的问题。首先这个问题超出了大多数人的理解范围,至少超出了我的认知。即使在从业者中,很多顶尖的 AI 开发者对此也持不同观点,有种「看神仙打架」的感觉。我觉得这正是当前市场分歧很大的核心原因。我们文章中描述的现象,包括未来可能发生的一些变化,根源都在于此。
🚥 Koji
在操作这篇文章的时候,你们的起点是什么?是当时看到了什么具体的信号,或者听到了某一个故事,就让你们想着要去做这么一篇内容。
👩🏻 程曼祺
其实文章的起点很常规,作为商业报道,主线通常分为几类:一类是单个公司或人物的报道,另一类是行业现象类的报道。
最初我们在十一之前策划这篇文章时,主要方向是想盘点中国头部大模型创业公司从去年到今年近两年的变化。当时并没有特别明确要重点写他们与大公司之间的竞争。后来是在与更多人交流过程中,包括回顾我们从去年到今年的大量采访要点,慢慢发现这可能是一条能串起很多事件的主线。而且这个角度对读者来说也比较容易理解,本质上就是一个竞争的故事。就像你刚才说的具体案例,豆包最近的声势确实很猛。
🚥 Ronghui
那文章发了之后到现在你们有收到什么反馈吗?就是有什么大家的评论,有比如说纠正一些文中的一些观点,还是说大家其实非常认同这篇文章写出来的东西。
👩🏻 程曼祺
我想先问一下,比如说你们自己的反馈会是什么了?就你们看到之后会是什么感觉了?
🚥 Koji
我在即刻第一时间转发了。因为这篇文章把大家潜藏在心里的一些想法,甚至是一些共识提炼了出来,并且用非常清晰有力的方式表达出来。我觉得它凝聚了共识,也形成了一种新的叙事框架。
👩🏻 程曼祺
你那个转发还 cue 了新世相的 slogan 是吧?我记得里面有潮水的方向这几个字(笑)。
🚥 Koji
对,潮水的方向(笑)。
👩🏻程曼祺
对,我们更多是在做记录,很难说能改变潮水的方向。我觉得把这些现象描述出来是一个比较有意思的复盘。
其中有几点值得关注:第一点就是你刚才提到的,有些内容确实引起了共鸣,大家有共同的感受;另一点是我之前提到的中外关注差异,这个现象挺有意思的。我们这篇文章里确实没有特别深入讨论开源和闭源的问题,这也是一个很值得探讨的话题。第三点是你们提到的,确实有一些读者觉得文章中有些内容不够准确,需要进行纠正。
比如关于我们使用的 QuestionMobile 30 日留存数据,后来我们在文章评论里也置顶了说明。大家对这个数字的质疑主要是觉得太高了:豆包在 9 月的留存是 34%,月之暗面的 KIMI 和 MiniMax 的海螺这类似产品都在 28% 左右。在聊天陪伴或虚拟社交类产品中,猫箱是 40% 多,MiniMax 的星野达到 60% 多。
产生这种差异的原因是,做产品运营的人通常更关注新用户的 30 日留存。而 QuestMobile 的算法计算的是第 30 天后仍在使用的用户数占总用户数的比例,他们每天都计算然后取平均值。
这个数据包含了所有用户而不仅是新用户的留存,所以一般会比新用户留存率高。因此这组数据更适合用来看各产品之间的相对关系,而具体数值确实会比市场上投资人或产品经理关注的新增用户 30 日留存要高。
另外还有一个有意思的反馈,是关于文章导语中提到的「一个大厂高层称做大模型的年度低消需要 20 到 30 亿美元」这个说法。文章发布后不久,就有投资人告诉我实际花费没有这么多,他提供了一套自己的计算方法。
🚥 Koji
对,无论具体数字如何,大模型的低消确实很高。这个趋势在海外市场也很明显。除了 OpenAI、xAI、Meta、Google、Anthropic 这五家公司,其他公司都有些跟不上发展节奏,甚至连 Cohere 和 Mistral 也显得有点力不从心。
刚才提到的第二点是中外关注的差异。一方面,海外在关注千问、DeepSeek,这两天推特上甚至有大 V 在说:「看看,芯片封锁并没有用,中国在 AI 领域非常厉害。」另一方面,Financial Times 在 11 月中也发表了一篇文章,但角度很不一样。他们说芯片封锁确实没起效,原因是中国的公司,从阿里巴巴到字节跳动再到美团,都在湾区设立公司,大量招募顶尖人才。这说明在技术浪潮面前,很多要素仍然是流动的。
说回这篇文章,开头写得非常吸引人,讲述了去年投资人争相投资大模型创业公司的场景。到了今年,各种小道消息显示已经有人开始着急要卖老股了。
从年初「六小龙」的状态来看 —— 曼祺,你还记得当时有哪些印象深刻的事或故事吗?
👩🏻 程曼祺
对,这里说的年初应该是指去年。那时候大模型创业确实很火热。说到那个时期的故事,我知道杨植麟最开始是比较难见到的,投资人想见他都不太容易。不过这可能与公司的火热程度关系不大,主要是因为他性格比较内向。
据他的同事说,杨植麟曾经提议说:
能不能不用见投资人?我写一个文档,让他们看文档就可以了。
🚥 Koji
我觉得他们最近的新闻发布会很妙。这或许可以说是一次巧妙的 PR 呈现 —— 杨植麟在台上花了 40 多分钟独自解数学题,将他作为科研工作者的形象淋漓尽致地展现在所有媒体面前,反而获得了非常好的评价和好感。
对了,曼祺你是不是也在现场?你有这样的感受吗?
👩🏻 程曼祺
我也在现场。首先想纠正一点,他并没有花 40 分钟做数学题,没有那么长。
杨植麟讲解 k0-math 整体花了 40 分钟,其中演示 demo 时讲解数学题的部分,我的体感大概只有十分钟左右。从现场媒体朋友后续的报道标题变化就能看出一些有趣的转变:从「回应一切」到「没有回应一切」,再到「不能回应一切」。
其实大家普遍有一个感受,就是他没有回应技术之外的一些市场关注的问题。这可能与发布会当周的周一刚好有他们仲裁风波的报道出来有关。
🚥 Koji
再回到年初的时候,还有一些什么样的你印象深刻的故事?
👩🏻 程曼祺
我对最近这个犹疑期的故事印象格外深刻,可能因为时间比较近。最近融资消息明显变少了,连上半年最大方的阿里,到了年底后也开始有所犹豫。
小红书上不是也传出消息说,他们对某个大模型公司的投资出现了跳票情况吗?
🚥 Koji
我们在小红书上看到好像是阶跃。
👩🏻 程曼祺
对,现在还没有投资。融资消息相比年初确实没有那么快、那么劲爆了。
🚥 Koji
最近网上广泛流传一个故事:马云在一次会议上问道「为什么大模型创业公司我们阿里都要投一遍?」现场众人面面相觑,无人应答。没有人直接告诉马云「我们是为了卖阿里云」。马云又追问了一句「是不是你们没有看懂?」
这个故事引发了一个思考:从什么时候开始,大模型公司、尤其是这一批创业公司的发展开始显得不如想象中顺利?
👩🏻 程曼祺
其实这并非发展不顺利,而是每个新技术出现后都会经历从狂热到理性的过程。
最初大家都很兴奋,但热度过后自然会回归平静,这是正常现象。所以与其说他们不顺利,不如说是在自身期望和大公司表现的衬托下显得发展缓慢。
从去年到今年,有个有趣的转折:
去年还被群嘲的字节大模型及其产品,在今年的表现却相当亮眼。
🚥 Koji
这让我想起之前「十字路口」和真格基金合伙人戴雨森的那一期对话。那期播客的标题是「大模型还是小学生,请大家不要着急让他打工赚钱」。
ChatGPT 3.0 发布至今才刚满两周年,但大家似乎期待它已经该孕育出下一个 Meta 或 Google 了。回顾这些科技巨头的发展历程:Meta 和 Google 都经历了六年到十年的成长,才在营收规模和利润水平上成为了令人瞩目的企业。
大家之所以认为大模型发展「不顺利」,主要是因为心态过于迫切。换个角度看,这并非发展不顺利,只是没有达到人们过高的期待。而这种期待本身可能就值得商榷。
👩🏻程曼祺
本来你每天被爆炸被震撼也不正常,对吧?人不可能每天都被震撼。
六小龙现状盘点:各家公司的发展重点与进程
🚥 Koji
曼祺在写这篇文章时,应该对现在的「六小龙」——六家典型的大模型创业公司都做了全面盘点。能否请你分享一下,你们观察到的这六家公司目前的发展重点和进程?
👩🏻 程曼祺
关于 Kimi,我觉得他们现在的方向比较明确,就是要做好 Kimi 这一个产品,而且在品牌上也是往 Kimi 收拢的。
现在月之暗面自己对外提到公司时,经常会用 Kimi 而不是月之暗面这个名字。还有一个冷知识,可能很多人知道,就是杨植麟自己的英文名就叫 Kimi。所以现在创始人、公司品牌和产品都叫 Kimi。因为重名,在公司里为了区分是在叫创始人还是在说产品,他们会把杨植麟叫做 KK,提到产品时就说 Kimi,这样比较好区分。他们最大的策略,我觉得就是现阶段要做好 Kimi 以及做好生产力这个场景。
关于 MiniMax,它其实在 ChatGPT 之前就有产品出现了。它最开始火的产品 Glow,其实在 2022 年下半年就上线了,他们确实尝试了比较多方向。目前他们 To C 产品的重点肯定是在星野的出海产品 Talkie 上面。同时他们开放平台也做得比较多,就是 API To B 的那部分,这应该是他们比较重要的收入来源。
零一今年也有很多调整,我觉得现在也比较清晰了。一个方向是做出海的 To C 产品。之前看到有人在小红书上吐槽说零一没有产品,其实这么说有点冤枉他们,他们只是不太喜欢说自己的产品名字。因为现在是出海,如果你是一个比较大体量的公司,出海确实有一些压力,但他们的产品其实不少。最近他们刚上线了两个 AI 搜索类的产品,这可能是接下来一段时间他们 To C 产品的重点。另外他们最近还分拆了一个游戏公司,会有他们的联创之一马杰来带队。
我们之前在一篇独家报道里写过,零一也在做 To B,而且在之前的 API 基础上又加了一些新功能。API 其实是大部分大模型公司做 To B 时比较常见的操作。零一在中国市场最近开了一个 To B 的发布会,针对一些场景提供更完整的方案。当然也不一定完全自己来做,他们会和一些 ISV (独立软件开发商)合作,这样可以做得更轻量化和标准化一些,主要针对营销、直播等场景。
🚥 Koji
对,我看到他非常重点在讲虚拟数字人直播。前段时间在《AI 在中国》系列播客中的一期,我们找到了一位在 To B 领域实现 PMF 的创始人,这挺不容易的。他是集思科技的创始人李世尊,他们主要做虚拟数字人直播。这确实是一个落地场景和需求都比较明确的方向。
只是我稍微有点怀疑,整个市场规模对于一个创业公司来说从零到一确实不错,但对零一来说,不知道能否扛起这么大的责任和开复老师的野望,这一点我看到的时候心里有些疑问。
👩🏻 程曼祺
其实这就回归到我们开头说的问题。如果去做一些具体场景的细节产品,这里面有很多根本不做模型的公司,他们没有那么多资源,也没有那么多人的期待,反而可以很轻很灵活地去做。这些大模型公司在具体场景上就要和这些公司竞争。这大概就是零一 To B 的一个情况。
关于智谱,它一直以来 To B 和 To G 都是重点。据我们了解,智谱今年的合同收入和去年差不多。一方面看起来似乎没什么增长,但另一方面,去年他们做一些定制化模型开发时,客单价是很高的。去年有几个中国金融行业的大客户能给到 1000 万的订单,而今年可能同样一个项目的价格就急剧下降到 100 万甚至更少。从这个角度来说,智谱也许拓展了一些更有质量的客户和收入,具体情况我不是特别了解。
🚥 Koji
我感觉智谱现在把非常多的重点都放在讲他们的 Auto GLM 上面。发布第一版之后,确实获得了很高的市场反馈。紧接着在这个礼拜,他们又举办了一个发布会,推出了 GLM 更加正式的版本,还拍了非常精美的视频。我觉得这个是他们现在一个比较主要的方向。
👩🏻 程曼祺
他们这个是可以和手机合作的是吧?
🚥 Koji
对,在最近的发布会上出现在广告里面的那台手机就是荣耀的 magic 7 的系列。
👩🏻 程曼祺
我觉得可能他们就是会有合作,我觉得市场也可以期待一下。
👩🏻 程曼祺
还有一个阶跃,他们的信息相对比较少。当然他们做了一些 To C 的应用,这个从公开信息可以看到,比如「跃问」、「冒泡鸭」什么的。
🚥 Koji
说到阶跃,他们最近在 To C 端确实做了一些爆款。一个是「歌词爆改机」,另一个是前两天刚发布的「灵魂提取器」。有意思的是,当时他们比较重点在讲这些产品只是用了阶跃的 API,并没有重点提这些产品其实是他们自己内部做出来的,这个策略挺微妙的。
可能是因为他们长期希望定位为一个 To B 的公司,而不是 To C 的公司。因此哪怕做出了爆款,也希望大家控制预期,不要觉得阶跃从此就转向 To C 了,甚至都不让这些爆款产品带来的增长效应落到自己头上。
👩🏻 程曼祺
阶跃确实有一些很厉害的人才。张祥雨现在也在阶跃,之前和孙剑、任少卿,还有何恺明。他们做的 ResNet 当时应该是中国计算机视觉领域在全球最有影响力的成果。朱亦博也在阶跃,他是 2023 年初从 Meta 回国加入的。
六小龙里还有百川。百川的变化大家也都能看到。去年的时候,王小川应该是想做 To C 的超级产品,但到现在他们的思路比较明确了,就是专注做医疗这个场景。我觉得客观上这确实也避免了和巨头的一些竞争,不用在火力最强的战场上。但是医疗这个场景本身壁垒挺高的,商业关系也比较复杂。
我们比较关注的是 Kimi 和 MiniMax 这两个公司,我觉得他们的对比很有意思。Kimi 正如我刚才说的,有一个比较明确的主线。杨植麟在跟我们聊天时,包括他对外沟通时,他的逻辑都很自洽。他说要去做生产力这个场景,以及追求智能的最大提升。他认为生产力这个场景跟智商提升的关系更大,而娱乐社交类的产品对智能的需求没有那么多。
生产力确实也被大家认为是一个价值很大的场景。ChatGPT 某种程度上验证了这个判断。到今年 8 月底,OpenAI 有一个正式数据,ChatGPT 的周活达到了 2 亿。今年初的时候,它的周活跃用户数应该是 1 亿左右,所以不到一年的时间里又翻了一倍。某种意义上可以说它已经是 AI 领域我们看到的重要产品了。
🚥 Koji
非常牛逼。还有那么多套壳的 APP 都没有算在里面,它只是算自己的官方客户端。
👩🏻 程曼祺
对,他算的就是自己的。我觉得这是一个价值很大的方向,而且杨植麟的野心和抱负都是很大的。我去看了我们六月采访的一些情况,他当时在讲生产力产品时说了一句话:「最终会真正成为通用的入口级产品」。这是在解释为什么要只做 Kimi 这一件事,可以看出他设想的未来是要找到一个入口级的产品。
当然,这个策略也有一个很明显的问题,就是你是这么想的,别人也是这么想的,字节不也是这么想的吗?
🚥 Koji
所以豆包才如此火力全开。
👩🏻 程曼祺
对,因为 Flow 就是字节的 AI 部门,它有很多产品。但豆包显然是他们投入力度最大的一个,不仅体现在大家能看到的广告投放上,还体现在组织和人员安排上。朱骏之前是 Musical.ly 的创始人,现在是整个 Flow 的负责人,他自己直接带的产品就是豆包。豆包的网页端负责人、APP 端负责人等都是向朱骏汇报的。从投放到组织结构来看,字节显然都非常看重豆包这个产品。
所以 Kimi 选择的这个方向,就是和字节或者说和大公司的必争之地,会有一个比较正面的竞争。而 MiniMax 的产品策略我觉得比较灵活,他们会尝试很多方向。
不管是最开始的 Glow 莫名其妙就火了是个偶然因素,还是他们有意识的策略,从现在的结果来看,他们做的方向并不是直接和大公司竞争。在类似星野这样的产品里面,字节虽然也做了猫箱,但猫箱的表现现在应该是不如星野的。
这个我们在文章里也有一些具体的数据。产品带来的反馈很有意思,年初的时候我还做了个短视频讲这个事。我觉得 Kimi 为什么这么火,一个原因是它的目标用户恰好就是最关注 AI 的这些人 —— 投资人、分析师、媒体记者这些知识工作者。当这些人既关注 AI 又觉得产品特别好时,就会产生惊艳感。而这些人在社交媒体上又是最喜欢讨论这些事情的,比如在小红书、即刻或者朋友圈。
我自己经历了一个特别有趣的事,今年清明节的时候我去爬山,是一个创投圈朋友组织的,很多人都是互相不认识的。大家聚到一起开始自我介绍,中间有个人提到自己刚才在路上还在用 Kimi,结果这个自我介绍环节就变成了一个 Kimi 使用分享会,后来每个人都在分享自己是怎么用 Kimi,觉得很好用。
在 3、4、5 月的时候,这种自来水的传播和口碑传播确实非常强。当然有一个原因是那会儿豆包可能还没那么强。而星野的用户就特别有意思,比如我自己也下载了星野,但是玩不起来,因为我不是它的目标受众。我觉得大部分投资人可能也不是它的目标用户。但如果你去看这些用户在社交媒体上的分享,就会发现这些人其实非常沉迷这个产品。
B 站上以前就有很多 Glow 的养娃视频。点进去后可能都不太明白视频在讲什么,弹幕里也都是一些有点黑话的内容。我在小红书上也看到过有人分享在星野上养娃的情感体验。这些用户群里已经形成了很多小圈子的话语,有些确实看不太懂。那些帖子可能有 8000 个点赞,一千多条留言,能感觉到这些用户的情感投入和粘性都很强。
这个从 30 留存的数据也能看出来。虽然猫箱和星野比起来留存没有那么好,但还有 40% 多的月留存,比豆包更高。星野自己的留存更是达到了 60% 多。
🚥 Koji
所以其实看下来两个公司是走了非常不同的两条道路。因为你和两位创始人都分别做过比较深度的采访,你觉得这和他们本身的成长,或者他们本身的信仰是有非常直接的关系吗?
👩🏻 程曼祺
首先我想说,你跟他们采访过后了解这个人肯定比较全面,我只能分享一下我的感受。我觉得 MiniMax 的创始人闫俊杰确实有一个想法,这也是 MiniMax 很早就确立的内部 slogan —— 「Intelligence with Everyone」。他认为要做一个 AI 产品,这个产品应该让大部分人都能用,所以门槛要很低。
他在接受我们采访时说过,每天会打字的人不过就是「在座的各位」,他指的是知识工作者或办公室白领这类群体。如果要让这个产品覆盖更多用户,就得加入语音功能,或者视觉等多模态功能。这也是为什么 MiniMax 一开始就在做这几个模型。而且在国内的公司里,他们的语音模型做得还不错,Koji 可能在这方面更有发言权。我不知道你有没有试过他们的产品。
🚥 Koji
我觉得他们的视频模型更有口碑。最近遇到的各种创业者和朋友试用过各家大模型后,包括我自己的体验,都认为 MiniMax 的视频模型表现确实非常突出。不过这里面有个值得关注的点 —— MiniMax 做视频模型的团队据说只有十来个人。
在我们这期播客发布时,腾讯混元的视频大模型已经正式发布了。我在内测时也觉得非常惊叹,水准很高。字节也有两个团队在做视频大模型,比较低调,没有太多 PR,但用过的人都觉得不错。所以在字节、腾讯,包括未来可能加入的阿里这样的巨头围剿之下,创业公司确实有难熬之处。关键是看在目前领先的情况下,如何尽快打开更大的局面。
👩🏻 程曼祺
我刚才说的是闫俊杰的想法。其实他这个想法往后发展,也会受到竞争压力,这是个时间窗口的问题。
杨植麟的想法,至少他对我们表达的是 —— 他想做一个能明显提升智能的产品,这个场景要能促进技能的提升,同时要有人用。我觉得这有点类似于「攀登技术高峰,沿途布局商业化」的思路。不过随着市场环境的变化,他们可能都会有所调整。
关于这两个人,我有个比较有意思的发现,虽然这可能不能说明什么。一些投资人认为杨植麟比较看准一个方向,他认定了大方向就会坚定地往这个方向做。他的微信签名是「A million different people from day to next」,翻译成中文大概是「我朝夕变化不定」。这是一句摇滚乐歌词,因为他很喜欢摇滚乐。我们当时问过他这个微信签名,他解释说「长期目标是不变的,但我要快速迭代」。
MiniMax 的产品策略看起来比较灵活,更具适应性。而闫俊杰的微信签名是「To find more stable formulas」(寻找更稳固的方程)。我觉得这形成了一种微妙的对照,当然这可能也说明不了什么。
🚥 Koji
挺好玩的,我觉得最近我们也在做一些这个产品的尝试。然后其中一个尝试就是让用户上传自己的朋友圈和朋友圈的各种截图,然后这里面可以解读出非常多的东西。
👩🏻程曼祺
你说到这个,我突然想到一件事,就是有时候去一个新的社交平台时,需要想一个个性签名,如果能让 AI 帮忙生成签名也不错。
🚥 Koji
我们最近发现,即使用户只上传朋友圈的一屏截图,AI 就能够相当准确地推测出这个人的很多性格特点,甚至能判断出是安全型依恋还是焦虑型依恋。
我们正在尝试开发一个产品,通过 AI 帮助用户更好地了解自己,从而在脱单和寻找合适对象方面有所帮助。这个 demo 做出来后,试用过的人都感到很惊叹。过段时间我们会正式发布,欢迎大家来体验使用。
👩🏻 程曼祺
但是我能想到,这个产品发布后,大家可能不是用它来理解自己,而是会用来了解其他人。比如说看看暗恋对象是什么情况,把他的朋友圈第一屏截下来分析一下;或者想追求的人是什么性格;甚至去看看自己领导是什么性格。
🚥 Koji
这个也很好啊,其实就是在帮助大家提高理解别人的能力,看见别人的能力,其实如果人人这方面的能力都变高了,其实这个世界会变得更有情绪价值。
🚥 Koji
这里我们预告一下「新世相」和「晚点」即将发布的一个非常有意义的项目。我们联合了 20 位在行业内颇有影响力的创业者和文化人,准备一起发布一个关于 AI 的宣言,探讨 AI 将如何帮助人类、帮助我们的社会。这是一个有点宏大的命题,虽然显得我们有些不自量力。我们列出了 AI 应该做到的十个关键点,将会共同发布这个宣言,到时候也会在播客里向大家详细介绍。
👩🏻 程曼祺
提前预告挺好的,提前预告就板上钉钉,绝对不能跳票了(笑)。
🚥 Koji
好的,那我们再说回来。
🚥 Ronghui
最近我们发现一个现象,新一批宣布融资的创业者,多多少少都是从去年成立的那些模型公司里出来的人。你觉得这个现象说明了什么?
👩🏻 程曼祺
对,我们在一些独家报道里也写过。比如说月之暗面,之前有一些产品负责人出来创业,他们此前负责两个出海产品:一个叫 Ohai,一个叫 Noisee。
正好可以补充一下,前面说到 Kimi 只专注做 Kimi 这个产品,其实在这个过程中,他们也尝试过一些其他方向的产品。但据我们了解,他们在这些产品上投入的力量并不是特别多,而且这些产品到现在可能已经不在正常更新和持续投入的状态了。
更早的时候,他们还有一个产品负责人王冠也出来创业了,包括我们之前报道过的 Noisee 负责人明超平。后来我发现他很年轻,是 98 年的。而且他这个项目第一轮估值就达到了 5000 万美元,非常受市场追捧。
所以我觉得这至少说明了,目前做 AI 应用,市场上还是有不少人愿意支持,而且愿意以一个较高的估值来支持。这也回归到我们前面说的,如果大家认为模型本身的进化没有那么快,就会更多地关注应用是否有机会,而且会用更轻量的方式来做应用。
🚥 Koji
我觉得这一批从大模型公司出来创业的人,他们做的事情都挺有意思。比如王冠的 one2x 在做 AI 视频相关的尝试,大鹏依然坚定地做生产力工具,而明超平则在做 AI coding,估值达到了 5000 万美元。
👩🏻 程曼祺
杨植麟发布 k0-math 数学模型那天,在后面的群访中,有媒体问他关于人才流失的问题。他的回答很有意思,用了知乎标准回答的方式「先问是不是,再问有没有」。他的意思是公司并没有人才流失,而是因为业务调整、不做出海产品了,需要收缩精力,所以有一些人离开。这是一种比较委婉的说法,实际上是表达「现在不太需要这部分人了」。总的来说,就是一些大模型公司在调整业务,导致人员发生变化。
这些人出来创业,不管是自己想出来还是因为公司调整,都非常受市场欢迎。从融资情况和投资人的关注度都能看出来。比如明超平出来做 AI 编程,第一轮估值就达到 5000 万美元。如果对比 2015、2016 年那波硬科技创业热潮,这个估值算是非常高的了。
王冠也是出来没多久就已经融到资了。这些创始人都比较年轻,我觉得这个现象本身也和我们开头讨论的核心假设有关,就是技术发展的快慢问题。可能有些投资人判断,之前模型的爆发式增长已经到了一定阶段,相对放缓了,现在也许是应用端会有更多机会。
🚥 Koji
我们再回到这个文章里面提到的一个数字,就是 20 到 30 亿美元。这提到是大模型公司在现在每年的烧钱的门槛。
刚才曼祺也说这个文章发出来之后,你们收到了一些不同的对这个数字的点评。这里可不可以稍微展开一下?
👩🏻 程曼祺
关于投入规模的估算,大厂高管认为需要 20 亿到 30 亿美元。但有投资人的算法是,这些创业公司一年最多需要 2 亿到 3 亿美元。他的计算依据是:一个模型目前大概是千万美元级别,一万张 H 卡的租金一年也就几千万美元。而且训练模型并不需要整年,一般一个模型训练几个月就够了。按这么算,确实离 20 亿美元差距很大。
这个算法当然有一些前提:首先说的是继续做模型训练的公司,否则训练费用都不用算;另外,关于更低的训练成本,李开复也提到他们做模型训练时,用 1% 到 2% 的成本就达到了和 xAI 差不多的效果。但这里可能忽略了一个成本,就是在没有先行者探路时,前瞻性投入和探索的成本可能很大。这就像跑马拉松,有人在前面帮你探路,后面的人确实会省一些成本。
我们可以参考一下 Information 对 OpenAI 花费的报道。OpenAI 在 2022 年、还没有大火的时候,那一年就花了 5.4 亿美元。今年 6 月的报道显示,OpenAI 今年全年可能要花掉 70 亿美元,其中光是研发人员的成本就有 15 亿美元。当然,美国的 AI 研发人员可能特别贵,那篇文章的标题就是「Why OpenAI could lose $5B this year」。
这又回到了中国大模型公司的两难境地。
在中国的市场容量下,很难融到让你无后顾之忧去追求技术极限的资金,不可能像 OpenAI 投入那么多钱。所以你必须要有一些商业化和增长的成果。但要同时做好技术、产品增长和商业化,本身就是一件很难的事情。
🚥 Koji
所以又回到我们一开始聊到的看千问,看字节的模型,以及看 DeepSeek。就这些跳出六小龙,跳出创业公司框架的巨头也好,或者本身手握重大资源和大笔财富的这样的玩家,他们代表中国会做出什么样不一样的前瞻性的成果出来。
👩🏻 程曼祺
对我觉得至少字节和 DeepSeek 肯定很明显在模型层都是有这个想法。
🚥 Ronghui
就像刚才曼祺已经说到,有一些挑战是由模型本身决定的,比如说耗钱耗资源。很多事情在中国可能很难去对标硅谷发生的事情。
除了这些以外,对创业公司来说(这里我们特指这几个模型公司),他们在组织和人的方面会遇到什么挑战呢?
👩🏻 程曼祺
我们有很多关于这些组织和人的零碎信息,但在文章中呈现得不多。因为从早期公司员工的视角来看,老板的决策变化确实很快——今天要增长,明天要收入,之前说要做这个,后来又做那个,这其实都很正常。
这些公司在当前处境中要考虑的因素很多,不是单一的。首先高估值是一个卡点,它本身会导致后续融资变难。其次,模型能力的进化方向和速度都不够明确,加上产品体验和增长的说服力也不够强。同时,大公司还在全力出击产品。关于这点,我今天特意用豆包和 Kimi 去查了一下今日头条当时的情况,因为历史数据比较难搜。
今日头条是 2012 年 8 月上线的。如果对比去年大模型产品到今年这小一年的时间,看看当时今日头条是什么表现:到 2013 年 2 月底,也就是上线七个月时,它的日活就到了 200 万;到 2013 年年底,日活达到了 1000 万。如果用这个来对比现在创业公司里的 Kimi 的话,今日头条当时作为创业公司的新产品,增长确实更快。
而且还要考虑到,2013 年的流量成本没有那么高,现在的流量成本比当年要高很多。那时还是移动互联网早期,百度可能没有看懂推荐算法这个事,可能当时并没有很早就意识到要盯着这个创业公司。所以回头来看,今日头条当时的增长环境都要更宽松一些。
顺便说一下,在帮我查今日头条历史日活数据这点上,豆包确实表现得更友好一些。Kimi 和豆包都给出了 2013 年底 1000 万的数据,但当你进一步追问数据来源时,豆包的解释更友好。它会直接在生成的文段里告诉你在哪些文章里看到了这些信息。在手机上查看时,不用点击外链就能直接看到信息来源,省了一步。而 Kimi 不会直接在生成的文段里说明信息来源,而且到后面它又说 2013 年底的日活是 100 万,当我问到底是 1000 万还是 100 万时,它就有点混乱了。
所以这些公司现在面临的挑战是需要调整和考虑很多因素,而且调整一个因素可能就会影响其他方面。比如今年早些时候,在大模型创业公司里有个引起较多讨论的话题:当时有报道提到至少两家「六小龙」已经停止预训练了。
回头看,停止预训练这件事是否一定不对?也许这是一个理性的选择。创业不怕打脸,在这件事带来的一系列后果里,打脸和没面子是最次要的。
创业肯定会打脸,但它面临一些现实问题:首先是估值能不能撑住?因为最开始投资人看中的可能是核心技术优势。不做预训练了,这个估值还能撑住吗?当然另一方面,如果不做预训练,但能做出真正有价值的产品,顶住几十亿美元的估值也 OK。但这又带来一个问题:最开始是以大模型技术去组织核心团队和创业班底的,这个班底到底能不能做出爆款产品,可能大家都持怀疑态度。所以我觉得他们现在的处境确实比较艰难,各种问题都纠缠在一起。
字节跳动:会跳舞的大象如何布局 AI?
🚥 Koji
听下来确实让人替「六小龙」捏一把汗。不过我们还是要送上祝福和鼓励,希望看到「六小龙」都能发展得越来越好。因为他们的成功,关系到整个中国创投生态的健康发展。在这个生态系统里的每个角色,都能获得更多机会和更强能量,让大家无论是在工作事业还是日常生活中都能越来越好。
说完初创公司的挑战,我们再来聊聊字节。今天之所以要讨论这些挑战,很大一部分压力就来自字节这样一个既有资源又很努力、大家都很会「跳舞」的公司。我们之前看到有朋友提到,2023 年是字节给 AI 创业公司们的一年窗口期。
曼祺,根据你们的采访和了解,字节在 2023 年这一年在做什么?为什么会说它给了大家一年的窗口期呢?
👩🏻 程曼祺
我们文章中提到,在 ChatGPT 之前,字节高层可能更关注 AI 的另一个进化方向:AI for Science。这个方向当然也很有价值,比如今年的诺贝尔化学奖就颁给了 AlphaFold。AlphaFold 可以说是 AI for Science 其中一个方向的重要进展。
这里涉及一个有趣的题外话:中国和国外的不少大佬,到了后期都对生物科技特别感兴趣,比如 AI 和生物科技的结合,都比较上心。
然后从公开信息来看,字节在这方面的积累确实不如国内其他大公司。我们 2023 年发过一篇文章叫「大厂大模型」,盘点了当时中国大型科技公司在大模型上的动作和投入。文章里有一个时间线,记录了中国大公司开始做大模型的时间节点。可以发现,百度确实是最早的,2019 年就发布了模型,这就是后来文心的前身。只不过当时可能用的是谷歌的 BERT 架构,还不是 GPT 架构,但都属于大模型。
再往后到 2021 年,华为发布了盘古,阿里也发布了 M6 和 M6-plus 两个模型。这两个模型后来都并入了通义系列。商汤也发布了书生大模型,就连大家觉得比较落后的腾讯,其实在 2022 年 ChatGPT 之前也发布过模型。他们在 4 月发布了混元,到了前年 10 月左右,微信自己也发布了一个微信的大模型,叫 WeLM。
👩🏻 程曼祺
在这些公开动作中,有几点值得说明。一个是华为 2021 年的盘古大模型,当时是还在循环智能的杨植麟和北京智源的一些人与华为一起合作开发的。这也解释了为什么资本市场最开始非常看好杨植麟,我觉得与他之前的这段经历有关,他在技术背景上确实非常相关。
再比如商汤,MiniMax 的闫俊杰之前就是在商汤工作的。所以我觉得字节在 2023 年反应相对较慢也很正常,因为他们之前在这方面的技术积累可能确实不如其他公司,追赶肯定需要时间。据我们了解,在 ChatGPT 之前,字节的 AI Lab 里面的 NLP(自然语言处理)组虽然有一百多人,但其中只有大约十个人在研究大语言模型方向。所以我感觉那时候他们正在追赶这个技术,同时也在调整一些思路。
🚥 Ronghui
看到这个标题和文章时,我觉得挺有感触的。这让我想到一本书「谁说大象不能跳舞」,讲的是 IBM 当年转型的故事。有一个类似的情节:让 IBM 这头「大象跳舞」的人叫郭士纳,他是个外来者,顶住了特别大的压力,在 IBM 内部推动了改革。
我在做记者时曾采访过 IBM 中国的一位研发负责人。他提到 IBM 有两个重要原则。如果我没记错的话,华为后来也是跟 IBM 学习了这套方法。其中一点是始终把客户至上放在最重要的位置,这也是华为一直在强调的。另一点是他们非常重视自己的研发中心。
当时那位负责人跟我说过一句话:正是因为重视研发、重视客户,才能让你一直了解市场上在发生什么。除了组织管理上的灵活度,这才是最重要的。
所以看到你们写的这个观点,我就提出这个问题:根据你们的了解和采访,除了资源上的优势,字节做了哪些事情在今天看来是正确的,让他们获得了今天的局面?
👩🏻 程曼祺
这个时间线正好接续上一个问题。从 2023 年下半年开始,他们就开始有一些变化,到今年才逐渐看到一些成果。我觉得其中一个关键是一号位对这件事的重视。这个观点来自于一位提出「中国的大象会跳舞」比喻的投资人。我们跟他交流时有个启发:其中一个重要因素是创始人张一鸣,从去年底开始,他对这件事更加重视,更加亲力亲为地参与。一个比较直接的变化是他在广泛地与最优秀的研究者建立联系,亲自去招募团队。
那位投资人提供了一个很有意思的视角:一个大公司在某个阶段的行动,往往与创始人(如果一代创始人还在且有影响力的话)的人生阶段密切相关。张一鸣确实很年轻,他是 1983 年出生的。我们可以看看这些互联网、移动互联网公司创始人的年龄:腾讯的马化腾 1971 年出生,比张一鸣大了十岁;再往前,马云是 1964 年的,李彦宏是 1968 年的。扎克伯格更年轻,他 1984 年出生,比张一鸣还小一岁,Sam Altman 是 1985 年的。
有趣的是,「六小龙」的创始人中只有两个比张一鸣年轻:1989 年出生的闫俊杰和 1993 年出生的杨志林。当然,年龄和人生阶段并不代表一切,这只是观察问题的一个角度。
张一鸣现在确实还保持着很强的学习和探索潜力。在这样的市场氛围下,当他开始特别重视这件事后,具体做了什么?就像我刚才说的,他在招人上投入了很大精力。张一鸣之前表达过,创业最重要的两件事:一是对事情有准确的判断和认知,二是找到最合适的人和团队。大部分问题都可以通过这两点来解决。在与杨植麟交流时,他也引用了这句话。
我们在今年 3 月采访闫俊杰时,发现他对这个问题的判断也很类似。他认为对自己来说最重要的是技术资源,因为他的产品能力已经准备就绪,而且有无限多的产品资源可以尝试。他最重要的任务就是提升技术水平。后来可以看到,在招人和研发方面,他确实在朝这个方向努力。
2023 年 6 月之后,字节明确了一个策略:要自己做大模型和产品,不再对外投资中国的大模型公司。在 2023 年 6 月之前,他们曾考虑过投资两个公司:阶跃星辰和 MiniMax。据我了解,这些投资已经走到比较后期的流程,但最终都没有成功。这个决定也让内部形成了更明确的共识:专注于自己做好这件事。
第三件重要的事是 Flow 部门和团队的建立,而且整个集团确实给了这个部门很多支持和资源。有了这个部门后,他们的做法与闫俊杰描述的很像:一边提升技术能力,一边开发多个产品。我们可以看到他们推出了豆包、扣子、星绘、猫箱,还有豆包爱学(这是从字节教育拿过来的产品)。包括猫箱,之前是抖音那边番茄小说的产品,现在都汇聚到这里了。当然现在除了 Flow,字节的其他团队也在做 AI,这在大公司很常见。
我们的文章后面也提到,大公司可能会给创业公司一个机会,就是如果一个项目投入一段时间没有明显反馈,大组织内部可能会出现很多张力。比如团队之间的拉扯,或者战略重点的变化。
说到这个,最近有个有趣的事:字节要起诉一个实习生,让他赔偿 800 万。最初传闻出来时,不知道你们看到了没有,说那个实习生之所以蓄意破坏,是因为他对所在项目没有得到足够的 GPU 支持而不满。我不能确定这件事是否完全真实,只能说最初流传的版本是这样。这个人并不在朱文佳管理的大模型研发团队,而是在字节商业化技术团队,也就是刘小兵下面的团队。其实字节很多部门都在做 AI 相关的尝试。
🚥 Ronghui
从这个报道里面看到,感觉字节是非常强大,甚至就是强到让人有点害怕的,那它没有什么弱点吗?
👩🏻 程曼祺
字节还面临一个外部变量,我们文章里并没有特别展开:它已经是一个规模庞大的公司,而且 TikTok 在海外,特别是在美国面临着一些压力。因此,海外的压力可能会影响到他们在 AI 方面的投入力度和方式。
虽然字节现在有很多产品都在海外,但据他们自己说,这些出海产品背后使用的并不是自家的模型,而是使用了 OpenAI 等其他公司开发的模型。
阿里云的 AI 野心:代理人战争与云服务之争
🚥 Koji
在聊字节的同时,还有另一个非常值得关注的大公司是阿里。他们不仅在投资方面非常激进,自家的千问大模型也很出色。
曼祺,能否请你分享一下关于阿里的观察?特别是在采访中让你印象深刻的一些故事和发现?
👩🏻 程曼祺 从去年 9 月开始,阿里云可以说是焕然一新。在此之前的一年里,阿里经历了「1+6+N」的组织结构调整,云业务也一直在不断调整。但自从去年 9 月吴泳铭开始担任云业务 CEO 后,他确立了一个新方向:「AI 驱动,公共云优先」。这个战略方向非常清晰地概括了阿里云的发展重点。去年 10 月我们采访了阿里云 CTO 周靖人,这篇文章我可以放在 show note 里,是在「晚点」发布的。他很清楚地阐述了阿里云如何看待 AI 这个机会。
阿里云的核心目标是成为新智能时代的计算基础设施提供者。首先是算力层(S 层),主要是大规模 GPU 集群。再往上是模型服务层(MaaS,模型即服务),包括模型搭建工具、调优工具等。他们还在打造社区生态,比如「魔搭」平台,用户可以在上面下载各种模型。
此外还有模型本身,即通义开源系列。这部分无论是行业口碑还是关注度都很高。根据他们披露的数据,到今年 9 月,通义开源系列已经被下载超过 4000 万次,衍生了 5 万多个模型。这个数据在全球仅次于 Meta 的 LLaMA 系列,显示出很强的国际影响力。我觉得阿里云就是想把这个生态体系做好。
🚥 Ronghui
还是挺受关注的,在 X 平台上搜索可以看到很多评论,其中不少来自业内有影响力的 KOL。
👩🏻 程曼祺 然后我们今天早些时候,Koji 不是还总结说这是字节和阿里的代理人战争对吧?就说阿里投了这些公司。我们自己文章里倒是没有用这个词。我看到是阑夕在即刻上发的一个总结里用到了这个词,我觉得挺有意思的。
如果说现在的竞争是代理人战争的话,那我觉得未来这个市场确实可能有一个看点,就是火山云和阿里云之间会不会有一些竞争。
我看到朱亚辉发的朋友圈里也提到了这个,我们那个文章也引了他这条朋友圈。他朋友圈很长,我们可能只引用了他关于字节前面的表现的评价部分。他后面其实写到说他年初的时候跟阿里云的高管聊过,说他觉得字节的大模型 API 是一定会猛干的,而且会想办法让一些厂商必须用他们的 API,这是火山云崛起的关键。然后他说阿里的那个高管不太信,但是他认为这是字节未来会发展的一个方向。
关于阿里云和火山云的情况,其实我去年到今年也有和阿里的一些朋友沟通。我的感受是阿里云还是很自信的。因为 2023 年初的时候,火山云的算力声势一度很火。我不知道你们还有没有印象,他们还开发布会说中国多少大模型公司就是用我们的算力,然后百分之多少的模型是在我们这里训练的。
到今年的话,感觉他的声势就稍微弱了一点。阿里的人的解释是说,2023 年初为什么火山云那会儿特别火?是因为当时字节确实是 GPU 的储备比较多。而且那会儿大家主要就是要买训练用的模型,又要得比较急,所以一下子它这个量起得比较多。不过这个市场再往后发展的话,真正对算力需求的大头其实在推理上。推理对数据中心的数量,包括你的区域分布的广度、稳定性、弹性计算的能力的要求都会多很多。
阿里云的人认为,一旦进入这种正式竞争,火山云不要说跟阿里云比,可能和腾讯和华为都很难比。他们当时觉得自己是最好的,阿里云在基础设施本身的稳定性、工程细节上积累了很多年。而且 o1 这个方向出来之后,大家对这个转变有一个总结,就是说你从 Pre-train 到 Post-train,你是 Inference Scale Law,就是推理阶段的规模扩张,推理阶段的算力需求也会上升。我觉得未来火山云和阿里云之间怎么变化,这会是一个看点。
其他科技巨头的 AI 布局:腾讯、百度的策略
🚥 Koji
其实朱亚辉朋友圈里还说到,他认为字节一定会学 Google 和 Amazon 的路。一方面现在要把厂商的广告费用吃下来,另一方面还会去吃掉他们的云服务费用。所以字节云的市场份额,慢慢地一定会等同于字节的广告市场份额。
除了字节和阿里,你感觉其他大厂还有谁在牌桌上吗?
👩🏻 程曼祺
我觉得腾讯应该算。大家可能认为腾讯想后发制人,他敢为天下后,也能为天下后。他什么时候上牌桌,都能有上牌桌的入场券。因为它确实有超级 APP 在手里,而且有非常多的流量,微信的流量等于是免费的。
我发现你去观察一个产品或公司是否成为基础设施时,一个很有趣的观察点是看用什么方式关联新的注册。
比如说我在海外要注册一个新产品,那我肯定是用我的 Google 账号,所有东西我都可以用 Google 账号去注册登录。在国内的话,包括 Kimi 在内的这些新产品,我基本上都是用微信一键登录。它已经像水和空气一样,是互联网世界的基础设施。
🚥 Ronghui
你的互联网通行证。
👩🏻 程曼祺
对,就是你的互联网通行证。所以我觉得腾讯他算是想上牌桌的时候随时都可以。我甚至想好了之后我们写这个事时可以用一个标题,至少是个小标题,叫「字节捕蝉,腾讯在后」。
🚥 Koji
所以腾讯是螳螂,字节是大象。与此同时你观察到百度在做什么呢?
👩🏻 程曼祺
你们观察到百度在做什么?
🚥 Ronghui
今年百度世界大会的主题叫「应用来了」。李彦宏在接受甲子光年的专访时说,相比超级应用,更重要的是不断赋能数百万超级有用的应用。
👩🏻 程曼祺
我对百度在大模型上的具体进展,今年明显比去年的信息要少很多。我们这个文章里写到一些百度的情况,就是他们在组织上现在确实比较复杂。比如说在百度,训练基础大模型的团队、用技术大模型开发 To C 产品的团队、和用技术大模型提供 To B 方案的团队,是在三个不同的事业群里,而不是三个部门。这样跨部门的协作沟通就会比较麻烦。
所以之前为什么有人传说百度暂停预训练,一个原因是训练团队想要调用更多 GPU 时,可能会遇到资源不太好拿的情况。因为同样的算力,如果放在 To B 业务上可能就会有收入。如果重新投入去训练新模型,由于现在训练模型本身的性能提升可能没有那么明显,这个回报就会变得不确定。
我觉得百度这个公司真的挺神奇的,一方面确实挺技术驱动的,他也有一些很有技术前瞻性的东西。从公开信息来看,在中国的公司里最早做大模型的也是百度,他 2019 年就发布了一个大模型。而且他曾经有很多很厉害的人,比如吴恩达之前也在百度。还有 xAI 最开始那 12 个成员里面有一个叫杨格的,他以前好像也是在百度实习的,包括 Anthropic 的 Dario 他也是在百度实习过一段时间。百度曾经是一个 AI 人才的技术高地,也许跟他投入太早,又很难坚持一个方向有关。但另一方面,我觉得百度今年可能在 AI 领域更受关注的是他 Robotaxi 上的一些进展。
今年 6 月萝卜快跑这个事儿还是非常出圈的,甚至算是上了社会新闻,大家都非常关注。我还专门去看了武汉的市民留言板,挺有意思的。对普通人来说,那个留言板里不管是吐槽还是期待,说「你赶快到我家附近去开一个萝卜快跑的点」,这里面没有任何一个人用「Robotaxi」这个词,这个词可能只在媒体和投资圈才会出现。
比较有趣的是,2023 年底的时候,留言板上有很多消息都是在问「规划里说要在我家附近开一个点,怎么还不开点」,都是在问什么时候开点的。总之是前面的留言都在期待说「你到我这儿来开个点」,后面的留言都是一些吐槽,比如说他怎么阻塞交通了,又或者他怎么霸占着加油站,让居民加不了油。这个现象我觉得也挺有意思。
🚥 Koji
我老家是重庆永川区,永川是在 2021 年百度就开始部署萝卜快跑的一个地方,是仅次于北上广的试点区域。所以我的老乡们很早就体验到了萝卜快跑。我感觉到的口碑在今年 6 月份那个社会新闻发酵之前,真的都还不错,很多人觉得很方便,也在呼吁说「是不是可以赶紧到我家附近来开」。
👩🏻 程曼祺
对我觉得这个倒是他坚持这么多年,好像看到有一点变化的一个东西。
轻装上阵:AI 应用创业者的新机遇
🚥 Koji
我们聊完大厂之后,再来聊一些最近的感受。上周日,「十字路口」在北京办了一场活动,曼祺也来到了现场,我们非常惊讶。这个活动的通知发出去之后,48 小时内报名了 776 人。最后因为活动现场在北京大学校园里的斯坦福中心空间,只能容纳 200 来人,所以我们最终只能接待这么多人。
很多朋友都非常遗憾没能到现场来,但是在现场我确实感受到了巨大的能量。大家都超级热情,让人感觉充满了希望。在现场我观察到,第一是多数人都是做应用的,第二是至少超过三分之一、可能接近一半的人都在做出海的应用。
👩🏻 程曼祺
我去了那个活动的感受是:我们应该多采访 AI 应用创业者,专门做 AI 应用的。这是我觉得我们以后应该多聊的方向。因为我们之前可能是聊大模型公司的人会更多一些。
他们的处境确实很不一样。比如说我在现场遇到的很多人,其实还不是全职创业的阶段。有的人在寻找创业方向,有的人可能还在大公司里,但在兼职做一些事情。所以这完全不同于典型的由 VC 支持的那种「Go big or go home」、「如果不做大就等于死」的创业逻辑。我觉得他们很多人都是没有融资的。我在线上聊了一些人,他们就用自己的钱,或者说产品上线后很快就有现金流、有收入,是用这种方式来运转的。所以我觉得他们是一种轻装上阵的状态。
🚥 Koji
这是今年一个非常大的趋势。首先是 AI 来了之后,超级个体或者很小规模的团队可以做出在过去需要融资 100 万美金才能做的事情,需要的启动资金变少了。第二个变化是,AI 来了之后,大家从第一天就可以收到钱,因为为 AI 产品付费在海外市场是特别天经地义的。第三是,AI 来了之后,中国的创业者更容易做全球市场了。
在过去可能都还有语言的障碍,这里面大家甚至会有一些害怕。但是在今天语言根本就不是问题。而且前面也有很多榜样,就像 Monica 的 肖弘,他说自己的英语虽然四级考过了,但其实非常差,也不妨碍他成为一个在全球做得很优秀的企业。我觉得这些原因加在一起,让今天有更多人选择不融资,用自己 bootstrap 的方式去做应用开发。
🚥 Ronghui
当时看完这个报道,会觉得中国的创业者真是艰难,前有封锁,后有激烈的竞争,而大家都是如此努力的人。我们从小就接受这样的教育,在这样的竞争环境下,我觉得每一个人,不管是大模型还是应用创业者,其实都是在同一件事上选择不同的方向来探索。大家都是希望这个方向能共同发展。
👩🏻 程曼祺
我觉得你很难说谁好谁不好,就是逻辑不一样。比如说这些比较小的团队,他们确实可能会遇到一个问题,就是做了一个产品,这个产品的需求也许就是个一波流。就比如这一两个月特别火,可能之后就没有人用了。它不是一个持续性的事情,不是一个事业,也很有可能是这样的情况。
🚥 Ronghui
而且 AI 应用虽然热火朝天,但也面临着一个问题。大家本来期待 2024 年是 AI 应用爆发年,到年底又有很多声音在说,感觉好像没有爆发似的。
👩🏻 程曼祺
Koji 你觉得什么地方爆发了吗?比如说 AI 编程这种算是一个小小的爆发吗?AI 搜索算吗?
🚥 Koji
我觉得大家对这个事情的预期太高了,好像明天就要出现第二个字节跳动。如果是这样的预期,那注定是要失望的。但是我们自己在一线,不管是做这个博客,还是我们自己做项目,身边的朋友们都在做类似的事情。我感觉到的是非常多雨后春笋般的新事物,很有希望,有非常多新的东西在不断地冒出来,感觉仍然是应接不暇的。
比如说最近我自己就很感慨,像 Recraft,我用完它的交互之后觉得「太牛 x 了」,感觉 Photoshop 突然就像是上个时代的东西了。如果我的小孩要开始用电脑做图像编辑,我从第一天就一定会——不是我教他,可能是他受到整个教育或者他的朋友们影响——从 Recraft 这样的交互开始。这么自然,就符合人类更容易、更轻松地操作图像的习惯。
👩🏻 程曼祺
可以讲一下这个吗?就是它是电脑端用的吗?还是在手机上?
🚥 Koji
它还是在电脑端用的。首先是一张无限画布,可以文生图,也可以针对图片做局部调整。这些功能在早年有 WebUI 或者 ComfyUI 的时候都可以做到,但是这些其实让普通人望而却步,那个学习门槛是最高的。打开 Webui 看到 100 个英文参数,是个人都懵了。但是 Recraft 不但自己模型能力做得好,把交互也做得非常好。我观察到小红书上的网友们也都很轻松就上手了,最后做出来的作品不管是质量还是创造力都非常好。
再说 Cursor,用的第一天就有触电的感觉。我记得那天我们在「十字路口」有一个 Fellowship 每周日的线上会。在那个会上有一个 00 后的泛函,是我们的 Fellow 之一。他说他用了 Cursor 之后,认为从此以后编程的学习门槛不再是编程,而是克服自己的恐惧心理。我听了这句话后真的被打动了。那个会还在进行的过程中,我就下载了 Cursor 开始用,十分钟就写出了第一个 demo——我输入一段随便什么样的自然语言,它就翻译出一段 Emoji 来表达我的这段自然语言。我觉得这些都是很大的变化。
我们之前在「十字路口」有一期内容叫《那些闷声发大财的在海外赚钱的 AI 应用》,我们在那里面列举了十几二十个,这些都是中国人做的。而且做完那一期之后,又有不断的朋友告诉我说:「你们漏掉了这个、漏掉了那个」,漏的越来越多。看到很多是低调的,他们不需要 PR,也没有理由去 PR,因为不融资,也不面向中国的开发者和用户。所以他们就只需要很少的人,都不需要去做 PR 招聘,团队就十几个人。从应用领域来看,像我们办一场活动来了 776 人报名,想上台去分享的、报名开放麦的都有七十多人。我感觉这里面的生态是很繁荣的,很多人在这里看到了机会,甚至已经得到了一些正反馈。
👩🏻 程曼祺
这个挺有意思的。我觉得确实这也是接下来市场里就除了大公司和我们能看到的最头部的又做模型又做应用公司的这些公司之间的变化博弈之外,就应用怎么产生会很有意思。
🚥 Ronghui
颠覆雅虎的不是它的同类,是 Google。后来对 Google 有挑战的也不是搜索引擎,而是 Meta。日后看来,对你最有威胁的竞争对手,都不是在今天能看见的,这才是最可怕的事。
👩🏻 程曼祺
我们今天聊的比较多都是 AI 软件,不管是大模型还是刚才说的一些应用都是软件。其实现在软件和硬件结合,包括做一些新型 AI 硬件的创业尝试也挺多的。
创业者的煎熬与期待:等待也是战争的一部分
🚥 Koji
曼祺做完这个稿子,你对这几家大模型创业公司有什么整体感受吗?
你会觉得大家在努力地找出路,还是说整体有一种强挣的感觉,或者内部的情绪是很悲观的,还是和刚才说的这些相反?
👩🏻 程曼祺
我觉得他们肯定是在努力地寻找出路。至少在创始人这个层面,创始人没有空去悲观。
我觉得比较理想的或者比较典型的创始人画像,他可能会很机警,对危险很敏感。但这个危险带来的更多是你要去行动、要去反应、要去谋划。他可能更多是兴奋感而不是恐惧感。
一直选择去创业,而且选择「我要去做很大的事情」这种创业方向的人,他本身的冒险偏好和成就动机都是比较大的。可以观察一下大家会去找什么样的出路。除了技术和产品之外,肯定有一些公司也想更早地上市。就是在商业上,包括融资渠道上是不是能有一些变化?我觉得大家都会有很多思考和要去尝试的方向。所以这个故事肯定还没有到结束的时候,这对我们这种观察者来说当然是个好消息。可以继续去看未来会发生什么,我也很期待会有不一样的翻转叙事出现。
🚥 Koji
就像晚点稿子里引用了王兴的一句话:「大多数人都以为战争是由拼搏组成的,但其实战争是由等待和煎熬组成的。」虽然王兴现在已经不玩饭否了,但是他曾经在饭否上发过的各种句子,在今天仍然时不时地冒出来。
👩🏻 程曼祺
而且从后台看到的数据显示,这句话是被划线次数最多的,大概被划线了七十多次。他非常犀利和精辟地总结了这个现象。
🚥 Koji
好,我们今天就聊到这里,谢谢曼祺。也希望在大模型这场冒险继续往前时,相信大家还会有很多等待和煎熬。在这个过程中,虽然听起来俗套,但还是希望大家能享受这个过程,因为过程本身即是奖励。
👩🏻 程曼祺
谢谢十字路口的邀请,感谢串台的机会,各位拜拜。
欢迎订阅「十字路口」播客
🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱新变化,新的可能性。
👦🏻 主播 Koji:新世相/躺岛的联合创始人。我相信科技尤其是 AI 会在未来彻底改变社会,赋能人类,欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻[6],Koji 的网站[7]
👧🏻 主播 Ronghui:供职于科技 VC,前《第一财经周刊》驻硅谷记者,Ronghui 的即刻[8]
欢迎加入「十字路口」的会员群
☀️ 第一手的 AI 资讯与洞察
👫🏻 鼓励大家谈恋爱/交朋友/寻找未来的同路人
🦀 添加小助理微信入群:Rwkfbcianvd ,或扫下方二维码
参考资料
程曼祺: https://web.okjike.com/u/362209fd-6e58-4204-8b97-30a009b07b9c
晚点聊 LateTalk: https://www.xiaoyuzhoufm.com/podcast/61933ace1b4320461e91fd55
Monica: monica.im/
Steiner-preview: https://monica.im/help/Changelog/new_in_version_7.2.0
DeepSeek: https://www.deepseek.com/
Koji 的即刻: https://okjk.co/0JSUes
Koji 的网站: https://koji.super.site/
Ronghui 的即刻: https://okjk.co/0cbnYV