中国大模型生存战:巨头围剿,创业难熬

科技   2024-11-29 21:03   北京  

中国的大象真的能跳舞。

作者 |  王与桐 贺乾明 程曼祺

编辑 |  程曼祺 黄俊杰

本文经授权转自《晚点LatePost》(ID:postlate)

“如何能卖掉部分手里的大模型创业公司股份?”

今年10月上旬一场聊天中,数位投了大模型的投资人到场。惬意的音乐中,他们讨论着这个不算轻松的话题。

而整个投资市场,大半年前还在为争抢份额头疼。当时有一位投资人告诉我们,没有拿到份额的机构 “没资格谈选择”,而他拿到了所有 “第一波大模型” 公司的投资机会,并投到了他认为最好的一家。

现在,悲观的心态在投资人中蔓延:大模型赛道,创业公司可能很难打赢大厂——他们高估了增长拐点到来的速度,也低估了中国大公司的决心与行动力。

一位大厂高层给出判断,做大模型,“一年低消也要20亿-30亿美元”,这超出任何一家中国大模型六小龙的总融资额。

当游戏变成需要持久烧钱的拉锯战,天平开始倾倒。

创业公司与大公司间的攻守易位,发生在不到12个月之间。


01.
中国的大象,真的能跳舞


“去年字节的AI战略是不及格,但完全不影响今年的满分表现。” 昆仑万维创始人周亚辉今天在社交媒体上说,“这符合我对这个组织快速迭代能力(卷死人能力)的预期。”

不到12个月里,字节跳动在大模型上后来居上。
相比2023年3月率先发布大语言模型的百度,和2020年就研发多模态大模型的阿里,向来看重AI的字节并没有跟上大模型的第一声发令枪。
一位字节人士去年曾告诉我们,在ChatGPT横空出世前,字节更看重AI for Science,“押错了宝”。那之前,约有100多人的字节AI Lab NLP(自然语言处理)组里,只有不到10人在研究大语言模型。
长期观察中国 AI 发展的一位研究人员当时也告诉我们,相比其他大公司,字节去年做大语言模型 “相当于是从零开始”。他推测,字节很有可能收购一家公司,但头部的创业公司里,没一家愿意卖。
字节大模型研发负责人朱文佳,去年四季度OKR的首要目标还是 “让语言模型整体效果达到GPT-3.5”。当时百度和一批头部大模型创业公司的进度已来到追赶GPT-4。
而今年夏天之后,字节大模型口碑迅速翻转,其产品数据和影响力也今非昔比。
据数据分析机构QuestMobile,字节豆包App今年9月的日活已达760万,成为中国日活最大的AI产品;同为生产力场景的Kimi智能助手(Kimi手机版),同期日活则在130多万。
一位接近豆包的人士称,只要字节想投放,“豆包日活很快就能破千万”。来到10月,豆包的日活已达945万。
而去年11月,第一还是百度文心一言,当时豆包日活不到130万,比文心少几十万。
从生产力到娱乐陪伴,从对话产品到Agent工具再到文生图,字节陆续推出了十几个AI应用,饱和式地覆盖了几乎所有主要AI产品方向。
字节还做了AI硬件——在今年10月推出能与豆包语音对话的Ola Friend耳机,近期还在研发AI眼镜。
投流竞争也不是字节的困扰,而是它相对创业公司的优势。字节每年的利润有数百亿美元,比六小龙加起来的融资总额还多几倍。
同期,一批创业公司进入调整期。我们了解到,今年下半年,至少5家大模型创业公司出现人员调整:
  • 智谱AI高峰期有1000多人,今年一度缩减上百人,不少交付、销售人员离开;
  • 零一万物调整了数十人的团队,集中在产品和运营部门;
  • MiniMax 的商业化和部分产品运营团队总计减员约50人;
  • 月之暗面则因收缩海外业务,减少10余位员工;
  • 百川智能也减员约20人,主要调整了C端产品人员。
智谱和零一万物回复称,调整业务后,他们也在持续招人,总人数稳定。百川回复称 “我们没有任何裁员”。
一些技术人才也从创业阵营转向巨头:如字节今年就招募了零一万物原预训练负责人黄文灏,和智谱 AI 的一名资深研究员……还有许多人未浮出水面,字节大模型团队里用花名的人越来越多。
曾经每个月都有的大模型融资消息,也有近半年不再出现。
一位投资人感叹:“一般来说,新技术出现时,创业公司的逻辑是用更少的资源、更小的团队,依靠更领先的技术洞察,使产品或服务先一步爆发,以对抗大公司的资源优势,让巨头陷入所谓‘创新者的窘境’。”
可惜,一个变量的存在——字节跳动,“它这么有资源,又这么努力”,创业公司很难像商学院教材里写的那样 “以灵活与敏捷应战大公司的缓慢”。
中国的大象真的能跳舞。‍‍‍

02.
去年冬天,
阿里、字节射出反方向子弹


共同造就如今创业公司过山车轨迹的,是同时酝酿于去年冬天的两种大厂策略。

经历了2023年2月王慧文自掏5000万美元启动 “光年之外”,到一批新公司涌现,再到光年之外突然被美团收购,AI大模型的融资水温本已由热转凉。
一位去年跟踪了4家大模型公司的投资人,曾 “辛辛苦苦要到了”六小龙中某一家的份额,而到下半年,他认为大模型已没有机会:“年初时我见这些founder,他们还说一年就能追上美国。到年底,大家发现钱不容易拿到,人也挖不来。”
此时,阿里的激进投资,一举扭转了市场情绪。
去年底,阿里开始密切接触当时大模型公司中排位相对靠后的月之暗面。当时经过两轮融资,估值来到8亿美元的月之暗面已寻求新融资数月。
原本的交易方案不足为奇:以投前9亿美元获得约1亿美元融资,潜在领投方是小红书。如果成功,月之暗面会成为中国第5家估值超10亿美元的大模型独角兽。
而年底入局的阿里却提出,将投前估值抬到15亿美元,小红书此后放弃了领投。
这笔交易最终在2024年春节前谈定,阿里大手笔投资月之暗面近8亿美元,持股比例约40%,月之暗面投后估值来到23.4亿美元,与之前的第一,MiniMax相当。
这符合阿里云的战略:做智能算力供应商。类似微软与OpenAI的组合,阿里用算力加现金,投资了一批大模型公司。
也是在去年冬天,阿里开始接触MiniMax,并在今年初投资了约6亿美元。
阿里的出手,改变了创业公司的身位,带来了弹药,也带来了比钱和算力更莫测难求的势能。
从今年2月8亿美元融资曝光,到3月Kimi获得300%的用户增速,发布200万上下文的长文本新功能,今年上半年,月之暗面一直处于口碑与影响力的上升通道。
被刺激起FOMO(害怕错过)情绪的投资机构,也继续贡献着融资。阿里之后,又有源码、高榕等机构投了月之暗面。
当日历翻过年中,小阳春里的热情很快被巨头的阴影所笼罩。而字节快速包抄的种子,也萌芽于去年冬天。
当时,一位投资人像往常那样循着AI论文去拜访作者,他惊讶地发现:不少人刚和字节创始人张一鸣一对一聊过,这其中还有尚未毕业的博士生。
他马上和自己投资的一位大模型创始人说:“这是个危险的信号。”
“这说明字节变了。” 这位投资人认为,那之前,字节的大模型研发主要由朱文佳、李航(AI lab负责人)等人负责,“他们的精力分配,他们能不能跟上最前沿的技术,都让人怀疑。”
危险的信号在今年逐渐变成危险的事实。
字节的AI技术骨干持续增加,包括今年2月加入的Google原VideoPoet项目负责人蒋路,8月加入的零一万物黄文灏,和阿里通义大模型原技术负责人周畅。
一位接近此事的人士说,当黄文灏提出离职,称要 “奔赴AGI梦想”,并讲了字节开的条件时,“他们都不好意思挽留。”
几位之前就认识周畅,听说他离职后想创业的投资人也告诉我们,当时 “根本约不上”“发消息不回”。
这很可能是因为,字节的行动比投资人更快。一位接近周畅的人士告诉我们,字节高层也一对一和周畅聊过,并表达了追求顶尖AI技术的决心,这更符合周畅的技术抱负。
一些阿里研发人员曾向我们表达共同的困惑:通义做得很好,为何要用这么多钱和算力支持外面的团队?
同时,字节也在整合内部力量,快速完善AI新部门——Flow。
我们了解到,Flow现在已是和抖音、火山、飞书等平级的主要业务部门。
有数位字节人士告诉我们,如果Flow特别想调哪个人,原部门一般会同意。一些分散在字节各部门的产品也在向Flow汇聚,如猫箱原属抖音BG,盒马爱学原属字节教育。
广义的Flow大部门现在有3部分:AI产品团队Flow,大模型研发团队Seed,和产品研发支持团队Stone。
Flow部门的总负责人为朱骏,他同时是豆包产品的总负责人。
留着一头长发的朱骏今年45岁,他在字节面对面活动里曾说,自己曾为感受世界而去酒吧驻唱。他联合创立的Musical.ly在2017年被字节收购,成为抖音产品形态的基础之一。朱骏加入字节后,负责过战略投资、TikTok、产品和战略等。
与朱骏搭档的Seed负责人是朱文佳,此前是TikTok产品技术负责人。2015年,朱文佳从百度加入当时刚成立3年的字节,是把深度学习应用到今日头条上的第一批技术骨干。
朱文佳之下,字节有4个主要模型研发方向,分别是:朱文佳百度时期的同事、字节原搜索技术负责人乔木带队的大语言模型,字节智能创作团队负责人杨建朝带队的视觉模型(蒋路即在杨建朝团队),以及王雨轩带队的语音模型。
新近加入的周畅则将探索一个更前沿的方向——世界模型。“接触过他的人都觉得他很有技术野心。” 一位字节人士说。
Stone则于今年下半年从Flow产品团队中拆分,向字节工程技术负责人洪定坤汇报。这让朱骏可以更专注于产品的洞察、设计和运营。
将近10个月前,周亚辉曾在社交媒体上评价:“这波AI中,字节AI战略也就40分,还是靠了家底厚……当然以一鸣同学天才般的智力和悟性,Hands on估计不出3月,就会从40变80甚至90分。”
那时周亚辉预言:“字节的业务战略 vs 阿里的资本战略对决会是一大看点。”
现在,两种策略确实开始交锋。收束思路、整备团队后,字节的射程逐渐覆盖一批创业公司。
而创业公司们,也只能带着从阿里那里获得的资金和算力,投入这场艰难的战争。

03.
不要正面竞争,然后呢?


创业的一条道理是:不要与大公司正面竞争,尤其是不要在大公司的强项上竞争。

目前大模型创业的两难是,to C AI产品仍跳不出移动互联网生态,而字节、腾讯等公司在这里积累已久。
其中,大公司最擅长,创业公司也绕不开的一个环节就是投放和流量获取。
第一波投放战争起于今年3月。Kimi智能助手在 “拉一个用户要20-30元” 的传闻中实现了300%的增速,成为话题中心。
后来杨植麟告诉我们,其实Kimi只有30%的增长来自投放,而且称 “我们肯定不是投放最多的”。
关于投放上到底花了多少钱,各公司面对第三方数据,标准回复是 “不准确”“没这么多”。相对可监测的数据是投放素材量和用户情况。
据广告营销数据平台DataEye,Kimi智能助手10月的投放素材超18万条,是豆包的4倍多。但目前,豆包的日活和月活都更胜一筹,据QuestMobile,豆包App 9月月活为4200多万,Kimi智能助手为1000万出头。
在投放上,字节的可怕之处在于不只有钱,还有效率。
字节掌握了中国最大的聚合广告投放平台“穿山甲”,同时有抖音等流量巨大的超级App。
从今年4月起,抖音App就不再接受其它AI产品的投放。同时,豆包作为字节系产品,在抖音投放时很可能有折扣。当年字节大力做教育产品时,就有类似的操作。
“现在创业公司一上来也得去字节买流量,这是最尴尬的。” 一位投资人说。
投放和流量,只是字节等大公司在移动产品生态里的强项之一。他们过去还积累了产品设计、留存转化和商业化策略等App生产链条里的诸多能力。
据QuestMobile数据,今年9月,豆包App的30日留存率 [1] 达到34.5%,而Kimi智能助手和MiniMax的海螺AI都是约 28%。
一位月之暗面人士告诉我们,他们在9月逐一列出了豆包有,而Kimi没有的功能点,开始仔细分析去年还不被视为对手的豆包。
大公司也在更强势地争取大模型API客户。
AI儿童玩具公司Haivivi CEO李勇告诉我们,此前他们一直用MiniMax的语音模型,而当其产品在抖音热卖后,字节联系到他们,称可提供优惠价的豆包大模型API ,还承诺升级抖音店铺。李勇说,现在Haivivi会同时调用MiniMax和豆包的语音模型。
几乎投了所有头部大模型公司的阿里,也是创业公司的API和To B业务潜在对手。
阿里是中国最积极做开源大模型的公司。到今年9月,其Qwen系列开源大模型的总下载量已超4000万次,衍生出了5万个大模型,仅次于Meta的Llama系列。
这可能会让本想购买创业公司大模型API,或让创业公司定制模型的客户转而投向开源生态。
我们了解到,去年为大客户定制一个大模型,最高订单额可达1000万元,而今年则快速降到了百万元级别,乃至更低。
在更底层的模型研发上,字节也展现出 “饱和” 进攻的姿态。
视频生成模型是一个缩影。据了解,月之暗面从去年10月就开始做视频模型,起步很早;而在去年四季度朱文佳的OKR中,尚看不到视频模型的相关描述。
到今年9月,字节已发布了2个视频生成大模型——PixelDance和Seaweed,前者来自AI Lab,后者来自 Seed。字节尚未发布的类似探索还有更多。
而MiniMax视频模型团队只有约10人,月之暗面的视频模型团队也是相似规模。MiniMax在今年8月底发布了视频生成模型,月之暗面则至今还没发布。
投资人也逐渐认清现实:模型能持续比字节好,比开源的也好,而且好得很明显,这很难,最终要赢在产品。
创业公司可能的出路是:找大厂看不上的、小众的产品方向,或愿意干脏活、累活。
Kimi和豆包激烈交战的生产力方向,普遍被认为价值高、智能含量高。而在类Character.ai的陪伴和虚拟社交产品上,巨头暂时没拿出那么多火力。
据了解,Flow旗下的“猫箱”,目前日活在65万左右,字节另有一款类似产品“小黄蕉”,已被放弃。而MiniMax 的 Talkie加星野的总日活则约有500万。
其中,据QuestMobile数据,星野9月日活为94万,30日留存率达到60%,超过猫箱的44.8%。
另一条路是等待。
美团创始人王兴曾说:大多数人以为战争由拼搏组成,其实战争是由等待和煎熬组成。
一位投资人认为,现在大公司正处在 “上头” 期,但 “一旦一件事干了几年还拿不到结果”,内部张力会涌现,尤其是组织上的拉扯。这时如果创业公司还在场,可能有机会。
百度已出现了类似的张力。
在百度,训练基础大模型、开发to C大模型产品和提供to B大模型方案,分属三个事业群。一位百度人士说,到今年中,当百度模型训练团队希望调动更多算力,训更强的大模型时,会遭遇GPU不够用的情况,需要集团高层出面协调——同样是GPU,放在to B业务,马上就有收入,而训练新模型,回报则不明确。
在字节,我们了解到,一些一线员工并不想转岗去Flow,因为这是个变动不居、正在 “跑马圈地” 的部门。
也有字节员工认为豆包是 “ ICU产品”——离开投放的插管就活不下去。
近期,字节在与创业公司竞争一位人才时,未能获胜。我们了解到,华为诺亚方舟的一位AI研究员已加入月之暗面,将带领团队探索类似OpenAI o1的大模型技术。他也曾接到字节邀请,但选了创业公司。
不过,中国掌握极强产品能力和流量资源的不止字节。微信还没出手呢。

04.
半熟的技术,半新的战场


“大模型这么嗨,我也没觉得怎么样,如果不建立自己的商业闭环,只是把悲剧又加速重演一遍。”

一位AI计算机视觉公司创始人今年3月对我们说。当时,多个大模型创业公司的估值已突破100亿人民币。
就像如今情形的一场预演,当计算机视觉的商业化场景转向安防后,战争不再发生于创业者之间。真正的威胁来自成立了十几年的安防行业巨头海康。
创业公司高薪招博士、发论文,更懂AI视觉识别,但要从头学习研发硬件产品、搭建营销体系。海康每年卖出数百亿元硬件产品,有完善的供应链和销售体系,对安防需求有长期洞察,但需要引入AI技术。
在这位创业者看来,大模型时代只不过是换了一批创业公司,对手从海康威视换成了资源更多、决心明确的BAT和字节。
上一次,创业公司都没有赢。
所有依靠新技术的创业,都是在和大公司赛跑——看创业团队先补上完整的商业化体系,还是大公司先学会新技术。
这一竞赛的结果,取决于新技术能在多大程度上颠覆原有体验,新技术的进入门槛有多高、赛道有多长。
大模型确实比驱动上一波AI热潮的人脸识别等技术有更高的资源门槛,从头训练大模型也是一个更综合、复杂的技术工作,涉及GPU调用、模型架构设计、数据处理、调优等多个环节。复杂度远超AI视觉。
技术门槛之外,创业公司和大公司间的竞赛结果,也取决于新技术是否能找到新生态:这里应该有新的供应链、新的硬件载体、新的渠道和新的需求与用户来源。它们尚未被大公司深度染指。
一位投资人类比了大模型和移动互联网浪潮:移动互联网是新软件、新硬件同时出现,从电脑到手机,带来了App的强劲自然增长,当时的流量成本也低得多。
“现在是新软件有了,还没有新硬件。” 他指在智能手机后,尚没有出现规模足够大、能承载足够多应用的硬件载体。
但实际上,大模型产品现在的软件也还是 “半新状态”:由大模型支撑的很多产品,仍是一个个App,模型能力是提升体验的最重要动力,但需求洞察、功能设计,流量和用户获取依然重要。
这是一个半熟的技术遇上半新的市场的故事。
尚未成熟的技术,是创业者的机会所在:如果大模型能力还能持续进化,前瞻的技术判断和跟随能力,也许有四两拨千斤的效果。
半新的市场,则是大公司的砝码:如果大模型能力提升短期遇阻,应用开发和产品表现会更依赖现有移动互联网基础设施,这就是一个烧钱、拼资源的游戏。
2001年,成立3年的Google刚成为雅虎搜索引擎供应商,当时的CEO埃里克·施密特(Eric Schmidt)在劝桑德伯格加入公司时说:“如果你得到了坐上火箭的机会,别管是什么位置,上去就行。”
现在,去年怀着雄心挤上大模型火箭的人,都不得不调整姿态,适应新的现实。
他们接下来的选择和动作,将不仅关系位置好坏,也关系着公司的生死去留。
题图来源:《星球大战外传:侠盗一号》


GenAICon 2024上海站预告


12月5-6日,智东西联合主办的2024中国生成式AI大会(上海站)将举办。主会场将进行大模型峰会、AI Infra峰会,分会场将进行端侧生成式AI、AI视频生成和具身智能三场技术研讨会。50+位重磅嘉宾将参与主题演讲、高端对话和圆桌Panel。完整议程已公布,上下滑动了解报名⬇️



智东西
智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。
 最新文章