聊一聊大模型六小虎公司，目前的生存现状

文摘 2024-10-30 08:00 浙江

近期文章回顾（更多热门文章请关注公众号与知乎Rocky Ding哦）

写在前面

WeThinkIn最新福利放送：大家只需关注WeThinkIn公众号，后台回复“简历资源”，即可获取包含Rocky独家简历模版在内的60套精选的简历模板资源，希望能给大家在AIGC时代带来帮助。

AIGC时代的《三年面试五年模拟》算法工程师求职面试秘籍（持续更新）独家资源：https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main

Rocky最新发布Stable Diffusion 3和FLUX.1系列模型的深入浅出全维度解析文章（持续更新），点击链接直达干货知识：https://zhuanlan.zhihu.com/p/684068402

以下文章来源于微信公众号：NewBeeNLP

作者：NewBeeNLP

链接：https://mp.weixin.qq.com/s/nEPMiA8zlJKIKTioJxu8_Q

本文仅用于学术分享，如有侵权，请联系后台作删文处理

导读

生成式AI创业迎来新一轮热潮，国内涌现出智谱AI等“六小虎”领跑者。OpenAI和国内大模型厂商们的未来走向，将成为AI领域的关键悬念。本文将带您走近这场全球大模型创业竞赛的最新动态。

ChatGPT横空出世，打响了生成式AI创业热潮的发令枪。

在国内，智谱AI、百川智能、零一万物、月之暗面、Minimax率先领跑。今年6月，前微软全球副总裁姜大昕创办的阶跃星辰，开始受到资本的青睐，一轮20亿美元的融资，将其送上了第一梯队的牌桌。

自此，大模型创企的“六小虎”的格局形成。

从新年伊始，AI应用层的井喷被预告为今年AI领域的最强看点。

3月份，Kimi200万字长文本横空出世，率先出圈。此后大模型厂商开启了激烈的用户争夺战，用铺天盖地的投放轰炸目标用户的心智，越来越多的人开始了解AI工具，使用AI工具。

同时，今年的融资情况也异常顺利。纵观大模型“六小虎”，每位玩家都在今年取得了亿元以上的融资进展。

然而，我们也无法忽视大模型能力的增长正陷入普遍的停滞。

今天，距离OpenAI发布GPT-4已经足足过去了一年又六个月。新一代模型的发布就像“狼来了”的故事，AI社区普遍对奥特曼的谜语和炒作开始感到疲倦。

而作为AI创业的领头羊，OpenAI的商业化探索都依然迷茫。在ChatGPT增长呈现饱和后，OpenAI开始通过一系列开发工具的发布向B端发力，但收收支来看，仍然需要大笔的融资入账才能“续命”。

观之国内，大模型厂商们是否遇到了同样的困境？2024年已经过半，“六小虎”们过得还好吗？

模型能力增长放缓，

各家如何开卷产品差异化？

很多人期待GPT-5的发布能使模型能力再跃上一个台阶。

从目前的确切消息来看，OpenAI即将在秋季发布模型“草莓”，爆料称该模型特别擅长解决复杂的数学问题和编程问题，其生成的合成数据，正用于训练传说中的“下一代模型”猎户座。因此，“草莓”更像是针对特定领域的补丁，无法对其通用能力的提升抱有太多期待。

领跑者都在放慢脚步，模型能力的增长乏力有目共睹，追随者正渐渐跟上来，差距不断缩小。

放眼大模型“六小虎”，今年年中推出的新模型们纷纷“追平”了GPT-4。5月份，百川智能和零一万物前后脚发布的模型Yi-Large和Baichuan 4都在对标之余，实现了某几项能力的超越。同个月内，OpenAI展示了GPT-4o令人惊讶的“Her”功能，又掀起了大模型厂商对多模态能力的一轮追逐。7月，阶跃星辰发布了Step-1.5V多模态大模型，到了8月底，智谱发布的GLM-4-Plus已经持平GPT-4o，甚至抢先开始进行Her视频通话功能的内测上线。

模型能力卷不动的大前提下，怎么用AI能力、给谁用AI能力变成了极为重要的商业抉择。杨植麟和他的月之暗面坚定的选择了To C这条路，3月份Kimi打出的“长文本”功能带来了极大的关注，此后月活量在一众国产chatbot中居高不下，此后又率先推出了浏览器插件进一步争夺流量入口。

相较月之暗面的all in Kimi，MiniMax和阶跃星辰在C端产品的布局更相似，两者都推出了主打生产力工具的产品（海螺AI、跃问），又推出了一款AI陪伴产品（星野、冒泡鸭）。

以最近月活表现大好（据AI产品榜统计，8月的月活跃率长达7天）的星野为例，如果以AI陪伴功能来评判星野，其独特的玩法和用户共创的各种角色使得其成为一款完成度很高的产品。MiniMax的创始人闫俊杰，却不认为星野是中国版的Character.AI，他说“（星野的）底层设计不是陪伴用户聊天，而是一个内容社区。”从这里判断，闫俊杰的野心是希望该产品最终形成小红书、B站等APP的社区形态，虽然目前距离这一目标尚且遥远。

同样注重To C的还有零一万物，创始人李开复不看好AI产品在B端的市场推广，提出“零一万物要坚决地做to C，坚决不做赔钱的to B”。与前面三个“小虎”不同，零一万物选择了出海，推出了生产力工具PopAi。如果按照李开复的C端路线图来走，零一下一个阶段应该会尝试推出AI-first的娱乐、音乐、游戏等方向的应用。

综合来看，C端能成为AI时代Super App的形态还没有被挖掘出来。差异化仍然没有逃脱出“雕花”的范围，给人一种“草色遥看近却无”的迷离之感。

相对的，智谱AI和百川智能把更多的精力投入到To B赛道。智谱看好B端用户的付费意愿，也认为公司的基因适合做To B, CEO张鹏曾坦言：“我们推C端产品的目的是为了向B端用户展示能力”。值得一提的是，这家清华系出身的企业，现在客户总数已超过1000家，多次中标大型企事业单位的合作，这可能成为智谱最坚实的壁垒。

同样选择To B，王小川对医疗行业的浓厚兴趣，使得百川智能似乎是唯一一个有专攻领域的“小虎”。王小川曾说，““医疗是大模型皇冠上的明珠”。从此出发，百川智能也与许多医疗机构达成了合作，最新的进展是8月底宣布将与北京儿童医院推出儿童健康大模型。

当然，大模型“六小虎”虽然在To B和To C的选择上有所侧重，但并未完全放弃对另一条路的探索。例如百川智能姗姗来迟的chatbot“百小应”。

大模型厂商想卷出产品上的差异化，却卷得不够明白。

加之AI应用在大众层面的渗透率还不够高，谁能抢先触达到用户就变成了模型间竞争的一个关键。大模型厂商在线上线下纷纷铺开营销，其争夺用户和流量的强度有着愈演愈烈的趋势——烧钱，烧更多的钱。

烧钱的游戏还在持续，

但资本只垂青强者

当杨植麟在采访中被问到“如果你今天拿到的钱是最后一笔钱，你会怎么花这笔钱？”，他坦诚地回答：“ 我希望这个永远不会发生，因为我们未来还需要很多钱。 ”

杨植麟所言非虚，今年上半年，AI“六小虎”开启了激烈的用户争夺大战，一度达到了“百家投流”的局面。以月之暗面为例，3月起Kimi在B站开启了持续的轰炸式投放，涌入的新增用户让月之暗面尝到了甜头。

根据媒体报道，月之暗面对于Kimi PC端的新增用户报价在38-40元范围内，从此推算，Kimi通过B站投流获得一位新增用户，起码要支付30元——这是一个让其他创业公司都望而却步的价格。

上图：Kimi在B站的投放

B站用户相对年轻、乐于尝试的特点，让其成为大模型广告投放的绝佳场域。此外，也不乏有大模型厂商尝试线下渠道，例如智谱清言就在地铁铺放了“更懂打工人的AI助手”海报，通过结合一系列办公痛点，力图精准击中挤在早晚高峰的职场白领。

此番投流的效果显著，根据报道，AI五小龙（未统计入阶跃星辰）产品的总访问量，在6个月内暴涨了963%。然而，这波高调的投放并未瞄准直接的商业化回报，只是为抢在对手之前获得更多的早期用户。

不过，相比更为烧钱的研发支出来说，这些营销费用可能只是毛毛雨。从OpenAI的数据来看，外媒爆料这家AI模型领头羊每年支出85亿美元，包括40亿的算力成本、30亿的训练和数据成本以及15亿元的人力成本。手握全球最成功的C端AI应用ChatGPT，OpenAI在年收入到达35亿的情况下，还得亏损50亿美元左右。

可想而知，国内的情况也并不乐观，李开复曾透露，“零一万物今年 ToC 单一产品收入达 1 亿元人民币，ROI 在 1 左右。所以这样的结果至少从国内大模型公司来看是非常有优势的。”考虑到海内外用户付费意识的差距，“六小虎”距离收支平衡还有很远、很难的路要走。

因此，对于包括OpenAI在内的大模型厂商来说，没有真正的安全——一旦融资不顺利，失去的可能就是最后的“救命钱”。

不过，今年“六小虎”的融资情况还算乐观，场上的所有玩家都拿到了亿元以上的融资。从近两个月来看，资本对AI创企的热情依然高涨。7月底，百川智能完成A轮融资，总融资金额达50亿元，并将在接下来以200亿元（人民币）估值开启 B 轮融资。8月初，零一万物又拿到了数亿美元的新一轮融资。更不用说月之暗面，在阿里占股四成的情况下，还罕见地拿到了腾讯的参投，这轮融资后其估值也来到了33亿美元的新高点。

此外，如果全球投资数据也展现了对人工智能的偏好，根据智库CB Insights的报告，虽然全球风投交易整体处于低迷状态，但人工智能却逆势上涨，仅2024第二季度，AI初创就获得了183亿美元的融资总额，占全球VC融资总额的28%。

值得注意的是，在这183亿元中，马斯克的 xAI 公司就占到 60 亿美元，约为总金额的三分之一。考虑到xAI在特斯拉公司获得的数据和人才，以及在X平台上获取实时数据的独特优势，很难将其当做一家纯粹的初创公司看待。

报告给出的结论是，投资者对那些已有成熟技术生态系统的企业情有独钟，资本会对更少的公司进行更大规模的投资，而不是扶持那些排行榜位次靠后的小企业。

朱啸虎的观点则更加激进，在近期接受界面新闻采访时直说，独立大模型公司活不下来：“我上次发朋友圈说（5年内就没有独立的大模型公司）的时候，就有很多国内知名投资人在下面说5年都太长了，可能3年就没有独立的大模型公司了。确实是这样的，接下来融资都很难。 ”

融资难，却并不代表不能成。OpenAI新一轮数亿美元的“续命”融资即将到位，对标其1000 亿美元的身价，国内大模型“六小虎”的估值上升空间还很大。

提到对标OpenAI，有一件有趣的事情：国内大模型厂商也开始布局对AI创企的投资了。今年1月份，智谱AI曾公布将联合生态伙伴正式推出AGI生态基金“Z 基金”，基金总额达到10亿元人民币，截至目前，其投资的公司已达10余家。同时，月之暗面也似乎有投资动作，该公司创始成员汪箴拥有投资机构的从业经历，知情人士透露曾就其产品接洽过月之暗面的投资部门。

大模型厂商的“不务正业”，是一种“既要又要”的野心，也是迫于AI生态链不完善的一种无奈。

从人事变动看增长停滞：

裁员、出走与内斗大戏

最近，小红书上的AI博主@橘子汽水铺爆料称，“大模型六小虎的情况，略显悲观”。这篇帖子及后续内容透露了大模型头部厂商“裁员”“锁HC”“团队出走”“内斗”等一系列人事变动的爆料。

虽然这些逸闻的真实性有待考证，但我们能捕捉到这场动荡的蛛丝马迹。

8月底，零一万物的算法副总裁黄文灏被证实已加盟字节的大模型团队，负责技术项目管理和规划。紧接着，另一位公司的核心成员李先刚也被爆出走，选择返回“老东家”贝壳任职，他曾任过零一万物的法定代表人。

核心成员的频繁变动，揭开了AI企业内部动荡的冰山一角。但从招聘平台上看，智谱AI、百川智能、Minimax、阶跃星辰都还有大量的岗位放出，其中不乏薪酬待遇优厚的技术岗位。

看起来，大模型厂商并未放弃团队扩张的计划。

AGI的等待：冲刺上市，旷日持久

大模型“六小虎”的路绝不是一帆风顺。

时间拨回到23年，美团联合创始人王慧文在创建光年之外时，提出过“双轮驱动”的设想。虽然光年之外由于种种原因退出了大模型的竞技场，但不少AI创企延续了这个思路的探索。

但是，在整理此篇文章的时候，越来越直观地感受到：模型能力增长与商业化探索，这两条路皆阻碍重重。站在这个角度，也许更能理解王慧文当时所感受到的压力和焦灼，最终光年之外以被美团收购草草离场。

依照朱啸虎的看法，这或许是一家独立大模型的最好结局。

从硅谷的先例来看，微软花费40亿，“吞掉”了初创企业Inflection AI，带走了其联合创始人Mustafa Suleyman和Karén Simonyan，以及“大多数员工”。时隔不久，谷歌又如法炮制，支付数十亿美元，吸纳了独角兽Character.AI联合创始人Noam Shazeer和Daniel De Freitas，以及约30名研发人员。

于是朱啸虎提出了一个扎心的问题：“好的结果就是卖给大厂。但是在国内来说，你到底有没有一些额外的人才是大厂没有的？这是每个投资人都要思考的问题，大厂会不会为了这些人才花这么多钱去并购？ ”

不过，答案没有那么绝对。

根据外媒The Information推测，IPO或将成为OpenAI的出路。上市可以为OpenAI提供大量的、源源不断的资金支持，提高品牌知名度。此前，OpenAI在聘请Sarah Friar担任首席财务官时，外界就对其上市动向有所猜测，这位信任CFO曾帮助支付公司 Square、社交网络Nextdoor完成上市安排。

此前的爆料透露，“六小虎”已经有公司在冲刺上市了。而零一万物的李开复也早有这个想法，他曾分享说，一年前，他就跟投资人自愿主动承诺：10年内自己不会套现。他说：“我认为套现最好的方式是赶快上市，这是我们未来努力的方向。”

这场努力可能旷日持久。AGI带着改变世界的宏大愿景，其实现必然不可能一蹴而就。对于AI技术来说，负面的声音可能会在漫长的瓶颈期中一直持续。

但是，抱有一丝乐观又何妨？2013年，斯派克·琼斯执导的电影《Her》上映了，谁能设想仅仅十余年之后，我们就将遇见自己的萨曼莎呢？

参考链接：

1.https://www.cluebenchmarks.com/superclue_2404

2.https://finance.sina.com.cn/roll/2024-07-06/doc-inccevzf3094386.shtml

3.https://36kr.com/p/2677672437708552

4.https://new.qq.com/rain/a/20240815A06W4V00?suid=&media_id=

5.https://new.qq.com/rain/a/20240513A07HQR00

总结

在本研究中，我们引入了EfficientQAT，它在内存使用和训练时间上均提高了量化感知训练（QAT）的效率。经过全面测试，EfficientQAT在多样性和性能方面超越了现有的后训练量化（PTQ）、量化感知训练（QAT）以及量化参数高效微调（Q-PEFT）方法，适用于不同模型和量化级别。此外，EfficientQAT利用标准均匀量化，这简化了使用现有工具箱进行部署的过程。

Reference

[1] Extreme Compression of Large Language Models via Additive Quantization

[2] QuIP#: Even Better LLM Quantization with Hadamard Incoherence and Lattice Codebooks

[3] LLM Inference Unveiled: Survey and Roofline Model Insights

[4] The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

[4] OmniQuant: Omnidirectionally Calibrated Quantization for Large Language Models

[5] BRECQ: Pushing the Limit of Post-Training Quantization by Block Reconstruction

[6] Up or down? adaptive rounding for post-training quantization.

[7] Optimize weight rounding via signed gradient descent for the quantization of llms

[8] How Good Are Low-bit Quantized LLAMA3 Models? An Empirical Study

[9] QLORA: Efficient Finetuning of Quantized LLMs

推荐阅读

1、加入AIGCmagic社区知识星球

AIGCmagic社区知识星球不同于市面上其他的AI知识星球，AIGCmagic社区知识星球是国内首个以AIGC全栈技术与商业变现为主线的学习交流平台，涉及AI绘画、AI视频、大模型、AI多模态、数字人、全行业AIGC赋能等50+应用方向，内部包含海量学习资源、专业问答、前沿资讯、内推招聘、AI课程、AIGC模型、AIGC数据集和源码等。

那该如何加入星球呢？很简单，我们只需要扫下方的二维码即可。知识星球原价：299元/年，前200名限量活动价，终身优惠只需199元/年。大家只需要扫描下面的星球优惠卷即可享受初始居民的最大优惠：

2、《三年面试五年模拟》算法工程师面试秘籍

《三年面试五年模拟》面试秘籍旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试方法，力求让读者在获得心仪offer的同时，增强技术基本面。

Rocky已经将《三年面试五年模拟》面试秘籍的完整版构建在Github上：https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main，欢迎大家star！

想要一起进行项目共建的朋友，欢迎点击链接加入项目团队：《三年面试五年模拟》版本更新白皮书，迎接AIGC时代

3、Sora等AI视频大模型的核心原理，核心基础知识，网络结构，经典应用场景，从0到1搭建使用AI视频大模型，从0到1训练自己的AI视频大模型，AI视频大模型性能测评，AI视频领域未来发展等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

Sora等AI视频大模型文章地址：https://zhuanlan.zhihu.com/p/706722494

4、Stable Diffusion 3和FLUX.1核心原理，核心基础知识，网络结构，从0到1搭建使用Stable Diffusion 3和FLUX.1进行AI绘画，从0到1上手使用Stable Diffusion 3和FLUX.1训练自己的AI绘画模型，Stable Diffusion 3和FLUX.1性能优化等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

Stable Diffusion 3和FLUX.1文章地址：https://zhuanlan.zhihu.com/p/684068402

5、Stable Diffusion XL核心基础知识，网络结构，从0到1搭建使用Stable Diffusion XL进行AI绘画，从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型，AI绘画领域的未来发展等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

Stable Diffusion XL文章地址：https://zhuanlan.zhihu.com/p/643420260

6、Stable Diffusion 1.x-2.x核心原理，核心基础知识，网络结构，经典应用场景，从0到1搭建使用Stable Diffusion进行AI绘画，从0到1上手使用Stable Diffusion训练自己的AI绘画模型，Stable Diffusion性能优化等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

Stable Diffusion文章地址：https://zhuanlan.zhihu.com/p/632809634

7、ControlNet核心基础知识，核心网络结构，从0到1使用ControlNet进行AI绘画，从0到1训练自己的ControlNet模型，从0到1上手构建ControlNet商业变现应用等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

ControlNet文章地址：https://zhuanlan.zhihu.com/p/660924126

8、LoRA系列模型核心原理，核心基础知识，从0到1使用LoRA模型进行AI绘画，从0到1上手训练自己的LoRA模型，LoRA变体模型介绍，优质LoRA推荐等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

LoRA文章地址：https://zhuanlan.zhihu.com/p/639229126

9、Transformer核心基础知识，核心网络结构，AIGC时代的Transformer新内涵，各AI领域Transformer的应用落地，Transformer未来发展趋势等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

Transformer文章地址：https://zhuanlan.zhihu.com/p/709874399

10、最全面的AIGC面经《手把手教你成为AIGC算法工程师，斩获AIGC算法offer！（2024年版）》文章正式发布！

码字不易，欢迎大家多多点赞：

AIGC面经文章地址：https://zhuanlan.zhihu.com/p/651076114

11、50万字大汇总《“三年面试五年模拟”之算法工程师的求职面试“独孤九剑”秘籍》文章正式发布！

码字不易，欢迎大家多多点赞：

算法工程师三年面试五年模拟文章地址：https://zhuanlan.zhihu.com/p/545374303

《三年面试五年模拟》github项目地址（希望大家能多多star）：https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer

12、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识，从0到1搭建AI绘画框架，从0到1使用AI绘画框架的保姆级教程，深入浅出介绍AI绘画框架的各模块功能，深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

AI绘画框架文章地址：https://zhuanlan.zhihu.com/p/673439761

13、GAN网络核心基础知识，网络架构，GAN经典变体模型，经典应用场景，GAN在AIGC时代的商业应用等全维度解析文章正式发布！

码字不易，欢迎大家多多点赞：

GAN网络文章地址：https://zhuanlan.zhihu.com/p/663157306

14、其他

Rocky将YOLOv1-v7全系列大解析文章也制作成相应的pdf版本，大家可以关注公众号WeThinkIn，并在后台【精华干货】菜单或者回复关键词“YOLO” 进行取用。

http://mp.weixin.qq.com/s?__biz=Mzg4NDYwOTUwNA==&mid=2247489233&idx=1&sn=f93b964c9e91ccaaabdadd58be94459d

WeThinkIn

Rocky相信人工智能，数据科学，商业逻辑，金融工具，终身成长，以及顺应时代的潮流会赋予我们超能力。