谁才是大模型“四小龙”？

科技 2024-07-12 21:00 英国

大数据文摘受权转载自定焦（dingjiaoone）

作者 | 黎明

编辑 | 魏佳

这两年热闹的大模型创业潮，被业内称为“AI 2.0”。

与之对应的“AI 1.0”，指的是2015年左右开始的那一波AI创业潮，当时诞生了商汤、旷视、云从、依图等明星创业公司，它们以CV技术（计算机视觉）为主导，大量融资，风头无两。这四家公司，是公认的“AI四小龙”。

“AI 2.0”时代，大语言模型成了新的主导技术，业界普遍认为，这一波浪潮会掀起生产力革命。这次同样出现了很多创业公司，它们被投资机构和科技巨头追捧，估值水涨船高。但谁是“大模型四小龙”，目前尚无共识。

有一种说法是，智谱AI、月之暗面、百川智能、面壁智能，这四家公司是新的“四小龙”，在6月中旬举办的2024智源大会上，四位CEO首次同台，“四小龙”的说法就传开了。

还有人说中国有“大模型五虎”：百川智能、智谱AI、月之暗面、MiniMax、零一万物。这里边把面壁智能剔除了。

这些说法没有得到广泛认可。总体上，智谱AI、百川智能、月之暗面可以入围，剩下的这个名额会给谁，还存在不确定性。

我们认为，综合创始人背景、技术实力、融资能力、商业化潜力等因素，智谱AI、百川智能、月之暗面、MiniMax这四家公司，可以称作“大模型四小龙”，它们最有可能拿到“AI 2.0”时代的船票。

四小龙，各不同

“大模型四小龙”，各有各的特色，我们分别用四个词来形容：根正苗红（智谱AI）、厚积薄发（百川智能）、高举高打（月之暗面）、隐秘机巧（MiniMax）。

从公司成立时间来看，智谱AI最早——2019年6月，那会儿大模型很小众，科技圈和投资圈没什么人关注。百川智能最晚——2023年4月，当时ChatGPT已经亮相快半年，国内大模型公司正在抢人、抢钱。

智谱AI来头不小，它由清华大学孵化，脱胎于清华大学计算机系知识工程实验室，是根正苗红的清华系。它的核心团队也来自清华，CEO张鹏是清华计算机系博士，总裁王绍兰为清华创新领军博士，首席科学家唐杰是清华计算机系教授。

清华的光环加持，再加上入局早，让智谱AI有一定先发优势。早在2020年，智谱AI就研发并训练了一个百亿参数的模型。OpenAI发布GPT-3模型后，智谱AI加大在预训练大模型上的投入，后来几乎全模型产品线对标OpenAI。

从整体的观感上，智谱AI对外展现的形象很正，讲的故事也很大，包括它背后的投资机构也主要是人民币背景。

最晚入局的百川智能，所有能量来自王小川。

王小川是互联网江湖里的“老人”，早年在搜狐一路做到CTO的位置，后来又在搜狐内部创业，担任搜狗CEO，最后搜狗被卖给了腾讯。王小川的技术实力和创业能力早已被验证，过去这些年他也积累了深厚的人脉，所以当他宣布入局大模型创业时引起了很高关注。

另外，王小川当年带领搜狗搜索跟百度搜索打仗，如今又在大模型赛道和百度狭路相逢，时不时吐槽几句李彦宏，这些素材成为人们茶余饭后的话题，也增加了百川智能的热度。

月之暗面比百川智能早成立一个月，没有显赫的背景，但有一个明星创始人。

杨植麟92年生人，是这几个大模型公司CEO中最年轻的，他毕业于清华大学和卡耐基梅隆大学，学术和工作经历都跟大语言模型相关，之前就在AI学术圈小有名气，算是个小天才式的人物。尤其是他读博士时，跟着苹果AI研究负责人和谷歌首席科学家做研究，发了一些论文，给了他很大加持。

这些标签和光环，被杨植麟充分利用，经过有意识的包装和营销，他树立了清华90后学霸的人设，被打造成新锐大模型创业者的代表。

这家公司的创始人和产品，都比公司有名。今年3月Kimi智能助手爆火出圈之前，很多人根本不知道月之暗面。但杨植麟一路高举高打，硬是靠一个人打满了全场。

MiniMax是这四家公司中最低调的，但实力不容小觑。它早在2021年12月就成立了，比目前市场上活跃的大部分大模型公司都要早，它在2022年推出的AI对话产品Glow，上线四个月就收获了近500万用户，在年轻人中很受欢迎。

当很多大模型公司在拼参数、秀肌肉的时候，MiniMax已经找到了应用场景，并将产品悄悄落地了，还打进了海外市场。

MiniMax的核心班底来自商汤，创始人闫俊杰在商汤从实习生做到副总裁，还曾担任研究院副院长和智慧城市事业群CTO，这项业务曾为商汤贡献了大量收入。在2021年底商汤上市前，闫俊杰离职创办了MiniMax。联合创始人周彧聪也曾在商汤科技研究院主管算法团队。

商汤就是在上一轮AI创业潮中成长起来的，位列“AI四小龙”，如今，闫俊杰创办的MiniMax晋级为“大模型四小龙”，和老东家同台竞技。

总体来看，“大模型四小龙”的四位创始人履历非常光鲜，都是各自领域里的精英，但同时他们又各有特色，导致每家公司的气质和侧重点有所不同，进而导致了竞争策略的差异。

融资、估值与站队

四家公司都有融资，估值涨得很快。

目前估值最高的是智谱AI，市场传闻在6月初的一笔融资中，智谱AI估值约30亿美元，中东石油巨头沙特阿美旗下基金投了4亿美元。

月之暗面与智谱AI接近。今年2月由阿里领投的那笔超10亿美元融资中，月之暗面估值已达约25亿美元，这是当时国内AI大模型公司获得的单轮最大金额融资。最新传闻是，腾讯或将入局，将月之暗面的估值推高至30亿美元。

这意味着，智谱AI和月之暗面将率先进入“200亿人民币俱乐部”。

MiniMax和百川智能的估值相对低一些，融资轮次也相对较少。今年3月有消息称阿里领投了MiniMax新一轮大规模融资，估值超过25亿美元。百川智能官宣的融资停留在去年10月，今年4月有传闻称最新估值18亿美元，百川智能否认了。

由于月之暗面和百川智能在2023年上半年才成立，那段时间也是国内大模型投融资最热闹的阶段，所以几笔金额较大的融资，基本都集中在过去一年里。

这四家公司由于被业内认为是头部项目，融资时遭到投资机构拥抢，加剧估值上涨，吸走了行业里的活跃资金。反观那些腰尾部的项目，融资则没那么容易，估值也没这么疯狂。

天眼查数据显示，李开复创办的零一万物，除了公司成立时获得了创新工场的启动资金，对外只获得了阿里云的一笔投资；知乎CTO李大海担任CEO的面壁智能，成立至今获得两笔融资；微软前全球副总裁姜大昕创办的阶跃星辰，没有公开的融资纪录。

跟十年前的那波AI创业潮相比，今天的资金更加理性，或者说是局部疯狂。当年“AI四小龙”融资时，行业里有大量流动的热钱，项目在资本泡沫中长大。

而大模型遭遇了资本寒冬，美元基金退潮，能拿出大钱的大基金不多，头部几个基金抢项目又很强悍，VC对着十来家大模型公司猛投，项目估值一时被拉到很高。

英诺天使基金合伙人王晟对「定焦」说，“百模大战”中很多投资机构陷入迷茫，资金端20多家VC投资很活跃，资产端就几十个项目融了很多钱，两边都没有泛化。实际活跃的投资机构也就20来家，剩下的都是在看热闹，跟着摇旗呐喊。“因为大家第一看不懂，第二不敢投，第三投不到。一堆创业者各种鼓吹项目多厉害，其实根本没人投。”

项目和基金都在扎堆。王晟认为头部几个项目的估值被拉的过高了。

红杉资本投资了“大模型四小龙”中的三家——月之暗面、智谱AI、Minimax，此外还有光年之外和阶跃星辰。今日资本也投资了光年之外，还投了“大模型四小龙”中的两家——月之暗面和智谱AI。

除此之外，“大模型四小龙”从一开始就进入了大厂的射程，主动或被动接受了大厂的投资，提前选边站队。

这与“AI四小龙”时代有很大不同，当年的AI创业浪潮完全由创业公司主导，互联网大厂基本没怎么参与，它们还在忙着抢地盘、大并购，那是消费互联网的黄金时代。今天的大模型创业，OpenAI发布ChatGPT之后，大厂从第一天就下场了，甚至比很多创业者还早，没有给创业公司留出时间差。

大厂基本都是两手准备，一手自研，一手投资。

最典型的是阿里，它除了全力推进自研大模型通义千问，还投资了场上几乎所有的头部项目——“大模型四小龙”+零一万物。腾讯投资了“四小龙”中的三家——Minimax、智谱AI、百川智能，接下来有可能投资月之暗面，另外它此前还投了王慧文的光年之外。美团收购了光年之外，还投资了智谱AI、月之暗面。

从项目的视角来看，智谱AI背后站着阿里、腾讯、美团；百川智能背后有阿里、腾讯、小米；月之暗面是阿里、美团；MiniMax是腾讯。

如果我们相信顶级投资机构和大厂的眼光，以融资情况来看，智谱AI、百川智能、月之暗面、MiniMax这四家公司，毫无疑问是公认的头部，即便它们是被“捧”出来的。

如何赚钱？

“AI四小龙”当年也从投资人手中拿了很多钱，但最后从市场上没赚到多少钱。它们的技术很好，商业化很难，客户主要是B端企业和G端政府，通过向它们提供人脸识别等AI解决方案来赚钱。

这不是一个好的商业模式，项目非标准化、落地周期长、成本高，导致后来一提到“AI四小龙”，就跟亏损、烧钱的标签混在一起。

“大模型四小龙”同样要面对来自商业化的拷问。

四家公司中，智谱AI最早进行商业化探索。按照智谱AI自己的说法，公司从成立的第一天起就有收入，在研究技术的同时也在开拓市场。因为智谱AI一开始的研发重点是数据挖掘与科技情报分析，2020年6月OpenAI发布GPT 3后，智谱AI才将重点转向大语言模型。

然而这不能证明智谱AI跑通了大模型的商业模型，反而说明它从一开始就有To B基因，像是上一代视觉AI公司的翻版。

2023年初开始，智谱AI开始组建大模型的商业化团队，人员规模一度发展到上百人，而很多大模型公司所有人加起来都不到一百人。它探索出API、云端私有化、本地私有化等几个主要的变现方式。

智谱AI有意无意进入了巨头的射程范围。今年5月，大模型公司掀起价格战，字节、阿里、百度、腾讯全部卷入其中，将API价格降到无限逼近零。业内普遍认为，大模型创业公司的成本比大厂高，专用数据少，很难建立壁垒，无力与巨头打持久战。

出身相对“平民”的月之暗面和MiniMax，选择从C端入手，靠产品说话。

杨植麟说过，月之暗面不是为了竞争而建立的公司，不做to B，从第一天就决定做to C。

作为一个学院派创业者，杨植麟被认为是典型的“技术信仰派”，带有一点理想主义，相信scaling law，而不只是盯着眼前的竞争。

它去年10月推出的面向C端的产品“Kimi智能助手”，被网友称为ChatGPT中文平替，热度和月活一度逼近百度的文心一言。今年3月，Kimi宕机上了热搜，然后被股民盯上，炒作“Kimi概念股”，让这款产品加速出圈。

通过Kimi，月之暗面向外界证明了自己的技术实力和产品能力，为变现奠定了基础，随后推出打赏模式，但这块的收入还很薄弱。有意思的是，当时Kimi火了之后，阿里在第一时间宣布，通义千问免费开放1000万字长文档处理功能，超过Kimi。而当时阿里刚成为月之暗面的股东。

MiniMax应该是目前C端产品做的最成熟的大模型公司之一，它的突破口是AI情感陪伴。

第一款产品Glow，上线四个月收获500万用户，随后因涉及隐私和敏感问题遭到举报被下架，后来Glow以升级版本“星野” 卷土重来，去年底月活用户达到数百万人。MiniMax还开发了一款AI虚拟人物聊天软件Talkie，主打出海，上线一年时间累计下载超过1400万次。Data.ai数据显示，2024年4月，Talkie的日活跃用户数超过900万。

MiniMax很会做产品，非常精准把握了年轻一代的消费喜好。比如Talkie最大的卖点是AI角色定制，AI角色又与卡牌游戏机制相结合，这些卡牌不仅可以收藏，还能在平台上交易。Talkie让用户付费订阅，同时通过抽卡机制让用户充值，还在抽卡环节插入广告。

当其他大模型公司还在拼参数时，MiniMax已经找到落地场景并开始赚钱了。

百川智能切入市场的方式是开源。Meta靠开源在AI圈一炮打响后，百川智能选择跟随，在公司成立两个月后就发布了70亿参数的开源大模型，随后不断进行升级，通过开放API接口的方式进入ToB领域，开启商业化进程。

王小川考虑的问题很大，像大多数大模型公司CEO一样，他也还在探索最适合公司的商业化落地方式。

结语

站在今天的时点，评选“大模型四小龙”可能还有点早，毕竟，这个赛道还处在早期，存在太多变数。上文提及的四家头部公司之外，零一万物、面壁智能、阶跃星辰也都很有实力，只是暂时在估值、产品落地、商业化等方面略逊一筹。

现在大家都在等待超级应用出现，超级应用可能会成为改变行业格局的跷跷板。大模型公司们都在往这个方向努力，因为如果应用跟不上，商业化的空间就无法打开，靠融资推动的商业模式也就难以为继。

在那之前，“大模型四小龙”需要突破技术天花板，找到落地场景，平衡好与巨头们的微妙关系，甚至被迫参与价格战。它们面对的挑战，丝毫不比“AI四小龙”小。

*题图及文中配图来源于Unsplash。

黑色小圆动图分割线

租售GPU算力

租：4090/A800/H800/H100

售：现货H100/H800

特别适合企业级应用

扫码了解详情☝

点「在看」的人都变好看了哦！

http://mp.weixin.qq.com/s?__biz=MjM5MTQzNzU2NA==&mid=2651734339&idx=1&sn=791e0f495bc7c625ac6f24e19a524175

大数据文摘

普及数据思维，传播数据文化

最新文章

深夜重磅！ChatGPT可以“AI搜索”了，但并不完美

谷歌被俄罗斯罚款2,500,000,000,000,000,000,000,000,000,000,000,000美元

OpenAI放弃自制AI芯片！伦敦场开发者日Hugging Face工程师现场“拷问”Sam Altman

想用AI特效在万圣节“鬼混”，看这一篇就够了。

AI + 影视，学会「避坑」再「吟诗」丨CNCC 2024

做AI捏捏，享赛博解压。

困扰18亿人的“全球干旱”，被AI更准确预测了

开源一夜崩塌：Linux无理由除名俄罗斯开发者。我们该醒了？

帮老外割草、送餐、保洁，中国服务机器人冲向海外

Character AI被起诉！14岁青少年自杀，AI陪伴何去何从

加强版Claude3.5正式上线，一句话操控电脑的时代真的要来了。

Transformer能否推理引争议，DeepMind连夜更新论文开源数据集：Transformer真的很强

Andrej Karpathy预言AI马太效应：差异只会越来越显著

“AI调解员”登上Science！Google DeepMind打造，“劝架”水平远超人类

台积电股价创历史新高，先进制程比想象中重要？

谷歌计划将 Gemini 并入 Deepmind，下个月开始生效

这个AI插件，想让你体验在浏览器上开挂的感觉。

对统计学“又爱又怕”，到底如何学统计？

科研那些事（万字长文，真诚分享）

创造历史，马斯克成功回收20多层楼高的星舰助推器

从广东看中华文明起源，《穿越磨刀山》以AI技术开拓考古新视野

苹果发文质疑：大语言模型根本无法进行逻辑推理

三星，正在自救

o1诞生对下一轮AI爆发的启示：技术远远没有收敛，仍在演进丨智源Workshop精华观点回顾

马斯克的Cybercab首秀！没有方向盘和踏板，26年量产，特斯拉这次又玩大的了

哈佛大学俩学生开发出一种 AI 眼镜，看你一眼就能扒光所有个人信息

AI 法力无边！物理诺贝尔奖颁给了 HNN 之父和深度学习之父

别笑，你可能也分不清这些视频是不是AI的。

两万字实录：大语言模型、提示学习与未来科技研发的交汇点

破纪录！OpenAI成为史上第一家估值万亿元的AI公司！独家融资协议：“别投对手公司”

是什么，缔造了英伟达神话？

ChatGPT上线全新功能Canvas - 我消灭你，与你无关。

为何马斯克的“盲视”不可能超越肉眼？

当代年轻人，在AI实现婚纱照自由

国庆从你的城市出发，5小时高铁最远能到哪

颠覆认知：大模型不可靠，越大越不可靠？最新研究登上 Nature

科研大佬投稿顶会的经验分享：时间安排、idea灵感、科研习惯

三只羊卢总的录音AI到底能不能做出来？我的答案是：当然能。

2024工博会最新洞察：机器人走向大负载，中国厂商从跟随到并跑

AI击败人类！DeepMind推出AlphaChip，几小时内即可生成“超人”芯片布局

Meta放大招，发布真AR眼镜！但让人“高”攀不起

腾讯 Robotics X 控制负责人郑宇近日离职，已加入优必选

OpenAI CTO深夜离职！Altman再发长文：感谢她做的一切，我将专注于技术和产品

热门视频：人形机器人一拳破次元！远程暴打沙袋和乒乓球

Sam Altman罕见发长文：ASI终将至，准备好迎接“智能时代”吧！深度学习是有效路径

Nature重磅：颠覆AI计算，提升460倍能效，新型分子忆阻器有望为Transformer提速

西安一高校老师实名公开举报！397页PDF痛诉同院老师学术不端，评审推诿包庇

世界气象组织最新报告：AI正在革新天气预报，更快、更便宜、更易获得

为人工智能赋予机器人躯体的“登月计划”项目，倒在具身智能热潮之前

科普之旅｜漫话智能体-当机器学会思考

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉