南阶跃、北智谱:大模型“基模双雄”格局初现|甲子光年

科技   科技   2024-12-24 15:19   北京  

大模型下半场开启。


作者|赵健


短短一周时间内,“大模型六小虎”的两家先后宣布大额融资。


先是智谱在12月17日宣布完成30亿人民币融资,引入多家战投及国资。一周后,12月23日市场传出阶跃星辰完成数亿美元B轮融资,有国资、战略和财务投资人等多家参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。


众所周知,大模型是一个非常“烧钱”的领域。今年甲骨文创始人拉里•埃里森说过一句话:“训练人工智能模型的成本是天文数字,一个真正前沿模型的入门价格是1000亿美元。”


国内大模型的入门价格或许没有这么昂贵,但不可否认的是,大模型的先进技术与产品,都要建立在充足资金的基础之上,这是一个很残酷的现实。


值得一提的是,今天大洋彼岸马斯克成立的xAI宣布完成60亿美元C轮融资,快速跻身大模型超级独角兽。


显然,通过积极融资来应对大模型下半场潜在的激烈竞争,已经成为全球共识。谁先获得充足的资金,谁先获得通往AGI之路的先发优势。


当前大模型投资市场环境竞争激烈。此番融资之后,智谱与阶跃已经在国内市场率先拿到了大模型下半场的入场券。


至此,“南阶跃、北智谱”,中国大模型市场的基模双雄格局初步形成。




1.“基模双雄”的技术实力


在相近的时间宣布融资,或许并非完全出于巧合。实际上,智谱与阶跃星辰这两家“基模双雄”,在很多层面是有相似性的。


首先看这一轮融资结构,投资方都是以国资为核心。


智谱的背后主要是北京国资,阶跃星辰背后主要是上海国资。可以说,智谱与阶跃星辰分别是北京与上海两城的大模型国资队代表。


为什么以国资为主?一位投资人告诉「甲子光年」:“大模型公司现阶段处在一个微妙的时间点,大部分VC说实话没什么钱,真正有钱在手的VC没多少,PE也不会投这个阶段。国资有钱,且非常鼓励搞AI,所以国资就成了最匹配的选择。”


其次,智谱与阶跃星辰都明确表态,本轮融资都会坚定投入到基座大模型的研发。


基座大模型是大模型技术、产品与生态的根基。要想构建核心竞争力,必须长期投入基座大模型。这对大模型公司的长期战略定力提出考验。


此前业内传闻称有两家大模型公司将会放弃预训练。对此,有人辟谣,有人沉默。无论如何,今年下半年大模型六小虎的战略方向已经悄然变化。比如,百川智能战略投入医疗方向,零一万物拓展to B的数字人解决方案,等等。


目前来看,只有智谱与阶跃星辰两家明确表态继续投入基座大模型研发。这两家“基模双雄”的愿景也基本一致,那就是追求AGI(通用人工智能)。基座大模型将是通往AGI的必经之路。


第三,智谱与阶跃星辰的模型矩阵布局全面,是唯二两家在模型丰富度上能够对标OpenAI的大模型公司。


智谱紧追OpenAI的模型发布节奏。2024年1月,智谱推出新一代基座大模型GLM-4,后续又陆续发布视觉模型GLM-4V、视频生成模型CogVideoX以及视频生成产品“清影”、端到端情感语音模型GLM-4-Voice等。


而阶跃星辰实现AGI的技术路线与OpenAI的思路一致:“单模态—多模态一多模理解和生成的统一—世界模型—AGI”。


按照清晰的技术路线,过去10个月阶跃星辰保持着极高的研发效率,一共发布了11个自研基座模型,包含千亿参数语言大模型Step-1、万亿参数语言大模型Step-2、图像理解大模型Step-1V、图像生成大模型Step-1X、多模态理解大模型Step-1.5V、视频生成大模型Step-Video、语音复刻和生成大模型Step-tts-mini、语音识别大模型Step-Asr,以及近期发布的国内首个千亿参数端到端语音大模型 Step-1o Audio等。


阶跃星辰主打“万亿参数+多模态”的差异化路线。其中,Step-2是国内首个由大模型创业公司发布的万亿参数模型,而Step-1V的多模态理解能力出色,在大模型竞技场Chatbot Aren的榜单上位列视觉领域中国大模型第一,总分跟 Gemini-1.5-Flash-8B-Exp-0827持平。



目前,智谱与阶跃星辰都尚未发布类似OpenAI的o系列的推理模型,但相信这也只是一个时间问题。




2.toC/toB各有侧重


智谱与阶跃星辰在基础模型、技术实力等层面有很多相似之处,这也是两家公司获得资本看好的原因。另一方面,在核心业务的发展路径上,两家也存在一定的不同。


首先核心团队的基因不同。


智谱核心团队来自“清华系”,偏向学术派。


智谱的前身是在2006年诞生于清华大学计算机系知识工程实验室(KEG)的学术搜索与情报挖掘平台AMiner。清华大学教授、KEG主任唐杰,是AMiner的核心创立者之一。清华大学计算机系教授、中国科学院院士张钹是智谱首席顾问。智谱CEO张鹏,是国内首个中英文平衡的跨语言知识图谱系统XLORE的设计和研发者。


阶跃核心团队来自“微软系”,偏向市场派。之所以说是市场派,是因为阶跃星辰核心团队有丰富的将技术落地到实际产品的经验。


阶跃星辰创始人、CEO姜大昕博士,是微软前全球副总裁,微软亚洲互联网工程院首席科学家,也是阶跃星辰的算法负责人;阶跃星辰数据负责人焦斌星,此前担任微软必应引擎核心搜索团队负责人,负责利用数据挖掘和NLP算法优化索引和搜索质量。


姜大昕博士曾带领四百多人研发团队开发微软必应搜索引擎,负责网页排序、智能问答、知识图谱卡片,图片和视频搜索结果。他将深度学习技术应用于必应搜索引擎,并提出了一系列语言对齐、数据增强和迁移学习的方法,显著提升了必应搜索结果质量,帮助必应搜索服务扩展到全球200多个国家和地区。这些技术也成功应用于微软的其他产品,包括微软小娜(Cortana),Azure Cognitive Services,Outlook,以及Xbox。


阶跃星辰系统负责人朱亦博,此前先后在微软、字节跳动等公司从事算力集群相关工作,拥有多次单集群万卡以上的系统建设与管理实践经验。


此外,阶跃星辰首席科学家张祥雨,是ResNet作者之一,在今年加入公司。张祥雨的另一个代表作ShuffleNet,后来影响了包括苹果3D人脸解锁在内的各种手机毫秒级人脸解锁技术。阶跃星辰目前公司研发人员占比 80%以上,同时公司招募了很多来自字节、腾讯等互联网产品背景的人才。


智谱与阶跃星辰核心团队基因不同,现在很难说哪一个类型的团队会更有利于企业发展。但可以确定的是,企业基因会对企业的成长、发展带来深远影响。


现在来看,智谱与阶跃星辰的核心业务已经有了相对明显的倾向性:智谱更to B/to G,阶跃更侧重to C场景。


智谱在B端、G端的业务上覆盖智能汽车、制造、大消费、金融、政务服务、医疗健康、游戏娱乐、文化旅行等行业。智谱的MaaS平台已经吸引了70万企业和开发者用户,2024年的整体商业化收入超过100%。


阶跃星辰战略聚焦“超级模型+超级应用”,通过自研+生态合作,围绕基座大模型的能力为C端用户打造创新体验。


阶跃星辰推出的智能助手「跃问」,支持多模态交互,可帮助用户解决工作和生活场景下的各种问题,更好地进行内容创作。跃问的多模态智能视觉搜索功能「拍照问」,是国内首个集成到 iPhone 16相机控制键中的大模型应用产品能力;此外,在金融财经、内容创作和智能终端等领域,阶跃星辰通过跟合作伙伴达成深度合作,共同在垂直场景为用户打造创新的 C 端应用体验。


同时,越来越多的开发者正在基于阶跃星辰的多模态大模型创造更丰富的 C 端应用功能和体验,通过AI原生应用挖掘并满足新的消费场景。数据显示,2024年下半年阶跃星辰多模态 API 的调用量增长了超 45倍。


网红AI应用「胃之书」基于阶跃星辰多模态能力,帮助用户以更快捷有趣的方式记录饮食,开发者赵纯想公开表示曾对国内大部分模型做过AB测试,最终发现阶跃星辰付费率最高;AI心理疗愈应用「林间聊愈室」通过阶跃星辰多模态能力让用户和聊愈产品实现多模态视觉互动,极大地丰富了交流体验和深度。创始人李神龙称,接入阶跃星辰大模型后,产品整体付费率有所提升。此前在社交网络爆火的原生AI应用「歌词爆改机」和「换你来当爹」背后调用的也是阶跃星辰的多模态大模型。


随着“基模双雄”先后融资,大模型的下半场也悄然拉开大幕。在大模型创业的下半场,充足的融资、领先的技术以及找到合适的商业模式,将是通往AGI之路缺一不可的条件。


大模型的空间很大,赛道很长。以智谱、阶跃星辰为代表的中国大模型公司,有机会在这一轮技术浪潮中站上全球视野的更高的身位。


(封面图来自《极速车王》)





END.






甲子光年
甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。
 最新文章