本文由半导体产业纵横(ID:ICVIEWS)转载自腾讯科技
象帝先对解散传闻的回应
一时间,象帝先为什么会突然大举收缩,国产GPU创业赛道开始洗牌了吗?这些也成为了国产GPU乃至整个芯片产业需要思考的问题。
“中国英伟达”的战略误判
2020年,“集成电路产业与国际先进水准的差距逐步缩小,16、14纳米制造工艺实现规模量产”;2030年“集成电路产业链主要环节达到国际先进水准,一批企业进入国际第一梯队。”
在这一大背景下,国内GPU创业第一波大潮拉开序幕,芯原微、景嘉微、龙芯等在这一阶段都开始布局相关项目。
不同时期成立的国产GPU创业项目,数据来源:企查查
现在回头来看,当初《纲要》对晶圆代工部分定的KPI其实完成得还不错。
2020年,中芯国际已能够以95%的良率实现14纳米的量产,如今还突破到更先进的节点,不过我们也要正视问题:先进工艺依旧在不断往前推进,过去的先进工艺,将来会被划分到成熟工艺;我们的制造能力进步都建立在进口设备的基础之上,距离全产业链的国际先进水平目标仍有差距。
到了2018年,中、美科技竞争加剧,断供的风险急剧飙升——中兴通讯被迫喊出“美国禁令将使公司立即进入休克状态”,台积电被迫停止向华为提供麒麟芯片代工服务,国产GPU创业进入第二轮投资浪潮,象帝先就是在这一轮创业大潮下诞生,同期的国产团队还包括壁仞科技、摩尔线程、沐曦等。
象帝先董事长唐志敏是中国芯片领域罕见的战略级科学家,我在20多年前就有过了解,曾在多家国产芯片项目当中担任负责人。
2000年,龙芯董事长胡伟武的热文《我们的龙芯一号》中,唐志敏就以龙芯项目负责人的身份出现。在创立象帝先之前,唐志敏还领导了海光的CPU、DCU项目,不过相关项目商业化都不是很成功,关键问题还是因为过度依赖AMD的Zen1授权,这里不展开讨论。
2020年9月成立初期,象帝先完成天使轮融资,2022年完成A轮融资。到2021年,两年时间公司规模已超过200人,发展速度非常快,而不久前由哈佛3名00后辍学生组建的AI芯片项目“Etched”团队仅仅只有35个人,所以不少观点认为,象帝先在前期扩张太快,但这种比较略显绝对,后文再详细展开。
2022年,象帝先迎来高光时刻,当年基于Imagination的IP核授权,流片并发布了“天钧一号”GPU——12纳米工艺,2048个计算核,4TFLOPS的FP32算力、16TOPS的AI算力、16GB显存、256GB/s带宽。
横向对比硬件指标,象帝先的“天钧一号”在带宽、算力和工艺上与2022年的国产竞品有一定差距,其性能勉强追上英伟达2019年的中高端产品RTX 2060(如下表),后者同样采用12nm工艺,总计1920个计算核心,6.5TFLOPS的FP32算力,51.6TOPS的AI算力,6GB显存,带宽336GB/s。
相关GPU产品硬件指标对比,来源:产品官网及相关报道
2023年9月,象帝先发布“天钧二号”,这代产品定位低端,1024个计算核心、2.6TFLOPS的FP32算力、8GB显存、128GB/s带宽,主打低功耗和高性价比。
两款产品作为敲门砖,帮助象帝先在2023年完成了至少来自14个资方的3轮融资,并于2024年成为重庆市独角兽企业,估值超过150亿元,被诸多媒体称之为“中国英伟达”。
不过,“中国英伟达”的帽子,对于象帝先来说不一定匹配——它要对标的英伟达,营收构成已经风格大变,数据中心业务占比接近90%。
而象帝先直到2024年,还停留在桌面显卡市场,唯一能和AI芯片相关联的产品,是2024世界人工智能大会上亮相的一块神秘的PCIE版本服务器显卡XDX X1900。
外界传过B轮融资满5亿元的对赌协议是压垮象帝先的“最后一根稻草”,而对赌牵涉的资本问题,与整个大环境有关,今年7月份,澎湃新闻在报道中披露,深创投大批量发起回购诉讼,通过这种方式来退出被投项目,但象帝先的境遇不能说明国产芯片设计团队遭遇资本寒冬,壁仞、摩尔线程毕竟还在排队IPO。
2024年世界人工智能大会上“象帝先”公司展出的产品矩阵
从我的角度来看,问题核心还是战略误判,对赌协议只是象帝先“解散”的导火索,即便没有这个诱因,也可能会出现其它原因。
对于象帝先目前的资本困局,我尝试过与其市场部前员工进行求证,但未获得正面答复,只是表示“我们也都盼着好消息。”
国产创业项目还在追硬件指标,然而GPU竞争已经从硬件为主、软件为辅的比拼,转变为硬件+软件的综合生态能力较量。
深度学习爆火之前,通用GPU需求数量最多的应用方向是PC桌面显卡,英伟达、AMD、英特尔是主要玩家,其中英特尔主要在CPU上集成GPU,2022年又重回独显市场。三家提供的产品多,满足办公、游戏、图形等各类需求。
新入局者,想要在这样的市场上分一杯羹,不仅需要扎实的产品性能,更需要运行多年的成熟供应链体系支撑,难度极高。
研究机构Omdia披露的近两年美国主要科技公司Hopper架构GPU的储备量
深度学习和人工智能为GPU带来了潜在的机会和蛋糕,但这不代表初创公司一定就有机会拿下,像AMD这样的GPU老玩家,一些产品算力指标都超越了英伟达,但在竞争中就是打不赢,以CUDA为代表的软件生态扮演了至关重要的作用。
有一个细节,今年的GTC大会上,黄仁勋说“英伟达是一家软件公司”,指的就是其GPU产品“统治”AI的关键因素之一,CUDA生态。这一点我在《没人能杀死1.5万亿的英伟达》一文中也解释过。额外插一句,这才过去半年多时间,英伟达市值已经冲破3万亿美元市值。
生态系统的统治力如何理解?可以类比用户对操作系统的偏好——苹果的macOS现在足够优秀了,过去10年其市场份额翻了一倍,但Windows仍然有先发优势以及用户的接受度,牢牢占据着70%的份额,这就是生态系统的力量。
基于GPU的通用计算,生态系统的重要性可能比操作系统还要极端——开发者一旦适应了英伟达的软件生态,就很难从其中切换出来。
举个例子,假设某个企业要采购国产GPU,首先就要解决代码兼容性问题,包括不兼容的库和函数都要替换或者修改,虽然国产厂商会提供迁移工具,这仍需大量的开发工作,迁移过程还会引发应用性能损失的问题,要减少这种损失,就得根据国产GPU的架构来调整优化算法,这又进一步增加开发工作量。
设备的稳定性也是影响效率的一个关键因素,之前Meta在论文中曾披露过——H100的万卡集群训练Llama 3.1,平均3小时故障一次,尽管很多问题都可以自动化处理,但依旧会增加人力和时间成本,最终影响效率。
而这还是H100这样市占率超高的产品,一些问题还有可能在线上社区找到解决方案,一旦换成国产设备,如果支持生态做得不好,快速定位问题并获取解决方案都不是一件容易得事情,用比较流行的话说,切换国产GPU的TCO(总拥有成本)太高。
从心理上说,应该有很多企业愿意支持国产芯片,采购成本不便宜也可以接受,但是从商业的角度来说,如果开发特别麻烦、使用出现问题,占用了研发团队过多精力,这样的商业合作很难维持下去。
抛开市场需不需要这么多英伟达的问题来看GPU、AI芯片创业,现在很多新项目一亮相就是数十倍的“吊打”英伟达,硬件指标看上去不用担心了,但除了纸面数据要好外,一开始就要想好如何做生态。而一旦涉及做生态,对于“400人算不算多”这类问题,就会好回答很多——我所知道的是,英伟达这样的企业,在大客户那里一般都会安排数十人的驻场支持团队。所以,GPU厂商是“软件公司”这个观点现在来看非常贴切。
没有生态支持的GPU通用计算项目,开局可以说是机遇与挑战并存。