文|杨泽原 徐涛 丁奇 孙竟耀 雷俊成
国产算力芯片新产品周期正开启,市场需要一个框架以更好地理解不同路线、不同产品的竞争力。我们认为,GPU和DSA处在算力芯片光谱上的不同位置,对产品定位有不同的取舍,不同类型的芯片应当适用不同的评价标准。本文主要回答GPU与DSA在硬件性能/软件生态上的差异来源和未来展望,同时详细复盘了CPU、GPU行业在历次主要变革中的市场格局变迁。我们认为GPU与DSA各有优势,两大路线内部料将出现格局集中。
▍分析维度一:硬件性能。
GPU路线与DSA路线的差异本质上是通用度(算法/多指标)VS特定性能之间的取舍,DSA针对特定算法、计算精度(如FP16)性能的快速提升、GPU全精度(FP64/32/16)、多算法的特点,是各自路线选择后的应有之义。当前,市场在研究算力时或过于简单地聚焦于FP16算力这个单一指标的机械比较。然而我们认为,GPU与DSA客观上存在硬件架构差异性,因而在FP16算力指标方面也会存在一些差异。但同时由于GPU与DSA在生态、通用性上也有不同,二者本身产品定位不同,因此单凭FP16算力判定产品力优劣是不够全面的。GPU与DSA能效/成本差异的来源主要包括更简单的控制逻辑、更低的计算精度、脉动阵列架构带来的更少数据搬运。我们认为不同路线应该分别进行内部比较,而不同路线之间的比较应该考虑到路线的差异。
▍分析维度二:软件生态。
在“类CUDA”之外,国产算力在GPU和DSA的硬件架构差别使得在兼容NVDA(GPU硬件架构)的CUDA软件生态时的难度存在差异。当前所有国产算力芯片的生态定位为“兼容CUDA”或“类CUDA”,但由于DSA与GPU的硬件架构存在显著差异,使得:1)GPU类国产算力芯片,由于底层硬件架构的相似性,在配套的上层软件架构向CUDA兼容的演进中的可实现性更高,往往体现为在迁移时间与成本中表现较优;2)DSA类国产算力芯片,由于底层硬件架构在控制单元功能、计算单元架构、计算精度等方面的差异(如上文),在设计配套的软件生态并向CUDA兼容的过程中挑战更大(例如对Pytorch、Tensorflow等框架与不同模型的完整支持难度),但好处是能与互相认可的客户实现更强的生态绑定关系。因此,在分析国产竞争力时,生态上更宜应进行分类比较。
▍分析维度三:市场竞争。
下游需求爆发在即,市场份额整合大幕拉开,GPU&DSA路线头部国产厂商份额均将逐步向头部集中。根据我们2024年11月4日外发的《”构筑中国科技基石”系列报告35——国产智算芯片崛起》中的测算,2026年我国智算芯片需求有望达到3000亿元以上。行业格局方面,诸多行业如工业品往往都是早期百花齐放、跑马圈地,向成熟期发展的过程中因规模效应和成本优势而经历格局收缩。在CPU/GPU这样的大芯片行业,由于软件生态的存在,规模效应和成本优势极度明显,最终市场格局往往会比大多数工业品更集中。上述规律在PC CPU、服务器CPU、手机CPU、游戏显卡领域已经得到反复验证。因此在算力芯片领域,我们认为,GPU与DSA两大赛道可能会呈现各自格局集中的趋势。
▍风险因素:
算力芯片供应链风险;芯片产能供给不足的风险;互联网大厂资本开支不及预期的风险;相关产业政策不及预期的风险;AI应用发展不及预期的风险;芯片技术迭代不及预期的风险;国产GPU厂商竞争加剧的风险等。
▍投资策略。
硬件方面,GPU与DSA是通用性与计算效率不同取舍的产物,GPU更通用而DSA效率更高;软件生态方面,GPU由于与NVIDIA GPU的架构相似性,因此适配CUDA难度更低,DSA往往是独立自有生态。我们认为GPU与DSA各有优势,两大路线内部料将出现格局集中。
投资建议:GPU与DSA格局呈现集中化趋势,占据性能与生态优势的领先企业有望受益。