👆如果您希望可以时常见面,欢迎标星🌟收藏哦~
来源:内容来自信息平权,谢谢。
伴随着生成式AI的大规模发展,AI服务器近几年水涨船高,火了英伟达的GPU芯片,火了SK海力士的HBM,但是在另一个细分领域,也有一家公司正在偷摸发大财,它就是Astera Labs,被业内人士称为“小英伟达”。
Astera Labs于2017年在一个车库里成立,具有典型的硅谷风格。联合创始人Jitendra Mohan、Sanjay Gajendra和Casey Morrison 在德州仪器 (TI) 的高速接口业务部门工作。今年3月20日,Astera Labs正式上市,首次公开募股价格为36美元,如今其股价在98美元左右,市值为153亿美元。
最近Astera Labs刚公布了其第三季度财报,Q3营收为1.13亿美元,同比暴增206%,环比增长47%,收入超出华尔街分析师预期的15%;毛利率高达78%,这比英伟达还要高一点,英伟达的毛利率为75%。而且这一盈利状况不是昙花一现,Astera Labs预计第四季度的营收为1.26-1.3亿美元,中位数增长153%,预计毛利率为75%。
Astera Labs公司究竟是卖什么的?Astera Labs目前主要有三大产品线,一个是Aries PCIe/CXL retimers(重定时器);二是Taurus智能电缆模块;第三是Leo CXL智能内存控制器。其中,PCIe retimers正是Astera Labs公司的“印钞机”,英伟达、AMD、英特尔等芯片巨头以及微软、谷歌、亚马逊等科技巨头均是Astera Labs的主要客户。
PCIe retimers的价值究竟有多大?就连博通和Marvell这样的大厂商都想要来分一杯羹。
Astera Labs在英伟达AI服务器中的价值含量
首先,让我们来看看,英伟达目前的DGX server中到底用了多少颗PCIe retimers和switches?
我们知道,一个DGX server里有一张UBB(universal base board)板,上面放了8颗GPGPU,另外还有一个CPU board (被称为head node),上面放了2颗CPU。笔者根据供应链调研得知,一个标准的DGX server里会在UBB板上配置8颗PCIe Gen5 retimers (对应8颗GPGPU),以及在head node上配置8颗PCIe Gen5 retimers,对应UBB上的8颗retimers(有些MGX客户也会通过改动板子的Layout来缩短数据传输距离,从而实现在head node上只放置4颗retimers,但标准版的DGX里是8+8 retimers的设计)。此外,一个DGX server里还配有2颗144 lane的PCIe Gen5 switch,用于连接CPU,GPU,以及CX7网卡。具体来说,每颗PCIe switch要连接1颗Intel或AMD的CPU,占用16 x 2 = 32 lanes;2张CX7网卡,占用16 x 2 = 32 lanes;以及4张GPGPU卡,占用16 x 4 = 64 lanes,总共占用了128 lanes,剩下的144 – 128 = 16 lanes英伟达没有规定配置,留给客户和整机厂家自由发挥(见下图,以AMD CPU DGX为例):
这其中,PCIe Gen5 retimers英伟达采用的是Astera Labs,一颗的量产价格在$30~35(取决于客户要的量多少);PCIe Gen5 switch则采用的是博通的PEX89144,一颗的量产价格在$400~450。讲完了DGX server, 下面让我们来看一下英伟达GB200 compute tray的PCIe拓扑结构图:
这里大家可能有一个理解的误区:自从Astera Labs在OCP大会宣布其Scorpio PCIe Gen6 switch产品会用在GB200之后,有一些投资人误以为上图中蓝色的PCIe fanout switch即是这颗用在GB200里的PCIe switch。其实这只是一个PCIe Gen3 switch(16个uplink接Grace CPU + 18个downlink接USB/BMC/Boot/Debug network),用于管理compute tray里面的一些miscellaneous/peripherals设备,由美国Analog芯片公司Diodes供应。英伟达标准版的GB200 reference design里面是没有PCIe Gen6 switch的,而只有采用非英伟达CX8网卡和/或采用非英伟达Grace CPU的hyperscalers客户才需要在GB200 compute tray里加装PCIe Gen6 switch。
我们知道,Astera Labs今年首先推出的是一款64 lane的PCIe Gen6 switch,用于连接compute tray里面的CPU/GPU/NIC/NVMe。笔者根据供应链调研得知,一张GB200卡需要对应使用2颗Astera Labs的64 lane PCIe switch,其中每颗PCIe switch要连接1颗CPU,占用17 lanes;1张NIC网卡,占用16 lanes;1张GPGPU卡,占用16 lanes;以及2个SSD(即NVMe),占用2 x 4 = 8 lanes,总共占用了57 lanes,剩下的64 – 57 = 7 lanes暂时闲置,不同客户可以根据自己需要自行配置(见下图):
一个GB200的compute tray有两张GB200卡,因此需要配置2 x 2 = 4颗这样的64 lane PCIe switch。此外,虽然标准版的GB200 compute tray因为CPU和GPU距离很近且是通过NVLink C2C连接,因此不需要再使用PCIe retimer,但如果hyperscalers客户采用based on FPGA的自研的NIC网卡,且NIC和NVMe是放在另外一块主板之外的extended board上的话,那就仍然会需要采用4颗PCIe retimers(对应4张NIC网卡)。
基于以上DGX和GB200的PCIe拓扑结构,我们可以来测算GB200中的价值量了,以及介绍Astera Labs目前拿到的GB200项目客户是谁。
如前文所说,Astera Labs在英伟达DGX server中的价值量大致为$30~35 ASP x 16 PCIe Gen5 retimers = $480~560 per compute tray,or $60~70 per GPU。如果单从retimer的角度来看的话,Astera Labs在GB200的content dollar的确会大幅下降:$45~50 ASP x 4 PCIe Gen6 retimers = $180~200 per compute tray,or每GPU$45~50。
这里需要注意的是,虽然GB200中PCIe retimer的使用量减少了很多,但因为PCIe Gen6 retimer与PCIe Gen5 retimer相比技术上有着显著提升,因此ASP将会有~50%的提高。
但这只是计算了DGX vs. GB200里面PCIe retimer的content。当我们把公司Scorpio PCIe Gen6 switch产品加入进去,就会发现Astera Labs在GB200中的价值量其实是大幅增加的:目前PCIe Gen6 switch芯片仍然在sampling阶段,所以还不知道确切的量产价格,但笔者大致推算一颗64 lane 的PCIe Gen6 switch价格应该在$200~250之间。一个GB200 compute tray里面需要用4颗。再加上4颗PCIe Gen6 retimers,则Astera Labs在英伟达GB200 中的content dollar大致为$1000~1200 per compute tray,或者每GPU $250~300。
Scorpio Fabric交换机,再来添把火
今年四季度初,Astera Labs推出专为云级AI基础设施打造的全新Scorpio Smart Fabric交换机产品组合,这也是公司的第四个产品线。很多人比较看好这一新产品,声称其将帮助Astera Labs公司大幅提升价值量。
Astera Labs在三季度的财报中也指出:我们的 Scorpio 智能光纤交换机系列超越了我们目前的 PCI Express 和以太网 Retimer 级产品以及用于 CXL 内存的控制器级设备的市场足迹,为我们的 AI 和云基础设施客户提供了有意义的更高功能和价值。我们估计,到2028年,Scorpio 将把我们四个产品系列的总市场机会扩大到120亿美元以上。
Scorpio Smart Fabric交换机系列包含两条应用专用产品线,包括用于 GPU 到 CPU/NIC/SSD PCIe Gen 6连接的P系列和用于平台专用后端GPU集群的X系列。
Scorpio P系列结构交换机是业界首款支持 PCIe 6 的交换机,其架构专为混合流量头节点连接而设计,可跨多样化的 PCIe 主机和端点生态系统进行数据提取。
Scorpio X 系列结构交换机专为提供最高的后端 GPU 到 GPU 带宽而设计,并通过其软件定义的架构支持特定于平台的自定义。协议增强、带宽和延迟调整以及扩展的遥测功能方面的创新提供了优化,可以可靠地扩展同构 GPU 或加速器结构,从而为实时洞察提供最佳的直接用户体验,并最大限度地延长正常运行时间,以提高大规模 AI 训练和推理构建的投资回报率。
公司的Scorpio PCIe Gen6 switch目前已经进入了AWS和Google的客制化GB200 rack(即compute tray中采用自研的NIC而非英伟达的CX网卡)。具体拿到多少订单?在台积电的投片明年增长多少?从台积朋友那里问到一些可靠的排产数字只能说按照上述推演算估值的话,的确还是贵...但产业群有个做互联芯片的创业大佬称赞这家公司产品力很强,且后续还有很多产品线,长期非常看好。总之分歧是越来越大,欢迎大家去知识星球讨论。
END
👇半导体精品公众号推荐👇
▲点击上方名片即可关注
专注半导体领域更多原创内容
▲点击上方名片即可关注
关注全球半导体产业动向与趋势
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3940内容,欢迎关注。
推荐阅读
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦