核心观点
1、交换机变革 1:AI 驱动组网架构变革,新增后端组网需求
相比传统网络架构,AI 服务器组网增加后端网络组网(Back End),增加了每台服务器的网络端口数量,叠加 AI 集群加速 Scale out,万卡、十万、百万卡集群组网使得网络架构层数提升,有望带来大量高速交换机需求。当前 IB 仍然主导AI 后端网络,但以太网根基深厚,生态厂商众多,未来以太网方案占比有望逐步提升,最终或将成为主流方案。
2、交换机变革 2:800G 交换机开始放量,102.4T 交换芯片有望推出
AI 大模型参数量持续增长倒逼集群规模提升,叠加 AI 芯片带宽提升,促使交换机端口速率及交换容量同步升级。交换机端口速率从 200G 向 400G、800G、1.6T 提升,交换芯片带宽容量提升至 25.6T、51.2T,下一代 102.4T 交换芯片有望于2025 年下半年推出,盒式交换机端口数量得以持续增长以支持组网规模提升,高速数据中心交换机市场规模有望快速增长。
3、交换机变革 3:交换机白盒化趋势显著,带来新成长机遇
白盒交换机是一种硬件与软件解耦的网络交换机,其硬件由开放化的硬件组件组成,而软件可由用户或第三方自由选择和定制,具备灵活性、可扩展性较高、采购和维护成本较低等优势,广泛应用于互联网厂商和运营商网络,交换机白盒化趋势显著,目前产业生态较为完善,商用交换机芯片厂商、JDM/ODM/OEM 交换机设备商有望迎来发展新机遇。
4、交换机变革 4:光交换机商用逐渐成熟,光电融合组网落地大模型训练
光电路交换机(OCS)主要通过配置光交换矩阵,从而在任意输入/输出端口间建立光学路径以实现信号的交换,相比电交换机,光交换机具有成本低、时延低、功耗低、可靠性高等特点,在 AI 大模型预训练应用场景中表现较好。当前光电融合方案中 OCS 方案商用化程度较高,基于 3D-MEMS 系统的 OCS 方案综合应用较好。
5、投资建议:AI 时代交换机迎来四大变革,交换机产业链有望长期受益。(1)交换机&交换芯片推荐标的:紫光股份、盛科通信、中兴通讯;受益标的:锐捷网络、菲菱科思、共进股份、烽火通信、Arista 网络、思科、Juniper、博通、Marvell 等;(2)全光交换机受益标的:光迅科技、Coherent 等;(3)工业交换机受益标的:映翰通、三旺通信、东土科技等;(4)交换机配套 AIDC 推荐标的:宝信软件、润泽科技;受益标的:光环新网、奥飞数据、云赛智联、网宿科技等;(5)交换机配套光器件推荐标的:中际旭创、新易盛、天孚通信;受益标的:华工科技、光迅科技、源杰科技等;(6)交换机配套液冷推荐标的:英维克;受益标的:科华数据、网宿科技、飞荣达、高澜股份、申菱环境等。
6、风险提示:云计算需求不及预期、数字经济增长不及预期、AI 发展不及预期
报告原文
1、交换机:AI 时代的核心网络通信设备
以太网交换机是重要的通信网络设备,随着全球 AI 的高速发展,AI 集群规模持续增长,AI 集群网络对组网架构、网络带宽、网络时延等方面提出更高要求,带动交换机朝着高速率、多端口、白盒化、光交换机等方向持续迭代升级,我们认为AI 时代交换机有望迎来四大产业变革新机遇。
交换机变革1:AI 集群新增后端组网需求,集群规模持续增长,以太网占比有望逐步提升,有望带来大量高速以太网交换机需求
(1)AI 训练集群带来 GPU 互联需求,新增后端网络组网需求。AI 服务器比传统服务器新增 GPU 模组,GPU 模组通过对应的网卡与其他服务器或交换机互联,实现各节点之间的通信。因此相比传统网络架构,AI 服务器组网增加后端网络组网(Back End),增加了每台服务器的网络端口数量,拉动对高速交换机、网卡、光模块、光纤光缆等组件需求。
(2)AI 集群加速 Scale out,万卡、十万、百万卡集群组网带来大量高速交换机需求。随着 AI 模型参数持续增长,带动集群规模从百卡、千卡拓展至万卡、十万卡,Scale out 推动组网架构从 2 层向 3 层、4 层架构拓展,带来大量高速交换机需求。
(3)以太网网络根基深厚,生态厂商众多,AI 网络中以太网网络占比有望持续提升。IB 网络凭借低延迟、堵塞控制以及自适应路由等机制,仍然主导 AI 后端网络,但随着以太网网络部署的不断优化,超以太网联盟加速发展,我们认为未来以太网方案占比有望持续提升,带动以太网交换机需求增长。 在当前“电算光传”的信息社会下,微电子/光电子其技术瓶颈不断凸显,硅基光电子具有和成熟的CMOS微电子工艺兼容的优势,有望成为实现光电子和微电子集成的最佳方案。
交换机变革2:AI 网络带来低时延、大带宽等网络需求,400G/800G 交换机持续放量,1.6T 交换机加速落地
AI 大模型参数量持续增长倒逼集群规模提升,叠加 AI 芯片带宽提升,促使交换机端口速率及交换容量同步升级。交换机端口速率从 200G 向 400G、800G、1.6T 提升,交换芯片带宽容量提升至 25.6T、51.2T,下一代 102.4T 交换芯片有望于 2025 年下半年推出,盒式交换机端口数量得以持续增长以支持组网规模提升,高速数据中心交换机市场规模有望快速增长。
1.1、交换机工作在数据链路或网络层,负责电/光信号转发
交换机是用于电/光信号转发的网络设备。普通二层交换机(Switch)意为“开关”,是一种用于电(光)信号转发的网络设备。它基于MAC地址进行数据的转发,工作在OS七层模型中的第二层(数据链路层)。普通交换机具有多个端口,每个端口都具备桥接功能,可以连接一个局域网或一台高性能服务器或工作站。当设备接入交换机时,交换机会学习设备的MAC地址,并将MAC地址与端口对应起来,形成一张MAC地址表。在后续的数据传输过程中,交换机根据数据包中的MAC地址信息,将数据从对应的端口发送出去,实现数据的精准转发。按应用场景和传输介质来看,交换机种类较多。
交换机是重要的通信网络设备,最常见的网络交换设备以以太网交换机为主,其次还包括语音交换机、光纤交换机等,适应不同网络环境与应用场景。
按照应用场景划分:(1)园区用以太网交换设备:可分为金融类、政企类、校园类;(2)运营商用以太网交换设备:可分为城域网用、运营商承建用以及运营商内部管理网用;(3)数据中心用以太网交换设备:可分为公有云用、私有云用、自建数据中心用;(4)工业用以太网交换设备:可分为电力用、轨道交通用、市政交通用、能源用、工厂自动化用等。
以太网交换设备已支持多个层级的数据转发,网络性能持续提升。早期以集线器为代表的以太网设备主要在物理层工作,无法隔绝冲突扩散,网络性能难以提升,而以太网交换机能够隔绝冲突,持续提升以太网性能。世界上第一台以太网交机最早于1989年问世,经过三十余年的的发展,以太网交换机在转发性能和功能上持续提升。转发性能方面,以太网交换设备的端口速率从10M发展到800G,单台设备的交换容量从Mbps量级提升至Tbps量级。功能方面,以太网交换设为二层交换机、三层交换机和叠加型多业务交换设备。二层交换机和三层交换机之间的最大区别在于路由功能,叠加型多业务交换设备(四层或更高层)除了实现二层和三层的业务外,还可具备如防火墙、网关等其他功能。
交换机与其他网络设备功能各不相同。光猫:工作在物理层,通常安装在网络入口处即光纤接入点处,用于光电信号转换,主要应用在家庭网络接入场景;路由器:工作在网络层,连接不同网络,基于IP地址进行转发与路由选择;网关:通常用于连接使用不同协议的网络,能够在多个层次上进行必要的翻译和协议转换。二层交换机主要工作在数据链路层,具有网桥和集线器的功能,用于同一网络内基于MAC地址进行帧/数据包转发与过滤。
从交换机物理形态上,可以分为框式交换机和盒式交换机。框式交换机通常由一个机框和多个插槽组成,可以插入不同类型和数量的模块,如接口模块、主控模块、交换模块等,具有较高的灵活性和扩展性;而盒式交换机一般是一体化设计,接口数量和类型相对固定,部分盒式交换机接口采用模块化设计。框式交换机与盒式交换机的主要差异更多体现在内部构造与应用场景(OSI使用层级)上。
2、交换机变革1:AI驱动组网架构变革,新增后端组网需求
2.1、RDMA技术被广泛应用于AI智算中心组网,IB与以太网分庭抗礼
交换机下游需求场景主要包含数据中心、园区及企业、工业和运营商共4种网络场景,不同场景下交换机组网架构略有区别,根据终端设备数量采用2层或3层组网架构。其中,园区场景可采用无源光纤网络(PON)网络2层架构组网,主要由核心交换机、光线路终端OLT、无源分光器POS、ONU光网络单元组成;也可采用全光以太网络组网,由核心、汇聚、接入交换机组成。工业场景中对交换机速率要求不高,需要设备的稳定性和可靠性更高,能适应严峻的工业作业场景。
传统的数据中心主要面向业务场景,以服务器或虚拟机为池化对象,网络提供服务器或虚拟机之间的连接,数据大多进行南北向流动。而智算中心主要面向任务场景,以算力资源为池化对象,网络提供 CPU、GPU 和存储之间的高速连接,数据大多进行东西向流动。
传统三层网络架构主要是为南北向流量设计,包括核心层、汇聚层、接入层交换机,当东西向流量较大时,服务器间通信数据转发路径有5跳,汇聚层和核心层交换机的流量压力会快速增加,网络性能会局限在汇聚层和核心层。相比Spine-Leaf架构,扁平化设计可缩短服务器之间的通信路径,转发路径仅有3跳从而降低延迟,更适合东西向流量较大的业务,同时,Spine-Leaf拓扑架构还拥有较好的可扩展性,横向扩展时不需要重新架构。
AIGC发展带来蓬勃算力需求,大模型加速迭代拉动。2022年底生成式AI大模型ChatGPT横空出世,掀起新的AI浪潮,海内外云计算厂商和研究院所等企业均陆续投入到大模型研发当中。人工智能发展迅速,AI大模型快速迭代,从语言模型走向多模态,模型架构不断优化,出现MOE混合专家模型等架构。当前Scaling Law依旧成立,模型为获得更好的性能,数据量和参数规模均呈现“指数级”增长,算力需求持续增长。从参数量来看,以GPT模型为例,GPT-3模型参数约为1746亿个,训练一次需要的总算力约为3640 PF-days。据中国信通院数据,2023 年推出的 GPT-4参数数量可能扩大到 1.8 万亿个,是 GPT-3的10 倍,训练算力需求上升到 GPT-3 的 68 倍,在 2.5 万个 A100 上需要训练 90-100 天。
AI模型参数持续增长,单卡算力和显存受限,迫使训练集群规模持续增长,AI军备竞赛下,网络性能成制胜关键之一。对于参数较大的AI模型,更大的网络带宽能够显著减少训练完成时间。
伴随模型参数增大,网络瓶颈问题逐渐凸显。AI 大模型以GPU 集群分布式训练为基础,但随着AI算力集群规模的扩大,超大集群并不直接意味着超大算力,训练过程中各集群节点间需要频繁地进行参数同步,产生大量通信开销。集群有效算力正比于(GPU 单卡算力×总卡数×加速比×有效运行时间),加速比指单处理器和并行处理器在处理同一任务时消耗时间的比率,当集群规模越大时,集群算力的实际增长程度越低,即集群算力不等于集群GPU数量与单GPU性能的乘积,集群算力的损失值大多是因为网络耗时导致,而网络性能则是决定GPU集群算力加速比的关键。
AI模型参数持续增长,AI训练集群带来GPU互联需求,新增后端网络组网需求。传统数据中心架构下,传统服务器与交换机之间通过网卡互相通信,网卡可直连CPU进行数据交换;AI服务器比传统服务器新增GPU模组,服务器内部GPU之间通过PCIe Switch芯片或NVSwtich芯片实现内部互联,GPU模组通过对应的网卡与其他服务器的网卡互联,实现各节点之间的通信。因此相比传统网络架构,AI服务器组网增加后端网络组网(Back End),增加了每台服务器的网络端口数量,拉动对高速交换机、网卡、光模块、光纤光缆等组件的需求。
RDMA技术广泛应用于智算中心组网。RDMA(RemoteDirect Memory Access)远程直接内存访问技术,可以绕过操作系统内核,让一台服务器可以直接访问另外一台服务器的内存,相较于传统TCP/IP网络,时延性能会有数十倍的改善。且有零拷贝、内核旁路、无 CPU 干预的特性,使得 AI 应用可以借助无损网络直接与远端服务器进行数据交互和内存读写,有助于消除GPU跨节点通信网络瓶颈,提高资源利用率和训练效率。
RDMA包含IB、RoCE和iWARP共三种实现方式。 其中,iWARP 是基于 TCP/IP 的RDMA 技术,受到 TCP 影响,性能稍差,使用较少;RoCEv1技术当前已经被淘汰,主要以RoCEv2技术为主。
IB网络于1999年由IBTA提出,为第一代 RDMA技术,是一种专用无损网络,包括私有协议和专用硬件,和以太网不能互通。IB 网络从硬件层面保证数据无损,基于 credit 信令机制,确保发送端数据不会过量发送,从根本上避免缓冲区溢出分组丢失。即只有在确认下一跳有额度能接收对应数量的报文后,发送端才会启动报文发送。由于网元和网卡都必须得到授权才能发送分组,因此IB网络不会出现长时间拥塞,能够保证可靠传输的无损网络。
RoCE网络是一种纯分布式网络,将RDMA技术应用到传统以太网,本质上是一种网卡封装技术,只需配置支持 RoCE 的网卡和交换机即可,RoCE网络设备的国产化厂家较多,国内数据中心交换机厂商包括华为、新华三、中兴通讯、锐捷网络等。
IB网络时延较低,RoCE组网性价比显著。对比IB和RoCE网络来看,(1)性能方面:IB网络端到端时延更低,应用层性能方面更好,但RoCEv2性能足以满足绝大多数场景需求。(2)组网规模方面:IB网络可支持万卡GPU规模集群,RoCEv2在千卡规模集群上表现较好,组网性能仍在持续优化;(3)运维方面:IB网络技术上更为成熟,无需复杂参数调优,部署更快。(4)成本方面:IB组网成本较高,主要是IB交换机成本高于传统以太网交换机。(5)生态方面:IB生态较为单一,以英伟达为主,RoCEv2基于以太网,生态较为开发,供应商较多。
IB网络仍为AI集群后端组网主流选择,以太网份额持续增长。当前数据中心交换机通常用于通用服务器前端组网,而AI集群中算力卡间频繁通信,AI工作负载持续拉动服务器后端网络建设。IB网络凭借低延迟、堵塞控制以及自适应路由等机制,仍然主导AI后端网络,但随着以太网网络部署的不断优化,我们认为未来以太网方案占比有望持续提升,据650group预测,以太网在RDMA市场中占比将逐渐提升,2027年市场份额将超过IB网络,成为主流选择:
(1)国内外头部云厂商积极使用以太网部署AI网络。AWS使用以太网为Trainium2 GPU组网形成6万以上规模的GPU集群;Meta 构建2个由24576个H100 GPU组成的算力集群,其中一个集群使用Arista 7800等交换机通过RoCE网络组网用于Llama3的训练,另一个集群采用Quantum 2交换机通过IB网络组网训练,两种组网方式下均不存在网络瓶颈,RoCE网络在万卡规模组网下表现良好;字节跳动使用以太网部署万卡GPU的AI集群。
(2)以太网根基深厚,中腰部云厂商及大型企业或继续选用以太网。虽然当前主要需求来自头部云厂商,但中腰部云厂商及大型企业需求仍然十分显著,据Dell'Oro Group预计Tier 2/3 CSP厂商及大型企业需求在未来五年内接近 100 亿美元,更偏向于使用以太网组网。
超以太网联盟成立以对抗IB网络。在 AIGC 等因素催化下智算需求激增,IB网络凭借零丢包特点在 AI 训练中独占鳌头。为取代RoCE协议,创建一个适用于AI/HPC场景、基于以太网的完整通信堆栈架构,以提高网络吞吐量、降低延迟,UEC孕育而生,成员包括AMD、Arista、博通、思科、华为、新华三、锐捷网络等设备商以及 Meta、微软、BAT等云厂商。UEC旨在优化以太网以实现高性能 AI 和 HPC 网络,最大限度地保持以太网的互操作性。我们认为,随着超以太网联盟的成立,多方厂商有望共同合作加速以太网发展,促进以太网网络在AI后端网络占比持续提升,逐步挑战IB领导地位。
国内主导GSE和ETH+协议加速智算网络建设。
2023年5月,中国移动联合 10 余家企业发布全调度以太网技术架构(GSE)白皮书,并在2023年8月启动GSE推进计划,已有中国移动、中国联通、腾讯、华为、中兴通讯、锐捷网络、新华三、盛科通信、燧原科技等多个厂商加入。全调度以太网技术划分为 GSE1.0 和 GSE2.0 两个商用阶段,GSE1.0 基于现有芯片最大限度地支持 GSE 新技术,优化网络性能,已在中国移动智算中心(哈尔滨)超万卡集群实现首次商用,GSE2.0则全面革新以太网底层转发机制和上层协议栈,从根本上解决传统无损以太性能和可靠性问题。
2024年9月,由阿里云和中科院计算技术研究院牵头,联合平头哥、盛科通信、腾讯、字节跳动等40余家机构发布内首个高通量以太网(ETH+)协议标准1.0。ETH+协议通过优化帧格式,实现了有效载荷比74%的提升;通过深度支持链路层和物理层的重传技术,ETH+以太网的语义可靠性及规模大幅提升;基于RDMA的在网计算技术,实现集合通信性能提升30%以上。
2.2、AI/ML后端市场快速增长,拉动交换机和网卡需求
AI/ML后端网络市场规模快速增长,拉动交换机和网卡需求。后端网络可采用运用RDMA技术的RoCE以太网和IB网络组网,据650group数据,2021年之前,RDMA的市场规模每年在4亿至7亿美元之间,主要受HPC应用的驱动。2023年,由于AI/ML部署的激增,市场对RDMA的需求激增至60亿美元以上,预计到2028年将突破220亿美元,分产品来看,主要以交换机设备需求为主,分技术来看,以太网网络占比持续提升。
从各业务网络速率需求上看,计算网络需求较高。每个GPU对应一个高速率网络端口如400G、800G、1.6T等,以SXM 8卡GPU模组为例,则对应8个网络端口;存储网络速率需求同样较高,但端口相对较少;管理/业务网络速率则相对较低。
从组网架构上看,智算AI集群组网需满足大带宽、无阻塞以及低时延等需求,要求数据中心交换机提供全端口线速转发的能力,并对交换机端口速率以及密度提出更高要求,交换机下联和上联带宽采用1:1无收敛设计,即如果下联有32个800Gbps端口,则上联也有32个800Gbps端口。
主流网络架构包含Fat-tree、Torus、Dragonfly三种。其中,Fat-Tree拓扑具有网络直径短,端到端通信跳数少,建网成本低的优点,适用于中小规模智算中心。当网络达到一定规模后,例如上万节点时,可采用三层架构或改用Dragonfly和Torus。Dragonfly和Torus拓扑的建网成本更低,交换机端到端转发跳数明显减少,可提升网络整体吞吐和性能,适用于大规模、超大规模智算中心。
(1)Fat-Tree是一种树形拓扑,网络带宽不收敛,支持对接入带宽的线速转发,并且在横向扩展时支持增加链路带宽。Fat-Tree拓扑中所使用的网络设备均为端口能力相同的交换机,可有效降低网络建设成本。
(2)Torus是一种环面拓扑,它将节点按照网格的方式排列,然后连接同行和同列的相邻节点,并连接同行和同列的最远端的2个节点,使得Torus拓扑中每行和每列都是一个环。Torus拓扑通过从二维扩展到三维、或更高维的方式增加新的接入节点,可提高网络带宽,降低延迟。以谷歌TPU OCS网络为例,采用4096个TPU v4 进行3D Torus组网。
(3)Dragonfly是一种分层拓扑, 包括Switch、Group和System 3层,其中Switch层包括一台交换机和与其相连的多个计算节点,交换机负责连接对应计算节点以及其他Group的交换机;Group层包含多个Switch,多个Switch间进行全连接;System层包含多个Group,多个Group间也进行全连接。主要优势是网络转发路径小,组网成本较低,多用在超算领域。
在胖树组网架构下,以搭配8卡SXM GPU模组的AI服务器组网为例,每个服务器1号网口上连至leaf层1号交换机,2号网卡连接至leaf层2号交换机,并以此类推,直至8号网口连接至8号交换机。每8台 Leaf交换机和下联的A I服务器组成一个group, 每8 台 Leaf交换机又与上面对应的Spine交换机组成一个pod。若算力集群规模持续增长至3层组网,则以Pod为单位持续拓展,加入Core交换机进行组网,所有交换机之间均采用Fullmesh全连接,leaf和spine层交换机上下行收敛比为1:1无收敛,spine和Core层组网可能存在收敛比。
两层和三层无收敛网络架构可容纳GPU卡规模,取决于交换机端口数量和速率(即交换容量=端口数×端口速率×2),因此超大AI集群需要高端口密度和高速率端口的数据中心交换机。以N代表GPU卡规模,以P代表单台交换机端口数量,根据我们测算,则两层无收敛组网架构下最多支持P^2/2 GPU卡,对应3/2P台交换机;三层组网最多支持P^3/4 GPU卡。
以DGX B200服务器、NVIDIA MQM9790 64个400G端口交换机(32个OSFP端口)为例,服务器后端中间有4个双端OSFP对应8个GPU,31台服务器(即248个GPU)组成1个节点上联8台leaf交换机,并对应4个Spine交换机,共计12台计算网络节点交换机。此外,存储网络仍需配套高速400G交换机,管理网络则速率较低(100Gbps),均会带来大量数据中心交换机需求。
2.3、未来组网架构—Scale up和Scale out的探讨
为支持万亿或更大参数量模型持续发展,未来集群规模或将从万卡逐渐向十万卡或更大规模扩展,对于超节点及超大规模组网架构,未来有望从Scale up和Scale out两个维度来实现总算力规模的提升。
Scale up:主要通过提高单个节点内的算力规模,进而提升集群的算力规模。在服务器层面增加算力芯片总数,以A100、H100、B200 DGX系列为例的单个AI服务器内部算力模组主要由8张算力卡内部通过NVSwitch芯片互联组成,未来有望通过引入支持更多算力芯片互联比如16卡、32卡互联的Swtich芯片,以优化GPU南北向的互联效率和规模,增强张量并行或MoE并行的数据传输能力,同时提升GPU卡间互联带宽,通过高速互联总线将更多算力芯片互联,提升单服务器算力性能;在机柜层面增加服务器总数,以GH200 NVL32、GB200 NVL72为例,单机柜内部通过引入更多服务器再搭配高速交换机实现互联,提升单机柜算力性能,再通过机间互联扩展至NVL576,提升单个节点的算力性能。
Scale out:主要通过高速互联容纳更多节点,进而提升集群整体算力规模。当前机间通信主要以400G/800G为主,未来有望通过更高速率如1.6T组网互联,以提高互联带宽,支持更多节点高速互联;采用CPO (Co-Packaged Optics) /NPO (Near Packaged Optics)、多异构芯片C2C (Chip-to-Chip)封装等方式降低延时,进而提升数据传输效率;通过增加交换机端口数量提升相同架构下的GPU节点数量上限,或通过增加集群组网规模以实现更多节点间互联,如从2层胖树组网增加至3、4层组网架构,或改由Torus、Dragonfly等方式组网,实现从千卡向万卡、十万卡集群拓展。
3、交换机变革2:800G交换机开始放量,102.4T交换芯片有望推出
3.1、AI大幅提升算力需求,驱动以太网交换机需求增长
以太网的起源可以追溯到1973年,梅特卡夫发明了基于Aloha网络的新系统,改进了Aloha可随意访问共享通信信道的机制,能够把任何计算机连接起来,实现计算机之间的数据传输,该系统被其命名为以太网。3年后,以太网局域网时代正式开始,为了能接入更多不同的设备,以太网技术走上标准化之路。此后,以太网进入了高速发展的40年,网络速度快速提升,从10Mbps到百兆、再到千兆、万兆以太网,到现在以太网已具备400、800Gbps的商用能力;应用范围也从最初的局域网,进入到城域网和广域网。
经过几十年的发展,以太网已经广泛运用在生活中的多个场景如汽车、工业、企业和校园、运营商和云服务商网络等。分场景来看,(1)汽车向智能化、网联化发展,车内高速以太网在丰富的多媒体需求以及自动驾驶辅助系统(ADAS)等需求推动下高速发展,以太网速率从10M逐渐向100G提升;(2)传统工业持续推进数字化转型,工业4.0、新型工业化背景下,工业生产设备数据互联互通,从传统的现场总线网络转向以太网,以太网速率从10M逐渐向10G或更高速率提升;(3)运营商网络多年来持续推动以太网迭代,在DCI、PON光接入、OTN等多个场景中运用以太网技术,随着5G-A、6G时代来临,以太网有望向800G、1.6T更高速率升级;(4)AIGC浪潮下,云服务厂商加速部署高速高密度网络,随着AI模型参数持续增长,算力节点之间的互联带宽需求高速增长,持续推动以太网速率扩展800G、1.6T。
由于交换机使用场景较为分散,行业产业链参与公司众多。交换机产业链上游主要包括芯片、元器件、光模块、电路板、网络操作系统、电源模块和结构件等元件;中游按照终端应用场景,可分为工业交换机、运营商交换机、数据中心交换机、园区交换机等;下游应用于电信运营、云服务、数据中心等领域。从交换机出货形式可分为传统交换机、白盒交换机和裸金属交换机,其中,传统品牌交换机厂商主要包括思科、华为、新华三、Juniper、中兴通讯、Mellanox等,白盒交换机厂商主要包括Arista、锐捷网络、新华三等,裸金属交换机包括Accton、Quanta、Alpha Networks等。交换机作为数据中心的网络底座,随着数据中心的持续建设,有望带动数据中心交换机的需求。
从交换机原材料成本结构来看,芯片成本占比达到32%,包含以太网交换芯片、CPU、PHY、CPLD/FPGA等,其中以太网交换芯片和CPU是最核心部件,其次为光器件、接插件、壳体、PCB等。
数据中心以太网交换机主要客户为云厂商,园区交换机主要客户为中大型企业。以太网交换机市场可分为数据中心交换机市场、园区交换机市场、运营商市场和工业交换机市场,其中,数据中心和园区交换机市场空间较大。据650 Group数据,预计2024年全球数据中心和园区以太网交换机市场规模都将超过200亿美元,从下游客户结构来看,数据中心交换机客户主要以北美五大云厂商为主,园区交换机客户主要为中大型企业。
国内数据中心交换机占比有望持续提升。据中商情报网数据,国内交换机市场以数据中心交换机为主,2022年,国内数据中心用以太网交换机收入占比达47%,我们认为园区交换机需求受宏观经济发展节奏影响较大,当前需求增长放缓,相反,AIGC发展迅猛,或将带动数据中心交换机持续放量,占比有望持续提升。从交换机制造商结构上来看,仍以品牌商自产为主,2021年国内交换机品牌商占比68.7%。
随着AIGC持续发展,交换机作为算力网络底座,需求有望加速释放。据IDC预测,全球生成式AI数据中心以太网交换机市场将以70%的年复合增长率快速增长,有望从2023年的6.4亿美元增长到2028年的90.7亿美元。
全球以太网市场份额较为集中,CR5超75%,思科份额领先,华为、新华三份额靠前。交换机从全球市场份额来看,2023年,思科以太网交换机营收同比增长22.2%,非数据中心交换机占比69.5%,仍居以太网交换机市场首位,市场份额达到43.7%;Arista凭借数据中心交换机放量,以太网交换机营收同比增长35.2%,市占率达到11.1%;华为以太网交换机营收同比增长10.6%,市场份额达到9.4%;HPE以太网交换机营收同比增长67.6%,其中89.6%来自非数据中心领域,市占率达到9.4%;新华三2023年市占率达到4.2%。
3.2、交换芯片不断升级,102.4T芯片有望于2025年底推出
通常有三种方式来增加数据中心以太网互联速率:(1)使用更复杂的信号调制技术,以提高比特速率,增加传输效率,如PAM4信号调制技术的比特速率是NRZ信号技术的2倍;(2)增加单通道速率或波特率;(3)增加通道数量。
交换芯片平均迭代周期约为2年,下一代102.4T交换芯片有望于2025年底推出。数据中心网络对高性能交换机的需求推动以太网交换芯片的飞速发展,以博通开发的数据中心交换芯片Tomahawk系列为例,第一代Tomahawk芯片于2014年下半年发布,带宽3.2Tbps,采用25Gbps SerDes技术,支持32个100G端口;2022年下半年,Tomahawk5发布,单芯片带宽高达51.2Tbps,采用112Gbps SerDes技术,支持64个800G端口(单芯片最多具有64个集成Peregrine SerDes内核,每个内核集成8个SerDes和相关PCS)。
芯片制程由2014年的3.2T 22nm快速演进至2022年的51.2T 5nm,据博通公开电话交流会,下一代102.4T芯片有望于2025年底推出,或将采用3nm制程,单芯片功耗存在超过1000W的可能,或切换至液冷散热模组,我们认为下一代芯片或将沿用PAM4技术,SerDes速率或将达到224Gbps,通道数量保持512个,并且延时方面更低以支持AI集群网络发展。
AI高密度训练需求下,高交换容量交换机需求持续增长,采用多芯片盒式交换机的形式有望填补芯片迭代真空期带来的盒式交换容量瓶颈。2024年3月,英伟达在GTC大会上发布Quantum-X800系列交换机,包含4颗交换芯片,可实现端到端 800Gb/s 吞吐量。以Q3400-RA型号为例,整体高度4U,可实现144个800G端口分布在 72 个OSFP端口中,总交换容量带宽达到115.2Tbps,单个隧道为200Gb/s SerDes,其中,Q3400仍采用风冷散热设计,Q3400-LD采用液冷散热设计。由于单交换机包含4颗交换芯片,交换机容量增长带动可支持高速率端口数量增长,可充分满足AI集群的高密度组网需求,两级胖树拓扑结构下,可连接至多10368个NIC网卡,Quantum-X以太网系列已被Azure和Oracle云采用。
中国移动主导GSE芯片研发,国产51.2T交换芯片加速发展。2024年9月,中国移动启动GSE芯片合作伙伴招募,计划向GSE交换芯片方向投入上亿元资金,与合作伙伴共同开发一款高规格的(51.2T以上),适用于智算、通算、超算等场景的芯片产品,国产交换芯片有望加速追赶。
3.3、AI拉动高速交换机需求,全球800G交换机开始放量
AIGC持续带动数据中心市场持续增长,800G端口数据中心交换机有望于2024年开始放量,400G需求加速释放。据IDC数据,2023年全球以太网交换机市场规模达到442亿美元,同比增长20.1%,全球企业及运营商路由器市场规模达到164亿美元,同比基本持平。分市场结构来看,2023年数据中心市场规模达到183亿美元,同比增长13.6%,占比达到41.5%,其中,100G端口交换机仍为市场主流,占数据中心市场46.3%,营收同比增长6.4%,200/400G端口交换机营收同比增长68.9%,ODM厂商直销营收达到63亿美元,同比增长16.2%,占数据中心市场14.3%;非数据中心交换机市场规模达到259亿美元,同比增长25.2%,其中,1G端口交换机仍占主流,占非数据中心市场56.5%,同比增长24.2%,10G端口交换机2023Q4占比20.4%,全年营收同比增长5.3%。分地区来看,美国地区市场2023年同比增长28.8%,中国市场虽然全年下跌4.0%,但在2023Q4同比增长9.1%,市场需求持续回暖。
据Dell’Oro数据,从端口速率来看,2023年全球100G端口数据中心交换机仍为主流,400G端口交换机加速放量,预计2024年800G端口交换机有望逐渐放量,并逐渐成为主流,1.6T端口交换机有望于2026年左右开始放量。对于AI后端网络,Dell’Oro预计到2027年,AI后端网络中几乎所有端口都将以800 Gbps的最低速度运行,其中1600 Gbps占端口的一半,网络带宽将以3位数复合增速迅速提升。
国内数据中心交换机市场持续增长,加速向400G端口交换机迭代。据IDC数据,2023年中国交换机市场规模同比增长0.7%,其中数据中心交换机同比增长2.2%。随着AI模型的快速发展,数据中心超大规模组网需求持续提升,网络需求由云数据中心CPU计算的10G~100G上升至GPU训练的100G~400G,预计2024年400G端口出货量将继续增长,51.2Tb芯片的成熟商用也将助推400G端口的采用。2023年园区交换机市场受到宏观经济波动影响,同比下滑0.5%,伴随宏观经济好转,园区交换机部署节奏有望回到正轨。
4、交换机变革3:交换机白盒化趋势显著,带来新成长机遇
多方助力,白盒交换机在过去30年间加速发展。1994年,Linux 1.0 版本正式发布,2年后 2.0 版本正式更新,提供了网络协议/功能控制的开源框架。用户可根据自己的需求,对网络功能与协议进行修改和定制。2013年,OCP开启交换机硬件白盒化的标准化工作机硬件白盒化的标准化工作,2015年,第一款白盒交换机 Wedge正式亮相。至今,白盒设备、软件操作系统、网络自动化等技术蓬勃的发展,白盒交换机生态不断完善。
白盒交换机核心在于解耦。传统交换机采用软硬一体化设计,底层芯片与上层系统紧密捆绑,白盒交换机是一种硬件与软件解耦的网络交换机,利用标准化芯片接口解耦底层芯片和上层应用,其硬件由开放化的硬件组件组成,而软件(包括操作系统和网络功能等)可以由用户或第三方自由选择和定制。而裸金属交换机只包含硬件,由用户自主购买或者选择软件操作系统。
从硬件上来看,主要包括(1)交换芯片:用于交换转发数据包,是交换机的核心部件,白盒交换机芯片要求接口标准化,解耦底层芯片和上层应用;(2)CPU芯片:主要管控系统运作;(3)网卡:提供CPU侧管理功能;(4)存储器件:包括内存、硬盘等;(5)外围硬件:包括风扇、电源等,接口、结构等需要符合OCP或其他标准化规范。从软件上看,软件主要指网络操作系统(NOS)以及其所搭载的网络应用,NOS一般通过基础软件平台的引导来完成安装,而芯片接口层会将交换芯片的硬件功能封装成统一的接口,从而实现上层应用与底层硬件的解耦。
白盒交换机灵活性、可扩展性较高。白盒交换机不同于传统品牌交换机,相比传统交换机,白盒交换机灵活性、可扩展性较高,采购和维护成本较低,广泛应用于互联网和运营商网络。白盒交换机产业生态较为完善,上游主要为硬件提供商包括Arista、思科、新华三、锐捷网络、Accton、工业富联、Dell、Quanta等,网络操作系统供应商包括Arrcus,Kaloom,Cumulus,Big Switch、FBOSS、SONIC等,下游客户主要包括云服务商、电信运营商等,主要利用白盒交换机用于业务转型和网络重构。
Sonic逐渐成为超大数据中心网络首选开源系统,白盒交换机市场空间持续增长。2016年,微软在OCP峰会上正式发布SONiC(Software for OpenNetworking in the Cloud)开源交换机操作系统,SONiC将网络软件与底层硬件分离,并建立在交换机抽象接口(SAI)的API之上,SAI为ASIC提供统一接口。目前,SONiC作为一个成熟的构建交换机网络功能的软件集架构,可实现数据控制面与转发面的分离,用户通过购买白盒交换机搭载SONiC实现不同网络功能,能够更快调试、测试、更改软件策略和拓扑,进而实现新的网络架构,已被BBAT、微软、谷歌等国内外多个云厂商规模部署运行,其中大部分为单芯片盒式交换机。据Omdia数据,2022年数据中心以太网交换机端口出货量增长12%,其中思科市场份额为37%,Arista 18%,华为8%,H3C 7%,白盒供应商份额占比14%,同比增长4个百分点。
5、交换机变革4:光交换机逐渐成熟,光电融合组网落地大模型训练
光交换机可靠性更强,功耗更低。在光电融合交换方案中,光交换功能模块的主要方案分为光电路交换(OCS)、光突发交换(OBS)和光包交换(OPS)3种。
光电路交换机(OCS)主要通过配置光交换矩阵,从而在任意输入/输出端口间建立光学路径以实现信号的交换。
(1)由于光传播路径的宽带和无源的特性,OCS对光信号的速率和协议等均是透明的,不需要随着服务器NIC网卡速率以及端口迭代,相同OCS硬件可以跨代际的被重复利用,长期成本开支更低,生命周期较长;
(2)由于没有光/电转换和相应的包处理和分发的过程,OCS拥有更小的每端口功耗,以400Gbps端口为例,OCS每端口功耗<1W ;电交换机每端口功耗>10W),以及较低的时延(OCS时延数十ns,EPS时延百μs);
(3)由于OCS整机使用芯片类型及数量较少,故障率远低于电交换机,可靠性更强。
由于OCS缺乏包处理能力,只能将某个输入/输出端口连通配对, 只有当全局动态的流量预测与实时光交换矩阵配置完美结合时,OCS才能较好满足业务需求,而传统业务流量通常难以预测,成为了制约OCS规模应用的重要因素,但AI大模型预训练基于已知的数据集和模型算法,具有流量可预测的特点,进而催生了OCS的众多应用形式, 当前光电融合方案中OCS方案商用化程度较高,基于3D-MEMS系统的OCS方案综合应用较好。
以谷歌OCS解决方案为例,OCS在谷歌基础设施中主要有Jupiter数据中心和TPU数据中心两大应用场景。在初代Jupiter的基础上,通过引入OCS取代Spine层传统电交换机,将网络逻辑拓扑CLOS架构演进到 Aggregation层的直接光互联, 由于OCS采用光交换,对传输的速率无感,通过进一步引入WDM和环行器等技术可以实现在单根光纤上传输通道数的增加以及Tx/Rx双路信号,以提升单光纤的数据传输速率,在增加带宽容量的同时,减少电力消耗和降低成本。目前已有Polatis、Coherent和光迅等多家公司推出了商用的 OCS产品。
6、投资建议及交换机相关企业介绍
AIGC有望拉动高速交换机需求持续增长,交换机产业链有望长期受益。
(1)交换机&交换芯片推荐标的:紫光股份、盛科通信、中兴通讯;受益标的:锐捷网络、菲菱科思、共进股份、烽火通信、Arista网络、思科、Juniper、博通、Marvell等;
(2)全光交换机受益标的:光迅科技、Coherent等;
(3)工业交换机受益标的:映翰通、三旺通信、东土科技等;
(4)交换机配套AIDC推荐标的:宝信软件、润泽科技;受益标的:光环新网、奥飞数据、云赛智联、网宿科技等;
(5)交换机配套光器件推荐标的:中际旭创、新易盛、天孚通信;受益标的:华工科技、光迅科技、源杰科技等;
(6)交换机配套液冷推荐标的:英维克;受益标的:科华数据、网宿科技、飞荣达、高澜股份、申菱环境等。
6.1、盛科通信:稀缺的国产商用交换机芯片龙头
盛科通信立足于以太网交换芯片领域,提供以太网交换芯片模组和定制化产品解决方案。公司深耕以太网交换芯片领域的研发、设计和销售,现已形成丰富的以太网交换芯片产品序列,目前已拥有100Gbps-2.4Tbps的交换容量和100M-400G的端口速率的交换芯片,覆盖从接入层到核心层的以太网交换产品,自研以太网交换芯片已进入新华三、锐捷网络、迈普技术等国内主流网络设备商的供应链;在自研以太网芯片的基础上提供芯片模组,同时为行业客户提供定制化服务,提供定制化产品解决方案。此外,公司提供少量以白盒以太网交换机为主的终端产品,主要面向企业网络、运营商网络、数据中心网络和工业网络等场景需求。
6.2、紫光股份:国内交换机排头兵,率先布局1.6T端口、800G CPO交换机
紫光股份作为云计算基础设施建设和行业智慧应用服务的领先者,提供智能化的网络、计算、存储、云计算、安全和智能终端等全栈 ICT 基础设施及服务,主要包含:(1)网络设备:交换机、路由器、WLAN、IoT、SDN、5G 小站、PON等;(2)服务器:通用服务器、人工智能服务器、塑合刀片服务器、关键业务服务器、边缘服务器等;(3)存储产品:全闪存集中式存储、混合闪存集中式存储、分布式存储、备份、容灾设备和存储网络设备等;(4)云计算与云服务:虚拟化平台、云操作系统、超融合产品、分布式存储系统、云桌面、大数据平台等产品及云运营服务等;(5)网络安全产品及服务:边界安全(包括防火墙、入侵防御系统等)、云安全、安全大数据、终端安全等领域产品及专业安全服务;(6)智能终端:商用笔记本电脑、商用台式机、智慧屏等。
交换机方面,公司深耕交换机产品多年,产品覆盖企业及园区、数据中心、工业交换机等场景,率先推出51.2T 800G CPO硅光数据中心交换机,首发1.6T端口智算交换机,适用于 AIGC 集群或数据中心高性能核心交换等业务场景。据IDC数据,2024Q1公司在中国以太网交换机、企业网交换机、园区交换机市场,分别以 34.8%、36.5%、41.6%的市场份额排名第一,在中国数据中心交换机市场份额 29.0%,位列第二。
6.3、 中兴通讯:核心芯片自研,400G交换机全场景布局
中兴通讯拥有 ICT 行业完整的、端到端的产品和解决方案,处于行业领先地位。公司是全球领先的综合通信与信息技术解决方案提供商,基于 ICT 全栈核心能力,围绕连接(CT 技术)、算力(IT 技术)、云网融合构建高效数字底座,聚焦于运营商网络、政企业务和消费者业务。
运营商网络:基于 ICT 端到端全栈核心能力,面向运营商传统网络,推出 5G基站、5G 核心网等无线产品;推出固网、光传输、路由器、交换机、光模块等有线产品;面向运营商云网业务,推出云电脑、服务器及存储产品、数据中心交换机和路由器、数据中心电力模块和液冷系统等产品。政企业务:紧跟算力浪潮,依托芯片、数据库和操作系统等底层核心技术,深入拓展国内政企市场,产品主要包括星云研发 AI 大模型、模型训推一体机、全系列服务器(AI 服务器、GPU 服务器、通用服务器、信创服务器等)及存储设备、数据中心交换机和路由器、数据库、5G+数字星云平台、车规级模组等。消费者业务:公司持续推出多款新品,产品矩阵不断丰富,产品主要包含手机、平板电脑、AR眼镜、MBB&FWA、PON CPE、机顶盒、路由器等。
交换机方面,公司推出国产超高密400GE框式交换机,搭载了自研的7.2T分布式转发芯片,采用业界领先的112Gb/s高速总线和正交连接器,整机支持高达576个400G或288个800GE接口,充分满足了大规模数据中心和云服务商对高带宽、高密度网络的需求。同时支持提供51.2T/12.8T/3.2T/2T等多种型号,灵活匹配不同场景下100GE/400GE组网需求。据IDC数据,2024Q1公司在中国以太网交换机运营商市场营收实现同比增速第一,在数据中心交换机运营商市场领域,中兴通讯市场份额跃居第二位。
6.4、 锐捷网络:中标多个头部互联网客户项目,受益于白盒化浪潮
锐捷网络主营业务为网络设备、网络安全产品及云桌面解决方案的研发、设计和销售,主要产品包括网络设备(交换机、路由器、无线产品等)、网络安全产品(安全网关、下一代防火墙、安全态势感知平台等)、云桌面整体解决方案(云服务器、云终端、云桌面软件)以及 IT 运维等其他产品及解决方案。公司产品遍及网络建设中的各主要层级,广泛应用于局域网、城域网、广域网等各类型计算机网络中,根据IDC数据统计,2024年第一季度,公司在中国以太网交换机市场占有率排名第三,在中国数据中心交换机市场占有率排名第三,在中国企业级WLAN市场占有率排名第二,其中Wi-Fi 6产品出货量排名第一。
6.5、 共进股份:800G交换机陆续交付,突破多个海外客户
共进股份主要业务包括网通及数通业务(PON 系列、AP 系列、DSL 系列等各类宽带接入终端,交换机、核心路由等数通产品)、移动通信业务(4G/5G小基站设备、固定无线接入设备以及以移动通信为技术基础的各类专业和综合应用产品)、汽车电子业务等。其中,数通业务已覆盖园区/SMB交换机及 100G、400G、800G等多种数据中心交换机。2024年上半年公司 800G 数据中心交换机已开始陆续交付,工业交换机JDM项目完成零突破,获海外P客户、B 客户SMB交换机项目,交换机海外客户近10家。
6.6、 菲菱科思:发力中高端产品,国内领先ODM/OEM厂商
菲菱科思多年来专注于网络通信设备领域,在业务拓展方面,继续深耕园区接入、 汇聚层中高端交换机,在产品方案方面,深度扩展国产方案交换机、安全防火墙、IOT 网关等业务;在中高端数据中心交换机产品部分,在 200G/400G /2.0T/8.0T 数据中心交换机上迭代12.8T等产品形态,扩展了基于国产CPU的COME模块;在交换机细分领域,扩展了工业控制和边缘计算场景需求的新一代 TSN 工业交换、Multi-GE(2.5G/5G/10G)电口交换机及 2.5G 光上行千兆交换机/2.5G光下行万兆上行全光交换机等,已经成为S客户、新华三、锐捷网络等国内主要品牌商的合格供应商。
7、 风险提示
(1)云计算需求不及预期
若云计算需求不及预期,将会影响到国内云巨头、电信运营商对于网络设备的采购。
(2) 数字经济增长不及预期
若国内数字经济增速放缓,则会影响园区及企业、工业对网络设备采购,进而影响交换机、路由器等网络设备放量。
(3) AI发展不及预期
若AIGC发展不及预期,将会影响AI后端组网需求,进而影响高速率数据中心交换机的采购量。
证券研究报告:《开源证券_行业深度报告_AI时代交换机迎四大产业变革新机遇_通信团队》
对外发布时间:2024年12月9日
报告发布机构:开源证券股份有限公司
本报告分析师:蒋颖
分析师执业编号:S0790523120003
蒋颖 开源证券通信首席分析师
中国人民大学经济学硕士、理学学士,商务英语双学位。2017-2023年,先后就职于华创证券、招商证券、信达证券,2023年12月加入开源证券研究所,深度覆盖AI算力产业链、新型工业化、工业机器人、卫星互联网、自动驾驶、物联网、5G产业链等。曾获2024年新浪金麒麟“菁英分析师”通信第4名;2022年wind“金牌分析师”通信第4名;2020年wind“金牌分析师”通信第1名;2020年新浪金麒麟“新锐分析师”通信第1名;2020年21世纪“金牌分析师”通信第3名;2019年新浪金麒麟“最佳分析师”通信第5名。
陈光毅 开源证券通信组成员
北京大学物理学博士,凝聚态物理专业。2024年2月加入开源证券研究所,曾就职于信达证券研究开发中心,从事通信行业研究工作,主要覆盖光模块、光器件、光芯片、卫星通信、通信新能源、自动驾驶等领域。
雷星宇 开源证券通信组成员
伦敦国王学院理学硕士,公司金融专业。2024年4月加入开源证券研究所,从事通信行业研究工作,主要覆盖海外算力、液冷、AIDC、服务器、交换机、通信基站等领域。
欢迎关注开源通信
获取更多通信资讯