本文来自“AI以太网趋势明确,看好白盒交换机、交换芯片、PCB和以太网高速连接方案厂商”。目前 AI 网络主要基于 Infiniband 协议,但 Infiniband 相较以太网价格更高,对于英伟达的依赖度较高,同时以太网具备长期在大型数据中心以及远距离传输的部署经验,为了成本以及供应链安全考虑,目前包括英伟达的厂商也在探索以太网 AI 网络。
下载链接:
5、面向未来重新定义液冷
1、面向分布式AI智能网卡低延迟Fabric技术.pdf
2、RDMA参数选择.pdf
3、RDMA技术白皮书(中文版).pdf
4、RDMA技术在数据中心中的应用研究.pdf
5、华为面向AI时代的智能无损数据中心网络.pdf
23 年 7 月 UEC(超以太网联盟)成立,创始厂商包括芯片厂商英特尔、AMD、博通,设备厂商思科、Arista,以及云厂商微软、Meta 等。UEC 的目标是超越现有的以太网功能,例如远程直接内存访问 ( RDMA ) 和融合以太网 RDMA (RoCE),提供针对高性能计算和人工智能进行优化的高性能、分布式和无损传输层,将在 AI 领域与 InfiniBand 展开竞争。
随着模型参数量的提升,训练模型所需要的算力也不断增加。根据 EpochAI,2017 年只有两个 AI 模型的训练所需要算力超过了 10^23 FLOP,在截至 2020 年,模型数量提升至 4个,截至 22 年,模型数量提升至 31 个,在 24 年 1~6 月份,训练所需要算力超过了 10^23FLOP 的新增的模型数量达到了 25 个。另外,部分模型训练所需要的算力已经超过了 10^25FLOP,如 GPT-4、Gemini 1.0 Ultra、Mistral Large 等。
1、白盒交换机趋势明显,OEM 厂商软件壁垒高,白牌厂商空间逐渐打开
大型及超大型数据中心建设不断加速,在此背景下,软硬件解耦的白盒交换机市场得到迅猛发展。白盒交换机将硬件与软件分离,下游数据中心客户可选择为交换机安装外部操作系统或在交换机厂商已提供开放式操作系统基础上开发上层应用软件,并实现对交换机的统一部署与维护,极大提高数据中心运维效率。
交换机软硬件解耦趋势下,传统黑盒方案厂商思科市占率下降迅速。从规模的角度看,Arista 在数据中心 10G 以上速率的交换机市场份额在过去 12 年中提升了 26.4%,已逐渐逼近思科;从端口数量的角度看,Arista 市场份额在近三年提升较快,并于 2023 年完成对于思科市场份额的反超。
而在数据中心高速以太网交换机市场(100G/200G/400G),Arista 于近三年持续保持行业领先地位,端口出货量不断拉大与思科的差距,2023 年,Arista 份额达到 45%,是思科的两倍之多。
从收入角度看,白盒厂商如 Arista、天弘科技、智邦等也具备更高增速。2019-2023 年,Arista 营业收入由 24.11 亿美元提升至 58.60 亿美元,CAGR 为 24.9%;天弘科技连接与云解决方案业务营收由 36.03 亿美元提升至 46.41 亿美元,CAGR 为 6.54%;智邦交换机业务营收由 377.90 亿新台币提升至 571.30 亿新台币,CAGR 为 10.88%。作为对比,2019-2023年,思科营业收入由 515.50 亿美元提升至 572.33 亿美元,CAGR 为 2.65%。
白盒交换机厂商当中,OEM 厂商如 Arista 凭借软件的较高壁垒,以自研操作系统+硬件的产品形态进行出售,具备高毛利率,白牌交换机厂商则主要是进行硬件组装,毛利率较低。
白牌交换机厂商较为依赖云厂商客户自身操作系统的能力。短期来看,Arista 凭借具备良好生态的成熟的自研操作系统有望继续维持当前份额,长期看,出于成本考虑我们认为云厂商采用自研系统采购白牌交换机的比例有望逐渐扩大。
根据华经产业研究院,2021年中国交换机市场当中,华为、新华三、星网锐捷按销售额市占率分别为 36.4%、35.2%、12.4%。2021 年我国交换机品牌商市场规模为 344 亿元,占比 68.7%,制造商(代工厂)市场规模为 157 亿元,占比 31.3%。
2、交换芯片是交换机核心芯片,博通市占率高,国产厂商进展迅速
以太网交换机通常由以太网交换芯片、CPU、PHY、PCB、接口/端口子系统等组成,其中以太网交换芯片作为以太网交换设备中最核心的部件,主要用于交换处理大量数据和报文转发,是针对数据传输和网络应用进行专门优化的芯片。以太网交换芯片内部的逻辑通路由数百个特性集合组成,在协同工作的同时保持极高的数据处理能力,因此其架构实现具有复杂性。
CPU 是用来管理登录、协议交互的控制的通用芯片,PHY 用于处理电接口的物理层数据。部分以太网交换芯片还将进行协议控制管理的 CPU 和处理电接口物理数据的PHY 集成在以太网交换芯片,进一步提高了以太网交换芯片的技术密集度和产品复杂度。
以 400G 交换机 N9510-64D 为例,产品搭载的主要芯片包括英特尔 Xeon D-1627 CPU、 博通 Tomahawk4 交换芯片、8GB DDR4 内存以及 240GB 闪存。根据中商产业研究院,交换机主要由芯片、光器件、插接件、阻容器件、壳体、PCB 等资源组成。其中芯片成本占比最高,达 32%。其次分别为光器件、插接件、阻容器件、壳体、PCB,占比分别为 14%、10%、10%、8%、7%。
目前交换芯片主要分为商用芯片,以及部分交换机厂商的自用芯片。其中商用芯片厂商包括博通、Marvell、英伟达等,自用厂商则以思科、华为为主,自研芯片用于自己交换机。随着白盒厂商如 Arista、天弘、智邦等厂商在数据以太网交换机市场快速增长,有望带动商用芯片需求快速增长,博通、Marvell 等商用芯片厂商有望充分受益。
AI 集群的效率提升未来关键在于网络效率的提升,以太网有望应用于 AI 大规模组网,以及推理应用,产业趋势较明确。未来以太网有望在 AI 用于:1)英伟达 GPU 大规模训练集群组网;2)英伟达 GPU 推理组网;3)非英伟达 GPU 及 ASIC 的训练和推理组网。
1、服务器及存储用液冷部件技术规范 第1部分:冷板 2、服务器及存储用液冷部件技术规范 第2部分:连接系统 3、服务器及存储用液冷部件技术规范 第3部分:冷量分配单元 4、服务器及存储用液冷部件技术规范 第4部分:监控系统
本号资料全部上传至知识星球,更多内容请登录全栈云技术知识星球下载全部资料。
‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧ END ‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言删除,谢谢。
温馨提示:搜索关注“全栈云技术架构”微信公众号,“扫码”或点击“阅读原文”进入知识星球获取10000+份技术资料。