依据谷歌于24年10月在OCP Global Summit披露的《+/-400Vdc Rack for AI/ML Applications》,伴随芯片功率的迭代升级,服务器机架设计的复杂性不断增加,机架功率的需求增长速度超过了电池模块与AC/DC电源功率密度的提升速度,叠加下一代的机架可能没有足够的空间容纳电源组件。因此,未来的电源架构需要革新,在不影响机架直流配电的优势下将电源组件放置在机架外。
现有结构的限制:
(1)下图左侧,上方红框部分为AC/DC电源,中间层为48VDC到PoL负载,下方为48VDC的UPS。在功率持续增加的趋势中,越来越多的机架空间需要分配给AC/DC与UPS。
图表. 现行机架电源结构
数据来源:谷歌
(2)母线Busbar亦需要调整以支持更高的电流,机架设计需要容纳更大/更重的母线/连接器,同时需要运行主动冷却以支持更高的电流。
图表. 母线调整以支持功率升级
数据来源:谷歌
下图为谷歌电源设计的演变历史,AC/DC+UPS功能从托盘上升级到机架内,而下一代预期在机架外重新定位,需要更高的直流电压(+/-400Vdc)以实现架外电源解决方案。
图表. 电源设计进化过程
数据来源:谷歌
推荐使用+/-400Vdc的原因:
图表. 三种方案优缺点对比
数据来源:谷歌
48VDC机架电源系统的优势在于转换阶段更少,高可靠性以及更小的故障域;+/-400Vdc的优势在于与DC机架电源系统相同的系统效率/可靠性优势;更好的功率密度与效率;可依托于电动汽车行业开发成熟的400Vdc组件生态系统(关注相关企业切入产业链)。
图表. 48Vdc与+/-400Vdc结构
数据来源:谷歌
过渡到+/-400Vdc架构:数据中心更改为该架构是颠覆性的,如何管理现有的48V设备成为关注点。若没有匹配的基础设施支持,转换是不可行的,需要新产品支持转换。一是引入+/-400Vdc侧车电源架Sidecar power rack,用于从有效载荷架上移除AC/DC电源转换器和备用电池;二是研究在+/-400Vdc的环境中支持传统的48V机架设备。
侧车电源架可在配置传统416/480V电源的数据中心里部署+/-400Vdc结构,可根据需求决定是否配置BBUs和支持不同的载荷架配置,用于从48V向+/-400V过渡,对数据中心空间占用较小。
图表. 侧车电源架
数据来源:谷歌
2. AI数据中心四种供电系统架构
根据谷歌的披露,目前AI数据中心供电系统构架有两种成熟解决方案:
架构1:传统供电方式
机架外UPS+机架内/托盘内PSU
图表. 数据中心供电方式架构1
架构2:OCP ORV3交付架构
机架内PSU+BBU
图表. 数据中心供电方式架构2
以上两种架构共同点是AC/DC转换环节均放于服务器机柜内部。机架配电均在54Vdc,200Kw机架的配电损耗基本在0.2-0.5%,两种的生态系统成熟度都很高。
两种架构主要区别在于备用电源的选择与放置位置:架构1选择在线UPS(双重转换),且UPS独立于服务器机柜,从市电输入端到负载输出端整体效率在 93.13%-93.4%。架构 2则选择BBU+超级电容作为备用电源,端到端效率在96.02%-96.32%,较架构1有明显提升。空间占用层面,架构1对IT机架的空间消耗较低,但对数据中心占地面积消耗大;架构2对IT机架的空间消耗高,对数据中心占地面积消耗也高。
根据野村,英伟达GB300或将考虑使用架构2,具体的方案可能是单个备用电源模组包含6个BBU+一个超级电容器。架构2将备用电源进行分布式布置,同时由于BBU采用锂电池,使用寿命也将有明显提升(但对应会有安全问题,在之前的《BBU基础信息》中有详细介绍)。
此外,谷歌还提供了两类未来方向:
架构3:Sidecar +/-400Vdc电力输送
图表. 数据中心供电方式架构3
架构4:Northstar-建筑级 +/-400Vdc
采用储能/微网的电力输送架构
图表. 数据中心供电方式架构4
架构3采用了前文提到的Sidecar作为从传统配置向+/-400V的过渡方案,AC/DC转换环节与BBU从机架内移出至Sidecar。从市电输入端到负载输出端整体效率在 96.05%,机架配电是+/-400Vdc,几乎没有机架配电损耗,不消耗机架内空间,但对数据中心占地面积消耗高,整体生态系统成熟度中等。
架构4采用了Northstar(HVDC高压直流)方案,AC/DC转换与BBU被放置在数据中心基础设施环节。从市电输入端到负载输出端整体效率约在 96.53%,机架配电是+/-400Vdc,几乎没有机架配电损耗,不消耗机架内空间,对数据中心面积也几乎没有额外占用,但整体生态系统成熟度仍然处于低位。
图表. AI数据中心4种供电解决方案架构特点对比
数据来源:《+/-400Vdc Rack for AI/ML Applications》、 野村东方国际证券
图表. 数据中心全直流供电架构
数据来源:维谛
未来,HVDC架构有望大规模应用,在更高功率数据中心的渗透率不断提升。先将输入端市电转换为400V直流电,AC-DC大功率化,再进行降压处理至服务器适用电压范围。
依据谷歌和野村,采用HVDC架构的主要优势有:(1)提升能源效率;(2)服务器机架配电损耗降至约0%,成熟方案配电损耗0.2%-0.5%;(3)AI 电源移出服务器机柜,节省服务器机柜空间;(4)令更高的功率密度成为可能。
主要的挑战有:(1)电弧闪络危害Arc Flash Hazards,直流接地的风险;(2)设备兼容性的问题,供应商与组件需要完成AC至 DC的转换;(3)复杂性与成本问题,包含设计、安装、维护等环节。
综上,目前海外数据中心HVDC技术方案还处于相对较新的阶段,虽然短期实施存在挑战,但考虑到现有的电源系统无法支持未来机架功率密度的快速增长,叠加HVDC架构在能源效率、可靠性、空间节省、未来适应性等方面的潜在优势,使其成为未来有吸引力的选择。数据中心的电源生态系统或发生转变,通过开发接口产品来适应现有的电源基础设施以适应+/-400Vdc完成过渡。伴随技术逐步成熟、运维技术人员能力提升, HVDC有较大的应用空间。
具体到供应商层面,现阶段Vertiv采取双线布局: Vertiv针对传统与新建数据中心不同需求,同时布局UPS与HVDC两种技术路线。公司旗下 UPS 产品矩阵丰富,包括多数 Liebert 系列子型号等,容量广泛覆盖30-1200kVA;而 NetSure 与部分 Liebert 系列产品则用于满足下游对 HVDC、配电与逆变转换的需求,其中NetSure 8200作为公司高频高密度HVDC产品,电源容量高达1MW,以满足新建AI与云端数据中心部署高功耗需求。
市场空间测算(参考东吴证券):
设计时通常采用2N冗余设计,2路供电+每路电源的设计容量通常是服务器机柜容量的1.15-1.2倍,合计配比取2.4。当前HVDC价格假设比UPS高25%,按照24年英伟达算力卡出货预期,24年UPS+HVDC电源市场空间为94亿,25年或达201亿元,24-27年CAGR约61%。按东吴的预测,25年HVDC渗透率或在80%(具体需要观察下进展,小编推测偏乐观了),对应HVDC市场需求约为170亿元。
图表. AI数据中心UPS/HVDC市场需求测算(2023-2027E)
数据来源:科华数据、中恒电气、东吴证券研究所
图表. 各AI电气设备品类汇总
数据来源:东吴证券
最后,针对HVDC等前端强电侧的架构变化是否会影响powershelf的需求,中金的观点是影响不大,原因是(1)目前已有的服务器电源厂商的CRPS电源是兼容直流和交流的;(2)Powershelf本身是由整流电路、滤波电路、PFC(校正功率因数和升压)、中间电路、LLC(降压电路)等组成,其中在输入后第一步就完成了交变直,后端电路全部直流,因此即便做直流兼容架构上的影响也非常有限。