投资要点
◾ 算力快速发展带动散热需求提升,政策导向明确驱动液冷成为标配。伴随算力需求快速发展,处理器计算能力快速提升的同时功耗也显著提升,传统风冷已难以满足散热需求,需要更高换热效率、更节能的液冷技术来满足高功率散热需求。传统风冷的PUE值基本在1.5-1.6,而液冷能够将PUE值做到1.2甚至更低。2019年以来国内政策导向明确建设新型绿色数据中心,明确要求PUE值要做到1.3以下,液冷技术路径有望深度受益。
◾ AI领域蓬勃发展,液冷市场需求未来可期。液冷技术作为一种高效散热解决方案,近年来在数据中心、高性能计算(HPC)和电子设备等高能耗领域中得到了广泛应用。与传统的风冷系统相比,液冷通过冷却液直接传导和转移热量,实现了更出色的散热效果,能够有效支持高密度、高功率设备的稳定运行,并满足日益增长的计算需求和设备的散热要求。根据IDC统计预测,全球AI服务器市场规模将从2022年的195亿美元增长至2026年的347亿美元,复合年增长率达17.3%;2023至2028年间,中国液冷服务器市场规模年复合增长率将达到47.6%,预计到2028年市场规模将增至102亿美元。
◾ 冷板式方案是当下液冷方案的主流,浸没式方案与碳氟类冷却液大规模普及仍然需要降本驱动。根据热器件是否与冷却液接触,液冷技术可以分为直接接触式和间接接触式两种。横向比较来看,以间接接触式方案为代表的冷板式液冷技术由于对服务器结构改动需求较小,因此除定制冷板需要一定成本外,在可维护性、空间利用率、兼容性方面均具有较强的应用优势。从冷却液来看,冷板式冷却液现采用乙二醇+水方案居多。浸没式方案中,氟化冷却液由于性能较好,是目前较适合用于数据中心浸没式液冷系统的冷却液,但目前价格仍较为昂贵。我们认为未来氟化冷却液大规模普及仍需要降本驱动。
◾ 测算2022-2025年AI服务器液冷市场需求年复合增长率为21.50%。我们测算AI服务器液冷市场规模2023-2025年分别为66.87/ 81.29/ 106.12亿元,其中冷板式方案24.88/28.64/35.37亿元,2022-2025年AI服务器液冷市场需求年复合增长率为21.50%。
◾ 投资建议:华峰铝业:公司作为国内铝热传输龙头企业,受下游新能源汽车渗透率提升和单车热传输用铝增长的趋势下持续扩张产能,在生产成本严格把控与复合材料议价能力强的基础上深度绑定下游优质客户,公司业绩未来可期。我们预计2024-2026年公司归母净利润为11.92、13.77、16.79亿元,对应2025年1月23日收盘价PE分别为16/14/12X,维持“推荐”评级。建议关注:银邦股份,东阳光。
◾ 风险提示:项目进展不及预期,下游需求增长不及预期。
报告正文
1、 算力发展带动散热需求提升,推动液冷成为标配
算力是AI发展的重要引擎。在人工智能的发展中,“算力”、“算法”与“数据”并称为AI发展的三大基石。算法相当于AI的大脑,是指导计算机执行特定任务的一系列指令的集合,是AI实现智能化处理的基础,从上个世纪以来算法已经历经了从最开始的逻辑推理模型到专家系统到神经网络再到深度学习的多次进化。数据是AI的燃料,是人工智能系统学习和改进的基础,通过收集、处理和分析海量数据,AI系统能够不断优化模型参数、提升预测准确率从而实现智能化决策和应用。算力,即“计算能力”,是指计算系统(如电脑、服务器、数据中心等)处理信息和执行计算的能力,是人工智能系统实现高效准确处理任务的物质基础。从数据收集、模型训练到推理应用,每一步都离不开强大的算力支持。现代人工智能,特别是深度学习技术,依赖于复杂的神经网络模型,这些模型包含数百万甚至数十亿的参数。训练这样的模型需要强大的计算资源,从而对算力需求大幅提升,只有足够的算力才能使模型在合理的时间范围内完成对海量数据的学习。随着AI技术的不断进步,对算力的需求预计呈现出指数级增长。
以ChatGPT为代表的人工智能生成内容催动全球算力规模快速增长。人工智能生成内容(AIGC)又称生成式AI,是指利用人工智能技术来生成内容,包括绘画、作曲、剪辑、写作等。OpenAI在2018年推出的GPT参数量为1.17 亿,预训练数据量约5GB,而GPT-3参数量达1750亿,预训练数据量达45TB。在模型训练阶段,根据OpenAI公布数据,ChatGPT的总算力消耗约为3640PF-days。结合中国信通院和华为GIV公布的数据,2023年全球计算设备算力总规模达到1397EFlops,预计未来5年全球算力规模仍以超过50%的增速增长,到2030年全球算力规模将达到16ZFlops。
算力快速提升导致芯片热设计功耗持续攀升,散热需求迫在眉睫。算力性能提升主要通过半导体工艺增加晶体管密度实现,这就导致在芯片制程遵循摩尔定律持续微缩的同时,芯片的集成度在持续提升。高性能计算在执行复杂的计算任务时需要极高的功率,这导致其单位面积内的功率密度显著提升,更高的功率密度意味着更多的热量集中在更小的区域内,这就使得芯片的TDP(热设计功耗)在持续提升。以英伟达Blackwell架构GPU为例,B200功耗高达1000W,GB200功耗更是高达2700W。按照传统的散热经验(风冷),芯片的散热密度存在物理极限,每平方毫米芯片的散热能力约为1瓦,英伟达推出的GPU功耗已经突破了风冷的散热极限,需要更高效的散热方案支持。
过高的温度会直接影响电子元件的性能,散热需求不可忽视。电子元器件使用故障中,有半数以上是由于温度过高引起的。半导体元器件温度每升高10℃,反向漏电流将增加1倍。此外,在高温的环境下,机件材料、导线绝缘保护层、防水密封胶更容易老化,造成安全隐患。对于大量数据中心,由于电子设备集中部署,这种由于过热造成的安全隐患更值得注意,尤其对于在高温下易燃易爆的设备,更易引起火灾等安全事故,引发数据中心瘫痪。另外,大电流的持续作用,还会降低服务器内部电子部件的使用寿命。尤其在高温的环境下,电子产品产生的热量得不到及时疏散,造成了电子产品工作温度升高。电容温度每升高10℃,平均电子元器件的寿命会降低一半,且更容易造成击穿。在这种重负荷状态下工作,会加大电子部件的消耗,从而降低服务器的使用寿命。因此,对服务器尤其是对关键电子部件的散热冷却提出了更加严格的要求。
全球数据中心单机柜平均功率有望快速提升。作为解决计算力的核心支撑,AI服务器既可以用来支持本地应用程序和网页,也可以为云和本地服务器提供复杂的AI模型和服务,因而算力作为刚需将直接带动服务器的性能快速提升。据CDCC调研统计,2021年全行业8kW以上机组占比约为11%,2022 年 8kw 以上机组占比达到约25%; 据Colocation America数据,2020年全球数据中心单机柜平均密度达 16.5kW,赛迪顾问预计至2025年该数值有望达到 25kW。
风冷散热效率难以跟上数据中心设备散热需求的提升,液冷逐步成为标配。以数据中心为例,采用风冷的数据中心,可以解决12KW以内的机柜制冷。随着服务器单位功耗增大,服务器机可容纳的服务器功率往往超过15KW,风冷系统已经满足不服务器柜的散热需求。以英伟达的机柜设计为例,B200芯片的热设计功耗将达1,000W, GB200 NVL36及NVL72整机柜的TDP甚至将高达70kW及近140kW,传统风冷散热方案不足以满足需求,需要搭配液冷方案方以有效解决散热问题。
PUE(Power Usage Effectiveness)是衡量数据中心能源效率的重要指标。PUE 的计算方法为数据中心的总耗电量比上IT设备的耗电量,数值越接近1,表明数据中心的能效越高。根据赛迪顾问统计数据显示,2019年中国数据中心主要设备能耗占比中(传统风冷),制冷耗电占比(约为 43%)位居第二,仅次于 IT 设备自身能耗占比(约为 45%)。采用液冷可以大幅降低数据中心能耗,提高 PUE。以某液冷数据中心为例,液冷设备取代空调设备,耗能占比仅为 9%,数据中心 PUE 降低至 1.2 以下。
液冷技术路径可实现更低的PUE值。由于液冷数据中心冷却系统采用中高温水即可完成散热需求(一次侧进水温度35℃,二次侧供液温度40℃),可实现全年全地域自然冷却,而传统风冷方式冷冻水机组出水温度需低至15-20℃,在大部分地域、大部分时间段均需开启制冷压缩机才能满足条件,因此液冷方式省去大部分风扇及空调系统能耗,相比传统风冷机房节能20%-30%以上,冷板式液冷PUE低至1.2以下、浸没式液冷PUE低至1.1以下。
2、 液冷市场蓬勃发展,冷板式方案成主流
2.1液冷技术——AI大规模发展的必经之路
构成方面,液冷系统主要包括五部分:液冷服务器、液冷机柜、Manifold(分水管)、PDU(Power Distribution Unit,电源分配单元)以及CDU(Coolant Distribution Unit,冷液分配装置)。其中Manifold分水管主要用于连接液冷机柜CDU与冷板之间的主管路,CDU冷量温控单元作为液冷的重要组成部分,其核心主要由换热器构成,用于将二次侧(服务器侧)的热量交换到一次侧(冷却塔侧),再搭配水箱、水泵、过滤网、传感器等,构成相对独立的模块化的热交换模块。
短期维度看,数据中心耗电量快速增长同PUE指标是主要矛盾,有望刺激液冷需求快速增长。根据国家能源局统计预测,2022年我国数据中心总耗电量约2700亿千瓦时,同比增长约24.7%,占全社会用电量比重近3.1%(较2022年提升0.5pct)。在能耗变高的同时,在用大型数据中心PUE也存在较大提升空间。根据《Uptime Institute 全球数据中心调查报告 2022》,2022年调查对象(全球范围数据中心样本)的年平均PUE为1.55,自2014年以来年平均PUE值维持在1.55-1.65范围内。目前宏观政策明确要求到2023年底新建大型及以上数据中心PUE降低到1.3以下;到2025年全国新建大型、超大型数据中心平均电能利用效率降到1.3以下,液冷技术路径可实现更低的PUE值,应用需求有望快速提升。
长期来看,液冷技术成为支持大规模和生成式AI发展的关键,也是不可或缺的算力硬件之一。大模型和生成式AI的发展对算力、算法平台和数据管理提出了全新要求,传统以CPU为中心的云计算基础设施已难以满足日益增长的交互需求。为了满足AI模型的训练和部署需求,数据中心需要大量高性能、高稳定性的算力资源,并需具备智能化的数据管理流程和高效普惠的AI开发平台,以实现基础设施对大模型和生成式AI的全方位支持,液冷系统在其中不可或缺。根据IDC统计预测,全球AI服务器将从2022年的195亿美元增长至2026年的347亿美元,复合年增长率达17.3%,AI服务器的快速增长同样拉动了相关硬件市场的需求,而液冷有望实现量价双升,市场空间有望进一步打开。
2.2 液冷技术详解:液冷方案、液冷板与冷却液
2.2.1 液冷方案:冷板式方案具有成本优势更为普及
两相立式浸没方案是浸没式冷却未来的主要方向。其原理是将每个设备节点作为一个独立的小型浸没腔体,可有效避免相变冷却液的 运维耗散问题,且架构兼容性更优、维护操作更便捷。
2.2.2 液冷板:冷板式方案的核心部件
2.2.3 冷却液:热量传导的核心载体
冷却液是液冷技术的关键因素之一。冷却液的四大性质包括:热传性、绝缘性、安定性和环保性。从类别来看又可分为氟化学物质(或氟碳化合物)和烃类(例如矿物油、合成油和天然油)。氟化物性质稳定,冷却效果优于矿物油、硅油等,但是价格昂贵;矿物油则具有不易兼容、易燃、相对粘稠、易蒸发等缺陷。冷却液在冷板中的作用不大,主要用于封闭循环,基本无需补充。而浸没系统由于会蒸发,因此补液较为频繁。
碳氢化合物(Hydrocarbon)冷却液和有机硅类冷却液一样,常温下呈黏稠状,因此这一类被业内统称为“油类冷却液”。在数据中心液冷应用之前,工业上常用作变压器冷却剂。它们普遍具有沸点高不易挥发、不腐蚀金属、环境友好、毒性低等共性,且成本较低;但由于具有闪点,油类冷却剂使用中有可燃助燃风险。常见的油类冷却液可以进一步分为天然矿物油、合成油、有机硅油3大类。
天然矿物油从石油中蒸馏而来,并可能经过深度氢化处理,成本较低,在室外变压器冷却场景中应用悠久。但在使用中难以避免烃类分子的分解氧化,会造成酸性增强和污染物产生,影响冷却液特性甚至导致被冷却器件的腐蚀。合成油是在人工合成的烷烃类或酯类化合物的基础上加入添加剂制成的,常见冷却剂类型有聚α烯烃(Poly Alpha Olefins,PAO)、天然气合成油(Gas to Liquid Base Oil,GTL)、合成酯等。合成油的生成工艺更加精细,杂质含量、抗氧化性、材料兼容性与矿物油相比有较大改善,但是作为碳氢类通病的闪点问题依然存在。有机硅油主要依赖人工合成,可以设计出高闪点的产品,但其闪点同样与粘度正相关,可燃风险降低的同时导致了流动困难,设计时需协调好两者之间平衡。另外,硅油还可能发生水解和氧化沉积影响接触性能等问题。
碳氟化合物(Fluorocarbon)是将碳氢化合物中所含的一部分或全部氢换为氟而得到的一类有机化合物。碳氟化合物普遍具有良好的综合传热性能,可以实现无闪点不可燃。同时,由于C-F键能较大,碳氟化合物惰性较强,不易与其它物质反应,是良好的兼容材料。根据碳氟化合物的组成成分和结构不同,可再分为氯氟烃(Chlorofluorocarbons,CFC)、氢代氯氟烃(Hydrochlorofluorocarbon,HCFC)、氢氟烃(Hydrofluorocarbon,HFC)、全氟碳化合物(Perfluorocarbon,PFC)、氢氟醚(Hydrofluoroether,HFE)等种类。
在碳氟化合物中,CFC和HCFC问世较早,是20世纪广泛被应用的制冷剂,但因为对大气环境尤其是臭氧层的破坏性,这两类已在《蒙特利尔议定书》中被认定为禁止使用的制冷剂。HFC最常见的应用是家用冰箱和空调中的R410A制冷剂,其没有臭氧层破坏作用,但会带来温室效应。PFC包含全氟烷烃(Perflroroalkane)、全氟胺(Perfluoroamine)、全氟聚醚(Perfluoropolyethers,PFPE)等类型,在沸点和介电常数方面的特性较为适合半导体设备冷却场景,其应用历史可以追溯到半个世纪前的大型机时代,和HFC一样在导致温室效应方面的缺陷较大。HFE的温室效应影响较小,对臭氧层无破坏,但通常具有较高的介电常数,和PCB微带线或连接件直接接触时对信号传输影响较大。
3、 AI服务器液冷市场空间测算
参考上文对全球AI服务器液冷市场空间进行测算。其中,
4、 相关标的
5、风险提示
1)项目进展不及预期:若标的公司在建或待投产项目进展不及预期,可能进一步影响公司产销水平,对公司业绩造成一定不利影响。
2)下游需求增长不及预期:AI液冷领域目前尚处于发展阶段,若对上游材料需求不及预期,可能会对行业整体产生不利影响。
重要声明