智算中心液冷冷却介质与管道系统的兼容性研究

科技   2024-11-21 15:58   北京  

摘  要






作为解决未来智算中心高能耗问题的液冷散热技术,因其散热系统的特殊性,管道系统腐蚀成为系统失效的重要因素之一。通过对以往液冷管道系统腐蚀案例及机理分析,并采用失重法对散热冷板常用材料进行兼容性实验验证。分析结果表明,铝合金材质在液冷系统中较易被腐蚀,铜材质冷板在恶劣环境中的耐腐蚀性较好,且与不锈钢材质管道有良好的兼容性。此外,液冷系统对冷却介质的要求较高,应严格控制液冷系统内冷却介质的各项指标,建立长效化监测、预警、管理和运行控制机制,提高液冷管道系统腐蚀控制水平。






    前  言     

近年来,随着AI算力的快速发展,典型AI算力服务器的功耗较常规通用服务器的功耗增长了5~10倍,对智算中心IT机柜散热能力提出更高要求。与传统的散热技术相比,液冷在解决高密算力带来的高能耗问题上有着得天独厚的优势,成为目前智算中心主要的散热技术。

冷板式液冷系统的工作原理是在高功耗芯片上贴合一块导热冷板,冷板内布置有流体通道,通过管道系统内的冷却液流动带走芯片的热量,具有高效散热、低噪声、维护方便等优点,成为目前智算中心行业主流的研发方向。然而,冷板式液冷系统紧贴散热芯片,部分管道布置于服务器主板上方,一旦发生泄漏,冷却液体将直接进入服务器内部,出现服务器短路甚至烧毁主板电器组件、电源等问题,具有严重的安全隐患。液冷管道系统主要由金属材料组成,导热冷板的常用材料有铜、铝合金等,长时间浸泡在冷却液中会出现不同程度的腐蚀情况,因此,腐蚀是造成液冷系统失效的重要因素之一。

   0 1   

智算中心液冷系统腐蚀现状及案例分析

目前智算中心服务器的液冷系统仍是一种新兴技术,相关研究较少,并且这些研究大多集中于液冷系统的散热效率和耗能方面,对液冷冷却介质与管道系统的兼容性研究较少。液冷管道系统与常规冷却水管道的不同点在于引入了散热冷板,目前主要采用铜或铝合金材质以及焊接冷板所用的焊料,增加了系统的复杂度和腐蚀风险,研究腐蚀发展程度对预测腐蚀行为和了解机理有着重要意义。

由于液冷管道系统的材质较为复杂且长期处于几乎封闭的状态,其腐蚀形式主要有电化学腐蚀、冲刷腐蚀、微生物腐蚀、结垢等,通常在冷却介质中会加入一定量的缓蚀剂和杀菌剂,但随着时间的推移,冷却液的性质会发生改变,管道内部常出现碳酸盐结垢或微生物的繁殖产物积累,导致管道堵塞、传热效率降低、管道泄漏等情况,最终造成液冷系统失效。

1.1 A液冷系统流道腐蚀

A液冷系统在2016年投入使用,主要为高功耗设备提供液冷散热,2019年在调试过程中出现漏液现象,拆下器件后发现冷板漏液处已被腐蚀穿孔,部分位置出现腐蚀现象但暂未穿透,剖切开冷板后发现流道内部有较多沉积物堆积。

对样件进行金相组织分析,探究样件处母材晶粒大小、显微组织状态改变情况,以确定冷板漏液和穿孔位置是否为腐蚀所致。

从冷板的金相显微组织结果(见图1)来看,冷板正常部位金相组织状态、基体晶粒大小并未存在缺陷现象,与母材金相组织状态相近;冷板失效处金相组织状态存在明显的点状腐蚀形貌,腐蚀沿着厚度方向发展且部分区域已经穿透整个厚度方向形成穿孔。

图1 冷板的金相显微组织对比

1.2 B液冷系统法兰密封处腐蚀

B液冷系统在2018年投入使用,系统内存在多种金属材质(不锈钢、铜、铝合金等),2022年至今已出现多次泄露现象,泄露点主要出现在接头密封处、法兰密封处,其中密封处的腐蚀状态如图2所示。从图2可知,附着物为白色、褐色腐蚀产物,这些腐蚀产物易碎成渣,基本不溶于水,加酸会产生气泡,对附着物烘干后选取4个点进行EDS能谱测试,结果如表1所示。

图2 法兰密封处的腐蚀附着物

表1 附着物的化学成分(质量分数)

(单位:%)

从表1可以看出,这4个点的化学成分主要包括C元素、O元素、Al元素、Fe元素和Cu元素,可推断出腐蚀产物主要由碳酸盐、铝和铜的氧化物杂质构成,还存在较少的Si、S等元素,应为管道系统内部镀层或焊料溶解腐蚀形成的化合物。由于该液冷系统中部分液冷冷板为铝合金材质,杂质中存在较多铝的氧化物,反映出铝合金在液冷系统中较易被腐蚀。此外,液冷系统中的Fe3+和Cu2+会与铝合金形成电偶,加速铝合金的腐蚀,因此不建议在液冷系统中使用铝合金。

1.3 案例分析小结

以上案例分析表明:

a)铝合金材质在液冷系统中较易被腐蚀,长时间使用容易出现点蚀的情况,在对可靠性要求较高的智算中心液冷系统中,应慎重采用。

b)液冷系统对水质要求较高,应严格控制管道系统内冷却介质的洁净度和离子浓度指标。

   0 2   

液冷系统金属管道腐蚀机理

液冷系统中冷却介质在运行过程中不断与散热器件进行热量交换、不同种金属之间的相互作用、密闭系统中微生物的生长,都将导致冷却介质的腐蚀倾向逐渐增强,引起金属管道的腐蚀,在腐蚀形态上主要表现为均匀腐蚀、缝隙腐蚀、点蚀、应力腐蚀等。

本章将介绍液冷系统中几种常见金属管道腐蚀机理。

2.1 铝在冷却介质中的腐蚀机理

铝在空气中能自然形成一层保护性的氧化铝(Al2O3)薄膜,这层薄膜可以有效地阻止进一步的氧化反应。然而在水中,特别是水中存在氯离子时,这层氧化膜容易被破坏。当铝表面的氧化膜局部被破坏后,暴露的铝基体会与水发生反应。铝在水中的氧化过程可以简化为以下公式:

Al → Al3+ + 3e

2Al + 6H2O → 2Al(OH)3 + 3H2

在反应过程中,铝原子首先失去电子形成铝离子(Al³⁺),然后这些离子与水分子中的氢氧根离子(OH⁻)结合生成不溶于水、白色凝胶沉淀的氢氧化铝Al(OH)3〔在一定条件下,Al(OH)3会分解成Al2O3〕,在腐蚀点附近出现白色凝胶或白色沉淀物。

2.2 铜在冷却介质中的腐蚀机理

常规条件下铜的腐蚀速率很小,这是因为铜自身的电位较高(0.35 V),并且铜表面一般会有一层致密的氧化膜覆盖,使铜与周围环境隔离,避免相互接触,从而抑制铜被腐蚀。但在某些条件下,如在含有硫酸盐的还原菌环境中,铜的腐蚀速率会大大提高。

铜在水溶液中具有比氢更高的正电位,因此,在不含氧的纯水及中性水溶液中,铜表现出较高的稳定性,不发生氢的去极化作用。但在含溶解氧的淡水中和含某些活性离子(如CN-、NH4+等活性离子)的盐类中,铜材质会受到不同程度的腐蚀。

从电化学角度来看,铜在溶液中发生腐蚀过程可以分为阳极反应和阴极反应。在阳极上,铜失去电子发生氧化反应:

2Cu → 2Cu2+ + 4e−1

而在阴极上得到电子发生还原反应生成OH-

O2 + H2O + 4e−1 → 4OH

这些铜离子会与水中的氢氧根离子结合形成氢氧化铜〔Cu(OH)2〕,随着时间推移,铜表面会逐渐被覆盖一层由CuO、Cu2O和Cu(OH)2等组成的混合物,形成钝化保护膜,使管道壁的腐蚀速度减慢。此外,环境因素如温度、pH值、冷却介质中溶解氧量及其他离子(如Cl-、SO42-、HCO3-)等也会影响铜的腐蚀行为。

2.3 电化学腐蚀理论

电化学腐蚀的本质是一种氧化还原反应,金属在阳极失去电子而被氧化,冷却介质中的物质在阴极获得电子而被还原。形成的产物是进入介质中的金属离子或覆盖在金属表面上的氧化物(或难溶盐);对金属管道而言,输送的冷却液就是介质,冷却液的pH值影响管道的腐蚀速度,其中的溶解氧及二氧化碳是管道腐蚀的重要因素之一。

由于金属管道自身含有杂质,金属和杂质之间存在电位差,在冷却液介质内,形成了无数个微腐蚀电池。腐蚀速率受多种因素影响,包括金属电位的变化、表面状况以及环境条件等。当金属表面的电位高于平衡电位时,腐蚀反应更容易发生,并且需要吸收由电解阳极或化学氧化系统产生的电子。

总之,电化学腐蚀是一个涉及金属表面与电解质溶液之间相互作用的复杂过程,其核心在于阳极的氧化反应和阴极的还原反应之间的电子流动,可根据这一机制制定有效的防腐蚀措施。

2.4 管道内的生物性腐蚀

微生物在生长繁殖过程中产生附着力强的生物黏泥,覆盖在液冷系统金属管道表面,不仅抑制缓蚀剂、杀菌剂的效用,也会导致黏泥覆盖部位的氧浓度偏低,提供厌氧菌生长的环境,出现垢下腐蚀。常见的微生物有异氧菌、铁细菌、硫酸盐还原菌等。

硫酸盐还原菌是一种腐蚀性很强的厌氧细菌,它常存在于管道内壁,在无氧情况下,它在金属管道电化学腐蚀过程中主要在阴极起极化剂的作用,能把硫酸盐还原成硫化合物,加快管道的腐蚀结垢速度。

细菌对pH值都有一定的适应性,通常细菌在中性和偏碱性介质中生长较好,铁细菌最佳繁殖的pH值范围为6~8,硫酸盐还原菌最佳繁殖的pH值范围为7~8,硝化细菌适宜中性或弱碱性环境。对于金属材料如铜或不锈钢,随着冷却介质的pH值提高,水中H+浓度降低,金属腐蚀过程中H+去极化的阴极反应受到抑制,金属表面生成氧化性保护膜的倾向增大,冷却介质对金属的腐蚀性随pH值提高而降低。因此,保持冷却介质pH值为8~9,可有效防止金属材料的微生物腐蚀。

   0 3   

兼容性实验验证

为验证管道系统材料在不同介质环境下的腐蚀速率,通过全浸泡腐蚀法(失重法)对不同金属材料进行兼容性性能测试,实验参考《金属材料实验室均匀腐蚀全浸试验方法》(GB/T 10124-1988)。分析相同时间下不同介质环境的试样形貌特征,研究腐蚀发展程度与材质和介质环境的相关性。

3.1 样品

试样采用符合GB/T3880.1的6063铝合金以及符合标准GB/T2040的紫铜,均为液冷系统中散热冷板常用的材料。每种材料加工同样尺寸的试样3块,外形尺寸保持一致。

3.2 实验内容

分别将铝合金和铜的试样放入不同温度,不同离子浓度的溶液中进行试验,由于金属材料最易失效的形式是点腐蚀,而在静态腐蚀过程中腐蚀物逐渐堆积,形成闭塞的原电池,会加速点腐蚀的进程,因此腐蚀试验以静态腐蚀形式开展。

a)材质的温度试验:将铝合金和铜的试样浸泡至35℃和45℃的同种离子浓度溶液中,经过3个月后采用失重法计算样品的腐蚀速率。

b)材质的介质试验:将铝合金和铜的试样浸泡至介质M和介质N的不同种离子浓度溶液中,经过3个月后采用失重法计算样片的腐蚀速率。

c)材质的腐蚀发展程度:取出样片分别观察其腐蚀后状态并分析其腐蚀规律。

3.3 数据处理和计算

通过检测前期失效液冷系统中冷却介质离子含量,结合金属腐蚀机理,配置易诱导腐蚀的离子溶液,主要有Cu2+、Fe3+、Cl-和SO42-等离子,参考失效液冷系统中的各项离子浓度配制介质M及提高离子浓度配制介质N。

试验后,铝合金和铜的试样腐蚀后的状态如图3所示,对应材质的腐蚀速率如表2所示。分析表2中的数据,可以得出如下结论。

图3 试样的腐蚀状态

表2 试样的腐蚀速率

a)铝合金和铜材质在同种介质环境中的腐蚀速率随着介质温度升高而增大,铝合金的腐蚀速率明显高于铜材质,且铜材质对温度的腐蚀敏感度较低。

b)铝合金和铜材质在同样温度不同介质环境中的腐蚀速率随着冷却介质中离子浓度的升高而增大,铝合金的腐蚀速率明显高于铜材质,且铝合金对冷却介质中几种离子的腐蚀敏感度高于铜材质。

c)从实验样片的腐蚀状态可以看出,铝合金样片表面状态较差,更易发生点蚀,铜材质的样片表面平整,以均匀腐蚀为主,耐腐蚀性明显优于铝合金。

   0 4   

提高冷却介质与管道系统兼容性的措施

在提高液冷冷却介质与管道系统兼容性时,应重点从液冷管道系统材质选择、防腐措施处理、控制微生物滋生、建立有效的运维管理等方面着手,从腐蚀的源头、过程、实际操作多维角度杜绝风险,有效提升液冷管道系统质量和使用寿命。因此,提高液冷冷却介质与管道系统兼容性不仅要关注管道系统腐蚀诱因以及加剧条件,更要分析避免腐蚀或延缓腐蚀速度的方法,构建完善的腐蚀控制体系。

4.1 液冷管道材质选择

液冷管道系统的材质选择是影响管道腐蚀速度的关键性因素。液冷系统管道材质良好的防腐蚀性能,配合管道防腐处理和运行维护将有效减少腐蚀概率,降低腐蚀程度,提高系统可靠性和使用寿命。液冷系统管道的材质选择必须符合国家标准,根据实际技术需求和成本要求选定相应的金属材质,散热冷板常用的金属材质有铝合金、铜、钛合金等,二次侧管道和分水器常用的材质一般为316L或304不锈钢。在设计液冷管道系统时,如果不可避免地需要将2种不同金属材质的管道连接在一起,应谨慎选择材料以防止因电位差较大而导致的接触腐蚀现象。

4.2 防腐处理

在提高液冷冷却介质与管道系统兼容性方面,除材质因素外,通过管道的防腐处理来进一步控制腐蚀问题。目前最常用的措施是在液冷系统的冷却介质中加入缓蚀剂,其主要作用在于延缓腐蚀速度,也能在一定程度上降低腐蚀发生概率。液冷管道系统通常由2种以上不同金属组成,为了增强系统管道的缓蚀性能,需要探寻对不同金属如304不锈钢和铜均具有缓蚀作用的缓蚀剂。

目前应用较广的缓蚀剂主要有3种:金属离子型缓蚀剂、氧化膜型缓蚀剂和离子型缓蚀剂。无机金属缓蚀剂易与金属发生氧化反应,在金属表面形成一层不能渗透的氧化膜,从而阻止介质中的离子与金属的进一步相互作用,延缓金属在介质中的溶解,但大多数无机缓蚀剂的毒性大,例如铬酸盐、亚硝酸盐、硅酸盐等都具有较大的毒性。有机缓蚀剂一般含有极性基团,具有大比表面积、活性中心等,通过吸附作用能在金属表面形成一层覆盖层,从而隔绝金属与外界活性离子的接触。液冷管道系统需要根据材质、性能、环境要求及技术性、经济性要求合理选用缓蚀剂。

4.3 有效运维管理

在液冷管道系统的运维管理方面,需建立长效化监测、预警、管理和运行控制机制,提高液冷管道系统腐蚀控制水平。通过对冷却介质的电导率、离子浓度进行实时监测,在腐蚀率、风险性高的部位可定期进行超声波测厚,实现长效化的监测和运行控制。在液冷管道上布置漏液检测装置开展泄漏监测和预警管理,也可通过液冷机柜的支路压力传感器来监控压力变化,主动识别漏液情况,完成管道系统泄漏预警监管保护管理。同时制定应急处理方案,以便及时响应警报信息,高效开展液冷管道系统泄漏处理等工作。

   0 5   

结束语

通过对液冷管道系统腐蚀机理及兼容性的实验研究,得到如下结论。

a)铝合金材质在液冷系统中较易被腐蚀且易出现点蚀,在对可靠性要求较高的智算中心液冷系统中应慎重采用。铜材质冷板在恶劣环境中的耐腐蚀性较好,且与不锈钢材质管道有良好的兼容性,得益于其高导热率和出色的成型工艺,铜材质是目前液冷系统散热器件的最优选择。

b)液冷系统对水质要求较高,应严格控制循环系统内冷却介质的日常指标,定期检测循环水中微生物数量。

c)建立长效化监测、预警、管理和运行控制机制,提高液冷系统管道腐蚀控制水平,加强监测二次侧管道系统内冷却介质的洁净度和离子浓度,并定期增加缓蚀剂或更换冷却液。


作者简介


李世龙,工程师,硕士,主要从事数据中心液冷基础设施研究工作;

贺晓,正高级工程师,硕士,主要从事数据中心研究咨询管理工作;

胡孝俊,高级工程师,硕士,主要从事数据中心基础设施研发工作;

杨猛,高级工程师,硕士,主要从事数据中心云网基础设施研发工作;

程序,正高级工程师,学士,主要从事数据中心研究咨询管理工作;

魏文豪,高级工程师,硕士,主要从事数据中心研究咨询工作。


推荐阅读




基于深度时序学习的数据中心热风险智能检测与预警研究


中讯运营企业网络托管服务


无人化业务运营平台研究与设计


中讯网络5G专网产品

点击“阅读原文”,下载论文PDF

欢迎扫码关注

头条号|邮电设计技术

官方网站|http://ydsjjs.paperopen.com

编辑|李星初  审核|袁江

邮电设计技术
这是一个资源型公号,您可以在这里淘到大量原创技术资料。 《邮电设计技术》1958年成立,1974年复刊,是中国通信领域成立较早的期刊之一。刊号:CN10-1043/TN,邮发代号:36-176。
 最新文章