01 背景
在现代数据中心里,每部署一个千瓦级的计算能力设备,可能需要超过几百瓦的冷却功率来支持它。相比传统空气冷却来说,液冷具有冷却能力强、能量消耗少和好管理的优点,已成为高性能计算中心冷却设计的首要选择和发展趋势。
本文分享Iceotope利用系统仿真工具Simcenter Flomaster开展世界首个1U浸没式液冷服务器KU:L系统优化设计的案例(Iceotope是英国数据中心与边缘计算精密液冷技术知名供应商,早年前已引入Flotherm,FLOEFD和Flomaster以三维和一维相结合的方式开展浸没式液冷技术研发)。
02 案例介绍
液冷设计难点
该液冷系统需要输送冷却剂到机架级和服务器级各主要热源处,需要确保每个部件具有足够的冷却剂输送,但是又不能过度的输送。过度的输送会增加硬件成本和运行能耗成本,因此需要精确设计流量分配并选择合适的泵。Iceotope研发人员采用系统仿真工具Flomaster来快速解决这些问题。
解决方案
为了能够有效利用计算资源和节省运行时间,Iceotope通过使用“数字孪生”概念确保能够在更宽范围的设计场景中检查多个变量,实现最优的系统和部件设计。对于液冷泵选型设计,利用Flomaster建立如图1所示的服务器级液冷系统模型,并以此确定系统中一系列潜在流量下的压力损失(系统阻力曲线)。
图1 KU:L 刀片服务器级Flomaster冷却系统模型
通过DOE功能定义设计空间探索并批处理运行模拟,生成如图2所绘制的系统阻力曲线。通过与泵的流量扬程曲线进行匹配分析,研发人员可根据流量需求和每个泵的额定功率来优化水泵选型。
图2 KU:L系统刀片服务器系统流阻曲线 vs 泵扬程曲线
在开发原型机证明了“数字孪生”的概念之后,研发人员通过使用Flomaster来进行数值计算、系统调节和流量平衡,以便使足够量的冷却剂被输送到服务器内每一个主要热源处,并且不会过度的输送。
除了平衡刀片服务器内的流量外,还用Flomaster来平衡数据中心机架各个服务器的流量。研发人员建立一个“系统的系统”,在每个阶段进行流量平衡,确保机架中的每个1U服务器有足够的冷却剂流量,从而使得系统设备尺寸能够达到最小化,同时确保系统中的温度是可接受的,如图3所示。
图3 机架级Flomaster冷却系统模型
应用液冷设计方案可能会涉及大量的冷却剂消耗和更高的泄露率,通过使用Flomaster设计系统可以很好的预防泄露。如设计一个管路输送冷却剂到机架服务器机箱内,而不会产生任何的压力波动,也不会在接头处产生任何应力,这样可以从服务器内直接消除泄漏,如图4所示。该方案还可以很好地减少冷却剂浪费,也是数据中心运维管理的理想选择。
图4 Flomaster预测的服务器移除引起的相对压力峰值变化
03 总结
本次Iceotope案例从系统角度重点介绍了利用Flomaster指导服务器浸没式冷却及机架冷却设计的方法,与此同时Iceotope还使用Flotherm/FLOEFD 三维CFD方法进一步优化服务器和机架详细结构设计。两种方法相结合,各取所长,宏观微观互补,有效地解决了服务器级、机架级到数据中心级多尺度、多颗粒度、多复杂度冷却设计问题。
欢迎联系咨询
作者:薛志杰