随着全球电价上涨,如何提升数据中心的用电效率成为巨头们关注的重点。根据Statista的报告显示,在2021年至2022年间,世界电价飙升至历史最高水平。2021年下半年,能源需求增加,电价创下历史新高。随后稍事缓和,紧接着2022年初,由于俄乌战争导致能源市场再度趋紧,能源危机加剧。
尽管性能效率已经在不断提高,但数据中心的电力消耗增长更快。换句话说,虽然单位性能在提高,但速度赶不上对资源的需求增长速度。这一方面是因为算力规模的扩大和GPU计算量的激增,另一方面是因为消耗的电力越多,功率越大,服务器产生的热量也就越多,为数据中心提供散热服务的压力也就越大。事实上,这也是数据中心的主要运营开支之一,在高峰时甚至可以占到常规开支的近一半。
目前行业内通常使用电源使用效率(PUE)这一指标,来评估数据中心的能耗水平。PUE指的是通过计算总能耗与IT设备专用的能耗比,来衡量数据中心的能源利用效率。
较低的PUE值意味着数据中心有着更高效的能源利用率,表明其在非计算能力(散热和其他耗能)方面的消耗比较低。面对不断增长的AI基础设施规模和不断上升的电力消耗,那些PUE指标优异的新型数据中心会有更加良好的营收和运营空间,也能更坚实地支撑AI产业的发展。
物理冷却方案
想降低PUE值,首先要提升数据中心的散热效率。通常来说,一个数据中心内部需要散热的设备不光只有服务器,还有其他物理尺寸纷繁复杂,能源消耗水平各有高低的IT设备。一些大型IT设备,虽然功率也不算小,但是由于其表面积较大,反而相对更容易冷却。一些高能耗设备的虽然尺寸较小,但是产生热量密度却高得惊人,散热压力就很大。
这种情况下,数据中心的散热设备就需要应对不同散热条件下复杂的情况,需要以不同的散热速度让各种设备保持合理的工作温度。
简单来说,散热需要的冷却技术可以分为两大类:空气冷却和非空气冷却。空气冷却通过空调,冷水机组等设备进行散热,非空气冷却则使用水、油或固体材料等物质进行冷却,以及自然冷却等各种新型方法。
空调:空调系统是专业数据中心里使用最普遍的冷却方式。它们的基本原理与家用空调相似:流经服务器的空气在空调中循环,通过散热器格栅冷却,然后再循环回服务器。这个循环过程确保了连续的冷却机制。
冷水机组:继空调之后,冷水机组是第二种被广泛采用的冷却系统。与空调不同,冷水机组使用水(或以水为基础的溶液)将热量从需要温度控制的空间转移出去。虽然空调更简单且通常更便宜,但其较高的能源成本有时会成为企业的一个障碍。另一方面,冷水系统更节能,但在安装和维护方面需要更多的组件和复杂性。
需要注意的是,冷水机组并不等于水冷系统。冷水机组通常也有风冷和水冷冷水机组之分。
绝热室和绝热垫:绝热冷却涉及使用将水倒入并蒸发的腔室或垫子。随着水蒸发,腔室和垫子会与内部空气一起冷却。虽然绝热冷却也是一个可行的选择,但由于操作复杂,相较于空调和冷水机组,它在数据中心冷却中并不常见。
水冷系统:在水冷系统中,使用水或含水液体进行散热。在服务器房间中,水管被有规划地布置以带走更多的热量。每台服务器连接两根水管——一根用于热水外流,另一根用于冷水流入。CPU、GPU及其他设备上的散热器会直接连接到供水系统。这种方法在实现冷却的同时,也产生了一些可供循环利用的温水。
热交换器:该方法利用外部寒冷环境来提高冷却效率。当附近有冷源(例如湖泊、海洋或冷地)时,可以将水管直接部署到其中,以传输IT设备产生的大量热量。
热电冷却模块:与风冷和水冷不同,基于珀耳帖元件的热电冷却器(TEC)属于“固态冷却法”。通过珀耳帖元件的半导体效应,冷却器的一侧吸收设备热量,另一侧释放热量。
自然冷却方案
与目前各种物理冷却方案不同,自然冷却方案以环保和双碳潮流为目标,旨在最大限度地提高冷却效率。无需依赖传统冷却系统,引入利用自然环境冷源进行冷却循环,通过自然的热力学过程来调节数据室内的温度。
目前业内的实践证明,自然冷却方案显著降低了功耗(与其他冷却系统相比降低了75%至92%),减少了二氧化碳排放量,并且降低了冷却系统中对水的需求。
可以说,自然冷却是目前数据中心最环保的选择,可以消耗更少的能源和资源,还节省了大量成本。
该类系统的运行方式非常简单,将外部自然环境中的空气或者水引导通过过滤器与IT设备进行冷却散热,然后将其排出。这种模式降低了冷却系统的复杂性,与传统方案相比在建设和维护成本上也有很大优势。
空气自然冷却的局限性
目前已经采用自然冷却的数据中心以空气自然冷却为主,将数据中心建设在气温较低,条件合适的地区。比如,坐落在我国贵州贵安的腾讯七星洞库式数据中心,以及AtNorth在冰岛建设的12MW超大数据中心,都可达到1.2及以下的PUE值。
一些质疑者认为随着全球变暖加剧,空气自然冷却的前景会变得不妙。就眼下来说这一担忧并不切实际。十年来全球平均温度升高了约1.5度,这种程度的温度变化短期内并不会影响到那些低温地区的冷却效率稳定性。
空气自然冷却的真正局限性还是在于地理位置。一方面,显然炎热地区与空气自然冷却无缘,但很多炎热地区对数据中心建设也有大量需求。
另一方面,并不是寒冷的地方都合适,需要考虑建设位置的可访问性。选择的区域必须拥有必要的基础设施,并且能让负责数据中心维护的专业人员方便到达。设施的连接性(包括光纤线路的可用性)也很重要。比如,在北极圈内建立自然冷却数据中心显然非常不切实际。
空气自然冷却还要考虑相应环境的空气质量。例如靠近繁忙高速公路或密集农业活动的地区,可能会给循环系统带来问题。与循环内部空气的传统空调数据中心不同,自然冷却中心吸入外部空气,本来就需要更频繁的进行过滤器维护,如果所处环境空气质量不好,则会增加很多成本。
海水自然冷却的优势
2023年在我国海南下水的全球首个商用海底数据中心成功实践了自然冷却的另一条道路。和寒冷地区的空气同样,海水也属于自然冷源。但海洋空间的可选择性比陆地寒冷区域大得多,不管是中低纬度还是高纬度地区,沿海海床的海水温度都足够满足数据中心的热交换需求。而且对数据中心有需求的沿海地区,其基础设施和交通建设普遍都比较发达,各种条件都要比寒冷内陆环境优越得多。
目前,海底数据中心在技术上已经没有障碍。经过一年多的稳定运营,我国的海底数据中心已经证实了相关技术的可靠性,不仅能耗指标出众,同时避免了陆地数据中心经常会遇到的腐蚀、温度波动和天气、灾难等导致的物理干扰问题。
目前,许多有远见的企业,如Meta、微软、谷歌、亚马逊、Yandex和Wildberry等知名公司都在探索如何更好地将自然冷却方案应用于数据中心。
巨头们对自然冷却的节能优势和风险进行综合考量后,愿意为了节省大量潜在成本而承担应用新技术带来的一定风险。是坚持传统方案并承担高涨的成本和环保政策压力,还是积极研发和采用新技术,成为推动数据中心形态变革的先驱?答案显而易见。
供稿 | 李浪平
责编 | 唐菲
审核 | 唐甜