智算中心的“风火水电”各指的是什么?

2024-12-26 07:31   北京  

前言,相信很多智算中心领域朋友在做方案设计或者参加相关活动时经常会看到“风火水电”的字眼,今天也恰巧被一个朋友问到,到底“风火水电”指的是什么?在智算中心方案设计时各有哪些特点?今天我们简单聊聊!

一、“风火水电”的概述

我们知道“智算中心”的概念其实是由传统数据中心演进而来,两者并没有本质上的区别,“风火水电”一直是传统数据中心正常稳定运行的“综合保障系统”,简单来讲,风指的是空调系统、火指的是消防系统、水指的是数据中心加湿除湿系统、电指的是机房&设备供电、UPS及应急电源等。

二、智算中心“风火水电”的特点和趋势

1、“风”的变化:风冷散热系统升级并充分利用自然风资源,智算时代由于算力密度大、单柜功率高对空调系统也带来了更高的挑战,如下图所示,IT设备侧的散热可根据不同的机柜功率密度采用不同散热方案,从房间级到列间级,再到风液混合方案等,机房侧的散热可根据室外气候的不同采用制冷模式、预冷(部分自由冷却模式)及完全自然冷却三种制冷模式。

今年年初,宁夏智算中心项目一期工程——西云算力首个采用全自然风冷技术的30kW机柜人工智能数据中心在此落成,创新的直接新风自然冷却AHU方案,大幅降低了常规制冷系统的风扇和压缩机功耗,降低碳排放。

2、“火”的变化:智算中心设备价值更高、数据规模更大导致其消防系统设计往往更加复杂,为有效预防火灾,如有液冷的机房,通常需要采用集智能感测网络、实时数据分析与联动响应一体的方案设计,通过部署光电式烟雾探测器、红外火焰探测器和温度感应器,形成覆盖机房全区域的立体监测网络;利用物联网技术连接这些设备,大数据分析平台能实时评估火灾风险,并即时推送预警信号等。总结来说就是消防系统需要更智能、更高效和对设备的伤害更小

3、“水”的变化:很多朋友可能不了解,智算中心也是“用水大户”,采用新型散热方式如蒸发冷却机和液冷散热虽然能减少耗电量,但会增加用水量‌,比如谷歌2023年数据中心冷却水使用量达到61亿加仑(约2300万立方米)‌除了我们熟悉的PUE指标外,现在智算中心对用水指标“WUE”也越来越重视,WUE = ( 总耗水 ) / IT 设备耗电,我们不能盲目的追求PUE更低,会导致智算中心的耗水量上升,PUE和WUE两者是负相关的,所以我们要综合考虑算力、电力、用水三个维度的平衡。

假如某智算中心单柜15kW,共1000架机柜,使用系数按0.6,PUE按1.3,那每年耗电量约为15*0.6*1000*24*365*1.3=102492MW

不同制冷方式WUE取值不同,间接蒸发冷却WUE约为1.0L/KW,冷机+冷塔制冷WUE约为2.0L/KW,每年用水量计算如下:

  • 间接蒸发冷方案:102492MW x 1.0=102492t

  • 冷机+冷塔方案:102492MW x 2.0=204984t

可能有些朋友会问水不是能循环的吗?但是本地用水,水蒸发后就不知道循环到哪里了,会造成本地水资源短缺,大量的水资源消耗还会影响生态环境等。

4、电”的变化:主要包括单柜功率密度、供电方式、UPS和柴发等方面。

①、市电接入时通常来自两个不同变电站,要能够提供多种标准及高密电力规格,如果其中一路变电站发生非常情况,另一路市电依然能正常运行,保障智算中心电力持续稳定,且供电采用“预制模组”方案,效率和占地面积都有优势,对比如下图,。

智算中心供电负荷加大、安全级别的提高都对供电设备提出了越来越高的要求,智能小母线系统逐渐取代传统的列头柜,用于机房的末端配电。

③、UPS系统,举例-IT机房UPS按2N系统配置,弱电系统(安防系统、自控系统、环控系统)、应急照明、 冷冻水循环泵、精密空调等设备配备的UPS按照N配置。比如每台UPS配备的蓄电池组均能满足满载15分钟的要求等。

以上内容为个人总结(理解得较浅),不足之处欢迎大家指正!

下面是广告,老张是讲师之一,想参与课程学习的朋友可以了解一下。

----老张会持续通过公众号分享前沿IT技术,创作不易,大家多多点赞和关注!

IT技术分享-老张
北漂it民工,目标做最接地气的科普类文章!分享IT行业服务器相关的前沿技术、产品和方案,聚焦AI、信创、液冷、智算中心等相关细分领域!入交流群或商合可+vx(zcyaihuai)!
 最新文章