编辑:阿冒
设计:沐由
纵观人类文明史,从农业革命到工业革命再到当前的信息革命,产业技术的每一次变革,都给我们的生产生活方式带来了无比巨大的变化和异常深刻的影响。
人类社会正在加速向数字化、低碳化、智能化的方向演进,数字世界的形态也已经成为当今社会不可或缺的一部分,数字世界的安全稳定关乎到我们每个人。
作为支撑数字世界运行的关键基础设施,数据中心宕机总成本在过去十年里,呈现出不断上升的趋势。据测算,大型数据中心的每分钟宕机成本可能已经达到数万美元之多——实际上,在钱之外的隐形损失更是数字世界和我们无法承受之重。
2024年1月15日,华为数字能源正式发布2024数据中心能源十大趋势及白皮书,以科学、专业、审慎、负责的态度和极具远见的卓识,为千行百业加速迈向数字化转型,分享了华为对未来数据中心的洞见与思考。
“安全可靠、融合极简、低碳绿色。”在本次的发布会上,华为数据中心能源领域总裁尧权言简意赅地定义了未来数据中心的如上三大特征。
华为数据中心能源领域总裁尧权
他指出,由于AI大模型的加持,未来五年全球AI算力的年复合增长率将会超过80%。显然,数字世界对算力需求的激增,推动着数据中心进入新一轮的发展爆发期。
然而,一如过去的几十年,数据中心依旧面临安全性、可靠性等挑战,而且在数字化、智能化的需求之下,以前的某些因素被不断放大,情况也变得愈加严峻起来。
正因为如此,白皮书列举和分析了2024数据中心建设与发展的十大趋势,希望以此助力客户、伙伴构筑绿色可靠算力底座,让每一瓦特承载更多算力,让数字世界坚定运行。
趋势1:高可靠产品+专业化服务是保障数据中心安全可靠运行的关键
由于承载着海量数据的存储、传输和处理,数据中心的产品设计、生产环节就要贯穿“全链安全”的理念,严控产品质量,高度自动化,减少认为干预,保障产品的高可靠性。
与此同时,专业化的服务必不可少。通过提供专业化部署和运维服务,降低产品失效率,最小化灾后影响,完善端到端的保障机制,双管齐下保障数据中心安全可靠运行。
趋势2:分布式制冷架构将成为温控安全的更优选择
科学而高效的数据中心制冷,一直是数字世界可靠运行的关键环节之一。以前的数据中心通常采用集中式制冷架构,一旦发生单点故障,就有可能影响冷却系统的安全运行,导致大规模宕机。
白皮书指出,分布式制冷架构将成为温控安全的更优选择。由于各个子系统完全独立,即便单台设备出现故障也不会影响其他设备,从而在架构级保障了数据中心的运行可靠性。
趋势3:预测性维护将成为数据中心基础设施的标配
数据中心维护是保障业务连续性、提升整体运营效率的重要手段。不过,以前的维护往往是事后,发生事故之后才知道问题所在,这样的被动型势必难以满足智算时代的要求。
白皮书认为,预测性维护将成为未来数据中心的标配。得益于AI技术的快速发展,预测性维护的范围也将持续扩大,从部件的寿命预测到设备的热失控预警,再到制冷系统的各种预警,都能提前预测,从而防患于未然——相信这将是未来数据中心的“基本素质”。
趋势4:全生命周期的网络安全防护体系将成为数据中心基础设施的保护盾
作为数字世界的中枢与底座,数据中心需要全方位的安全,不管是UPS还是空调设备,一旦遭遇到恶意攻击,都会直接影响数据中心安全可靠性。
白皮书指出,硬件安全加软件安全,才是全方位的安全,软件安全更要从供应安全、纵深防御和运维/运营安全三个维度,构筑全生命周期网络安全防护体系,为数据中心保驾护航。
趋势5:预制化、模块化将成为高质量快速交付的最佳选择
作为一种创新性的设计理念,预制化、模块化的数据中心成为越来越多客户的选择。由于使用了独立的模块和预制组件,数据中心实现了更高的灵活性和效率,维护也更加容易。
数智时代,客户的各种业务要求快速上线,因此那种周期漫长的建设模式不再可行。通过“工程产品化”和“产品模块化”,新模式保证了更高质量产品的快速交付,还大幅减少现场施工造成的“三废”垃圾。
趋势6:专业化管理平台让数据中心运维更安全、更高效
由于规模化、集约化的发展趋势,数据中心的运维和管理变得越来越复杂,因此客户对专业化管理平台的需求变得愈发突出,这也是数据中心可靠性、安全性和高效性的重要保障之一。
白皮书认为,通过原厂的专业化管理平台,可以帮助客户构建设备深度管理能力,大大降低运维难度,做到快速判断问题,及时排除故障,确保数据中心安全稳定运行。
趋势7:风液融合将成为业务需求不确定场景下的优选架构
通用算力和智能算力并存,已经成为现今很多数据中心的“新常态”。由于功率密度不同,前者一般采用风冷即可满足需求,而后者则“欲壑难平”,往往需要液冷才能稳定输出。
白皮书指出,对于类似这种需求不确定的业务场景,风液融合将成为业务需求不确定场景下的优选架构。通过风冷+液冷的组合和比例可调,灵活适配未来的业务演进,保护用户投资。
趋势8:间接蒸发冷却依然是现在和未来最优的制冷方案
现在的大型数据中心,往往选址在相对寒冷的地区。由于可以最大化利用自然冷源,绝大部分时间无需压缩机制冷,可以实现极致的PUE,因此间接蒸发冷却较之冷冻水系统在架构、效率和运维方面存在明显优势,是当前最经济适用的制冷方案。
与此同时,针对智能算力需求,间接蒸发冷却也支持未来演进的架构,进一步适配液冷的计算场景,其能效高、适用范围广、成本较低、环保和灵活性高等优点,依然“夺目”。
趋势9:数据中心能效PUE挖潜要从关注部件高效调整为系统工程最优解
在“碳中和”的宏大命题下,数据中心提升PUE的努力势必也要从以前对元器件、部件的关注,转移到系统和工程优化的高度上。唯有如此,数据中心才可以更好地履行社会责任,为数字世界的坚定运行作出贡献。
白皮书建议数据中心客户在现实条件和部件技术水平进行权衡,得出最优解,譬如UPS双变换模式转向S-ECO、数据中心PUE转向PFPUE(算力PUE),端到端的进行数据中心能效优化。
趋势10:AI调优将成为存量DC能效智能优化的最佳选择
我们知道,除了少数新建的数据中心,现在仍有大量数据中心的PUE居高不下。面对国家和地方的政策要求,这些存量数据中心需要进行节能改造,因此必然就要停线停业务,存在业务中断的风险。
白皮书认为,相对于人工调优,AI能效调优解决方案通过预置AI算法和大数据模型,可对存量数据中心实现节能优化,且AI调优不依赖人工经验,优化速度快,效果好,实现从制冷到“智冷”的转变。
观察与思考
数据中心的建设、优化和运维,是一条没有终点的漫长道路。企业需要拥有敏锐的洞察力,随时准备应对新的挑战和把握新的机遇,方能推动数据中心和业务的可持续发展。
在数据中心领域,华为已经深耕了30年,拥有业界首屈一指的雄厚积淀。通过不断的探索、创新与磨砺,华为数据中心能源为业界提供了安全可靠、融合极简、低碳绿色的产品解决方案。
在日常采访中,笔者曾经参观过很多华为主导和建设的典型案例。在我看来,华为不仅关注业界发展的大趋势,也同样留意一些其他企业容易忽略的细节问题,而正是这种“抓大不放小”的态度,为华为的产品方案构建了独特、领先和差异化的竞争优势。
“道虽迩,不行不至;事虽小,不为不成。”长期以来,华为数字能源始终践行于此,不舍昼夜。
(个人观点,仅供参考)