数据中心百年技术之争:能耗战场,液冷何以为王?

科技   2024-11-18 21:02   北京  


● 

AI正在走入推理时代,并落地千行百业,但大规模应用已带来超高能耗难题:2023年至2026年,AI行业电力需求预计将增长至少10倍;而每一次向ChatGPT发出请求,电力消耗都达到谷歌搜索均值的10倍。


如此高成本、高能耗将难以为继,AI训练正在超出我们的负荷,算力需求持续扩大,能耗之争一触即发,我们用什么让数据中心的算力持续?



以百年为尺,我们才能看清当下。一些隐秘的力量,支撑计算百年沉浮发展,造就了此刻AI竞赛的制高点。



来自2100年的智能体科技历史学家再次出发,展开一场算力与能源技术角逐的探究。在他的时代,世界已经被计算重建,数字生命可以永生。人类究竟如何掌握驱动世界的算力能源?通过下面这支视频,以百年历史视角,带我们找到答案。



回顾数据中心的发展史,就是算力的发展史,也是近代人类的发展史。历史上强劲高效的冷却,不止于数据中心总成本的降低,更带来算力的提升,在与能耗的角力中制胜。



当今人类已将极致的冷却方案应用于数据中心的散热中,我们将随智能体科技历史学家穿越亦真亦幻,冰雪覆盖的联想集团数据中心——西班牙巴塞罗那教堂,中国华南理工,和阿根廷气象局,回到关于算力、能耗、冷却技术一切的起点。





过往篇章

算力与能耗之争



跟随科技树回到最初的起点,算力以一台大型机横空出世——1946年的ENIAC,通过联想小天输出可得知,它的庞大身躯占地167平方米,计算能力达到人的千倍,执行着关键军事任务;6年后,第一台商用大型机落地,能够存储数据,将计算的准确性更推进一步。



人类渴求算力,但彼时计算资源并不通用,程序被写在打孔卡上,人们排着队,拿着等待算力的号码牌。1959年,分时系统出现,处理器计算占用被切分至极短的几十分之一秒,轮流给多个终端的用户使用,每个用户都像独占了计算机一般。



往后的60至80年代,随着计算被浓缩至集成电路之上,TCP/IP协议的诞生,万维网在一台微型机上出现,人类迎来了互联网的创世纪——并将所有的计算终端连接,通向算力的源头数据中心。



90年代,机架式服务器在出现,标志了数据中心的诞生,它由数千个服务器聚集而来,能实现小型计算机千余倍的功能。21世纪初期,互联网启动疯狂领土扩张,数据中心也展开一场硬件的军备竞赛,规模迎来一次陡升,仅一台机柜就需要400W功率,能耗成为数据中心算力运行的挑战。





能耗何解

关于散热桎梏的探索



如何理解能耗?



能耗是计算过程的直接必然产物,以热量形式存在,与算力相伴相生。从视频中的桌面图表中看到,数据中心运转的算力越高,则能耗越高,但能耗的热量累积一旦超过阈值,甚至会反过来限制算力的发挥,成为算力的桎梏。而服务器起初设计的TDP(thermal design power)热设计功耗:处理器在极限性能下运转,释放出的热量,便是算力可持续的既定阈值。



突破的秘诀,就在于把热量彻底、有效的带走。从而提升数据中心能效,使基础设施算力得到应有的发挥。



为了获取算力,从计算存在的源头开始,人类就已经进行各种角度和方式的散热探索。



1940年代,大型机ENIAC使用真空管计算,它高成本高电力的需要,甚至使城市灯管都变暗;与此同时,能耗也极高,已经需要空调风冷进行散热。



之后,晶体管诞生,通过桌面窗口信息的对比,看到它对电力需求、散热要求更低,满足了人类对算力的渴求。



80年代,科幻小说般的液冷设计方案出现,拯救了大型机的计算。但液冷成本高昂,用TCO总拥有成本衡量,此刻仍然是风冷的天下。甚至机架式RACK服务器的布局,也几乎因风冷散热而奠定。



每一次算力与能耗的飙升,都需要迎面散热的难题。要如何真正突破能耗这一瓶颈?





液冷破局

数据中心算力跃迁



近百年来,人类沉浸在为算力爆发式的增长而喝彩,却忽略了伟大的背后——是冷却技术一次又一次地将算力从能耗的制约下拯救出来。



2012年,高性能计算使数据中心单柜功率飙升到单柜50kW,液冷技术登上能耗战场,就此全面爆发。它所面临的,是风冷百余倍的散热需求,伴随扑面而来的热浪挑战,液冷技术前所未有地改写了数据中心形态。



联想率先推出海神温水水冷技术——Neptune,采用温水水冷的非接触冷板,无风扇全液冷设计满足高性能计算需要,一出现便打破了风冷的技术格局。采用优于行业标准的45至50℃温水作为进水,将数据中心的PUE能耗指标从风冷的1.4降至1.1,冷却所占电力消耗可以降到10%或更低。



拆解开一台联想集团的AI液冷服务器,会看到液冷板紧扣每个散热节点,去离子水穿过铜板间的细微铜管,通过冷却液将高热带走。数据中心规模越大,液冷技术越经济,从TCO总拥有成本衡量,大型集群部署液冷技术2年成本即可低于风冷。



2024年,AI的计算推理需求,使单机柜功率直达100kW,将数据中心的能耗挑战拉至极限。联想集团液冷技术,再一次突破能耗瓶颈,拯救算力跃迁。



2024年联想集团Tech World上,联想集团与NVIDIA联合揭幕了第六代垂直液冷突破性产品,能够带走数据中心40%功耗;并实现精巧封装,使能源利用效率接近100%。



此外,联想液冷服务器单节点支持盲插,有效防止冷却液泄露;更利用manifold分液器、柜内CDU、列间CDU,将机柜改写成全液冷方案。



未来,面对更庞大的AI训练推理需求,联想集团将用统一支持全盲插的整合液冷方案——液冷集群微模块,彻底重构数据中心布局,改写数据中心的历史。以前沿技术突破能耗瓶颈,满足下一个时代更加澎湃的算力需求。





百年角逐 液冷为王



百年间液冷技术持续改写对数据中心服务器形态,支撑人类完成三次算力跃迁,在能耗与技术的争锋中,加冕为王,维系重建世界的计算力量。



随着浸没式液冷技术的到来,液冷将继续伴随人工智能,去迎接下一个时代崭新的能源方案。人类对算力的掌握,才真正做到了如基础能源般信手拈来。



联想集团服务器与数据中心作为千行百业的基础设施建设,将重新定义 AI 作为生产力的能量源泉,并以世界之力再造世界,加速迈向人本智能的未来。




从1984到2024

40年是一段时光机

欢迎大家点击下方图片

分享你的联想时刻

同时收获另一个联想时刻

↓↓↓



●复制PC成功模式,联想集团Q2业绩跑出加速度



● 机器人技术百年逐鹿:具身智能觉醒



●联想集团与NVIDIA扩大合作:联合发布全新液冷AI服务器








🔴可能是中国粉丝福利最多的一个公众号👇



联想集团
联想集团官方公众号,欢迎来到万物皆可计算的世界
 最新文章