冰与火之歌!揭秘算力性能破局的背后

科技   2024-11-15 18:38   广东  

自计算技术诞生之日起,能耗与冷却便如同双生之花,相互依存、相互制约,历经无数次的较量与博弈,在数据中心追求算力发展跃迁的百年历程中,谱写出一首冰与火的史诗。而这背后的基础设施出现过各种颇具实验性的形态,比如1985年,美国Cray-2超级计算机采用单相强制对流浸没式液体冷却系统,芯片被整个浸入冷却液中,极具科幻感和视觉冲击力。

2018年,Facebook在其数据中心首次使用蒸发冷却技术,创新性的省去了最耗电的机械压缩循环系统,使用100%自然风蒸发冷却、加湿系统。

放眼未来,面向量子计算机的冷却技术更为“神奇”,比如中国科学技术大学的研究团队提出了麦克斯韦妖式量子算法冷却方法,通过光学干涉装置搭建成冷却模块,实现量子系统的逐步冷却……

麦克斯韦妖式量子算法冷却

目光聚焦当下。2024年联想Tech World上,联想集团董事长兼CEO杨元庆,与NVIDIA创始人兼CEO黄仁勋同台登场,科技界两大顶尖领军者共同发布搭载联想第六代Neptune海神液冷解决方案的AI服务器。在数据中心这个算力的心脏中,海神液冷技术如同一股清泉,为高密度计算提供了冷静而高效的血液,为全世界的AI注入动力。

今早,联想集团2024/2025财年Q2财报发布,《Game of AI》系列科普视频第二集《数据中心:如何与世界交换算力》也伴随财报上线。

视频以《权力的游戏》风格开场,用三维沙盘、三维爆炸拆解等创意的表现形式,跟随著名英国科技历史学家、中科院外籍院士李约瑟为原型的智能体第一人称视角,展开了一场算力史与能源技术史的探究。

算力的发展史,就是一部人类科技进步史。从最初的大型机到如今的量子计算机,从简单的数值计算到复杂的人工智能模拟,算力的每一次突破,都为人类带来了新的可能。

在联想集团打造的这支科普视频中,我们一次次看到算力如何影响世界,片中大历史长镜头全景展示了人类算力的发展历程。能耗为何是算力性能破局的关键?算力如何可持续?我们一起从科技树的原点探索,随着一个个节点被点亮,我们惊奇的发现,每一次算力的飞跃,都如同主干上新增的年轮,记录着人类对算力探索的成就。伴随算力和能耗的发展,另一支以冷却技术为代表的分支也在同步演进,它们与算力发展的主支相互交织,相互影响,共同构成了当下数据中心的形态。

左右滑动 查看《数据中心百年通史》

也可点击放大,查看更清晰哦~  

1946 年 2 月 14 日,世界上第一台通用电子计算机 ENIAC 在美国宾夕法尼亚大学正式诞生!它是一个真正的庞然大物,占地约 170 平方米,重达 27 吨,使用了 17840 支电子管、7200 个晶体二极管,每秒可进行 5000 次加法运算,或者 400 次乘法运算,但同时,它的耗电量高达 150 千瓦。每当这台计算机启动的时候,费城的灯光都仿佛为之暗淡。

ENIAC的成功激发了对更高效计算设施的需求。6年后,UNIVAC I的问世,更是首次实现了存储能力,显示了计算机在数据处理上的巨大潜力。

然而,ENIAC和UNIVAC I并非完美无缺。ENIAC的电子管稳定性差,发热功耗和体积大,已经需要人们使用庞大的风冷系统为其降温。

在随后的20多年里,人类不断拓宽对计算探索的疆域,科技树被不断点亮——1960年代出现了集成电路,计算机开始小型化发展;1970年代见证了个人电脑的诞生;1980年代,个人电脑出现开始接入局域网;1990年代互联网开始普及,机架式服务器的出现,使数据中心的概念逐渐形成。能耗密度也达到每个机柜400W,迎来第一次算力跃迁。

但随之而来的能耗难题逐渐显现,空调解决了第一次算力密度增高、能耗增高带来的高热问题。也让人们意识到需要更强大的冷却技术才能将不断增长的算力从能耗的制约下拯救出来。

虽然此时液冷有着难以企及的高昂成本,但人们已经看到了它的巨大潜力。我们的目光随着视频中的科技树来到21世纪,高性能计算使得单机柜功耗呈直线飙升百倍,高达50kW,算力汹涌磅礴。然而,这也给散热同时带来了百倍的严峻挑战,在此形势下,液冷技术全面爆发。

2012年,联想集团推出了海神Neptune液冷技术,其核心优势在于温水冷却方案,该方案能够显著降低数据中心的能耗,提升散热效率,能够将数据中心的PUE值降低至1.1。联想集团为北京大学打造的“未名一号”高性能计算平台,通过采用海神Neptune液冷技术,每年节省了60万度电,降低了50%的制冷散热成本。在当时,可以说海神Neptune液冷技术标志着数据中心冷却技术的一次重大进步,算力获得了第二次跃迁。

终于,我们随着智能体李约瑟的视角来到了 2024 年,液冷行业将迎来“刚需”爆发元年。这一年,AI 训练和推理如同星火燎原之势迅速普及开来,迎来了第三次算力的跃迁。在这个过程中,单个 GPU 的功率需求如火箭般飙升至 1000W,而数据中心单机柜的功率密度更是达到了令人惊叹的 100kW,面对如此巨大的算力需求,带来的极致高密度热量,液冷技术已然成为了提升算力的关键所在。

2024年联想Tech World上发布的AI服务器搭载联想六代海神Neptune垂直液冷技术,革命性的垂直液冷机箱,实现了更精巧的封装,是对数据中心能耗问题的革命性解决方案。与传统风冷系统相比,这款液冷技术的变革性产品能够减少高达40%的电力消耗,使得AI和高性能计算客户能够在不依赖专门数据中心空调的情况下,运行功率超过100kW的服务器机架,有效转移98%的热量。

在联想集团的视频中,还展现了全机房的液冷整合方案——液冷集群微模块。它将多个子系统集成在一个模块化产品中,简化了液冷工程的复杂性。采用液冷机柜式CDU(Cooling Distribution Units),满足高散热量、高功率密度场景需求。不仅提升了数据中心的性能和可靠性,还为人工智能、云计算等前沿领域的发展提供了强大的支撑。在穿越百年的数据中心能耗技术争锋中,液冷技术当之无愧地加冕为王。

AI正以革命性的速度重构我们的世界和生活方式。医疗领域,AI被用于开发新的药物和治疗方法;在制造业中,机器学习和自动化技术的应用使生产过程更加高效和智能化……无论是AI大模型的虚拟世界,还是我们所在的现实。有算力支持的世界正被革新。

释放算力的冷却技术与制约算力的高热能耗,互相角力、相互促进,在持续百年的较量中,谱写数据中心的“冰与火之歌”。视频中,我们看到从风冷到液冷,再到未来的浸没式液冷、纳米流体冷却、真空冷却等技术,每一次技术的飞跃,都是对计算设施能耗的释放,对效率的一次提升,让算力可持续。

联想集团将继续引领液冷技术不断向前,持续推动数据中心架构的革新,使AI向实,促进算力在各行各业的持续发展,助力我们加速进入人本的智能新时代。

极果网
每天一款超乎想象的好东西,还有一个Q弹爽滑的极果君,有撩必应。
 最新文章