Hot Chips 2024 | 数据中心固态冷却技术应对爆炸性增长的热管理创新

文摘   科技   2024-11-01 08:00   四川  

引言

高性能计算,尤其是人工智能和机器学习领域的飞速发展,导致数据中心的功率密度和热量产生显著增加。本文探讨现代数据中心面临的热管理难题,并介绍创新解决方案:固态冷却技术[1]。


热管理难题

数据中心正经历指数级增长,预计全球市场规模将从2024年的3018亿美元增长到2030年的6224亿美元,年复合增长率为10%。这种增长由带宽、计算密度和数据管理能力的不断提高所驱动。然而,这些进步也带来了新的挑战,特别是在热管理方面。

图1展示2024年到2030年数据中心市场规模的预计增长,突显了该行业的爆炸性增长。


随着计算能力的提升,处理器产生的热量也随之增加。当前一代机架通常消耗约40千瓦,而下一代系统预计每个机架将需要高达120千瓦。这种三倍的功耗增加带来了重大的冷却挑战,因为即使是目前最好的解决方案,考虑到冷却限制,也只能管理约66千瓦每机架。


有效的热管理对数据中心至关重要。热管理约占数据中心功耗的40%,是这些设施总拥有成本(TCO)的关键因素。

图2说明了数据中心功耗的细分,强调了热管理所占的显著部分。


传统冷却解决方案的局限性

传统冷却方法难以跟上现代数据中心不断增加的热流密度。被动冷却技术,如散热器和热管,本质上受到环境温度的限制,对高性能计算需求往往不足。主动冷却解决方案,如蒸汽压缩系统,虽然有效但通常缺乏设备级所需的精确度,并可能消耗过多电力。


图3描述了传统冷却解决方案,包括被动和主动方法,强调了这些方法在解决现代数据中心冷却需求方面的局限性。


随着热设计功耗(TDP)值的增加,业界逐渐转向液体冷却。然而,这种转变也带来了自身的一系列挑战,包括基础设施改造和潜在的可靠性问题。


图4展示了XPU功率与冷却方法之间的关系,指出了高TDP值向液体冷却转变的趋势。


固态冷却技术简介

固态冷却技术作为一种有前景的解决方案,可以应对数据中心面临的热管理挑战。这种创新技术弥合了被动和主动冷却方法之间的差距,为热管理提供了动态方法。


固态冷却的主要优势包括:

  1. 动态响应:系统可以根据实时热需求,在被动和主动冷却模式之间无缝切换。

  2. 性能提升:通过防止热降频,固态冷却允许处理器长时间保持峰值性能。

  3. 能源效率:能够在可能的情况下以被动模式运行,仅在必要时启动主动冷却,从而实现整体节能。

  4. 灵活性:固态冷却解决方案可以集成到现有的数据中心基础设施中,减少资本支出和部署时间。

图5展示了固态动态冷却的概念,说明了如何在被动和主动模式下运行以满足不同的散热需求。


实际应用:Hex 2.0 CPU冷却器

为了说明固态冷却的实际应用,让我们来看看Phononic公司开发的Hex 2.0 CPU冷却器。这种创新的冷却器在紧凑的92毫米外形中结合了被动和主动冷却技术。


图6展示了Hex 2.0 CPU冷却器,展示了其紧凑设计以及被动和主动冷却元件的集成。


Hex 2.0有两种运行模式:

  1. 被动模式:在正常条件下,冷却器作为传统散热器运行,通过主散热器有效散热。

  2. 导热模式:当CPU处于压力下并产生更多热量时,热电元件激活,通过辅助散热器提供额外的冷却能力。


这种动态方法使Hex 2.0的性能超过了许多传统冷却解决方案,包括一些外形更大的液体冷却系统。


图7展示了Hex 2.0与其他冷却解决方案的性能对比,展示了其优越的冷却效率。


数据中心基础设施的广泛应用

固态冷却的原理可以应用于单个CPU冷却器之外的领域。这项技术有潜力彻底改变数据中心各种组件的冷却方式,包括:

  • 机架顶部交换机

  • 计算核心

  • 后门冷却系统


通过在整个数据中心实施固态冷却解决方案,运营商可以:

  • 稳定光学网络的频率

  • 消除CPU/GPU的降频

  • 提高现有基础设施的潜力

  • 延长组件的使用寿命

  • 平滑热点

  • 提高机架和数据中心层面的功率密度


图8展示了如何在数据中心基础设施的各个元素中部署固态冷却解决方案。


结论

随着数据中心不断发展以满足高性能计算和人工智能应用的需求,热管理仍然是一个关键挑战。固态冷却提供了一种有前景的解决方案,具备应对现代数据中心复杂热景观所需的灵活性和效率。


通过在动态、响应式系统中结合被动和主动冷却的优势,固态冷却技术使数据中心能够:

  • 最大化计算性能

  • 提高能源效率

  • 延长现有基础设施的寿命

  • 为未来功率密度的增加做好准备


随着行业的发展,采用固态冷却等创新冷却解决方案将对释放下一代计算技术的全部潜力起重要作用,同时保持可持续和高效的数据中心运营。


参考文献

[1] J. Edwards, "Datacenters: Explosive Growth Meets Thermal Consequences Power & Potential of Solid State Cooling," Phononic, Aug. 25, 2024.

END


软件申请
我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。

点击左下角"阅读原文"马上申请


欢迎转载


转载请注明出处,请勿修改内容和删除作者信息!




关注我们



                      




关于我们:

深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。


http://www.latitudeda.com/

(点击上方名片关注我们,发现更多精彩内容)



逍遥设计自动化
分享特色工艺半导体(PIC/Power/MEMS)设计自动化解决方案及行业技术资讯,与广大业界朋友、专家共同交流!
 最新文章