随着人工智能计算芯片的热设计功耗(TDP)不断提高,数据中心的散热需求日益增长。以NVIDIA的产品路线图为例,从A100的400-500W,到H100的700W,再到未来B200/GB200系列的1000W以上。与之对应,单个机架的功耗也从25-40kW升至60-140kW。在如此高的功耗密度下,单靠空气冷却已经难以为继。
液体导热效率是空气的30倍,因此液冷成为业界的共识,并在NVIDIA等厂商的推动下加速落地。以NVIDIA的GB200平台为例,低端的NVL36仍可采用液冷和风冷的混合方案,但高端的NVL72由于单机架功耗高达132-160kW,就必须使用纯液冷的液液散热方案了。
点击预约
11月7日下午15:00,来自华为数字能源、润泽科技、申菱、佳力图等知名企业的技术专家将齐聚IDC圈直播间,共同探讨“液冷是否是智算中心的必选项”这一话题。
市场研究机构Nomura预测,NVIDIA的AI服务器中液冷渗透率将从2024年的8%快速提升到2025年的43%和2026年的47%。这将带动全球AI服务器液冷市场规模从2023-2024年的17亿-121亿新台币,暴增至2025-2026年的1229亿-1292亿新台币。其中,冷板作为最大的细分品类,将占到液冷总市场的40-55%。
作为全球最大的数据中心市场,中国对液冷的需求同样强劲。根据中国信通院数据,2021年中国智算中心市场规模已达1500亿元人民币,预计2025年将突破4000亿元。阿里云、华为云、腾讯云等头部企业纷纷宣布在算力和AI领域投入上千亿元,这将进一步带动液冷等散热技术的国产化进程。
不过,液冷目前仍面临一些挑战,比如前期投入成本高、需要对既有基础设施进行改造、存在漏液风险等。因此业界也在积极创新,研发空液混合散热、双相变液冷等过渡性方案,以便在提升散热性能的同时降低实施门槛。例如Wiwynn投资的创业公司ZutaCore就推出了一种双相变液冷系统HyperCool,号称可在无需改造现有数据中心的情况下将PUE降至1.04。
在这样的背景下,液冷是否是智算中心必选项依然存在一定争议。部分企业认为,虽然液冷在高功耗密度下能显著提升散热效率,但前期高昂的投入成本、对现有基础设施的改造需求以及潜在的漏液风险,使得液冷技术的普及面临不小的挑战。另一方面,随着技术的不断创新,如空液混合散热和双相变液冷等方案的出现,部分业内人士则认为液冷可能会成为一种逐步过渡的解决方案,而非每个数据中心的“必选项”。
| 文章来源:中国IDC圈