实测H100满载下的功率

科技   2025-01-02 11:41   北京  
给大家实测看一下H100在GPU满载情况下的功率,绝对的真实。
结果让你很惊喜~
当时机房温度约23-25℃(机房冷通道方向,即服务器的进风口)

图一:GPU利用率跑到99%

图二:GPU满载情况下单卡功率
683-696W左右,基本快接近700W

图三:满载情况下整机的功率
满载时服务器总功率8448W,约8.45kW
一般没有跑业务的时候,功率维持在2200W-2300W左右。

官网发布的H100单卡功率约700W左右,则8卡的GPU功率5.6kW,与实际测试的相当。
但是官网发布的H100总功耗可到10.2kW(详见下图),与我们实测的8.45kW还是相差比较大。我理解这是不是GPU服务器的巅峰值?也可以理解在机房环境恶劣、机房温度较高情况下的最大值,因为机房温度过高的时候,为了加快服务器降温风扇功率会加大。
您觉得呢?欢迎评论区留言~
PS:如果H100真实的最大功率在8.45kW,是不是可以给机房节省一大笔的电费了呢?算不算惊喜?

如果对算力不是很熟悉的话,建议可先看看以下的文章,先对算力及相关的技术有个基本的了解,欢迎关注、点赞和收藏。

一文彻底读懂:什么是GPU及其微架构(干货)

一文搞懂:什么是RoCE网络(干货)

一文彻底搞懂:什么是InfiniBand(IB)网络【干货】

一文彻底搞懂:什么是RDMA技术及其三个协议

一文读懂:NVlink和NVSwitch技术及发展

一文读懂:GPU的通信带宽-运力

一文让你彻底了解算力到底是如何计算出来的-算力的计算方法(CPU和GPU)

一文读懂什么是智算和算力,让你看懂算力的规模!

AI DC的到来,你还不知道什么是数据中心?30页PPT让你快速了解数据中心


CDCC
数据中心标准、技术沟通交流平台
 最新文章