独家整理:GPU概念相关的10个常见问题

乐活   2024-08-27 08:35   北京  

一、GPU典型问题梳理-For新手

随着AI人工智能的火热,GPU卡和GPU服务器市场的需求也持续攀升,服务器相关领域的朋友对GPU相关问题的讨论也越来越多。我整理了常见的10个问题给大家做个专题分享。

如果你对如上问题都很清楚,下文可以不用看了!!

二、CPU和GPU芯片的对比

在计算机系统当中,GPU(图形处理单元)和CPU(中央处理单元)是两个至关重要的概念。它们分别承担着不同的任务,拥有不同的体系结构和设计理念。

  • CPU:中央处理单元,是计算机的大脑,必不可少,所有的工作都需要CPU来指挥或指挥&处理才能完成。

  • GPU:图像处理器,是协助CPU处理特定工作的,也加协处理器或者加速计算单元,在服务器、PC、工作站、游戏主机、手机、平板等往往都需要GPU。

CPU和GPU在架构组成上的差异:

两者虽然都是运算的处理器,在架构组成上都包括3个部分:运算单元ALU、控制单元Control和缓存单元Cache。但三者比例却相差很大。

  • 在CPU中缓存单元约占50%,控制单元25%,运算单元25%;

  • 在GPU中缓存单元约占5%,控制单元5%,运算单元90%。

三、GPU和显卡的区别

日常的材料和交流中往往大家GPU和显卡画了等号,不能说有错,但严格意义上讲还是有区别的。打个比方, GPU和显卡就像是CPU和主板的关系,GPU是显卡的心脏,CPU是主板的心脏。显卡除了包括GPU,还有一些显存、供电、稳压模块、总线、风扇、外围设备接口等。

四、GPU和GPGPU的区别

随着人工智能技术快速发展,除了图形相关算力需求外,对CPU通用计算能力的要求也越来越高。这时,GPGPU应用而生。全称是General Purpose GPU,即通用计算图形处理器。第一个“GP”就是通用的意思,可将GPGPU理解为一个更专的GPU(能力更聚集),主要进行非图形相关程序的运算。

GPGPU架构设计时,去掉了图形处理的单元,保留了GPU的SIMT架构和通用计算单元。使之更适合高性能并行计算,并能使用更高级别的编程语言,在性能、易用性和通用性上更加强大。目前市场主流的A800、H800、昇腾910B、海光DUC等都属于GPGPU的范畴。

五、GPU分类:消费卡、专业卡和数据中心卡

NVIDIA的显卡目前可以按照应用领域大致分为三种类型:

  • GeForce消费卡:面向游戏娱乐领域:如GeForce RTX™ 4090、GeForce RTX™ 3090等。

  • Quadro专业卡:面向专业设计和虚拟化领域:如NVIDIA RTX™ A6000、NVIDIA® T1000等。

  • Tesla数据中心卡:面向深度学习、人工智能和高性能计算领域:如NVIDIA H800\A800 Tensor Core GPU等。

市场定位不同,服务器大厂是不公开卖消费卡的。

三个分类在英伟达官网的截图实例如下:

六、涡轮卡和风扇卡的区别

做服务器的朋友都知道,目前GPU服务器通常要求显卡是涡轮的,到底和风扇的有啥区别呢?英伟达20系列显卡之前,公版显卡一直是采用涡轮散热器的,不管是AMD还是英伟达,公版显卡全部都是采用涡轮散热器,20系列以后显卡,风扇版显卡开始推广开来。

1、涡轮版显卡又称涡轮散热器显卡。

特点是:涡轮散热器从涡轮开孔处吸入冷空气,然后将冷空气向四周360度抛散,进而穿过散热鳍片,带走热量。所以涡轮散热器排出废热气流的地方是显卡尾部或显卡头部。

2、涡轮版显卡又称涡轮散热器显卡。

特点是:涡轮散热器从涡轮开孔处吸入冷空气,然后将冷空气向四周360度抛散,进而穿过散热鳍片,带走热量。所以涡轮散热器排出废热气流的地方是显卡尾部或显卡头部。

七、显卡的公版和非公版

公版显卡就是英伟达(NVIDIA)与AMD官方售卖的显卡,非公版就是各大厂品牌商购买GPU芯片后自己组装的显卡,个人消费市场一般比较多的就是非公版显卡。

公版显卡特点:

没有花里胡哨的设计,而且公版显卡不是每个芯片都会推出,有些显卡芯片只有公版参数,但没有推出公版显卡。

非公版显卡特点:

非公版显卡由其他显卡生产商基于官方芯片生产,比如华硕、七彩虹、微星、影驰等品牌显卡,

非公版显卡除了外观更为吸引眼球,主要差异还在于频率和一些散热设计。有一些非公版显卡,它们的频率超越了公版标准。这类显卡在同等级别的产品中,用料和设计都更高端,特别是在散热方面,厂商往往下足了功夫,大概分为顶级非公、普通非公、改版非公。

八、PCIE和SXM接口的卡

随着NVLink整机的火爆,英伟达的SXM(Scalable eXtensible Module)接口卡也被大家熟知,到底和标准的PCIe 接口卡有何区别,主要在设计理念、应用场景以及性能特点上的总结如下:

对比项

SXM卡

PCIE卡

接口类型

SXM是NVIDIA的高端GPU的专用接口。

计算机系统的通用接口,通用性强,更灵活。

互联速率

使用NVLink技术实现GPU之间的高速连接,支持多GPU直接互联,

受限于PCIe的版本和协议速率,远低于SXM  NVLink的互联速率。

供电与冷却

SXM接口支持供电,无需外部电源线,可采用更高效的冷却选项,支持TDP更高

受限于PCIe槽位供电和服务器主板的供电,TDP要低于SXM卡

维护性

英伟达一体化设计,八卡一体,往往故障维护不灵活

出现问题时,维护门槛低


九、英伟达HGX和DGX等

十、 Nvlink 和Nv Switch

1、Nvlink是一种互联技术,也指通信的链路。

2、Nv Switch是基于Nvlink技术的芯片或者设备。

3、在服务器内部NvSwitch就是芯片,跨服务器互联就是搭载芯片的Nv switch设备。

十一、以A800、H800阉割前后参数对比

为了合规,A800相对比较厚道,仅限制了GPU之间的互联带宽,从A100的600GB/s降至400GB/s,算力参数无变化。H800则对算力和带宽都进行大幅调整,尤其是HPC领域相关的双精度算力(FP64)几乎归零。

* 系数矩阵 

** SXM4 GPUs via HGX A800 server boards, PCIe GPUs via NVLink Bridge for up to 2-GPUs

----老张会持续通过公众号分享前沿IT技术,大家多多点赞和关注!



芯时代青年
专心数字前端全流程,芯时代有为青年的自我修养
 最新文章