Tesla架构(2008年):Tesla架构是NVIDIA第一个实现统一着色器模型的微架构,经典型号是G80,支持C语言编程,引入了单指令多线程(SIMT)执行模型。
Fermi架构(2010年):Fermi架构是NVIDIA GPU架构自初代G80以来最重大的飞跃,首款支持与共享存储结合纯cache层次的GPU架构,支持ECC的GPU架构。
Kepler架构(2012年):Kepler架构相较于Fermi更快,效率更高,性能更好,是第一款支持CUDA的GPU架构。
Maxwell架构(2014年):Maxwell架构引入了立体像素全局光照(VXGI)技术,首次让游戏GPU能够提供实时的动态全局光照效果。
Pascal架构(2016年):Pascal架构将处理器和数据集成在同一个程序包内,以实现更高的计算效率,1080系列、1060系列基于Pascal架构。
Volta架构(2017年):Volta架构配备640个Tensor核心,每秒可提供超过100兆次浮点运算(TFLOPS)的深度学习效能,比前一代的Pascal架构快5倍以上。
Turing架构(2018年):Turing架构配备了名为RT Core的专用光线追踪处理器,能够以高达每秒10 Giga Rays的速度对光线和声音在3D环境中的传播进行加速计算。
Ampere架构(2020年):Ampere架构在计算能力、能效和深度学习性能方面都有重大提升,引入了第三代Tensor Core,提供更强大的深度学习计算性能。
Hopper架构(2022年):Hopper架构是NVIDIA在2022年3月推出的GPU架构,这一全新架构以美国计算机领域的先驱科学家Grace Hopper的名字命名,将取代两年前推出的NVIDIA Ampere架构。
NVIDIA H100
架构: Hopper
内存: 80GB HBM3
功耗: 400W - 500W(根据不同配置可能有所变化)
特点: H100是NVIDIA专为AI和高性能计算设计的GPU,拥有强大的Tensor核心,适用于大规模AI模型训练和推理。
NVIDIA A100
架构: Ampere
内存: 40GB或80GB HBM2
功耗: 400W
特点: A100是NVIDIA上一代的旗舰GPU,提供了强大的AI计算能力和科学计算性能,适用于多种数据中心应用。
NVIDIA L40S
架构: Ada Lovelace
内存: 48GB GDDR6
显存带宽: 64GB/s 双向显存带宽
特点: L40S是一款针对AI推理优化的GPU,提供了高性能的FP64和FP32计算能力,适合企业级推理应用。
NVIDIA Grace Hopper Superchip
架构: 基于Hopper和Grace的超级芯片
内存: 预计拥有超过100TB的内存访问能力
特点: 这是NVIDIA推出的首款100TB级别的GPU内存系统,专为处理最严苛的巨型AI工作负载设计,通过NVLink高速访问大容量内存。
NVIDIA Blackwell
架构: Blackwell
制程技术: 采用TSMC的3纳米工艺技术
特点: Blackwell是NVIDIA最新的GPU架构,预计将提供比Hopper架构更显著的性能提升,预计将在性能和效率方面带来进一步的提升。
点击阅读原文,查看英伟达的故事-中文版-2024