【八测】火神降临,谁与争锋!七彩虹 iGame Geforce RTX 5090 D Vulcan OC 32GB评测

科技   科技   2025-01-24 22:06   山东  

前言

    2025年1月23日,万众瞩目的公版RTX 5090已经正式解禁,而今天是所有非公显卡解禁的日子。事不宜迟,让我们一起来看看七彩虹的旗舰代表——火神吧。

——七彩虹 iGame Geforce RTX 5090 D Vulcan OC 32GB



NVIDIA Blackwell 新功能解析

    *如果已经看过类似介绍,可以直接下拉跳转

    众所周知,如今的计算机发展面临着工艺制程进步缓慢的问题。在无法改变制程工艺的情况下,改进架构成了提升性能的唯一方法。近年来,AI性能的大爆发成为了各大硬件厂商垂涎的要点。而NVIDIA Blackwell就是在这样一个时代里诞生的架构。

GB202 核心一览:

    Blackwell的完整体是GB202,相比于原来的AD102,更多的改进在于单个GPC与SM单元。核心内的L2缓存翻倍增加至128MB。同时新的GPC单元内引入了更多的SM单元,以及改进的RT和Tensor Core,进一步强化显卡在AI计算上的性能。

    GB202共计有12个GPC(Graphics Processing Cluster,图像计算集群)。每个GPC中包含8个TPC(Texture Processing Cluster,像素计算集群),16个SM,16个ROPs。整个GB202拥有512Bit的显存控制器。在每个SM中,包含了128个CUDA,2个FP64浮点计算单元,1个第4代RT光追单元,4个第5代Tensor张量计算单元,4个TMUs。因此整体规格如下:

  • 24576个CUDAs(上一代为18432,↑33.3%

  • 192ROPs(上一代为192,持平

  • 768TMUs(上一代为576,↑33.3%

  • 192RTCores(上一代为144,↑33.3%

  • 768TensorCores(上一代为576,↑33.3%

    如果我们把两者最大的核心放在一起对比,可以发现同样都是TSMC 4N工艺,AD102的核心晶体管数量为763亿,核心面积608.5mm²。而GB202为922亿与750mm²。由于晶圆变大造成的边际效应,GB202在每平方毫米晶体管数量略逊于AD102,而如果套用两者旗舰显卡的功耗,那么GB202的每平方毫米瓦数也将略高于AD102。

    GPC内的SM单元变化主要集中在CUDA的功能上。AD102 Ada架构的CUDA分为分为两种,一种是可以计算FP32/INT32的CUDA单元,另一种是只能进行FP32计算的单元。而在GB202 Blackwell架构上,所有的CUDA核心都支持FP32/INT32计算。如今高性能的模型都会采用量化的方式进行性能优化,也即模型内的计算都采用整数存储运算。Blackwell SM在面对量化模型上将会比Ada SM有更好的表现。

    因此从账面的数据来看,Blackwell构架更像是一个加大版Ada,传统性能提升可能并不会如RTX 3090到RTX 4090那样显著,更多的性能提升将会是RT与Tensor单元。

第五代Tensor Core

    第五代Tensor Core支持FP4计算。相较于第四代Tensor Core 的FP8而言,计算性能直接翻倍的同时,更低的计算精度意味着原来更大的模型可以在更小的显存中运行。目前NVIDIA也提供了相应的量化工具,实现模型的快速转化。


DLSS 4

    进入RTX时代以来,DLSS随之诞生。作为一种抗锯齿优化的技术,DLSS不仅不会降低性能,反而还会提升性能。这里面重要的操作就是引入AI的方式对画面进行优化。但话虽如此,早期的DLSS画质效果并不理想,因此大家对于DLSS的态度一直是画质与性能不可兼得。但是在DLSS 4时代,这也许会引来改变。

    新加入的DLSS 4是50系最重要的性能提升点。在MFG多帧生成技术和DLAA Transformer 模型的加持下,DLSS 4可以带来画质与帧数兼备的游戏体验。

    Multi Frame Generation(MFG,多帧生成技术)

    在40系时代,帧生成技术已经得以推广。简单来说,是通过AI模型实现1帧渲染1帧AI的方式获得成倍的帧数提升。在50系时代,得益于Tensor Core性能的进一步提升,NVIDIA推出了多帧生成技术,简而言之原来1帧渲染1帧AI的方式可以升级为1帧渲染2帧AI,甚至1帧渲染3帧AI。

    Transformer Model

    DLSS在抗锯齿上的优化一直以来AI模型。而当前主流的AI模型分类包含CNN与Transformer。了解深度学习的同学对CNN与Transformer这两个词应该非常熟悉。Transformer由于其更深更广的模型数据深度设计,在模型预测的能力上更强。因此它也是当今主流的AI模型。

    NVIDIA把Transformer融入到当前的超分辨率(Super Resolution)、追重建(Ray Reconstruction与深度学习超采样中(DLAA)中,以实现更优质的画质。

    对于主流玩家比较有用的功能基本如此了。还有部分核心技术与创作者功能这里仅列举名词和作用,有兴趣的同学可以等待白皮书发布并翻阅。

Mega Geometry:优化全局光追路径的一种技术
Linear Swept Spheres:针对毛发等条状物优化的一种技术
Neural Shaders:一种利用神经网络构建的渲染器

Blackwell Max-Q Power Efficiency Improvements:NVIDIA Blackwell构架显卡采用的更高效版能耗管理技术,旨在实现多区域能耗管控、高效频率管控与低延迟快速休眠。



显卡外观一览

    终于到了显卡环节了。我们马上拆开包装吧!

    首先我们来看一下火神的所有配件。今年的火神依旧延续着其独到的LCD屏幕屏幕设计。说明书,供电线这些就不多说了LCD屏幕与配套的LCD屏幕底座以及更像是为了防尘的LED灯带。当然千斤顶是必不可少的环节。

   全新火神延续系列经典三角设计元素,斜线设计让显卡结构更为分明,激进的三角及切割线条为显卡注入凌厉而前卫的气质,极具动感及力量感。更为锐利的金属外骨骼进一步展现了VULCAN的“暴力美学”,同时全身各处配备“光刃RGB”灯效。

    总结来说,今年的火神更加的方正饱满,轮廓感与冲击力更强,和过去自己相比,火神变得“成熟”了。

    整张显卡做出了大量的镂空设计,为了满足RTX 5090 D接近600W的散热需求。镂空的区域也并不单调,看似横七竖八的设计线条都在起着支撑作用。

    今年的RTX 5090应该不需要讨论钽电容的话题了。干干净净清一色的MLCC电容,为了高频设计。

    PCI-E挡板采用双槽设计,散热器达到3.5槽。显示接口相较于上一代多了一个HDMI,达到了3DP+2HDMI的规格。喜欢接机箱观察屏的孩子们终于不用去挤核显的接口了。同时DP接口也终于升级到了DP2.1b,这也意味着终于可以用上满血4K 240Hz UHBR20的显示器。

    作为七彩虹特色的一键超频按钮必然有保留。当按下时,会发出蓝色光圈,便于用户分辨是否开启超频。

    供电接口并没有网传刚开始一样可能有两个16Pin,仍旧为单个16Pin接口。作为一张TDP达到575W的显卡,单口16Pin已经接近用满了。而火神的超频BIOS把剩下的25W也压榨完。考验16Pin接口的时代来临了。

    火神特色的LCD屏幕肯定随迟但到。相较于上一代,小屏幕增加了90度翻转的设计,保留可以转移到桌面的底座。不过屏幕的分辨率仍旧为800x216,所有的设置都可以在iGame Center里调。除了常用的一些监控以外,还可以加入一些定制图片。

    外观我们就一览完了,接下来拆开这个猛兽吧!


显卡拆解一览

    一直以来我都比较忌惮拆旗舰显卡,因为旗舰显卡的设计往往都很复杂,当然还有一个原因是怕拆坏赔不起……

    不过得益于火神的全铝骨架设计,他就像中间纽带一样把PCB、散热和背板连接在一起起到固定作用。只要拆下背板的15颗螺丝之后,PCB和散热就能完整分离。全程骨架起到了极强的支撑作用,避免PCB受力压弯。这也是扩展槽可以缩到两槽的原因。

    光刃RGB灯带就藏匿在火神的全铝骨架中,灯光效果都可以用软件进行同步。全铝骨架本身还会和散热一起参与到核心的散热工作中。

    硕大的散热一览,为了压制600W功耗,火神祭出了7根8mm+2根6mm,共计9根热管。想当年4热管压450W的时代,9热管显得壕无人性了。

    与核心接触的镜面还采用了真空冰片技术。原理与热管散热类似,相当于在核心的位置再做一个平面热管增强散热。这也是核心位置为什么没有大面积的穿Fin原因。

    除了散热片的改进以外,风扇也进行了革代。3颗107mm的二代“风镰”风扇通过金属框架固定在全铝骨架中。对比第一代“风镰”,聚风能力更强,风量更大。风扇型号为Champion CF1015U12D,规格12V 0.55A。

    火神的PCB在散热面前就显得短小精悍多了。毕竟PCB越小当量就越大。为了方便辨识一些关键芯片,这里先做框选。整个显卡采用18+7+6组供电设计,外围的18+7颗供电覆盖核心的核心段与外围电路,剩下的6颗供电随显存分布嵌套在核心周围,为16颗显存提供供电。

    红框:供电电路

    黄框:显存电路

    大家也知道RTX 5090和RTX 5090 D的核心是一样的所以我就不多区分了,型号为GB202-250-A1。这不是一颗完整的GB202核心,实际启用的CUDA数量只有21760个,而完整的GB202核心有24576个CUDA。核心仍旧采用TSMC 4N工艺,面积750mm²,晶体管数量922亿。工艺对比RTX 4090并没提升,反倒是因为核心面积更大导致的边际效应,实际晶体管密度稍有下降。

    显存方面采用16颗三星GDDR7显存颗粒,单颗显存2GB,等效频率28Gbps。在512Bit的位宽下为RTX 5090 D带来了接近1.7TB/s的读写速度,已经与HBM2的速度差不多。在测试的时候,因为GPUZ还不能有效识别参数,所以不得而知具体功耗。不过参考RTX 4090时代,没有个百来瓦基本说不过去的。

    控制器是同为芯源系统的MP29816-A。并没有查到任何数据,但是结合整个PCB都没有另一颗控制器来看,它很有可能是一颗支持3路的控制器。所有的供电组都采用了芯源系统的MP87993,这颗新一体MOS网传供电能力为90A级。检测芯片是熟悉的UPI uS5650S,自30系就经常见面的老伙计。



性能测试

测试平台:
CPU:AMD Ryzen 9 9800X3D

主板:华硕 ROG CROSSHAIR X870E HERO

内存:金百达 黑刃 32GB×2 DDR5 6000 C28

主硬盘:达墨 水瓶座 2T

散热:鑫谷 昆仑 MU-360 ARGB

电源:鑫谷 昆仑 KE-1300P 冰山版

环境温度:19℃

系统版本:Windows 11 24H2

驱动:571.86

    主板为华硕 ROG CROSSHAIR X870E HERO。

    散热器为鑫谷 昆仑 MU-360 ARGB,支持最高320W散热能力,水冷头搭载320*240 LCD屏

    电源为鑫谷 昆仑 KE-1300P 冰山版数字电源,可实现电路电压高精准度控制

    测试项目包含游戏基准、创作、专业、AI和游戏实测5个大类,其中游戏实测将着重对比原生、DLSS 3与DLSS 4的帧数与1%Low帧性能。

    对比对象为七彩虹 Geforce RTX 4090 战斧。所有测试均以RTX 4090为基准,未特殊说明则均为帧数或分数,数值均越高越好。

    为了便于文字阅读,绿色代表超过/更好,红色代表不如

    首先来看一下GPU-Z参数。目前2.61版本暂时不能完全识别显卡型号,还有诸如热点温度直接显示255℃的bug。预计过段时间软件更新就会修复了。

游戏基准测试:

    先来看看进口娱乐大师3DMARK基准测试。RTX 5090 D在大部分的测试项目中相较于RTX 4090提升了40-50%。这个数据对比之前爆料的30%来看还稍微高了点。不过很神奇的是微软DXR光追测试有明显的落后,这应该是DXR未优化导致的,毕竟更新了新一版的RT单元,而且Port Royal的分数也没有问题。

    3DMARK DLSS性能对比。DLSS 4的加持下,RTX 5090 D对比RTX RTX 4090最高能实现接近1.5倍的性能提升4K画质下对比原生画质帧数提高了4.33倍。当然RTX 4090用上DLSS 4也能额外获得30-40帧的帧数提升。

    VRMARK对比,Orange Room已经没有测量的意义了。所以主要看Blue Room,性能提升为29.9%,是完全的光栅性能提升。

    我们再看看一些常见的基准测试跑分,Unreal Engine 2代表的Superpostion Benchmark、DX11 Valley&Heaven Bench和支持DLSS3的UE5 EZBench,从1080P,2K到4K进行性能测试。

    可以看到随着分辨率提高,RTX 5090 D在各项测试的性能提升变得越来越明显,1080P最高34.9%的提升来自Superpostion Benchmark的测试,2K最高42.6%的提升来自Heaven Bench。4K最高77.1%的提升来自Valley Bench。非常有趣的是,这仨测试都是DX11时代的测试软件。而代表当今时代的EZBench性能提升都在30%左右。

创作测试:

    这里直接选择VRay 5+Blender 4.2两大经典的渲染器进行测试,传统渲染其实也并不吃AI,所以性能提升也是在20-40%。

专业测试:

    专业测试采用SPEC Viewperf 2020进行测试。总体而言,因为这些计算都是实打实的传统GPGPU计算,所以RTX 5090 D的提升也是在30%上下。

AI测试:

    因为RTX 5090 D阉割了AI性能,所以基本没法和RTX 4090对比。不过这里的具体阉割是训练性能,针对应用的推理性能并没有进行限制。这里直接使用MLPerf进行图像创作,文字创作与总结应用的推理测试,对RTX 4090总体提升37%左右。50系虽然支持FP4的原生计算,但也只有用到FP4模型才会有成倍的性能提升。

上RTX 5090 D,下RTX 4090

游戏实测:

    接下来就是游戏实测了,同样包含了1080P,2K和4K的测试。在大部分不开启DLSS的游戏测试中,RTX 5090 D的1080P的平均性能提升为27.7%,2K提升至34.5%,4K达到45%。

   而在DLSS游戏下,1080P平均达到41.9%,2K为56.2%,4K 59.8%。这里面提升最大的当属支持DLSS 4的游戏,如2077。

    如果光从数据来看,在DLSS MFG 4x的设置下,分辨率越高,多帧生成的效果就会越强,对比原生能跑出远超4倍的性能。如果我们以2077和3DMARK DLSS横向拉一次表格,就能更明显看出原生,DLSS3和DLSS4 2,3,4倍率下的帧数差距。在3DMARK基准测试下,随着倍率和分辨率的提升,MFG的帧提升就越明显,尤其是在4K下已经有接近6倍的性能,8K下直接干到20倍!而在2077的测试下,也基本符合这个定律,4K全高画质下接近7倍的性能。单论帧数而言,4K全高游戏已经完全征服。


DLSS 4画质对比

    帧数提升了,还有一个重要的点就是画质,这也是过去DLSS一直被诟病的问题,虽然帧数高了,但是画质变差了。而新的DLSS 4采用了DLAA Transformer Model进行超采样优化。熟悉深度学习的同学对传统CNN模型与Transformer模型应该有所了解,我们直接从对比图来感受差距。

    首先是DLAA下的Transformer与CNN的对比。可以明显看到改进后的DLAA在Transformer模型的优化下远景网面能够显示出来,而传统的CNN模型会直接镂空掉。同时上面拥有光照的走廊有更明显的光影投射。在CNN下这些光照会被直接黑掉。

    如果我们直接拿霓虹灯管来进行对比会更明显,Transformer下的灯光会有明显的明暗区分,而CNN下的明暗区分并不明显。可以说在Transformer Model的帮助下DLSS 4真正做到了帧数与画质的兼备。


功耗与温度

    游戏的测试就此结束了,让我们最后来看看功耗和温度的表现吧。火神作为旗舰显卡,烤鸡温度根本不需要担心,使用OCCT 13.1版本进行GPU烤鸡,显卡顶着600W满功耗进行测试。9分钟后,温度曲线不再上升,此时的核心温度为66.4度,显存温度72度。此时风扇转速为2000转,基本听不到声音。此时记录平均核心频率为2340MHz。

    用3DMark Speed Way进行烤鸡测试,此时的显卡功耗在573W~,频率提升到了~2742MHz。最终得分99%。表现没有问题。

    不过需要注意的是,由于顶格600W的设计,此时16Pin线的压力非常大。我们已知16Pin线分别有6根正与负线,每根负载100W也既8.3A,而标准的14AWG正常电流正好为8.2A。我们对6根输入正极分别进行了电流测试,发现最低的电流只有7.8A,最高电流达到10.6A,其他都在9.3A左右。

    我们再用热成像仪对16Pin接口进行测温。可以发现在持续600W的烤鸡下供电温度最高达到了56.6度。这个温度其实也是比较热的。当然考虑到这是600W的顶格烤鸡,未免有点苛刻。

    最后提醒一下,这里用的电源还是自带数字控制的电源,如果传统模拟电源出现电压偏移下降,电流将会更大。因此如果想要使用RTX 5090 D,一定要购买ATX3.1的电源,同时一定要注意不要弯折16Pin线。这个问题也许会成为一个新的研究方向。


总结

    总结时刻,首先论RTX 5090而言,这张显卡再一次所向披靡斩下所有的对手,宣誓了NVIDIA在游戏显卡的绝对统治地位。对于中国玩家来说,多的这个字母D对于研究人员有阻碍,但是对于大部分玩家来说是没有区别的。NVIDIA研究了那么多年的AI技术终于以正反馈的形式回归市场。也算是回应了那么句我们还在意着游戏玩家。只不过确实,没有对手的情况下,1.65W的价格对于想要咬咬牙上旗舰的玩家来说更困难了。

    而说回火神这张显卡,毫无疑问,这张显卡依旧巩固着七彩虹旗舰显卡的制作水平。对于想要一步到位体验旗舰性能的玩家,火神已经把能考虑的问题全部帮你考虑在内,BIOS也好,设计也好,性能也好。好了,我想说的已经说完了,大年初二的那一天RTX 5090 D将正式发售,想要显卡的祝你一定能抢到。我们下期再见!




欢迎加入

买电脑讨论群:386615430

电脑吧评测室二手群:829132489

关注B站@电脑吧评测室


电脑吧评测室
欢迎关注电脑吧评测室,我们是电脑DIY硬件产品爱好者。买电脑、DIY硬件配置推荐、硬件咨询、新产品评测、什么产品值得买,都可以关注我们。
 最新文章