性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测

时隔两年又三个多月,英伟达终于带来了全新的GeForce RTX 50系显卡。然而受到相关规定(满足综合运算性能TPP不超过4800的限制)的影响,RTX 5090的命运和RTX 4090一样,化身RTX 5090 D进入国内市场。同时,RTX 5090 D是没有公版(Founder Edition)的,因此,高端玩家们就只能从一众非公显卡里面去挑选适合自己的那一款了。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图1

而说起耕升的踏雪系列,可能大家第一时间更多会想到纯白设计、中高端定位,很难会将过往最高只搭载过RTX 4070 TI SUPER芯片的它和旗舰显卡联想到一起。不过,当英伟达正式进入RTX 50系显卡时代之后,踏雪也迎来的蜕变,出现在了耕升的RTX 5090 D的产品名单里面。在了解耕升 GeForce RTX 5090 D 踏雪之前,我们先来简单回顾一下英伟达RTX 50系显卡到底有什么新的特点。

关于RTX 5090 D

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图3

相较于上一代RTX 4090 D来看,RTX 5090 D在芯片的规模上有了较大幅度的升级。虽然制程工艺不变,依然是定制的TSMC 4N,但是,凭借更大的芯片面积和新一代的Blackwell核心架构,后者的晶体管数量从763亿个增加至922亿个,CUDA核心数量增加将近50%,而且同样是12个GPC,RTX 5090 D每个GPC里的TPC和SM数量增多了,TPC从6个增至8个,SM从12个增至16个。编解码器同样进行了迭代加码,新增了4:2:2色度采样视频编解码的能力,节省CPU的负担,提升内容创作者的工作效率。此外,RTX 5090 D还用上了容量更大、性能更强的GDDR7显存,位宽也从384-bit增至512-bit。显示输出接口升级为3×DisplayPort 2.1b+1×HDMI 2.1b的配置,借助DSC技术最高支持4K@480Hz或8K@140Hz。

不过,这次的RTX 5090 D的命运并不像RTX 4090 D一样在核心规格作出调整。我们从表面参数上基本看不出与RTX 5090有什么区别,对游戏性能造成的影响肯定是远小于RTX 4090 D当初的。至于AI性能嘛,RTX 5090 D则从RTX 5090的3352 AI TOPS降至2375 AI TOPS,降幅约29%。

Blackwell架构有多牛

不断壮大的核心规模

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图5

其实,完全体的 Blackwell GB202共有12组GPC、24576个CUDA核心,RTX 5090 D上的GB202-250则用了其中的88.5%。从整体结构图上还能看到,GigaThread Engine调度器隔壁多了一个叫做AI-Management Processor(AI管理处理器,简称AMP)的帮手。AMP是一个位于管线前端的RISC-V处理器,支持Windows硬件加速GPU计划,能够更自由地管理GPU。CUDA、RT Core和Tensor Core三大部分在它的带领下可以协调工作,实现AI响应速度提高的同时,游戏画面也不会受到影响。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图7

GPC段中,它所包含的TPC从Ada Lovelace的6组扩展到了8组。不过布局上还是一样的,一个独立的光栅引擎,两个ROP分区(每个包含8个ROP单元),而每组TPC包含两组SM。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图9

SM段的变化是比较大的。现在所有的32个CUDA核心都能执行FP32/INT32运算了,因此INT32的算力可以说是增加了一倍。不过在一个时钟周期里面,核心只能二选一运算。NVIDIA表示,这种设计是为神经着色器优化的。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图11

Tensor Core和RT Core自然也有升级。第5代Tensor Core继承了上一代架构的特性,并新增了FP4、FP6的支持,还把FP8 Transformer Engine更新到了第二代。其中,FP4是个比较值得关注的点,它相比常规的FP16模型需要的显存更小,在TensorRT模型优化器的支持下能够做到几乎没有质量损失。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图13

现在,Blackwell上的SER(着色器重排序) 2.0还可以将神经网络的负载直接发送至Tensor Core处理,加速神经网络渲染,效率达到了Ada Lovelace上的2倍,降低开销之余还能提高精准度。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图15

同时运作的话,LLM的响应时间变慢,游戏帧率也会受影响

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图17

而第4代RT Core中,新增的组件包括有Triangle Cluster Intersection Engine、Triangle Cluster Compression Engine以及Linear Swept Spheres。同时,Blackwell提供了两倍于上一代Ada Lovelace的Ray-Triangle交叉检测吞吐量。它们的出现,与Mega Geometry技术息息相关,起到一个打基础的作用。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图19

Mega Geometry是在TLAS(顶层加速结构)和BLAS(底层加速结构)两个层级的架构上做改进。BLAS一侧的Cluster-level Acceleration Structures(CLAS,簇级加速结构)最多能把256个三角形簇打包好,并将其作为BVH的基础部分输入,最后组成BVH树。同时,CLAS不仅能在游戏里面按需创建,还能缓存到硬盘里面,后面的帧要用的话直接从硬盘加载。这样一来,系统要处理的事情就少很多了。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图21

TLAS还有个兄弟叫Partitioned Top-Level Acceleration Structure(PTLAS,分区顶层加速架构),是针对复杂场景设计的。NVIDIA表示,在很多游戏里面,场景内有不少物品比如建筑都是固定不变的,但是如果每一帧都要给它们构建一次TLAS,肯定就不划算。而正如名称中的Partitioned分区所示,PTLAS把场景内的物体分成了多个区域,一些用来放置静态的物品,然后一个全局分区用于处理动态的物品,同样可以做到减轻了系统的压力,提高运算效率。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图23

值得一提的是,所有RTX显卡都能支持Mega Geometry,但跟所有新技术一样,Blackwell是目前支持最好的。

上一页12 3 4 5 6 7 8 下一页 阅读全文

魔法一般的神经网络渲染

铺垫了这么多的硬件基础,英伟达实际上是为了更好地构筑神经网络渲染这项技术,应用范围包括RTX神经网络纹理压缩、RTX神经网络材质、神经网络辐射缓存(NRC)以及RTX神经网络皮肤/面部。

RTX神经纹理压缩:使用AI在不到一分钟的时间内压缩数千种纹理,在相同的视觉质量下可以节省高达7倍的显存占用。

RTX神经材质:使用AI压缩通常保留给离线材质的复杂着色器代码,并且这些材质由多层组成,处理速度可提升5倍。

RTX神经网络辐射缓存:使用在实时游戏数据上训练的神经网络,能更准确和高效地估计游戏场景中的间接光照,而大幅减少光线追踪的计算量。

RTX神经网络皮肤/面部:能够使光线完成射入皮肤内的反射和折射,并且基于AI模型生成更真实的面部和表情,改善人物的身整体呈现和解决恐怖谷效应的问题。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图25

RTX神经材质

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图27

RTX神经网络辐射缓存

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图29

RTX神经网络皮肤

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图31

RTX神经网络面部

DLSS 4:帧生成PLUS

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图33

新一代Blackwell架构GPU上引入了DLSS 4,提供了多帧生成功能,即在每个传统渲染的帧之间生成多达三个额外的帧。这不仅基于Blackwell的帧生成模型比上一代快了40%、显存占用降低30%的强大优势,而且用于提供光流场信息的不再是RTX 40系列上的光流加速器,而是一个更高效的AI模型。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图35

为了避免输出帧画面过多导致的顺序乱套,英伟达还引入了Flip Metering功能,能够将帧平滑逻辑从CPU转移到GPU的显示引擎上,让GPU更精确地掌控显示每一帧的节奏并降低帧时间。而刚好Blackwell的显示引擎拥有较为出色的像素处理能力,可以以支持更高的分辨率和刷新率,从而实现带有DLSS 4的Flip Metering。不过,由于DLSS 4多帧生成需要用到第5代Tensor Core的强劲算力去计算光流场和生成多帧,因此这个功能目前是Blackwell独占的。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图37

此外,超分辨率、光线重建、DLAA也获得了更新,它们的模型从CNN换成了Transformer,是一个采用自注意力机制的神经网络,能够提高画面的稳定性,提升光照细节,给予动态物体更多细节。预计在未来数年里,图像质量会持续提升。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图39

对于游戏和应用,DLSS 4结合多帧生成、光线重建和超级分辨率技术,将帧率提升至普通渲染的最高8倍,并在从帧生成升级到多帧生成时,进一步提高帧率高达1.7倍,性能提升效果非常地明显。

延迟救星NVIDIA Reflex 2

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图41

这时可能会有朋友说到了,DLSS 4补帧这么猛,延迟不会大打折扣吗?英伟达对此早已给出了对策——NVIDIA Reflex 2。它结合了Reflex低延迟模式和新的Frame Warp技术,能够把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。

NVENC和NVDEC新增YUV422支持

目前很多摄像机都支持录制YUV422格式的视频,这是有原因的:YUV422相比起YUV444更节省储存空间,但是比起YUV420能保存更多的颜色,这样一来就给后期调色留下了充足的空间。Blackwell这次新增了YUV422的编解码支持,从而能提高创作者的效率,比如说导出时间减少,更流畅的多路回放等。NVIDIA表示,第6代NVDEC可同步解码和播放多达8个4K60 YUV422视频流。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图43

而第9代NVENC则提升了HEVC和AV1的编码质量,为YUV422 H.264和HVEC编码提供了支持。另外,还有一个全新的AV1 Ultra High Quality(UHQ)模式,它可以用更多的时间去获得额外5%的质量提升。NVIDIA还表示,这个模式在RTX 40系列上也可用,不过Blackwell的质量是更好的。

显卡解析:踏雪至山巅

我们把目光放回我们本次评测的主角——耕升 RTX 5090 D 踏雪。由于它是不带OC的标准版,包括核心Boost频率在内的绝大部分参数都与英伟达官方标称一致。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图45

外观与包装

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图47

耕升 RTX 4070 SUPER 踏雪

说实话,老踏雪给我的印象妥妥的是一张定位高端纯白显卡,如果将它的外观直接搬到万元级的RTX 5090 D上,多少是缺少诚意的,重新设计是势在必行。

上一页 1 23 4 5 6 7 8 下一页 阅读全文

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图49

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图51

雪花标志依旧是踏雪系列显卡的灵魂所在,从外包装上,耕升就将此十分直接地展现出来,旁边附易略带古风的“踏雪”字样,给人一种磅礴凛冽之感。三年个人送保服务作为耕升引以为傲的优势,自然也是会标注在最显眼的地方。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图53

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图55

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图57

拿出显卡本体后我们可以看到,RTX 5090 D 踏雪果然是没有让我们失望。纯白外壳不仅与散热鳍片尽可能地齐平贴合,而且尾部延伸至金属背板,带来非常不错的一体性观感。三把第三代炫风之刃风扇(两侧100mm,中间90mm)采用了性能表现更好的环形连叶设计,扇叶表面还有纹理加强导流。轴心处注入了标志性的雪花logo,在同心圆金属纹理的衬托之下倍显质感。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图59

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图61

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图63

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图65

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图67

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图69

不仅如此,我们从显卡的大部分地方都能看到大量的雪花图案,充分展现“踏雪”之意。其中,最值得一提的就是侧面的logo灯板了,转角过渡的设计刚好对应着常规安装时的展示视角,给人一种曲面屏般的立体观感。比起以往的踏雪系列显卡,RTX 5090 D踏雪的颜值可谓是脱胎换骨了。

显卡的供电接口从RTX 4090公版的12VHPWR升级成了更安全的12V-2×6,并且旋转了180°,卡扣朝上,便于用户拔插的同时减少插不牢的概率。在它的旁边是ARGB灯光同步接口,配合附送的线材使用。

显卡的显示输出接口和英伟达官方标称的一样,为三个DP2.1b+一个HDMI2.1b的组合。PCIe挡板只给到了双槽,其中一槽多是散热开孔,剩余厚度位置被外壳所覆盖。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图71

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图73

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图75

上一页 1 2 34 5 6 7 8 下一页 阅读全文

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图77

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图79

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图81

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图83

尺寸方面,我们手动测量的结果的328×122×61mm(不包含挡板凸出长度和插槽),厚度大约是三槽多一点,对常规的MATX主板和机箱来说不太友好。不过都上旗舰卡了,一般情况下用户都会首先考虑大机箱。至于ITX用户,就只能按自身的实际情况去判断了。显卡实测重量是1907g,份量不小,正常安装方式下建议搭配显卡支架使用,尽可能避免造成PCB弯曲。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图85

而配件这边,耕升也是附送了一个与显卡相称的银白色显卡金属支架,底部带有磁吸固定,安装在机箱时不易脱落。另外就是常规的四8Pin转12V-2×6供电线以及5V ARGB灯光控制线,后者可直接实现与主板灯效同步,无需在显卡控制软件内部进行额外的设置。

显卡拆解

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图87

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图89

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图91

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图93

全新的雪魂散热装置配备了7根8mm复合式镀镍热管,核心接触面底座为VC均热板,提供高效的散热能力。供电元件、显存芯片也覆盖有导热垫与散热模块上的一体式金属中框充分接触。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图95

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图97

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图99

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图101

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图103

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图105

上一页 1 2 3 45 6 7 8 下一页 阅读全文

耕升 RTX 5090 D 踏雪采用了14层PCB设计,供电配置给到了16+7+6相,主供电控制芯片放置在了PCB的左上角,为来自MPS的MP29816-A,所用的MOSFET全部是来自MPS的MP97993,最大支持电流为50A。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图107

背面还有一颗型号为uS5650Q的供电控制芯片

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图109

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图111

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图113

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图115

风扇PWM接口和5V ARGB灯光接口在PCB的右下方,三把风扇现在是单独控制。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图117

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图119

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图121

GB202-250-A1核心在PCB的中心位置,周围环绕着16颗三星的GDDR7芯片,每颗容量为2GB,位宽为32-bit,组成512-bit/32GB的规格。

显卡背部元件不多,一眼看过去很干净,基本都布局在了正面,可见这次耕升 RTX 5090 D 踏雪的硬件集成度非常高。

性能测试:“软硬”兼施效果显著

测试平台与说明

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图123

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图125

为了能够发挥出耕升 RTX 5090 D 踏雪的最佳表现,测试平台的CPU选用了当下最强游戏CPU——AMD Ryzen 7 9800X3D;与之搭配的主板为微星 MPG X870E CARBON WIFI 暗黑,拥有18+2+1相110A SPS智能供电的它即便是带旗舰级别的Ryzen 9 9950X也是不在话下,另外主板还配备了具有战未来属性的PICe 8Pin辅助供电接口,为显卡提供稳定,高效和持续的电力供应(测试时并没有接,主要是考虑到其他品牌主板没有配备该接口,不进行“作弊”);内存辅以芝奇 Trident Z5 RGB 32GB双通道DDR5-6000 CL30内存,甜点频率+低延迟的组合不仅对于绝大部分用户都能够实现,而且我们实测相比高频在实际使用中差别非常小。

参加测试的显卡除了耕升 RTX 5090 D 踏雪,还有作为对比的GeForce RTX 4090 D。测试兼顾2K和4K分辨率,包括基准性能跑分、传统光栅游戏以及光追游戏,DLSS测试部分加入了最新的DLSS 4。

基准性能测试

首先是纯理论跑分,会以3D Mark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Steel Nomad、Port Royal、以及Speed Way八个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080P分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数。另外还有去年推出的Steel Nomad,这是原有的Time Spy基准测试的继承者,属于新的非光追显卡基准性能测试工具。而NVIDA DLSS测试项目中,由于我们拿到的是测试版本,可以对DLSS 4的性能表现进行一个初步的预估,具有第一定的参考价值,具体设置为4K质量挡位,帧生成选项提供了2X,3X和4X三挡切换,其中DLSS 4 2X其实就是DLSS 3 2X,即渲染1帧生成1帧。RTX 4090 D不支持DLSS 4,因此就没有相关的成绩了。

具体成绩见下表,表中所列成绩均为3D Mark显卡单项的得分。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图127

在3DMark测试中可以看到,耕升 RTX 5090 D 踏雪要比RTX 4090 D快35%~66.5%,其中,Steel Nomad、Port Royal和Speed Way三个测试中拥有相当明显的优势,领先幅度都在50%以上,两项考验DX12性能的Time Spy的测试里面也超过了45%,代表DX11性能的Fire Strike则随着分辨率的降低,领先幅度逐步缩小。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图129

耕升 RTX 5090 D 踏雪凭借更出色的性能表现在原生画质中就拔得头筹,再加上DLSS 4的助力,帧数的提升相当夸张,4X时大约达到了原生的5.6倍。这不禁让人更加期待它的实际游戏体验了。

上一页 1 2 3 4 56 7 8 下一页 阅读全文

游戏测试

在这次游戏测试环节中,我们在4K分辨率选择了7款光栅化游戏及光追游戏,2K分辨率选择了4款光栅化游戏及光追游戏,另外还有3款DLSS 4游戏。一般情况下,游戏会选择极高或者超高的预设画质,光追游戏如果有路径光追都会是优先选项,同时这些测试里都没有开启DLSS。由于GeForce RTX 5090 D属于旗舰显卡,基本上都是以4K游戏为目标,2K游戏则选择压力较大的几款大作,压力非常小的1080P分辨率的参考意义较低,就不作测试。

4K分辨率 光栅游戏

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图131

光追游戏

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图133

在4K光栅游戏的环节,除了《黑神话:悟空》勉强达到流畅之外,其余游戏在耕升 RTX 5090 D 踏雪面前基本算得上的游刃有余,相比RTX 4090 D有着较为明显的帧数提升。

开启光追之后,两者依然保有一定的性能差距, RTX 5090 D均能做到30fps以上,而RTX 4090 D有4款游戏是低于30fps的。但总体来说,要想4K光追畅玩,新一代显卡还是要依赖DLSS。

2K分辨率 光栅游戏

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图135

光追游戏

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图137

转战压力较小的2K分辨率之后,耕升 RTX 5090 D 踏雪毫无意外是继续领先。2K光栅对于它来说基本上是不成问题了,RTX 4090 D面对《黑神话:悟空》还是处于勉强过关的程度。2K光追的情况同样如此,RTX 5090 D悉数踩着60fps的畅玩基础线过关,RTX 4090 D除了《心灵杀手2》外都只有40多fps。

总体来说,RTX 5090 D让很多大作在高分辨率+光追+原生画质的条件下完成了从不可玩到可玩转变,打好的原生帧数的基础,才能更好地发挥DLSS帧生成的优势,提升游戏体验。

DLSS 4性能测试

在DLSS 4测试项目中,我们选择了四款游戏,包括《赛博朋克2077》、《心灵杀手2》、《星球大战:亡命之徒》和《漫威争锋》。原本想测试更多支持DLSS 4的游戏,但是遇到了不稳定等情况,而且时间有限。相信当大家收到RTX 50系显卡的时候,应该就会有很多游戏获得原生DLSS 4或DLSS优化支持了。帧生成选项和3D Mark的DLSS测试项目一样,提供了2X,3X和4X三挡切换,而RTX 40系显卡是只有开关选项,没有给到增幅挡位。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图139

在DLSS 4功能测试版的《赛博朋克2077》中,画质设置菜单里新增了超分辨率模型选择,玩家可以选择全新的Transformer或以前的CNN模型,虽然说是超分辨率,但其实光线重建的模型也会被一并切换。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图141

NVIDIA App的设置跟游戏中的类似,也是分成模型选择、帧生成倍数和超分辨率三个选项。一般来说因为是驱动级设置,过程可能比游戏内设置要略微多花一点时间,比如我们这次测试的《漫威争锋》,就需要先设置好再开游戏,而不能在游戏里实时设置。

测试内容除了原生帧率外,我们尝试了新旧两种不同模型,以及不同倍数的设置,让大家可以更好地去做对比。需要说明的是,《星球大战:亡命之徒》不支持DLSS新旧模型切换。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图143

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图145

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图147

DLSS 4对于帧数的提升是肉眼可见的大,均是成倍地增加,同时,多挡位以及双模型的切换也为用户提供了更多的选择。大家最关心的延迟问题其实总体感觉还好,大部分情况下DLSS 4 和DLSS 2/3仅存在些许的差距,且明显好于原生,实际体验的感知并不明显。另外,画质方面这里给到大家Transformer和CNN两个新旧模型的对比,所有的对比截图均是在性能挡获取的,屏幕分辨率为4K,渲染分辨率则是1920 x 1080。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图149

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图151

CNN模型CNN模型Transformer模型Transformer模型

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图153

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图155

CNN模型CNN模型Transformer模型Transformer模型

上一页 1 2 3 4 5 67 8 下一页 阅读全文

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图157

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图159

CNN模型CNN模型Transformer模型Transformer模型

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图161

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图163

CNN模型CNN模型Transformer模型Transformer模型

显而易见,Transformer在细节处理上要比CNN好上不少,不仅是正常的画面,而且水面的倒影也是更加清晰。在画面稳定性这块,新模型还显著减少了物体边缘处的闪烁以及伪影现象。

AI与生产力性能测试

AI生图与大语言模型

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图165

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图167

前面也提到了,RTX 5090 D新增了FP4的支持,具体表现究竟会如何呢?在UL Procyon FLUX.1 AI生图测试里面,RTX 5090 D在FP4模式下仅用了4秒不到就生成了一张图,而RTX 4090 D则是要花上将近20秒。在FP8模式里面,RTX 5090 D的速度依然是RTX 4090 D的1.7倍。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图169

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图171

至于不少玩家关注常规FP16性能,我们也做了相应的Stable Diffusion测试。需要提一下的是,在我们测试时公开的TensorRT加速库还没更新对RTX 50系列的支持,所以我们是用ONNX DirectML运行时进行测试的。在这个测试中,RTX 5090 D仍然处于领先位置。尽管RTX 5090 D在这个情况下的生成速度也挺快的了,要是有TensorRT的话,速度会更上一层楼。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图173

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图175

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图177

LLM类别的测试中,涉及的模型要多不少,但在首Token延迟和输出Token速度这些关键指标上,RTX 5090 D在大部分模型里面要比RTX 4090 D好上约30%。

生产力创意软件

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图179

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图181

3D创作有关的软件中,V-Ray和Blender我们认为是比较有代表性的,在这里面,RTX 5090 D相比RTX 4090 D获得了超过25%的增幅。

上一页 1 2 3 4 5 6 78 下一页 阅读全文

温度测试

我们的GPU散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,测试环境温度约为23.5℃。待机温度是开机以后记录5分钟,满载温度则是完成3DMark Speed Way压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图183

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图185

耕升 RTX 5090 D 踏雪支持低温风扇停转,所以待机温度都是被动散热下的温度,整体呈缓慢上升的趋势,直到最高的42.5℃依然是处于停转状态。满载时,显卡的最高温度大约在第6分钟达到最高,为72.1℃。在此之后,风扇转速还是稍有增加,最高达到1844 RPM以更好地维持在相对较低的工作温度范围内。

功耗测试

我们通过手中的PCAT套件,分别精确地测量显卡PCIe、外接电源接口瓦特数,显卡最大功耗在3DMark Speed Way压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图187

统计功耗测试的结果算出,我们手上这张耕升 RTX 5090 D 踏雪显卡的整卡平均待机功耗约为31W,满载平均功耗在584W左右,峰值功耗达到了668W,已达到16-Pin 12V-2×6供电接口满载状态。这也就不难解释为什么英伟达官方给到的电源瓦数建议从RTX 4090的850W提升至了1000W。

噪音测试

在GPU-Z的Log to File中我们同时记录下了显卡转速情况。由于这次的RTX 5090 D显卡风扇均独立控制,我们只标出最速较高的一个,为1844 RPM。接着我们把显卡放进了环境噪音小于10 dB(A)的消音实验室,把其风扇还原同样转速,然后在30CM的距离上测试其噪音水平,由于显卡在待机时风扇是停转的,所以就不用测试了。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图189

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图191

耕升 RTX 5090 D 踏雪所测得的噪音值为44.4 dB(A),在开放平台下会感受到些许声响,如果按照正常用户装入机箱的使用习惯,应该是感知不明显的。

GW-SOUL控制软件体验

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图193

前面我们有提到,耕升 RTX 5090 D 踏雪的三把风扇现在是独立控制的,旧版本的控制软件是只能控制其中的两把。而新版的GW-SOUL里面,风扇调节一栏就明确显示三把风扇均单独可调了。此外,软件还提供了显卡实时状态信息、超频和灯光调节功能,右上角给到了主板灯光同步开关。

总结:难以撼动的旗舰级性能表现

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图195

从耕升 RTX 5090 D 踏雪身上我们可以看到,英伟达的新一代旗舰显卡主要是在核心规模和相关技术上取得明显进步,拥有符合现时市场竞争状况的代际提升幅度,游戏及AI生产力表现出色。尤其是极具战未来意义的神经网络渲染与DLSS 4技术,更是将一些有着极高性能需求的游戏驯服妥帖。不过,由于芯片制程工艺没有变化,功耗增加是在所难免的,供电接口上引入了最新的12V-2×6正是为此而保驾护航,当然,搭配1000W或以上的ATX 3电源使用也是必不可少的。

价格方面,英伟达官方给到的建议零售价虽为16499元,但耕升 RTX 5090 D 踏雪作为一张用料扎实又有纯白外观和全新设计加持的非公版显卡实际上市的价格应该会略有增加,同时,首发的热度所带来的供需变化可能也会成为价格波动的因素之一。尽管如此,由于主要竞争对手AMD没有给到足够的压力,相信在未来的好一段时间内,RTX 5090 D会稳居最强消费级显卡的宝座,价格不会影响对其有需求用户的购买动力。

上一页 4 5 6 7 8下一页阅读全文

时隔两年又三个多月,英伟达终于带来了全新的GeForce RTX 50系显卡。然而受到相关规定(满足综合运算性能TPP不超过4800的限制)的影响,RTX 5090的命运和RTX 4090一样,化身RTX 5090 D进入国内市场。同时,RTX 5090 D是没有公版(Founder Edition)的,因此,高端玩家们就只能从一众非公显卡里面去挑选适合自己的那一款了。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图1

而说起耕升的踏雪系列,可能大家第一时间更多会想到纯白设计、中高端定位,很难会将过往最高只搭载过RTX 4070 TI SUPER芯片的它和旗舰显卡联想到一起。不过,当英伟达正式进入RTX 50系显卡时代之后,踏雪也迎来的蜕变,出现在了耕升的RTX 5090 D的产品名单里面。在了解耕升 GeForce RTX 5090 D 踏雪之前,我们先来简单回顾一下英伟达RTX 50系显卡到底有什么新的特点。

关于RTX 5090 D

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图3

相较于上一代RTX 4090 D来看,RTX 5090 D在芯片的规模上有了较大幅度的升级。虽然制程工艺不变,依然是定制的TSMC 4N,但是,凭借更大的芯片面积和新一代的Blackwell核心架构,后者的晶体管数量从763亿个增加至922亿个,CUDA核心数量增加将近50%,而且同样是12个GPC,RTX 5090 D每个GPC里的TPC和SM数量增多了,TPC从6个增至8个,SM从12个增至16个。编解码器同样进行了迭代加码,新增了4:2:2色度采样视频编解码的能力,节省CPU的负担,提升内容创作者的工作效率。此外,RTX 5090 D还用上了容量更大、性能更强的GDDR7显存,位宽也从384-bit增至512-bit。显示输出接口升级为3×DisplayPort 2.1b+1×HDMI 2.1b的配置,借助DSC技术最高支持4K@480Hz或8K@140Hz。

不过,这次的RTX 5090 D的命运并不像RTX 4090 D一样在核心规格作出调整。我们从表面参数上基本看不出与RTX 5090有什么区别,对游戏性能造成的影响肯定是远小于RTX 4090 D当初的。至于AI性能嘛,RTX 5090 D则从RTX 5090的3352 AI TOPS降至2375 AI TOPS,降幅约29%。

Blackwell架构有多牛

不断壮大的核心规模

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图5

其实,完全体的 Blackwell GB202共有12组GPC、24576个CUDA核心,RTX 5090 D上的GB202-250则用了其中的88.5%。从整体结构图上还能看到,GigaThread Engine调度器隔壁多了一个叫做AI-Management Processor(AI管理处理器,简称AMP)的帮手。AMP是一个位于管线前端的RISC-V处理器,支持Windows硬件加速GPU计划,能够更自由地管理GPU。CUDA、RT Core和Tensor Core三大部分在它的带领下可以协调工作,实现AI响应速度提高的同时,游戏画面也不会受到影响。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图7

GPC段中,它所包含的TPC从Ada Lovelace的6组扩展到了8组。不过布局上还是一样的,一个独立的光栅引擎,两个ROP分区(每个包含8个ROP单元),而每组TPC包含两组SM。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图9

SM段的变化是比较大的。现在所有的32个CUDA核心都能执行FP32/INT32运算了,因此INT32的算力可以说是增加了一倍。不过在一个时钟周期里面,核心只能二选一运算。NVIDIA表示,这种设计是为神经着色器优化的。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图11

Tensor Core和RT Core自然也有升级。第5代Tensor Core继承了上一代架构的特性,并新增了FP4、FP6的支持,还把FP8 Transformer Engine更新到了第二代。其中,FP4是个比较值得关注的点,它相比常规的FP16模型需要的显存更小,在TensorRT模型优化器的支持下能够做到几乎没有质量损失。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图13

现在,Blackwell上的SER(着色器重排序) 2.0还可以将神经网络的负载直接发送至Tensor Core处理,加速神经网络渲染,效率达到了Ada Lovelace上的2倍,降低开销之余还能提高精准度。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图15

同时运作的话,LLM的响应时间变慢,游戏帧率也会受影响

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图17

而第4代RT Core中,新增的组件包括有Triangle Cluster Intersection Engine、Triangle Cluster Compression Engine以及Linear Swept Spheres。同时,Blackwell提供了两倍于上一代Ada Lovelace的Ray-Triangle交叉检测吞吐量。它们的出现,与Mega Geometry技术息息相关,起到一个打基础的作用。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图19

Mega Geometry是在TLAS(顶层加速结构)和BLAS(底层加速结构)两个层级的架构上做改进。BLAS一侧的Cluster-level Acceleration Structures(CLAS,簇级加速结构)最多能把256个三角形簇打包好,并将其作为BVH的基础部分输入,最后组成BVH树。同时,CLAS不仅能在游戏里面按需创建,还能缓存到硬盘里面,后面的帧要用的话直接从硬盘加载。这样一来,系统要处理的事情就少很多了。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图21

TLAS还有个兄弟叫Partitioned Top-Level Acceleration Structure(PTLAS,分区顶层加速架构),是针对复杂场景设计的。NVIDIA表示,在很多游戏里面,场景内有不少物品比如建筑都是固定不变的,但是如果每一帧都要给它们构建一次TLAS,肯定就不划算。而正如名称中的Partitioned分区所示,PTLAS把场景内的物体分成了多个区域,一些用来放置静态的物品,然后一个全局分区用于处理动态的物品,同样可以做到减轻了系统的压力,提高运算效率。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图23

值得一提的是,所有RTX显卡都能支持Mega Geometry,但跟所有新技术一样,Blackwell是目前支持最好的。

魔法一般的神经网络渲染

铺垫了这么多的硬件基础,英伟达实际上是为了更好地构筑神经网络渲染这项技术,应用范围包括RTX神经网络纹理压缩、RTX神经网络材质、神经网络辐射缓存(NRC)以及RTX神经网络皮肤/面部。

RTX神经纹理压缩:使用AI在不到一分钟的时间内压缩数千种纹理,在相同的视觉质量下可以节省高达7倍的显存占用。

RTX神经材质:使用AI压缩通常保留给离线材质的复杂着色器代码,并且这些材质由多层组成,处理速度可提升5倍。

RTX神经网络辐射缓存:使用在实时游戏数据上训练的神经网络,能更准确和高效地估计游戏场景中的间接光照,而大幅减少光线追踪的计算量。

RTX神经网络皮肤/面部:能够使光线完成射入皮肤内的反射和折射,并且基于AI模型生成更真实的面部和表情,改善人物的身整体呈现和解决恐怖谷效应的问题。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图25

RTX神经材质

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图27

RTX神经网络辐射缓存

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图29

RTX神经网络皮肤

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图31

RTX神经网络面部

DLSS 4:帧生成PLUS

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图33

新一代Blackwell架构GPU上引入了DLSS 4,提供了多帧生成功能,即在每个传统渲染的帧之间生成多达三个额外的帧。这不仅基于Blackwell的帧生成模型比上一代快了40%、显存占用降低30%的强大优势,而且用于提供光流场信息的不再是RTX 40系列上的光流加速器,而是一个更高效的AI模型。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图35

为了避免输出帧画面过多导致的顺序乱套,英伟达还引入了Flip Metering功能,能够将帧平滑逻辑从CPU转移到GPU的显示引擎上,让GPU更精确地掌控显示每一帧的节奏并降低帧时间。而刚好Blackwell的显示引擎拥有较为出色的像素处理能力,可以以支持更高的分辨率和刷新率,从而实现带有DLSS 4的Flip Metering。不过,由于DLSS 4多帧生成需要用到第5代Tensor Core的强劲算力去计算光流场和生成多帧,因此这个功能目前是Blackwell独占的。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图37

此外,超分辨率、光线重建、DLAA也获得了更新,它们的模型从CNN换成了Transformer,是一个采用自注意力机制的神经网络,能够提高画面的稳定性,提升光照细节,给予动态物体更多细节。预计在未来数年里,图像质量会持续提升。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图39

对于游戏和应用,DLSS 4结合多帧生成、光线重建和超级分辨率技术,将帧率提升至普通渲染的最高8倍,并在从帧生成升级到多帧生成时,进一步提高帧率高达1.7倍,性能提升效果非常地明显。

延迟救星NVIDIA Reflex 2

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图41

这时可能会有朋友说到了,DLSS 4补帧这么猛,延迟不会大打折扣吗?英伟达对此早已给出了对策——NVIDIA Reflex 2。它结合了Reflex低延迟模式和新的Frame Warp技术,能够把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。

NVENC和NVDEC新增YUV422支持

目前很多摄像机都支持录制YUV422格式的视频,这是有原因的:YUV422相比起YUV444更节省储存空间,但是比起YUV420能保存更多的颜色,这样一来就给后期调色留下了充足的空间。Blackwell这次新增了YUV422的编解码支持,从而能提高创作者的效率,比如说导出时间减少,更流畅的多路回放等。NVIDIA表示,第6代NVDEC可同步解码和播放多达8个4K60 YUV422视频流。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图43

而第9代NVENC则提升了HEVC和AV1的编码质量,为YUV422 H.264和HVEC编码提供了支持。另外,还有一个全新的AV1 Ultra High Quality(UHQ)模式,它可以用更多的时间去获得额外5%的质量提升。NVIDIA还表示,这个模式在RTX 40系列上也可用,不过Blackwell的质量是更好的。

显卡解析:踏雪至山巅

我们把目光放回我们本次评测的主角——耕升 RTX 5090 D 踏雪。由于它是不带OC的标准版,包括核心Boost频率在内的绝大部分参数都与英伟达官方标称一致。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图45

外观与包装

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图47

耕升 RTX 4070 SUPER 踏雪

说实话,老踏雪给我的印象妥妥的是一张定位高端纯白显卡,如果将它的外观直接搬到万元级的RTX 5090 D上,多少是缺少诚意的,重新设计是势在必行。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图49

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图51

雪花标志依旧是踏雪系列显卡的灵魂所在,从外包装上,耕升就将此十分直接地展现出来,旁边附易略带古风的“踏雪”字样,给人一种磅礴凛冽之感。三年个人送保服务作为耕升引以为傲的优势,自然也是会标注在最显眼的地方。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图53

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图55

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图57

拿出显卡本体后我们可以看到,RTX 5090 D 踏雪果然是没有让我们失望。纯白外壳不仅与散热鳍片尽可能地齐平贴合,而且尾部延伸至金属背板,带来非常不错的一体性观感。三把第三代炫风之刃风扇(两侧100mm,中间90mm)采用了性能表现更好的环形连叶设计,扇叶表面还有纹理加强导流。轴心处注入了标志性的雪花logo,在同心圆金属纹理的衬托之下倍显质感。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图59

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图61

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图63

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图65

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图67

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图69

不仅如此,我们从显卡的大部分地方都能看到大量的雪花图案,充分展现“踏雪”之意。其中,最值得一提的就是侧面的logo灯板了,转角过渡的设计刚好对应着常规安装时的展示视角,给人一种曲面屏般的立体观感。比起以往的踏雪系列显卡,RTX 5090 D踏雪的颜值可谓是脱胎换骨了。

显卡的供电接口从RTX 4090公版的12VHPWR升级成了更安全的12V-2×6,并且旋转了180°,卡扣朝上,便于用户拔插的同时减少插不牢的概率。在它的旁边是ARGB灯光同步接口,配合附送的线材使用。

显卡的显示输出接口和英伟达官方标称的一样,为三个DP2.1b+一个HDMI2.1b的组合。PCIe挡板只给到了双槽,其中一槽多是散热开孔,剩余厚度位置被外壳所覆盖。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图71

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图73

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图75

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图77

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图79

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图81

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图83

尺寸方面,我们手动测量的结果的328×122×61mm(不包含挡板凸出长度和插槽),厚度大约是三槽多一点,对常规的MATX主板和机箱来说不太友好。不过都上旗舰卡了,一般情况下用户都会首先考虑大机箱。至于ITX用户,就只能按自身的实际情况去判断了。显卡实测重量是1907g,份量不小,正常安装方式下建议搭配显卡支架使用,尽可能避免造成PCB弯曲。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图85

而配件这边,耕升也是附送了一个与显卡相称的银白色显卡金属支架,底部带有磁吸固定,安装在机箱时不易脱落。另外就是常规的四8Pin转12V-2×6供电线以及5V ARGB灯光控制线,后者可直接实现与主板灯效同步,无需在显卡控制软件内部进行额外的设置。

显卡拆解

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图87

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图89

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图91

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图93

全新的雪魂散热装置配备了7根8mm复合式镀镍热管,核心接触面底座为VC均热板,提供高效的散热能力。供电元件、显存芯片也覆盖有导热垫与散热模块上的一体式金属中框充分接触。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图95

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图97

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图99

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图101

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图103

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图105

耕升 RTX 5090 D 踏雪采用了14层PCB设计,供电配置给到了16+7+6相,主供电控制芯片放置在了PCB的左上角,为来自MPS的MP29816-A,所用的MOSFET全部是来自MPS的MP97993,最大支持电流为50A。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图107

背面还有一颗型号为uS5650Q的供电控制芯片

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图109

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图111

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图113

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图115

风扇PWM接口和5V ARGB灯光接口在PCB的右下方,三把风扇现在是单独控制。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图117

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图119

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图121

GB202-250-A1核心在PCB的中心位置,周围环绕着16颗三星的GDDR7芯片,每颗容量为2GB,位宽为32-bit,组成512-bit/32GB的规格。

显卡背部元件不多,一眼看过去很干净,基本都布局在了正面,可见这次耕升 RTX 5090 D 踏雪的硬件集成度非常高。

性能测试:“软硬”兼施效果显著

测试平台与说明

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图123

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图125

为了能够发挥出耕升 RTX 5090 D 踏雪的最佳表现,测试平台的CPU选用了当下最强游戏CPU——AMD Ryzen 7 9800X3D;与之搭配的主板为微星 MPG X870E CARBON WIFI 暗黑,拥有18+2+1相110A SPS智能供电的它即便是带旗舰级别的Ryzen 9 9950X也是不在话下,另外主板还配备了具有战未来属性的PICe 8Pin辅助供电接口,为显卡提供稳定,高效和持续的电力供应(测试时并没有接,主要是考虑到其他品牌主板没有配备该接口,不进行“作弊”);内存辅以芝奇 Trident Z5 RGB 32GB双通道DDR5-6000 CL30内存,甜点频率+低延迟的组合不仅对于绝大部分用户都能够实现,而且我们实测相比高频在实际使用中差别非常小。

参加测试的显卡除了耕升 RTX 5090 D 踏雪,还有作为对比的GeForce RTX 4090 D。测试兼顾2K和4K分辨率,包括基准性能跑分、传统光栅游戏以及光追游戏,DLSS测试部分加入了最新的DLSS 4。

基准性能测试

首先是纯理论跑分,会以3D Mark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Steel Nomad、Port Royal、以及Speed Way八个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080P分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数。另外还有去年推出的Steel Nomad,这是原有的Time Spy基准测试的继承者,属于新的非光追显卡基准性能测试工具。而NVIDA DLSS测试项目中,由于我们拿到的是测试版本,可以对DLSS 4的性能表现进行一个初步的预估,具有第一定的参考价值,具体设置为4K质量挡位,帧生成选项提供了2X,3X和4X三挡切换,其中DLSS 4 2X其实就是DLSS 3 2X,即渲染1帧生成1帧。RTX 4090 D不支持DLSS 4,因此就没有相关的成绩了。

具体成绩见下表,表中所列成绩均为3D Mark显卡单项的得分。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图127

在3DMark测试中可以看到,耕升 RTX 5090 D 踏雪要比RTX 4090 D快35%~66.5%,其中,Steel Nomad、Port Royal和Speed Way三个测试中拥有相当明显的优势,领先幅度都在50%以上,两项考验DX12性能的Time Spy的测试里面也超过了45%,代表DX11性能的Fire Strike则随着分辨率的降低,领先幅度逐步缩小。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图129

耕升 RTX 5090 D 踏雪凭借更出色的性能表现在原生画质中就拔得头筹,再加上DLSS 4的助力,帧数的提升相当夸张,4X时大约达到了原生的5.6倍。这不禁让人更加期待它的实际游戏体验了。

游戏测试

在这次游戏测试环节中,我们在4K分辨率选择了7款光栅化游戏及光追游戏,2K分辨率选择了4款光栅化游戏及光追游戏,另外还有3款DLSS 4游戏。一般情况下,游戏会选择极高或者超高的预设画质,光追游戏如果有路径光追都会是优先选项,同时这些测试里都没有开启DLSS。由于GeForce RTX 5090 D属于旗舰显卡,基本上都是以4K游戏为目标,2K游戏则选择压力较大的几款大作,压力非常小的1080P分辨率的参考意义较低,就不作测试。

4K分辨率 光栅游戏

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图131

光追游戏

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图133

在4K光栅游戏的环节,除了《黑神话:悟空》勉强达到流畅之外,其余游戏在耕升 RTX 5090 D 踏雪面前基本算得上的游刃有余,相比RTX 4090 D有着较为明显的帧数提升。

开启光追之后,两者依然保有一定的性能差距, RTX 5090 D均能做到30fps以上,而RTX 4090 D有4款游戏是低于30fps的。但总体来说,要想4K光追畅玩,新一代显卡还是要依赖DLSS。

2K分辨率 光栅游戏

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图135

光追游戏

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图137

转战压力较小的2K分辨率之后,耕升 RTX 5090 D 踏雪毫无意外是继续领先。2K光栅对于它来说基本上是不成问题了,RTX 4090 D面对《黑神话:悟空》还是处于勉强过关的程度。2K光追的情况同样如此,RTX 5090 D悉数踩着60fps的畅玩基础线过关,RTX 4090 D除了《心灵杀手2》外都只有40多fps。

总体来说,RTX 5090 D让很多大作在高分辨率+光追+原生画质的条件下完成了从不可玩到可玩转变,打好的原生帧数的基础,才能更好地发挥DLSS帧生成的优势,提升游戏体验。

DLSS 4性能测试

在DLSS 4测试项目中,我们选择了四款游戏,包括《赛博朋克2077》、《心灵杀手2》、《星球大战:亡命之徒》和《漫威争锋》。原本想测试更多支持DLSS 4的游戏,但是遇到了不稳定等情况,而且时间有限。相信当大家收到RTX 50系显卡的时候,应该就会有很多游戏获得原生DLSS 4或DLSS优化支持了。帧生成选项和3D Mark的DLSS测试项目一样,提供了2X,3X和4X三挡切换,而RTX 40系显卡是只有开关选项,没有给到增幅挡位。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图139

在DLSS 4功能测试版的《赛博朋克2077》中,画质设置菜单里新增了超分辨率模型选择,玩家可以选择全新的Transformer或以前的CNN模型,虽然说是超分辨率,但其实光线重建的模型也会被一并切换。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图141

NVIDIA App的设置跟游戏中的类似,也是分成模型选择、帧生成倍数和超分辨率三个选项。一般来说因为是驱动级设置,过程可能比游戏内设置要略微多花一点时间,比如我们这次测试的《漫威争锋》,就需要先设置好再开游戏,而不能在游戏里实时设置。

测试内容除了原生帧率外,我们尝试了新旧两种不同模型,以及不同倍数的设置,让大家可以更好地去做对比。需要说明的是,《星球大战:亡命之徒》不支持DLSS新旧模型切换。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图143

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图145

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图147

DLSS 4对于帧数的提升是肉眼可见的大,均是成倍地增加,同时,多挡位以及双模型的切换也为用户提供了更多的选择。大家最关心的延迟问题其实总体感觉还好,大部分情况下DLSS 4 和DLSS 2/3仅存在些许的差距,且明显好于原生,实际体验的感知并不明显。另外,画质方面这里给到大家Transformer和CNN两个新旧模型的对比,所有的对比截图均是在性能挡获取的,屏幕分辨率为4K,渲染分辨率则是1920 x 1080。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图149

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图151

CNN模型CNN模型Transformer模型Transformer模型

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图153

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图155

CNN模型CNN模型Transformer模型Transformer模型

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图157

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图159

CNN模型CNN模型Transformer模型Transformer模型

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图161

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图163

CNN模型CNN模型Transformer模型Transformer模型

显而易见,Transformer在细节处理上要比CNN好上不少,不仅是正常的画面,而且水面的倒影也是更加清晰。在画面稳定性这块,新模型还显著减少了物体边缘处的闪烁以及伪影现象。

AI与生产力性能测试

AI生图与大语言模型

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图165

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图167

前面也提到了,RTX 5090 D新增了FP4的支持,具体表现究竟会如何呢?在UL Procyon FLUX.1 AI生图测试里面,RTX 5090 D在FP4模式下仅用了4秒不到就生成了一张图,而RTX 4090 D则是要花上将近20秒。在FP8模式里面,RTX 5090 D的速度依然是RTX 4090 D的1.7倍。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图169

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图171

至于不少玩家关注常规FP16性能,我们也做了相应的Stable Diffusion测试。需要提一下的是,在我们测试时公开的TensorRT加速库还没更新对RTX 50系列的支持,所以我们是用ONNX DirectML运行时进行测试的。在这个测试中,RTX 5090 D仍然处于领先位置。尽管RTX 5090 D在这个情况下的生成速度也挺快的了,要是有TensorRT的话,速度会更上一层楼。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图173

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图175

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图177

LLM类别的测试中,涉及的模型要多不少,但在首Token延迟和输出Token速度这些关键指标上,RTX 5090 D在大部分模型里面要比RTX 4090 D好上约30%。

生产力创意软件

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图179

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图181

3D创作有关的软件中,V-Ray和Blender我们认为是比较有代表性的,在这里面,RTX 5090 D相比RTX 4090 D获得了超过25%的增幅。

温度测试

我们的GPU散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,测试环境温度约为23.5℃。待机温度是开机以后记录5分钟,满载温度则是完成3DMark Speed Way压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图183

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图185

耕升 RTX 5090 D 踏雪支持低温风扇停转,所以待机温度都是被动散热下的温度,整体呈缓慢上升的趋势,直到最高的42.5℃依然是处于停转状态。满载时,显卡的最高温度大约在第6分钟达到最高,为72.1℃。在此之后,风扇转速还是稍有增加,最高达到1844 RPM以更好地维持在相对较低的工作温度范围内。

功耗测试

我们通过手中的PCAT套件,分别精确地测量显卡PCIe、外接电源接口瓦特数,显卡最大功耗在3DMark Speed Way压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图187

统计功耗测试的结果算出,我们手上这张耕升 RTX 5090 D 踏雪显卡的整卡平均待机功耗约为31W,满载平均功耗在584W左右,峰值功耗达到了668W,已达到16-Pin 12V-2×6供电接口满载状态。这也就不难解释为什么英伟达官方给到的电源瓦数建议从RTX 4090的850W提升至了1000W。

噪音测试

在GPU-Z的Log to File中我们同时记录下了显卡转速情况。由于这次的RTX 5090 D显卡风扇均独立控制,我们只标出最速较高的一个,为1844 RPM。接着我们把显卡放进了环境噪音小于10 dB(A)的消音实验室,把其风扇还原同样转速,然后在30CM的距离上测试其噪音水平,由于显卡在待机时风扇是停转的,所以就不用测试了。

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图189

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图191

耕升 RTX 5090 D 踏雪所测得的噪音值为44.4 dB(A),在开放平台下会感受到些许声响,如果按照正常用户装入机箱的使用习惯,应该是感知不明显的。

GW-SOUL控制软件体验

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图193

前面我们有提到,耕升 RTX 5090 D 踏雪的三把风扇现在是独立控制的,旧版本的控制软件是只能控制其中的两把。而新版的GW-SOUL里面,风扇调节一栏就明确显示三把风扇均单独可调了。此外,软件还提供了显卡实时状态信息、超频和灯光调节功能,右上角给到了主板灯光同步开关。

总结:难以撼动的旗舰级性能表现

性能更强 功耗更高! GeForce RTX 5090 D显卡天梯榜首测插图195

从耕升 RTX 5090 D 踏雪身上我们可以看到,英伟达的新一代旗舰显卡主要是在核心规模和相关技术上取得明显进步,拥有符合现时市场竞争状况的代际提升幅度,游戏及AI生产力表现出色。尤其是极具战未来意义的神经网络渲染与DLSS 4技术,更是将一些有着极高性能需求的游戏驯服妥帖。不过,由于芯片制程工艺没有变化,功耗增加是在所难免的,供电接口上引入了最新的12V-2×6正是为此而保驾护航,当然,搭配1000W或以上的ATX 3电源使用也是必不可少的。

价格方面,英伟达官方给到的建议零售价虽为16499元,但耕升 RTX 5090 D 踏雪作为一张用料扎实又有纯白外观和全新设计加持的非公版显卡实际上市的价格应该会略有增加,同时,首发的热度所带来的供需变化可能也会成为价格波动的因素之一。尽管如此,由于主要竞争对手AMD没有给到足够的压力,相信在未来的好一段时间内,RTX 5090 D会稳居最强消费级显卡的宝座,价格不会影响对其有需求用户的购买动力。

文章来自互联网,只做分享使用。发布者:张大嘴,转转请注明出处:https://www.dingdanghao.com/article/768716.html

(0)
上一篇 2025-02-12 01:31
下一篇 2024-02-23 09:20

相关推荐

联系我们

在线咨询: QQ交谈

邮件:442814395@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信公众号