微信关注,获取更多

Nvidia GeForce RTX 4090测评:性能巅峰的代价

你是否还记得2022年的那个时刻,当Nvidia的CEO黄仁勋在GTC 2022上揭示了GeForce RTX 4090的关键细节?在超过一年的极端GPU价格高涨和短缺之后,$1,599的价格肯定会让很多人失望。这是Nvidia Ada Lovelace架构中的顶级产品,实际上只比RTX 3090的发布价格高出$100,如果这张显卡能够达到Nvidia声称的比RTX 3090 Ti高2倍到4倍的性能水平,毫无疑问会有人愿意付出这个代价。现在,RTX 4090在GPU性能排行榜中占据着1440p和4K的宝座。对于那些追求最快GPU的人来说,价格并不是问题,它现在被认为是最佳显卡之一。

然而,并不是说RTX 4090代表了良好的性价比,这个问题有点主观。如果只看各种GPU每美元所提供的FPS,它在过去十年中的68张显卡中排名垫底。不过,我们的标准排名是使用1080p超级性能,而RTX 4090显然不是为了在1080p上表现出色而设计的。事实上,即使在1440p超级性能游戏时,仍然存在CPU瓶颈的问题。而在4K性能和光线追踪方面,你可以说它可能是性价比最高的显卡之一,这就是我们所说的价值是主观的原因。

再次强调,要拥有RTX 4090显卡,你将付出昂贵的代价,因为基础型号的RTX 4090 Founders Edition售价为$1,599,而合作伙伴显卡的价格可能会高达$1,999。但对于那些追求最佳性能的人,或者对于深度口袋足够宽敞的人来说,这就是你现在想要的显卡,除非未来推出RTX 4090 Ti,否则我们很难看到有任何显卡能够超越它。

当前顶级GPU规格

显卡 RTX 4090 RTX 3090 Ti RTX 3090 RTX 3080 Ti RX 6950 XT Arc A770 16GB
架构 AD102 GA102 GA102 GA102 Navi 21 ACM-G10
工艺技术 TSMC 4N Samsung 8N Samsung 8N Samsung 8N TSMC N7 TSMC N6
晶体管数量 76.3 28.3 28.3 28.3 26.8 21.7
芯片面积(mm²) 608.4 628.4 628.4 628.4 519 406
SMs / CUs / Xe-Cores 128 84 82 80 80 32
GPU着色器 16384 10752 10496 10240 5120 4096
张量核心 512 336 328 320 N/A 512
光线追踪“核心” 128 84 82 80 80 32
增频时钟(MHz) 2520 1860 1695 1665 2310 2100
VRAM速度(Gbps) 21 21 19.5 19 18 17.5
VRAM(GB) 24 24 24 12 16 16
VRAM总线宽度 384 384 384 384 256 256
L2 / Infinity缓存 72 6 6 6 128 16
ROPs 176 112 112 112 128 128
TMUs 512 336 328 320 320 256
TFLOPS FP32 82.6 40 35.6 34.1 23.7 17.2
TFLOPS FP16 (FP8/INT8) 661 (1321) 160 (320) 142 (285) 136 (273) 47.4 138 (275)
带宽(GBps) 1008 1008 936 912 576 560
TDP(瓦特) 450 450 350 350 335 225
发布日期 Oct 2022 Mar 2022 Sep 2020 Jun 2021 May 2022 Oct 2022
发布价格 $1,599 $1,999 $1,499 $1,199 $1,099 $349

这是极限性能显卡世界的佼佼者,涵盖了来自Nvidia、AMD和现在的Intel的最快显卡。显然,Intel的Arc A770在完全不同的领域竞争,但从技术参数上来看,它仍然具有一定的吸引力。

如果你想了解关于RTX 40系列的所有新技术和改变,我们建议你参考我们的Nvidia Ada Lovelace架构深度分析文章。上面的规格表已经告诉你了很多你需要知道的信息。与Ampere相比,晶体管数量几乎翻了三倍;RTX 4090的核心数量比RTX 3090 Ti高出52%;GPU时钟速度提高了35%,而GDDR6X内存基本上没有变化,只是现在有了12倍的L2缓存,可以减少GPU从内存中请求数据的次数。

从纸面上看,RTX 4090的计算性能仅略高于RTX 3090 Ti的两倍,而在某些工作负载下,你确实会看到这种性能提升。但在内部,还有其他改进可以进一步拉大差距。

光线追踪再次受到重点关注,三项新技术——着色器执行重排序(SER)、不透明度微贴图(OMM)和位移微网格(DMM)——都提供了潜在的改进。然而,它们也需要开发人员使用,这意味着现有的游戏和引擎不会受益。

深度学习和人工智能工作负载也有望实现巨大的世代性改进。Ada包括Hopper H100中的FP8 Transformer引擎以及FP8数字格式支持。这意味着每个张量核心的计算量增加了一倍,适用于可以使用FP8而不是FP16的算法,以及比3090 Ti多达四倍的数值计算能力。

可以利用新的张量核心的算法之一,以及改进的光流加速器(OFA)的是DLSS 3。实际上,DLSS 3需要一张RTX 40系列的显卡,所以早期的RTX显卡不会受益。DLSS 3是做什么的呢?它获取当前和先前渲染的帧,并生成一个额外的中间帧来填补差距。在某些情况下,它可以几乎将DLSS 2的性能提高一倍。我们将在本文稍后更详细地讨论DLSS 3。

从专业角度来看,特别是对于那些对深度学习感兴趣的人来说,你完全可以为拥有RTX 4090的成本提供充分的理由——时间就是金钱,提高了两倍或四倍的吞吐量肯定会节省时间。内容创作者会发现很多值得喜欢的东西,而且从3090或3090 Ti升级到4090也是一个快速而简便的过程。我们还将查看专业可视化性能。

但对于玩家而言呢?与RTX 3090和3090 Ti不同,Nvidia并没有强调RTX 4090是专为专业人士设计的。是的,对于这样的人来说,它会表现得很出色,但它也是GeForce家族的一部分,Nvidia并没有对其游戏性能的声称和比较保持克制。也许过去两年的加密货币挖掘是罪魁祸首,尽管GPU挖掘现在不再赚钱,所以至少玩家不必为了显卡而与矿工争夺。

总结

RTX 4090显然是一张强大的显卡,它在性能方面无与伦比,尤其是在高分辨率和光线追踪下。对于专业用户和深度学习从业者来说,这张显卡几乎可以被视为一种投资,因为它可以大大提高工作效率。然而,对于普通玩家来说,RTX 4090的性能可能过于强大,而价格也过于昂贵。毕竟,性能和价值是主观的,取决于你的需求和预算。

对于那些寻求最佳性能的游戏玩家,或者对于那些可以轻松支付$2,000的人来说,RTX 4090可能是目前最好的选择。但对于一般用户来说,其他性能更平衡的显卡可能更合适,因为它们提供了更好的性价比。

综上所述,Nvidia的GeForce RTX 4090无疑是一款令人印象深刻的显卡,它在性能和功能方面都堪称一流。然而,它的高价位可能限制了它的受众,只有那些不惜一切代价追求最佳性能的用户才会考虑购买它。

未经允许不得转载:大神网 » Nvidia GeForce RTX 4090测评:性能巅峰的代价

相关推荐

    暂无内容!