你是否还记得2022年的那个时刻,当Nvidia的CEO黄仁勋在GTC 2022上揭示了GeForce RTX 4090的关键细节?在超过一年的极端GPU价格高涨和短缺之后,$1,599的价格肯定会让很多人失望。这是Nvidia Ada Lovelace架构中的顶级产品,实际上只比RTX 3090的发布价格高出$100,如果这张显卡能够达到Nvidia声称的比RTX 3090 Ti高2倍到4倍的性能水平,毫无疑问会有人愿意付出这个代价。现在,RTX 4090在GPU性能排行榜中占据着1440p和4K的宝座。对于那些追求最快GPU的人来说,价格并不是问题,它现在被认为是最佳显卡之一。
然而,并不是说RTX 4090代表了良好的性价比,这个问题有点主观。如果只看各种GPU每美元所提供的FPS,它在过去十年中的68张显卡中排名垫底。不过,我们的标准排名是使用1080p超级性能,而RTX 4090显然不是为了在1080p上表现出色而设计的。事实上,即使在1440p超级性能游戏时,仍然存在CPU瓶颈的问题。而在4K性能和光线追踪方面,你可以说它可能是性价比最高的显卡之一,这就是我们所说的价值是主观的原因。
再次强调,要拥有RTX 4090显卡,你将付出昂贵的代价,因为基础型号的RTX 4090 Founders Edition售价为$1,599,而合作伙伴显卡的价格可能会高达$1,999。但对于那些追求最佳性能的人,或者对于深度口袋足够宽敞的人来说,这就是你现在想要的显卡,除非未来推出RTX 4090 Ti,否则我们很难看到有任何显卡能够超越它。
当前顶级GPU规格
显卡 | RTX 4090 | RTX 3090 Ti | RTX 3090 | RTX 3080 Ti | RX 6950 XT | Arc A770 16GB |
---|---|---|---|---|---|---|
架构 | AD102 | GA102 | GA102 | GA102 | Navi 21 | ACM-G10 |
工艺技术 | TSMC 4N | Samsung 8N | Samsung 8N | Samsung 8N | TSMC N7 | TSMC N6 |
晶体管数量 | 76.3 | 28.3 | 28.3 | 28.3 | 26.8 | 21.7 |
芯片面积(mm²) | 608.4 | 628.4 | 628.4 | 628.4 | 519 | 406 |
SMs / CUs / Xe-Cores | 128 | 84 | 82 | 80 | 80 | 32 |
GPU着色器 | 16384 | 10752 | 10496 | 10240 | 5120 | 4096 |
张量核心 | 512 | 336 | 328 | 320 | N/A | 512 |
光线追踪“核心” | 128 | 84 | 82 | 80 | 80 | 32 |
增频时钟(MHz) | 2520 | 1860 | 1695 | 1665 | 2310 | 2100 |
VRAM速度(Gbps) | 21 | 21 | 19.5 | 19 | 18 | 17.5 |
VRAM(GB) | 24 | 24 | 24 | 12 | 16 | 16 |
VRAM总线宽度 | 384 | 384 | 384 | 384 | 256 | 256 |
L2 / Infinity缓存 | 72 | 6 | 6 | 6 | 128 | 16 |
ROPs | 176 | 112 | 112 | 112 | 128 | 128 |
TMUs | 512 | 336 | 328 | 320 | 320 | 256 |
TFLOPS FP32 | 82.6 | 40 | 35.6 | 34.1 | 23.7 | 17.2 |
TFLOPS FP16 (FP8/INT8) | 661 (1321) | 160 (320) | 142 (285) | 136 (273) | 47.4 | 138 (275) |
带宽(GBps) | 1008 | 1008 | 936 | 912 | 576 | 560 |
TDP(瓦特) | 450 | 450 | 350 | 350 | 335 | 225 |
发布日期 | Oct 2022 | Mar 2022 | Sep 2020 | Jun 2021 | May 2022 | Oct 2022 |
发布价格 | $1,599 | $1,999 | $1,499 | $1,199 | $1,099 | $349 |
这是极限性能显卡世界的佼佼者,涵盖了来自Nvidia、AMD和现在的Intel的最快显卡。显然,Intel的Arc A770在完全不同的领域竞争,但从技术参数上来看,它仍然具有一定的吸引力。
如果你想了解关于RTX 40系列的所有新技术和改变,我们建议你参考我们的Nvidia Ada Lovelace架构深度分析文章。上面的规格表已经告诉你了很多你需要知道的信息。与Ampere相比,晶体管数量几乎翻了三倍;RTX 4090的核心数量比RTX 3090 Ti高出52%;GPU时钟速度提高了35%,而GDDR6X内存基本上没有变化,只是现在有了12倍的L2缓存,可以减少GPU从内存中请求数据的次数。
从纸面上看,RTX 4090的计算性能仅略高于RTX 3090 Ti的两倍,而在某些工作负载下,你确实会看到这种性能提升。但在内部,还有其他改进可以进一步拉大差距。
光线追踪再次受到重点关注,三项新技术——着色器执行重排序(SER)、不透明度微贴图(OMM)和位移微网格(DMM)——都提供了潜在的改进。然而,它们也需要开发人员使用,这意味着现有的游戏和引擎不会受益。
深度学习和人工智能工作负载也有望实现巨大的世代性改进。Ada包括Hopper H100中的FP8 Transformer引擎以及FP8数字格式支持。这意味着每个张量核心的计算量增加了一倍,适用于可以使用FP8而不是FP16的算法,以及比3090 Ti多达四倍的数值计算能力。
可以利用新的张量核心的算法之一,以及改进的光流加速器(OFA)的是DLSS 3。实际上,DLSS 3需要一张RTX 40系列的显卡,所以早期的RTX显卡不会受益。DLSS 3是做什么的呢?它获取当前和先前渲染的帧,并生成一个额外的中间帧来填补差距。在某些情况下,它可以几乎将DLSS 2的性能提高一倍。我们将在本文稍后更详细地讨论DLSS 3。
从专业角度来看,特别是对于那些对深度学习感兴趣的人来说,你完全可以为拥有RTX 4090的成本提供充分的理由——时间就是金钱,提高了两倍或四倍的吞吐量肯定会节省时间。内容创作者会发现很多值得喜欢的东西,而且从3090或3090 Ti升级到4090也是一个快速而简便的过程。我们还将查看专业可视化性能。
但对于玩家而言呢?与RTX 3090和3090 Ti不同,Nvidia并没有强调RTX 4090是专为专业人士设计的。是的,对于这样的人来说,它会表现得很出色,但它也是GeForce家族的一部分,Nvidia并没有对其游戏性能的声称和比较保持克制。也许过去两年的加密货币挖掘是罪魁祸首,尽管GPU挖掘现在不再赚钱,所以至少玩家不必为了显卡而与矿工争夺。
总结
RTX 4090显然是一张强大的显卡,它在性能方面无与伦比,尤其是在高分辨率和光线追踪下。对于专业用户和深度学习从业者来说,这张显卡几乎可以被视为一种投资,因为它可以大大提高工作效率。然而,对于普通玩家来说,RTX 4090的性能可能过于强大,而价格也过于昂贵。毕竟,性能和价值是主观的,取决于你的需求和预算。
对于那些寻求最佳性能的游戏玩家,或者对于那些可以轻松支付$2,000的人来说,RTX 4090可能是目前最好的选择。但对于一般用户来说,其他性能更平衡的显卡可能更合适,因为它们提供了更好的性价比。
综上所述,Nvidia的GeForce RTX 4090无疑是一款令人印象深刻的显卡,它在性能和功能方面都堪称一流。然而,它的高价位可能限制了它的受众,只有那些不惜一切代价追求最佳性能的用户才会考虑购买它。
未经允许不得转载:大神网 » Nvidia GeForce RTX 4090测评:性能巅峰的代价