Nvidia GeForce RTX 4090测评:性能巅峰的代价

你是否还记得2022年的那个时刻,当Nvidia的CEO黄仁勋在GTC 2022上揭示了GeForce RTX 4090的关键细节?在超过一年的极端GPU价格高涨和短缺之后,$1,599的价格肯定会让很多人失望。这是Nvidia Ada Lovelace架构中的顶级产品,实际上只比RTX 3090的发布价格高出$100,如果这张显卡能够达到Nvidia声称的比RTX 3090 Ti高2倍到4倍的性能水平,毫无疑问会有人愿意付出这个代价。现在,RTX 4090在GPU性能排行榜中占据着1440p和4K的宝座。对于那些追求最快GPU的人来说,价格并不是问题,它现在被认为是最佳显卡之一。

然而,并不是说RTX 4090代表了良好的性价比,这个问题有点主观。如果只看各种GPU每美元所提供的FPS,它在过去十年中的68张显卡中排名垫底。不过,我们的标准排名是使用1080p超级性能,而RTX 4090显然不是为了在1080p上表现出色而设计的。事实上,即使在1440p超级性能游戏时,仍然存在CPU瓶颈的问题。而在4K性能和光线追踪方面,你可以说它可能是性价比最高的显卡之一,这就是我们所说的价值是主观的原因。

再次强调,要拥有RTX 4090显卡,你将付出昂贵的代价,因为基础型号的RTX 4090 Founders Edition售价为$1,599,而合作伙伴显卡的价格可能会高达$1,999。但对于那些追求最佳性能的人,或者对于深度口袋足够宽敞的人来说,这就是你现在想要的显卡,除非未来推出RTX 4090 Ti,否则我们很难看到有任何显卡能够超越它。

当前顶级GPU规格

显卡 RTX 4090 RTX 3090 Ti RTX 3090 RTX 3080 Ti RX 6950 XT Arc A770 16GB
架构 AD102 GA102 GA102 GA102 Navi 21 ACM-G10
工艺技术 TSMC 4N Samsung 8N Samsung 8N Samsung 8N TSMC N7 TSMC N6
晶体管数量 76.3 28.3 28.3 28.3 26.8 21.7
芯片面积(mm²) 608.4 628.4 628.4 628.4 519 406
SMs / CUs / Xe-Cores 128 84 82 80 80 32
GPU着色器 16384 10752 10496 10240 5120 4096
张量核心 512 336 328 320 N/A 512
光线追踪“核心” 128 84 82 80 80 32
增频时钟(MHz) 2520 1860 1695 1665 2310 2100
VRAM速度(Gbps) 21 21 19.5 19 18 17.5
VRAM(GB) 24 24 24 12 16 16
VRAM总线宽度 384 384 384 384 256 256
L2 / Infinity缓存 72 6 6 6 128 16
ROPs 176 112 112 112 128 128
TMUs 512 336 328 320 320 256
TFLOPS FP32 82.6 40 35.6 34.1 23.7 17.2
TFLOPS FP16 (FP8/INT8) 661 (1321) 160 (320) 142 (285) 136 (273) 47.4 138 (275)
带宽(GBps) 1008 1008 936 912 576 560
TDP(瓦特) 450 450 350 350 335 225
发布日期 Oct 2022 Mar 2022 Sep 2020 Jun 2021 May 2022 Oct 2022
发布价格 $1,599 $1,999 $1,499 $1,199 $1,099 $349

这是极限性能显卡世界的佼佼者,涵盖了来自Nvidia、AMD和现在的Intel的最快显卡。显然,Intel的Arc A770在完全不同的领域竞争,但从技术参数上来看,它仍然具有一定的吸引力。

如果你想了解关于RTX 40系列的所有新技术和改变,我们建议你参考我们的Nvidia Ada Lovelace架构深度分析文章。上面的规格表已经告诉你了很多你需要知道的信息。与Ampere相比,晶体管数量几乎翻了三倍;RTX 4090的核心数量比RTX 3090 Ti高出52%;GPU时钟速度提高了35%,而GDDR6X内存基本上没有变化,只是现在有了12倍的L2缓存,可以减少GPU从内存中请求数据的次数。

从纸面上看,RTX 4090的计算性能仅略高于RTX 3090 Ti的两倍,而在某些工作负载下,你确实会看到这种性能提升。但在内部,还有其他改进可以进一步拉大差距。

光线追踪再次受到重点关注,三项新技术——着色器执行重排序(SER)、不透明度微贴图(OMM)和位移微网格(DMM)——都提供了潜在的改进。然而,它们也需要开发人员使用,这意味着现有的游戏和引擎不会受益。

深度学习和人工智能工作负载也有望实现巨大的世代性改进。Ada包括Hopper H100中的FP8 Transformer引擎以及FP8数字格式支持。这意味着每个张量核心的计算量增加了一倍,适用于可以使用FP8而不是FP16的算法,以及比3090 Ti多达四倍的数值计算能力。

可以利用新的张量核心的算法之一,以及改进的光流加速器(OFA)的是DLSS 3。实际上,DLSS 3需要一张RTX 40系列的显卡,所以早期的RTX显卡不会受益。DLSS 3是做什么的呢?它获取当前和先前渲染的帧,并生成一个额外的中间帧来填补差距。在某些情况下,它可以几乎将DLSS 2的性能提高一倍。我们将在本文稍后更详细地讨论DLSS 3。

从专业角度来看,特别是对于那些对深度学习感兴趣的人来说,你完全可以为拥有RTX 4090的成本提供充分的理由——时间就是金钱,提高了两倍或四倍的吞吐量肯定会节省时间。内容创作者会发现很多值得喜欢的东西,而且从3090或3090 Ti升级到4090也是一个快速而简便的过程。我们还将查看专业可视化性能。

但对于玩家而言呢?与RTX 3090和3090 Ti不同,Nvidia并没有强调RTX 4090是专为专业人士设计的。是的,对于这样的人来说,它会表现得很出色,但它也是GeForce家族的一部分,Nvidia并没有对其游戏性能的声称和比较保持克制。也许过去两年的加密货币挖掘是罪魁祸首,尽管GPU挖掘现在不再赚钱,所以至少玩家不必为了显卡而与矿工争夺。

总结

RTX 4090显然是一张强大的显卡,它在性能方面无与伦比,尤其是在高分辨率和光线追踪下。对于专业用户和深度学习从业者来说,这张显卡几乎可以被视为一种投资,因为它可以大大提高工作效率。然而,对于普通玩家来说,RTX 4090的性能可能过于强大,而价格也过于昂贵。毕竟,性能和价值是主观的,取决于你的需求和预算。

对于那些寻求最佳性能的游戏玩家,或者对于那些可以轻松支付$2,000的人来说,RTX 4090可能是目前最好的选择。但对于一般用户来说,其他性能更平衡的显卡可能更合适,因为它们提供了更好的性价比。

综上所述,Nvidia的GeForce RTX 4090无疑是一款令人印象深刻的显卡,它在性能和功能方面都堪称一流。然而,它的高价位可能限制了它的受众,只有那些不惜一切代价追求最佳性能的用户才会考虑购买它。

本文由作者 王大神 原创发布于 大神网的AI博客。

转载请注明作者:王大神

原文出处:Nvidia GeForce RTX 4090测评:性能巅峰的代价

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 2023年10月22日
下一篇 2023年10月22日

相关推荐

  • 盘点十大科技公司:科技巨头的辉煌与竞争

    在当今数字化的时代,科技公司扮演着至关重要的角色,推动着社会的变革和创新。这些科技巨头不仅在全球范围内拥有巨大的影响力,还在科技领域取得了辉煌的成就。本文将盘点十大科技公司,深入探讨它们的历程、业务…

    2023年12月27日
    00
  • 用audioFlux进行音频和音乐分析的深度学习工具教程

    故事开始于一个寂静的夜晚,你坐在电脑前,渴望探索音频和音乐的奥秘。你听说了一款强大的工具,名为audioFlux,它是一个深度学习工具库,专为音频和音乐分析以及特征提取而设计。在这篇教程中,我们将一起探索如何…

    2023年9月19日
    00
  • 如何在你的计算机上安装 PyTorch 以及 CUDA 11.0

    嗨,大家好!你是否曾经想要深入学习机器学习和人工智能,但却在安装PyTorch和CUDA方面感到困惑?别担心,我将带你一步一步完成这个过程。 在过去的几年里,PyTorch已经成为了深度学习领域的瑰宝。而CUDA,NVIDIA的…

    2023年9月17日
    00
  • ChatGPT 4.0解密:一个月多少钱才能畅聊?

    你是否曾经梦想过能够与一台超级聪明的人工智能对话,寻找答案,解决问题,或者只是闲聊?随着科技的不断进步,这一梦想正逐渐变成现实。开智AI推出的ChatGPT 4.0,正是这个领域的最新巅峰。但问题来了,这个AI大脑…

    2023年10月24日
    00
  • Python与人工智能之路:探索背后的不解之缘

    在一个寒冷的冬夜,我坐在电脑前,通过键盘与屏幕之间的互动,探索着人工智能的奥秘。这个场景对于许多编程爱好者来说并不陌生。他们通过编程语言,如同掌握了一种魔法,能够创造出智能的程序,让机器能够理解人类…

    2024年3月11日
    00
  • 教程:加速你的深度学习训练 – 使用? Accelerate

    你是否曾经为在不同设备上运行PyTorch训练脚本而感到烦恼?是否厌烦了编写和维护与多GPU/TPU/fp16相关的样板代码?如果是的话,那么你来对地方了。本教程将介绍如何使用? Accelerate来轻松、高效、灵活地加速你的深…

    2023年9月19日
    00
  • PyTorch与Keras:深度学习框架的选择之争

    深度学习已经成为人工智能领域的热门话题,而选择适合的深度学习框架对于项目的成功至关重要。在众多深度学习框架中,PyTorch和Keras都备受欢迎,它们各有优势。在本文中,我们将深入探讨PyTorch和Keras的特点,帮…

    2023年10月6日
    00
  • 如何理解苹果A17芯片及其性能表现

    苹果一直以来都是硬件领域的佼佼者,其自家研发的芯片也备受关注。最近,苹果发布了他们的最新一代芯片,A17。然而,有人对这款芯片的性能表现提出了质疑,认为它“翻车”了。在本文中,我们将深入探讨苹果A17芯片以…

    2023年10月19日
    00
  • iPhone SE 4:小屏巨变,中端市场新王者?

    每当新款iPhone发布,我们都知道,为期一年的猜测和期待就会开始。但今年的情况有些不同,因为有关明年iPhone SE 4的消息早早地传开了。今天,我们不再谈论iPhone 16,而是聚焦于小屏手机用户期待已久的iPhone SE 4…

    2023年12月8日
    00
  • 优化 VS Code:通过名称混淆缩减代码大小

    大家好!你有没有使用过 Visual Studio Code(简称 VS Code)?如果你是一名开发人员,那么你很可能使用过这款流行的开源代码编辑器。在这篇文章中,我将分享 VS Code 团队如何通过名称混淆技术将其 JavaScript 代…

    2023年9月19日
    00