NVIDIA GeForce RTX 4090 是英伟达于 2022 年 9 月 20 日面向台式电脑推出的旗舰级显卡模块,并于 2022 年 10 月 12 日(北京时间)正式上市 。该产品市场定位主要聚焦于游戏以及内容创作领域,具备强大的性能与先进的技术特性,在行业内占据重要地位。
RTX 4090 基于全新的 Ada Lovelace 架构打造,内部集成了多达 760 亿个晶体管 。其搭载的 AD102 核心,拥有 16384 个 CUDA 核心数量,为图形处理和复杂计算任务提供了坚实的硬件基础 。在 GPU 频率方面,基础频率达到 2235MHz,GPU Boost 频率更是高达 2520MHz(部分非公版这一参数会更高) 。如此高的频率使得显卡在数据处理速度上远超前代产品,例如相较于上一代 GA102 核心的 1560MHz 基础频率以及 RTX 3090 Ti 的 1860MHz Boost 频率,RTX 4090 的频率优势明显,能够更快地对图形数据进行处理和渲染 。
在光线追踪技术应用上,RTX 4090 搭载了第三代光线追踪核心 。这一核心在多个方面进行了升级,如引入 Opacity Micromap(不透明微图单元),在拥有 alpha 通道的几何图形中,遍历性能提高了一倍,设计人员得以更自由地丰富场景细节,提升画面逼真度;还有 Displaced Micro - Mesh Engine(置换微网络引擎,DMME),面对复杂曲面,通过特殊方式表达三角形平面,使得复杂物体渲染时 BVH 的构建速度可超 15 倍,存储空间需求缩小 20 倍;另外,Shader Execution Reordering(着色器执行重排序,SER)可在光线追踪算法出现分歧时,重新调度着色器工作排序,在《赛博朋克:2077》的 RT:Overdriver 模式下运行时,带来了 44% 的效能改善 。
第四代张量核心的配备,让 RTX 4090 在 AI 图形处理上更进一步 。相比 Ampere 架构,它带来了 2 倍的 FP16、BF16、TF32、INT8、INT4 张量性能,还加入了 Hopper 架构独有的 FP8 Transformer 引擎,具备最高超过 1.3 千万亿次的张量处理能力 。这使得显卡在深度学习、AI 加速等方面表现卓越,尤其在当下热门的生成式 AI 应用以及 DLSS(深度学习超级采样)技术中发挥关键作用 。
在显存方面,RTX 4090 配备了 24GB GDDR6X 显存,显存位宽为 384bit 。高速的显存能够快速读取和存储大量图形数据,保障了在高分辨率、高画质游戏以及复杂图形创作任务中,显卡不会因为显存带宽不足或容量不够而出现性能瓶颈 。例如在运行 4K 甚至 8K 分辨率的大型 3A 游戏时,能够流畅加载游戏场景与纹理,避免卡顿现象 。