计划于12月发布的nvidia的新rtx 6000 ada generation将加入其工作站gpu系列:rtx a6000,rtx a5500和rtx a5000。在nvidia的gtc 2022大会上宣布,以及geforce rtx 4080和4090,据说rtx 6000 ada相比其前身a6000可以提供高达4倍的性能提升。
虽然某些规格和定价仍然不详,但我们将讨论有关这款gpu从图形领域的“王者”中了解到的一切,包括它是否对您来说是一个明智的升级选择。
rtx 6000:概述
rtx 6000主要用于专业工作流程,如内容创作,模拟和gpu渲染,它是基于nvidia的新ada lovelace架构的首款工作站gpu。与他们的geforce rtx 40系列一样,该架构提供了第三代rt核心和第四代tensor核心,据称其吞吐量至少是上一代的2倍。
rt核心旨在加速光线追踪运动模糊的渲染,以及相关工作负载。这些工作负载包括渲染电影内容和建筑设计。同时,tensor核心提供更快的ai计算,例如执行混合浮点和整数计算。
除了模拟和内容创作,rtx 6000还为数据科学带来了巨大的好处,因为其庞大的48 gb ddr6内存使用户能够轻松处理大规模数据集。由于第四代pcie支持,rtx 6000还与最新的amd和intel cpu完全兼容。
与所有基于lovelace架构的gpu一样,rtx 6000还采用了dlss 3,也称为dlss frame generation。这项技术通过使用ai构建全新的帧,而不仅仅是像素来改进了dlss2。它分析旧帧和生成的帧之间的差异,以确定场景的变化。
nvidia rtx a6000
$4,106.00
- 基于nvidia ampere架构的cuda核心 – 单精度浮点(fp32)运算的双倍处理速度和提高的功耗效率提供了显著的性能改进…
- 第二代rt核心 – 比上一代的吞吐量提高了2倍,并且能够同时运行光线追踪和着色或去噪功能,第二代…
- 第三代tensor核心 – 新的tensor float 32(tf32)精度相比上一代提供了高达5倍的训练吞吐量,加速了ai和数据科学模型的训练,无需…
- 第三代nvidia nvlink – 增加的gpu到gpu互连带宽提供了一个可扩展的内存,加速图形和计算工作负载,并处理更大的数据集。
- 48千兆字节(gb)的gpu内存 – 超快的gddr6内存,通过nvlink可扩展到96 gb,为数据科学家,工程师和创意专业人员提供了处理…
在亚马逊上购买
如果您购买,我们将获得佣金,不会额外收费。
这允许以更低的分辨率生成更清晰的图像。虽然还没有关于这将如何有益于专业使用的官方消息,但在诸如计算机辅助设计(cad)等应用中,它可能具有积极的影响,因为这些过程通常受cpu的限制。
就定价而言,还没有得到确认的消息,但我们可以期待为这款gpu支付一大笔钱,因为即使前一款rtx a6000 gpu的零售价格仍在5000美元左右。考虑到ada系列gpu相对于其前任ampere gpu的普遍价格增加,rtx 6000很可能会有一个比a6000更高的巨大成本。
nvidia的工作站gpu:并排比较
rtx 6000 | rtx a6000 | rtx a5500 | rtx a5000 | |
---|---|---|---|---|
架构 | ada lovelace | ampere | ampere | ampere |
cuda核心 | 18,176 | 10,752 | 10,240 | 8,192 |
tensor核心 | 568 | 336 | 320 | 256 |
rt核心 | 142 | 84 | 80 | 64 |
gpu内存 | 48gb gddr6 | 48gb gddr6 | 24gb gddr6 | 24gb gddr6 |
图形总线 | pcie 4.0 x16 | pcie 4.0 x16 | pcie 4.0 x16 | pcie 4.0 x16 |
tdp | 300w | 300w | 230w | 230w |
尺寸 | 4.4英寸 x 10.5英寸 双槽 | 4.4英寸 x 10.5英寸 双槽 | 4.4英寸 x 10.5英寸 双槽 | 4.4英寸 x 10.5英寸 双槽 |
从表中可以看出,有几个参数保持不变,如尺寸、功耗、pci支持和内存,因此像数据传输速度和3d渲染这样的因素将不会有任何改进。然而,cuda核心、tensor核心和rt核心的数量几乎是a6000的两倍。
这就是为什么我们预计在几乎所有的专业应用中都会看到显著的改进,而不会增加尺寸或功耗,这绝对是一个巨大的优势。
性能提升主要会在工作站进行多个计算以及动态调整计算的情况下显现出来。这些包括3d cad和cae(计算机辅助工程),以及虚拟原型设计和复杂内容创作。
rtx 6000与rtx 40系列相比如何?
rtx 6000 | rtx 4080 | rtx 4090 | |
---|---|---|---|
架构 | ada lovelace | ada lovelace | ada lovelace |
cuda核心 | 18,176 | 9,728 | 16,384 |
tensor核心 | 568 | 304 | 576 |
rt核心 | 142 | 76 | 144 |
gpu内存 | 48gb gddr6 | 16gb gddr6x | 24gb gddr6x |
tdp | 300w | 320w | 450w |
cuda核心是最大的不同之处
nvidia geforce rtx 4090
$2,129.99
- 具有16,384个nvidia cuda核心
- 支持4k 120hz hdr,8k 60hz hdr
- 高达2倍的性能和功率效率
- 第四代tensor核心,提供2倍的ai性能
- 第三代rt核心
- ai加速性能:nvidia dlss 3
- nvidia reflex低延迟平台
在亚马逊购买
如果您购买,我们将获得佣金,且不需额外费用。
一目了然,尽管rtx 40系列与rtx 6000基于相同的架构,但规格的几乎所有其他方面都不同。虽然rtx 4090的张量核心和rt核心的数量略多,但cuda核心数量的大幅增加将显著提高性能和精度,尤其适用于多线程应用程序。
rtx 6000的预期用途在很大程度上依赖于多线程应用程序,例如内容创作、cad、cae和仿真,而设计rtx 40 gpu时则以游戏运行为目标,而游戏往往主要依赖单线程。
虽然rtx 6000的时钟速度可能低于rtx 40对应产品,但功耗也较低,这意味着实现的功率效率将会更好,尤其考虑到更高的核心数量。这将吸引专业人士,他们可能会遇到繁重的工作负载和使用需求。
gddr6与gddr6x:哪个更好?
对于所有基于ada的gpu,内存也是一个值得讨论的问题。由于gddr6x内存在技术上优于gddr6内存,可以说rtx 40系列在这方面更胜一筹。然而,大多数游戏可以在4k分辨率下使用gddr5和标准gddr6内存运行。因此,对于游戏玩家来说,gddr6x可能有点过剩。
虽然gddr6x在理论上提供了更高的渲染效率,但工作流通常受到其gpu的整体图形内存的限制。这是因为渲染比标准游戏使用更多的内存。因此,rtx 6000提供的48gb内存在诸如视频编辑等繁重应用程序中将比较小量的gddr6x内存更加有用。
rtx 6000适用于谁?
一般来说,游戏玩家不太可能从升级他们的系统到最新的rtx 6000中获得太多好处。这主要是因为即使是较新的游戏很少使用超过12gb的显存。考虑到这一点,rtx 4080和4090分别提供的16gb和24gb将足以处理甚至最高分辨率下的游戏。
时钟速度也是游戏性能的一个重要因素,与rtx 40系列相比,rtx 6000很可能较低。游戏也往往是大多数单线程应用程序,因此没有rtx 6000提供的额外核心也不会对性能造成太大影响。
然而,rtx 6000在专业和企业工作流程中将会表现出色。特别是那些涉及cad、cae、复杂视频编辑、内容创作以及利用人工智能的虚拟工作站和远程计算。
这些应用程序主要是多线程和图形复杂的,因此其性能和准确性将受到cuda核心数量的增加和巨大的gpu总内存的极大增强的影响,正如先前讨论的一样。特别是视频编辑将大大受益,因为据报道rtx 6000的视频编码性能是rtx a6000的3倍。
如果你正在寻找下一款工作站gpu,其中效率和精度不能妥协,那么rtx 6000应该在你的视野中,尤其是如果你是nvidia现有工作站gpu的粉丝。