RTX 4070 Ti SUPER显卡首测:16G/256bit显存不惧4K游戏

不久前,NVIDIA曾预告RTX 40系显卡将推出三位新成员,分别RTX 4070 SUPER、RTX 4070 Ti SUPER以及RTX 4080 SUPER。这是自RTX 20系之后以SUPER后缀命名的显卡再次登场,说明SUPER并不是只为RTX 20推出的“临时工”系列。

根据一个礼拜之前首先解禁发售的RTX 4070 SUPER的表现,证实了SUPER将延续它一开始的属性——加量不加价,以几乎等同原版型号的售价,提供更出色的性能。

如此这般,SUPER势必成为往后每一代NVIDIA显卡序列中玩家最期待的名字,后话暂且不表,RTX 40系SUPER的精彩在继续——RTX 4070 Ti SUPER的首发售价6499元,跟一年前RTX 4070 Ti的首发售价一样,今晚我们迎来这款显卡发售以及性能评测的解禁。

笔者一开始以为在GeForce显卡的后缀名称中SUPER的定义与Ti类似,它们是相对唯一的,不重叠的。现在RTX 4070 Ti SUPER的出现说明它们确实有不同的定义,互相不冲突,SUPER可以出现在Ti的后面。就像上文提到的,SUPER可视作加量不加价的标志,Ti作为即有型号当然也可以贴上这个标志。

与RTX 4070 SUPER不同的是,这次NVIDIA没有为RTX 4070 Ti SUPER推出Founder's Edition(公版,简称FE版),这一点似乎与RTX 4070 Ti是对应的,后者也没有FE版。于是我们第一时间收到的RTX 4070 Ti SUPER产品是影驰的RTX 4070 Ti SUPER大将,符合MSRP标准(即售价和频率参数符合NVIDIA默认标准),由它来代表NVIDIA官方标准完成本次首发评测。

游戏与创作双修

对于游戏玩家而言,和其它RTX 40系列显卡一样,DLSS 3/DLSS 3.5依然是SUPER显卡的核心卖点,包含超分辨率、帧生成技术、光线重建和NVIDIA Reflex。

DLSS3专属的Freme Generation(帧生成技术)可以将光流预估和DLSS相结合,在现有帧之间插入精确的合成帧,由较少的原始像素渲染量输出成倍的帧画面,实现帧数“翻倍”提升,让玩家获得更流畅的游戏体验。

而DLSS 3.5则引入的Ray Reconstruction(光线重建)是专为“光线”开发的一套AI模型,它将需要人工设计的降噪器,替换为NVIDIA超级计算机训练的AI网络,通过高达原来5倍的训练量,使采样光线之间生成更高质量的像素,获得更贴近真实的光影视觉体验。

需要RTX显卡的人不再限于游戏用户

自基于Volta架构的TITAN V开始,NVIDIA就算正式开始了在AI计算领域的布局,具体表现在首次集成在GPU内核中的张量计算单元——Tensor。专用于半精度、乃至四分之一精度海量并行计算能力的Tensor Core就是为AI量身打造的利器,无论是在游戏应用领域的还是AI创作领域,Tensor Core都是支撑其运行的核心硬件基础。

除了游戏以外,最近两年GPU在AI计算领域的应用如火如荼,整合Tensor core的NVIDIA桌面端显卡让AI应用进入千家万户。

NVIDIA专为生成式AI在GPU上的高性能推理、训练推出了TensorRT For Windows的SDK,无需一定要购买像H100那样昂贵的专业AI计算卡,广大普通用户也可以轻易使用GeForce RTX显卡为AI加速。调用NVIDIA GPU中的Tensor core,根据训练的模型条件,迅速推理生成想要的图像、帧画面,极大提高创作效率。

本次评测除了例行的游戏测试之外,也还将为用户展示RTX 40系显卡在AI创作领域的一些典型应用。

规格参数解析

完全在意料之中,RTX 4070 Ti SUPER显卡搭载的是AD103族系的芯片,因为它的原版型号RTX 4070 Ti采用的AD104-400芯片已经顶格,没有再往上发展的空间,RTX 4070 Ti SUPER只能基于于RTX 4080的芯片族系,它的GPU具体型号为AD103-275,后者为AD103-300。

显然RTX 4080也不是顶格的,在它之上应该有更高规格的AD103芯片——RTX 4080 SUPER?这非本文的话题,留到RTX 4080 SUPER评测中再探讨吧。


AD103-300架构示意图(RTX 4080)

RTX 4080的AD103-300芯片有7个GPC,相比之下RTX 4070 Ti SUPER的AD103-275削减了其中一组包含5个TPC的GPC,减少了10个SM流式多处理器。由于每个SM内建128个SP32单元,即RTX 4070 Ti SUPER比4080少了1280个CUDA,为8448个。


AD103-275架构示意图(RTX 4070 Ti SUPER)

GPC中包含的10个光追单元、16个ROPs、40个Tensor core和40个纹理单元也也相应减去,但令人欣喜的是显存规格完整的保留了下来——拥有8×32bit=256bit显存接口,配备16GB GDDR6X高速显存,与RTX 4080的配置一样。


AD103-275核心实拍照片

保留RTX 4080的显存规格意味着RTX 4070 Ti SUPER对高分辨率高画质贴图具有较强的负荷能力,游戏游戏可以用更高的画质,并可能在大多数游戏下胜任4K分辨率,尤其是那些支持DLSS3的游戏。

此外,AI推理和训练对显存容量、吞吐量的要求很高,显存的变化对性能影响可以为说立竿见影,可以预见RTX 4070 Ti SUPER显卡会比RTX 4070 Ti明显出色的表现。

其余细微参数不再文字赘述,可在规格对比表中自行查阅:

另外功耗方面值得一提:RTX 4070 Ti SUPER虽然跟RTX 4080的亲兄弟,但TGP比后者低不少,跟它的原版型号RTX 4070 Ti几乎一样,仅仅多5W,可谓加性能不加电费。

影驰RTX 4070 Ti SUPER大将介绍赏析

影驰大将一直是业内最具性价比的显卡系列,坚实可靠的散热加恰到实处的PCB做工用料,以及经济实惠的售价,再加上虽不十分精致,但也不令人讨厌的外观,它是广大玩家手头吃紧时的最优选择。

影驰RTX 4070 Ti SUPER大将是这次以6499元起步价开售的型号之一,性能与官方标准吻合。

不含挡板长宽厚分别是321mm、125mm和61mm,体型属于中等偏上,可以兼容当前几乎所有中塔机箱和大部分支持长显卡的小钢炮机箱,采用星炙散热器的三风扇布局,配备三个直径9cm风扇。


“GALAX”字样的影驰Logo位于侧脊上,是该显卡唯一的RGB灯光点缀


厚度不小,挡板为叁槽规格,输出接口为3个DP1.4a和一个HDMI2.1

下面是显卡运行状态的灯光图赏:

测试平台软硬件介绍

本次测试选用9款游戏充分全面考察这款影驰RTX 4070 Ti

SUPER 大将的性能,并且与它近邻的RTX 4080以及原版型号RTX 4070 Ti做对比。其中2款游戏支持最新的DLSS3.5,也就是光线重建,另外5款支持DLSS3,最后两款则分别考察DLSS2和非DLSS游戏的表现,尽可能覆盖各种玩家的各种应用范围。

测试平台软硬件配置如下:

值得一提的是,鉴于AMD最近发布的Ryzen 7000系列X3D处理器在游戏方面的优异表现(大部分超过了Intel i9 13900K),本次首测采用目前游戏测试中最为亮眼的Ryzen 7 7800X3D作为测试平台。

为确保Ryzen 7 7800X3D处理器性能稳定发挥,测试平台选用微星MEG X670E ACE主板,这是该芯片组产品中的准旗舰型号,仅次于GODLIKE。这款主板的BIOS还针对X3D处理器做了优化,为CPU和内存都提供了一些高性能预设参数,期待参加测试的这些显卡都能发挥出不同以往的表现。

3DMARK基准测试

首先是3DMARK基准测试,API涵盖DX11、DX12以及DX12 Ultimate,分辨率包括2K与4K,图形技术涵盖光线追踪与DLSS。

通过3DMARK跑分可以初步看出,RTX 4070 Ti SUPER的性能刚好位于RTX 4080与4070 Ti的中间位置,而RTX 4070 Ti与4070 SUPER的性能则比较接近。

DLSS3.5游戏-《赛博朋克2077》测试

《赛博朋克2077》自带Benchmark程序,并且支持DLSS3.5的光线重建技术,测试将分为关闭DLSS、打开DLSS3(帧生成)以及打开DLSS3/3.5(帧生成)的三种状态下运行,考察DLSS3的效能以及光线重建对性能和画面的影响。

由于《赛博朋克2077》的Benchmark驱使的硬件运行状态有不稳定性,所以测试结果可能出现倒挂,或者逻辑异常的情况,数据仅供参考。

DLSS开和关完全是两个游戏,尤其是2K和1080P直接从入门帧率变为畅爽。可能是测试程序不稳定的缘故,亦或者跟一些非开放的画面设置参数有关,开启光线重建有些时候会提升帧率,有些时候又会降低帧率。不过无论帧率如何,对光追视觉效果的提升是始终一致的。

下面为《赛博朋克2077》DLSS3.5光线重建开和关的画质对比:


《赛博朋克2077》


《赛博朋克2077》


DLSS3.5游戏-《心灵杀手2》测试

《心灵杀手2》没有自带的Benchmark程序,选择游戏开始时主角进入树林中调查,并从树林走到湖边的一段负载较高的路径来测试。

结果与《赛博朋克2077》类似,DLSS开与不开完全是两个游戏。而且由于该游戏在非DLSS状态下会默认打开DLAA,不但全分辨率像素渲染还额外消耗性能,此时变成了一个不折不扣的硬件杀手,即使是1080P下帧率也是不可接受的。所以运行该游戏必须开启DLSS,而DLSS3.5的光线重建能够进一步改善帧率,同时优化光追视觉体验。

注意到在4K分辨率下DLSS3测试,12G显存的RTX 4070 Ti、4070 SUPER与16G显存的RTX 4070 Ti SUPER、4080呈现断崖式差距,应该是显存容量瓶颈限制了前两者发挥。相比定位2K分辨率游戏的4070 SUPER和4070 Ti,拥有与4080相同显存的4070 TI SUPER彰显出它面对4K游戏的能力,通常一款显卡所定位的游戏分辨率很大程度上与显存配置有关。

下面为《心灵杀手2》DLSS3.5光线重建开和关的画质对比:


《心灵杀手2》


《心灵杀手2》


《心灵杀手2》

通过开启DLSS光线重建(DLSS 3.5)与关闭DLSS光线重建(DLSS 3)的画面效果对比不难看出,在开启光线重建之后,总体来说游戏的图像变得更加清晰,细节更为丰富,同时重影更少,并且在光线条件发生剧烈变化时响应更快,整体游戏体验变得更加逼真,代入感更强。

DLSS3游戏-《F1 22》测试

《F1 22》运行游戏自带的Benchmark程序就好

作为赛车类游戏本身对帧率要求就低,游戏优化又非常理想,RTX 4070 Ti SUPER可无压力用4K得到极致体验。

DLSS3游戏-《瘟疫传说:安魂曲》测试

游戏没有测试程序,用第一章节跑步到城堡遗迹下的路程来测试。

RTX 4070 Ti SUPER开启DLSS3后4K分辨率仍有流畅之力。

DLSS3游戏-《霍格沃茨之异》测试

游戏不自带测试程序,利用轨道车上的一段自动路径来测试。

游戏对DLSS3的优化非常好,四款显卡从1080P到4K都是通杀的。

热门相关:扑倒老公大人:龙总,我爱你!   重生隐婚:Hi,高冷权少!   唐土万里   顺明   顺明