使命召唤9配置(使命召唤9剧情深度解析)

嗨,我是易图科技。投稿人:快乐胖屋KiyoshimoriNVIDIA于9月20日召开新闻发布会,发布最新的阿达·洛芙莱斯游戏卡。首批产品包括RTX4090、RT

嗨,我是易图科技。投稿人:快乐胖屋Kiyoshimori

NVIDIA于9月20日召开新闻发布会,发布最新的阿达·洛芙莱斯游戏卡。首批产品包括RTX4090、RTX4080 16GB、RTX4080 12GB,国行MSRP分别为12999元、9499元、7199元。规模和价格引起了很多争议。主要问题集中在两个方面。一个是AD104内核,192bit内存位宽的RTX4080到底叫不叫“80”,另一个是这个定价面对海量矿卡的冲击有些底气不足。产品力能否支撑这个定价还存疑。但是,距离两兄弟的RTX4080发布还有一个多月的时间。目前关于他们的信息还是比较少的。相对于4080的质疑,人们对4090的评价还是比较正面的。今天我们就来看看刚刚解禁的RTX4090。

使命召唤9配置(使命召唤9剧情深度解析)插图

架构

在发布之前,有一些爆料称阿达·洛芙莱斯会使用类似于Hopper计算卡的SM架构(FP64除外),即一个SM包含两个FP32、一个INT32和一个FP16:

使命召唤9配置(使命召唤9剧情深度解析)插图(1)

但实际上,阿达·洛芙莱斯的SM内部架构与安培基本相同,依然采用FP32+FP32/INT32的双通道流处理器设计。

使命召唤9配置(使命召唤9剧情深度解析)插图(2)

使命召唤9配置(使命召唤9剧情深度解析)插图(3)

其实这种设计很像CPU上的执行端口。通过拓宽后端执行架构,可以实现更高的IPC性能,同时避免单元重复放置造成的晶体管浪费。从这个角度来看,安培/阿达·洛芙莱斯类似于一个有5个执行端口的CPU,只是其中一个启动端口可以启动FP和INT指令。

对比之前Ampere 30系列卡的架构图,可以看到无论是架构设计还是规模几乎没有变化。类似于Pascal的思路,GP100计算卡首先引入了类似Volta/Turing的精密分离设计,而GP102/104/106仍然采用纯FP32,只是工艺升级,运行频率大幅提升。好处是架构一脉相承。目前30系卡用户暂时不用考虑新驱动完全抛弃旧卡优化的问题。缺点是,如果他们想使用新的架构,他们必须等到至少50系列视觉。毕竟目前工艺加成越来越难,留一手给后续机型升级也无可厚非。

使命召唤9配置(使命召唤9剧情深度解析)插图(4)

GPU的架构层次变化很大。最值得注意的是中间巨大的L2缓存,它完全配备了AD102内核,并具有96MB L2缓存。应该类似于之前RDNA2上的Infinity Cache,缓解30系这一代逐渐出现的显存带宽不足的问题。不幸的是,RTX4090上使用的AD102与L2缓存节点一起被阉割了,实际可用的L2缓存只有72MB。

另一个不太引人注意的细节是安培/阿达·洛芙莱斯架构的一级缓存遵循SM的一级缓存。每一个128 KB的SM,AD102的完整内核都有18MB的一级缓存,比GA102好很多。不幸的是,RTX4090中只有16MB可用。

使命召唤9配置(使命召唤9剧情深度解析)插图(5)

制造工艺方面,Ada Lovelace GPU采用台积电4N定制工艺,晶体管密度超过130MTr/mm^2,比采用三星8nm工艺的AD102几乎高出三倍。因此,在插入近三倍数量的晶体管后,GA102的核心面积与AD102相似。总觉得老黄没有做到最好,很久没有在桌面上看到像TU102这样面积超过800平方毫米的巨大GPU核心了。

与流处理器单元相比,阿达·洛芙莱斯的光学跟踪单元在功能和性能上都有了很大的改进。

使命召唤9配置(使命召唤9剧情深度解析)插图(6)

使命召唤9配置(使命召唤9剧情深度解析)插图(7)

一种是将渲染目标的alpha通道的透明度信息引入到光线追踪操作中,类似于室外的树叶,一个多边形的框架+贴图组件。现在只能计算边缘与入射光的相互作用,映射部分复杂的反射和折射几乎得不到任何肉眼可见的信息。不如直接采用光栅渲染中的alpha通道方法。

使命召唤9配置(使命召唤9剧情深度解析)插图(8)

在DX11中引入曲面细分后,用于描述物体表面粗糙度的三角形数量大大增加,但这些三角形大部分对于光线追踪来说是不必要的——人们对灯光特效的感知远没有那么精细。对于一个物体,用一个大三角形包络它进行光线追迹计算,得到的结果同样令人满意。

使命召唤9配置(使命召唤9剧情深度解析)插图(9)

阿达·洛芙莱斯GPU可以创建这种简单的BVH。根据NV官方的PPT,它可以将简单BVH的构建速度提高十倍甚至九倍。不过以上两种新技术都需要游戏引擎的开发,在目前的游戏中并没有什么作用。对于现在的游戏来说,追光单位本身的性能提升相对更重要。

顶行不起眼的独立单元也是阿达·洛芙莱斯的重要升级,包括全新的硬件光流加速器和完全支持AV1编解码的NVENC/NVDEC。可惜PCIe接口仍然是4.0规范。如果要用PCIe5.0,还是要等下一代——不过应该对性能影响不大。反正这一代不支持SLI,所以不用考虑拆分x8。PCIe 4.0 x16有足够的带宽。

使命召唤9配置(使命召唤9剧情深度解析)插图(10)

还有一个新特性就是乱序执行,GPU的架构越来越像CPU。但是我以为乱序执行能力是SM带来的(我在我的PPT上写了),还在想它会额外消耗多少寄存器(x86 CPU在ROB这样的寄存器上花费了相当多的资源用于乱序执行)。仔细一看,RT内核支持ser(着色器重排),专用寄存器数量并不多。它主要使用新增加的阿达·洛芙莱斯缓存——这是一个聪明的设计。

新特性

新功能应该是DLSS3.0,这几天讨论的比较多。最大的争议在于加入了之前实现的插值分辨率,插值在游戏圈说实话有点臭名昭著。前段时间,个别“游戏手机”搭载的“独立显示芯片”被诟病如潮,很大程度上是因为游戏的延迟敏感应用。插值的体验真的很差。

使命召唤9配置(使命召唤9剧情深度解析)插图(11)

使命召唤9配置(使命召唤9剧情深度解析)插图(12)

不过就我自己这几天玩的体验来说,这个插帧用起来还是可以的。当然有前提条件,就是游戏中原本渲染的帧数不能太低。毕竟,即使是特殊的加速单元和运动矢量与光流的混合处理也只是部分解决了帧插入伪影的问题。无论延迟有多低,它都需要一帧数据用于未来的帧,因此渲染原始的一帧未来帧需要多长时间成为影响DLSS FG延迟的最关键因素。所以我个人认为这项技术适用于两个方面。一是在CPU有限的情况下通过插帧提高GPU的利用率,二是锦上添花,让本来就流畅的游戏更加流畅。虽然在实现上令人耳目一新,但确实不具备DLSS2.x的能力,以适中的成本让游戏从不可玩变成可玩。当然在实际使用中也可以同时开启,但是有一个关于各种DLSS组合的体验和画质的说法。这不是我们图文的强项。可以看看详细的第一段视频,真的很适合视频对比展示。

公版卡开箱拆解与用料点评​​

使命召唤9配置(使命召唤9剧情深度解析)插图(13)

使命召唤9配置(使命召唤9剧情深度解析)插图(14)

接下来有请主角,RTX4090创始人版(以下简称FE或公版)。这个公版在国内会卖给中国银行,朋友们可以在10月12日晚上9点上市后在JD.COM买到FE版,还有明天解禁的各种AIC非公版。

使命召唤9配置(使命召唤9剧情深度解析)插图(15)

使命召唤9配置(使命召唤9剧情深度解析)插图(16)

不得不说FE的包装和机身设计都很有个性。30系的公版还没有在国内销售,所以很多人只能选择海外代购。这次喜欢这个设计的用户可以尝试抢购国行。

使命召唤9配置(使命召唤9剧情深度解析)插图(17)

拆卸,第一步是把背板拆下来,把X型裂缝里的螺丝全部拧下来,不过有意思的是,这个背板是靠右边的一个卡扣固定的,不是很牢固。和前两天蓝厂粘的胶比起来,感觉有点卧龙凤雏...

使命召唤9配置(使命召唤9剧情深度解析)插图(18)

使命召唤9配置(使命召唤9剧情深度解析)插图(19)

第二步:取下背板中框,断开连接PCB和散热器的排线。总共有三根电缆。小心不要打碎它们,但是它们仍然非常易碎。

使命召唤9配置(使命召唤9剧情深度解析)插图(20)

步骤3:卸下挡板上的六颗Torx螺钉。这里不得不说,Nvidia在这块卡上用了两种四种尺寸的螺丝。光是来回换刀头就够麻烦的了。

使命召唤9配置(使命召唤9剧情深度解析)插图(21)

然后取下PCB。整体拆卸难度低于RTX30系列公版。

使命召唤9配置(使命召唤9剧情深度解析)插图(22)

散热器采用纯铜蒸汽室底座,6根8mm热管,前后双风扇。有趣的是,显存散热底座首次采用波浪形凹凸设计。

使命召唤9配置(使命召唤9剧情深度解析)插图(23)

接下来,我们来看看PCB。PCB采用类似RTX3090Ti的异形设计,但布局略有不同。部分电源空四相焊接,可能是为更高端的产品做准备。

使命召唤9配置(使命召唤9剧情深度解析)插图(24)

核心GPU是AD102-300-A1,可以看做工程样本。

使命召唤9配置(使命召唤9剧情深度解析)插图(25)

GDDR6X颗粒存储为镁微米,D8BZC MT61K512M32KPA-21,3090Ti带16Gb 21Gbps。

使命召唤9配置(使命召唤9剧情深度解析)插图(26)

MOS的电源为美国芯源MP86957,每相可提供最大输出电流70A。

使命召唤9配置(使命召唤9剧情深度解析)插图(27)

电源接口为+12VHPWR,带有2个输入滤波器。

使命召唤9配置(使命召唤9剧情深度解析)插图(28)

使命召唤9配置(使命召唤9剧情深度解析)插图(29)

除了电容电阻等器件,背面最显眼的是MP2891 PWM控制器,和3090Ti上的方案一样。

使命召唤9配置(使命召唤9剧情深度解析)插图(30)

还有一个更小的电源监控芯片uS5650Q。​

电源

这次RTX40系列全部采用12+4Pin +12VHPWR电源端子,其中RTX4080系列也是强制性的,后续的4070和60系列不会完全普及。

使命召唤9配置(使命召唤9剧情深度解析)插图(31)

使命召唤9配置(使命召唤9剧情深度解析)插图(32)

对于传统的6+2Pin PCIe电源端子定义,以下是+12VHPWR的端子定义。对于广大非ATX3.0动力用户来说,只有一种转移方式,转移这件事有几种不同的方案。

第一个是过渡期的准ATX3.0全模块电源。制造商将提供一条带双8针电源端子的模块电缆,连接到+12VHPWR视频卡的端子。8针端子中有三个有效的+12VDC输出,12VHPWR中有六组,两个接口正好一一对应。在端子质量过硬的前提下,一个8Pin可以提供24A电流和288W功率,两个端子576W W,稍微过载就可以达到+12VHPWR的600W功率最高规格。原厂提供的又黑又粗又硬的模块线,在端子方面肯定能满足电气性能要求,但如果是定制的线就不好说了。个人认为最好不要去定制线。即使没有办法用自定义线,也不要用两个8-8针的端子来转接。当然,也不排除定制线商家后期会推出大胆的线缆和优质的终端。过段时间可以关注一下。

对于非模块化电源,只有一种切换方式。以前,3090Ti标配3×8引脚至+12VHPWR适配器。但是在这条线的使用中出现了电流负载不平衡的问题,所以这一代的附赠适配器变成了4路8Pin到+12VHPWR。

使命召唤9配置(使命召唤9剧情深度解析)插图(33)

具体电流怎么分配我不知道,但应该能解决负载不均的问题。然后,有人担心插拔寿命的限制。索泰在官方备注中说,这种线的插拔寿命是30次。其实之前的8-8Pin终端的插拔寿命也差不多是这个数。30次后不会损坏,但端子的夹紧力会降低,导致接触电阻存在一定的安全隐患,端子发热增加。但是8-8Pin端子的设计负载电流比较低,接触电阻损失不会影响使用,而12-vhpwr的设计负载高,端子发热也比较集中,所以专门提出这个问题。好消息是端子的夹子都在线缆端,显卡和电源的端子都是实心端子,可靠性高很多。我真的很担心这个问题,所以定期换线就好了。反正能在使用寿命内拔插显卡电源端子30次的用户应该不多。

使命召唤9配置(使命召唤9剧情深度解析)插图(34)

功耗这次也有所提升。虽然电流的平均值增加了,但是通过削峰降低了峰值功耗,30系列上的易触发电源的电流保护问题也应该得到一定程度的缓解。这次连AIC的卡都采用了统一的电源设计规范和材料,不需要为此更改FE版本。

测试平台介绍

CPU:酷睿i9 12900K@5.5/4.0GHz

主板:不能说的新品

内存:海力士A-DIE小绿条16GB×2 @ 7200C32 Gear2

使命召唤9配置(使命召唤9剧情深度解析)插图(35)

电源采用华硕ROG Thor II 1600W,最高功率限制600W的12VHPWR接口,连接自有原装模块线。Thor II电源也有一个小有机发光二极管屏幕,可以实时监控系统的总输入功率。

顺带一提,Thor II 1600W的输入口也是16A。以后在书房要预留16A接口(sad

理论性能测试

使命召唤9配置(使命召唤9剧情深度解析)插图(36)

使命召唤9配置(使命召唤9剧情深度解析)插图(37)

我们先来看看GPU-Z显示的比例信息。RTX4090 FE使用GA102核心,CUDA核心数量从完整版的18432阉割为16384。其他单位也有不同程度的缩减。

功率限制默认为450W,但可以解锁到600W。公卡第一次给出如此激进的+33%权力限制。以前Fe都是扣的。

使命召唤9配置(使命召唤9剧情深度解析)插图(38)

使命召唤9配置(使命召唤9剧情深度解析)插图(39)

AIDA64 GPGPU基准测试,值得注意的是RTX4090实测显存带宽高达2.3TB/s,这显然是在L2缓存中运行的测试。在FP32单精度计算能力方面,RTX4090达到了88TFlops,是RTX3090Ti的两倍。对应INT32,AES256的运算能力几乎翻倍,而SHA的运算能力几乎不变,估计苦力性能和3090Ti差不多。

使命召唤9配置(使命召唤9剧情深度解析)插图(40)

3DMark的跑分系列确实和之前的传言差不多。时间间谍至尊的评分接近20000,比RTX3090Ti高出65.9%。应该是最近五年最大的性能提升。毕竟好评如潮的帕斯卡系列,只比1080Ti高出35~40%。

光学性能提高了68%,高于传统性能。另外,DLSS,DLSS3帧插入开启后,帧数并不是简单的翻倍。因为需要消耗额外的资源,所以只能在DLSS2的基础上带来33%左右的性能增益。

​游戏性能测试

使命召唤9配置(使命召唤9剧情深度解析)插图(41)

这就是标题的由来。毛驴1.6版本更新后,配置需求压力暴涨。看来这次比尔领先安迪一步,4090也不能完全征服4K游戏(

与3090Ti的实际帧数相比,开灯时4090Ti的数量增加了56%左右,关灯时增加了35%左右。

使命召唤9配置(使命召唤9剧情深度解析)插图(42)

2K以下的提升幅度变小,只有47/33%。换句话说,即使是2K分辨率下这么强的CPU内存子系统也不够用。等一波13代和Zen4 X3D。

使命召唤9配置(使命召唤9剧情深度解析)插图(43)

使命召唤9配置(使命召唤9剧情深度解析)插图(44)

使命召唤9配置(使命召唤9剧情深度解析)插图(45)

使命召唤9配置(使命召唤9剧情深度解析)插图(46)

使命召唤9配置(使命召唤9剧情深度解析)插图(47)

使命召唤9配置(使命召唤9剧情深度解析)插图(48)

使命召唤9配置(使命召唤9剧情深度解析)插图(49)

使命召唤9配置(使命召唤9剧情深度解析)插图(50)

使命召唤9配置(使命召唤9剧情深度解析)插图(51)

使命召唤9配置(使命召唤9剧情深度解析)插图(52)

使命召唤9配置(使命召唤9剧情深度解析)插图(53)

在不计算DLSS3(帧插入)的情况下,4K分辨率的RTX4090相对于RTX3090Ti的性能提升如下:

使命召唤9配置(使命召唤9剧情深度解析)插图(54)

4K分辨率下平均游戏性能提升51.19%。

使命召唤9配置(使命召唤9剧情深度解析)插图(55)

2K分辨率下游戏平均性能提升38.06%。

功耗、散热与超频

我们使用3DMark Time Spy Extreme 20分钟耐久性测试,统计测试过程中的功耗、温度和风扇转速。最近气温下降,所以室温控制在20℃。采用开放式平台测试,实际装箱使用温度会更高。

使命召唤9配置(使命召唤9剧情深度解析)插图(56)

使命召唤9配置(使命召唤9剧情深度解析)插图(57)

使命召唤9配置(使命召唤9剧情深度解析)插图(58)

使命召唤9配置(使命召唤9剧情深度解析)插图(59)

这个FE散热器效率还是可以的。虽然只有两个风扇,但几乎是目前显卡上除了owl A12x25以外最大的尺寸了。完全可以将60s出头的温度压制在满载时1500转以内,此时基本听不到噪音,使用体验非常好。至于功耗,由于NV没有解锁电压限制,所以之前传闻的500W和600W功耗根本跑不了(连简单的解锁功耗都跑不了,1.05V的电压限制很死)。实际测试的板上最大功耗只有427W,甚至低于3090Ti。考虑到平均50%左右的性能提升,这一代确实是能效比的大提升。

使命召唤9配置(使命召唤9剧情深度解析)插图(60)

超频方面,这一代应该是麦克斯韦之后最好的。想想你有多久没在MSI Afterburener里给核心直接+300频率了。当然这张卡+300是过不了关的,但是体质好一点的应该是可以的。实际上,它已经通过了+280和24Gbps显存的测试。此时,时间间谍极限得分达到20584,比默认状态高出7.5%,最大功耗也来到了560W W。

总结

最后,我来结束这个评价。相信你看完之后对4090的性能应该心中有数了。在更大规模和更高频率的加持下,4090确实取得了明显的性能提升。在实际的4K游戏中,50%的性能提升几乎是近年来最大的,而功耗不变甚至略有下降,能效比惊人。但是,我们也可以发现一些问题。首先,在scale× frequency几乎翻倍的情况下性能只提升了50%,也就是说即使增加大容量缓存,显存带宽仍然不够这个规模的核心使用,急需GDDR7甚至HBM去中心化游戏卡。那么RTX4090相对于完整核心来说阉割的有点严重,应该是历代第一大核心卡最大的阉割了。而且严格的电压限制让所谓的600W功率上限变得毫无意义。不过按照老黄一贯的精准刀法,这些应该是留给4090S/4090Ti甚至泰坦的。接下来,应该会有更多好看的节目。

@易图科技由几位不愿平躺的六先生组成。主要内容包括手机、电脑、摄影器材、数码酷玩。期待您的关注和互动。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

作者:美站资讯,如若转载,请注明出处:https://www.meizw.com/n/164872.html

发表回复

登录后才能评论