进军顶级显卡市场 AMD Radeon RX 6900XT显卡首发评测

2021-01-28 13:57《微型计算机》评测室
微型计算机 2021年1期
关键词:功耗光线架构

《微型计算机》评测室

在高端显卡领域蛰伏多年的AMD终于凭借RX 6800XT显卡重返高端消费级显卡市场,从我们的评测结果来看,这款显卡的确拥有不小的市场竞争力。不过AMD并未止步于此,优化的RDNA2架构、增强计算规模的NAVI 21核心,以及无限缓存等核心技术的加持,让AMD有能力冲击更高的显卡领域,AMD Radeon RX 6900XT(下文简称RX 6900XT)就是他们打开顶级显卡市场的敲门砖。下面就请跟随本文来看看RX 6900XT的性能究竟有多强,它是否能给NVIDIA带来足够的压力。

AMD Radeon RX 6900XT技术解析

在这个信息大爆炸的时代,我们每天都要通过各种途径接收大量信息,如果你已经记不太清RDNA2架构、NAVI 21核心或者无限缓存等技术的详细内容,其实也完全情有可原。因此,我们不妨首先来简单了解一下RX 6900XT的核心技术,如果你想详细了解其技术内容,不妨移步《高端显卡市场争夺战打响!AMD Radeon RX 6800 XT & RX 6800显卡首发评测》一文,这里有RDNA2架构的详细解析,应该能够满足你的好奇心。

RNDA2架构:规模更大、性能更强

RNDA2架构是一个基于RDNA改进、扩张和加入了大量全新功能的架构,它的规模更大、性能更强,同时拥有时下流行的光线追踪、VRS等高级功能,还提供了对DirectX 12终极版本的全面支持。需要注意的是,RDNA和RDNA2的所有产品采用的是台积电的7nm工艺,虽然在不断的工艺发展和生产过程中,台积电会对后期工艺进行优化,但是仅凭优化一般很难达到功耗降低一半、频率提升30%这样的效果,因此RDNA2现在拥有的优势主要还是来自于其架构的设计。另外,AMD还特别提到,RDNA 2的高频率和AMD目前在CPU中的设计经验的引入相关,AMD宣称在新的GPU设计和制造过程中使用了大量在CPU设计中曾使用到的技术或者经验,再加上优化过的微架构,最终实现了本代GPU超过2GHz的运行频率以及较低的功耗

CU单元:提升能耗比,引入光线追踪单元

RDNA2架构的NAVI 21核心在宏观上可以看做NAVI 10核心的扩大版本—后者拥有2个渲染引擎,每个渲染引擎包含了10个双CU单元,所以总计拥有2560个流处理器单元,而NAVI 21核心拥有4个渲染引擎,所以内部计算资源均相对NAVI 10翻倍。下面我们继续深入探究RDNA2的CU单元的技术亮点。在NAVI 21核心上,AMD保留了之前的双CU架构,也就是一个双CU单元包含了两个CU,每组CU分别可以执行两个SIMD 32指令,同时对应这种变化,CU单元的分发前端也改成了Wave 32,1个双CU单元就有两个Wave 32指令分发单元,在遇到SIMD 64指令的情况下还可以合并为Wave64进行分发,这一点和之前的NAVI 10完全相同。不过,AMD宣称在RDNA2上对CU单元内2个SIMD 32计算负荷平衡方面进行了优化,以提高计算效能,但是AMD没有给出更多信息。

缓存体系:带来三大优势

除了基本计算架构外,RDNA 2在缓存体系上做出重大改进。基于RDNA架构的GPU其缓存体系包含了4个级别,分别是L0、L1和L2,以及显存控制器单元。RDNA2则拥有L0、L1、L2和无限缓存(Infinity Cache)、显存控制单元5个层级。其中无限缓存是全新加入的大容量缓存,其容量高达128MB。根据AMD的架构图来看,无限缓存被分为4个区块,每个区块为32MB,这个数量和4个渲染引擎、4个显存控制器是相互对应的。在缓存连接方面,AMD使用运行在1.94GHz的、16×64Bit(1024Bit/时钟周期)的Infinity Fabric总线连接缓存和RDNA2的引擎,AMD宣称这个总线的带宽的峰值是256bit GDDR6显存的4倍。

那么AMD使用如此巨量緩存的收益是什么呢?性能功耗比方面,高速缓存往往会大幅度降低VRAM读取的频次,可以有效地提高GPU整体的能效比。此外,较大的缓存的另外一个好处是允许厂商使用较小的DRAM芯片或者较少的内存控制器模块来配置一个相对较小的存储系统。比如AMD在NAVI 21上就配备了256bit的GDDR6显存系统,而不是像GTX3090那样使用384bit的显存系统那样。AMD给出的数据显示,具有无限缓存的256bit显存系统相比传统的384bit显存系统,在能够提供2.17倍于后者峰值带宽的情况下,仅消耗后者90%的功耗,有着惊人的效果。

性能方面,AMD宣称无限缓存能够改善GPU在每个时钟周期内完成的实际工作量或性能,这里AMD所指的应该是提高GPU的数据命中率,而不是像传统GPU那样等待数据从VRAM中取出,这和前文在性能功耗比方面的描述是一致的,而AMD数据显示无限缓存带来了34%的延迟降低。另外,AMD还宣称在光线追踪计算中,BVH相关的遍历数据会存放在无限缓存中,这也是AMD设计的硬件光线追踪加速的重要组成部分。

光线追踪上线:支持DirectX 12 Ultimate

在RDNA2上,AMD宣布带来了硬件光线追踪、2级VRS可变速率阴影、Mesh渲染和采样器反馈四大DirectX 12高级功能,其中最受关注的是光线追踪。正如前文所说,RDNA2架构的每个CU单元配备了1个光线追踪单元,从而在硬件层面支持光线追踪技术。AMD的资料显示,RA单元的光线追踪交叉性能是传统软件执行的10倍,更具体的数据显示RDNA 2架构的GPU在微软DXRSDK的Procedural Geometry的测试中带来了471fps的成绩,在软件模拟下只有34fps,所以性能达到软件的13.8倍。

三大特色功能

除了架构、缓存等硬件方面的增强和优化之外,AMD还在这一代显卡上推出了三大特色功能。首先则是RageMode,简单可以理解为“自动超频”或者“狂暴模式”,在这个模式下,驱动和配套软件会寻找GPU是否还有性能提升的空间,并通过不断地提升GPU频率来获得更高的性能。此外,Smart Access Memory(显存智取技术)能在不同的4K游戏中带来大约5%~11%的性能提升,平均带来了6%的性能提升。另外一个特色功能则是超级分辨率(Super Resolution)。它可以通过AMD的GPU将较低分辨率的原始图像进行插值、锐化或者引入AI技术等,升格为较高分辨率的图像,比较类似的就是NVIDIA的DLSS技术。

更大计算规模

RX 6900XT和RX 6800XT同样搭载RDNA2架构的NAVI 21核心,但在计算规模上明显增强。例如RX 6900XT的CU单元比RX 6800XT多8个,所以前者的光线追踪计算单元也多8个,同时流处理器数量多512个。而在GPU频率、显存类型和容量、显存带宽和TDP这几个方面,RX 6900XT和RX 6800XT则基本保持一致。因此,从规格参数来看,RX 6900XT的纸面性能应该要比RX 6800XT稍强一些,但具体强多少呢,相信测试成绩能告诉我们答案。

AMD Radeon RX 6900XT鉴赏及测试

RX 6900XT采用了和RX 6800XT相同的外观设计,其整体造型比较硬派,而且黑色、银色和红色的色彩搭配也是比较经典的游戏显卡配色。细节方面,RX 6900XT同样配备3个散热风扇,可以保护PCB板并提升显卡强度的一体式金属背板也没有落下。此外,显卡顶部的Logo下还隐藏了LED灯,开机之后可透出AMDRadeon系列显卡标志性的红色光芒。在RX 6800XT显卡的首发评测中我们详细对比了它和RX6800在外观上的差别,其中一点就是RX 6800XT顶部的Logo采用的是白色导光材质,而RX6800则采用的是红色导光材质,当时我们猜测RX 6800XT可能支持RGBLED灯效。果然,顶部Logo同样采用白色导光材质的RX 6900XT可通过软件控制其灯效模式和灯光色彩,实现当下主流的RGB灯效。

性能测试

前文中我们提到,RX 6900XT主要是在流处理器数量上领先RX 6800XT,而核心频率和显存规格则保持一致,所以我们认为RX 6900XT在理论性能上应该能小胜RX 6800XT。不过相比靠经验推测,测试成绩明显更具说服力,所以在测试环节中,我们会把RX 6800XT纳入对比显卡的行列中。我们知道RX 6900XT的对标产品是来自NVIDIA的RTX 3090,相信不少玩家也非常好奇RX 6900XT的实际性能和RTX 3090相比到底谁强谁弱。于是我们也将NVIDIAGeForceRTX 3090FE(下文简称:RTX 3090FE)作为对比显卡之一,从而给大家一个准确的答案。除此之外,狂暴模式和SAM功能是RX 6900XT的一大亮点,我们也比较好奇它们究竟能给RX 6900XT带来多大的性能提升,所以我们也将对此进行测试。

提升在3DMark的测试成绩上有所体现—RX 6900XT的显卡总分均小幅领先RX 6800XT。与RTX 3090的对比方面,RX 6900XT在FireStrike、FireStrike Extreme和Fire Strike Ultra这3个场景中的显卡分数保持领先,但在剩下3个测试场景中落后于RTX 3090,特别是在测试显卡光线追踪性能的Port Royal场景中,RTX 3090 FE的领先幅度高达28%,看来NVIDIA的第二代RT Core实力不容小觑。

常规游戏性能的实测成绩,我们不妨同样从RX 6900XT对比RX 6800XT,以及RX 6900XT对比RTX 3090FE这两个部分来分析。首先在RX 6900XT对比RX 6800XT方面,总体来看拥有更多流处理器的RX 6900XT在综合性能上仍然领先RX 6800XT约4%,但前者并没有保持全胜战绩,运行部分游戏的平均帧率落后RX 6800XT约2%。而在和RTX 3090FE的较量中,RX 6900XT的综合性能落后前者约6%。并且仅在运行《尘埃5》《刺客信条:英灵殿》时的平均帧率高于RTX 3090 FE,运行其十余款参测游戏的平均帧率则有不同程度的落后。

光线追踪性能测试

在光线追踪性能测试部分,我们挑选了《看门狗:军团》《控制》《战地5》等游戏来考察RX 6900XT的表现。需要说明的是,在测试中我们统一关闭AMDSAM和NVIDIADLSS功能,以保证测试成绩的可对比性。测试结果显示,RX 6900XT运行这部分参测游戏的平均帧率领先RX 6800XT约2%,同时明显落后于RTX 3090FE。

通过测试成绩我们可以看到,在开启光线追踪之后,RTX 3090FE在4K分辨率下运行《控制》的平均帧率为42fps,而RX 6900XT在上述设定下运行这款游戏的平均帧率仅24fps,两者差距非常明显。不仅如此,同样在开启光线追踪之后,RX 6900XT运行《战地5》的平均帧率也明显落后于RTX 3090FE。由此可见,在硬件实时光线追踪渲染起步更早的NVIDIA,在這一领域的优势还是非常明显,AMD仍需努力。

AMDSAM+狂暴模式性能测试

在RX 6900XT的技术解析中我们提到,AMD推出的SAM功能和狂暴模式可有效提升RX 6900XT的游戏性能,所以我们也非常好奇SAM+狂暴模式到底能给RX 6900XT带来多大的性能提升。于是我们挑选了《刺客信条:英灵殿》《极限竞速:地平线4》《无主之地3》这3款游戏,并分别在2.5K和4K分辨率下考察了RX 6900XT在同时开启SAM和狂暴模式后的游戏性能。结果显示,参测游戏的平均帧率有非常明显的提升。例如在2.5K分辨率下,RX 6900XT运行《刺客信条:英灵殿》的平均帧率达到127fps,相比默认状态下的性能提升达41%。此外,开启SAM和狂暴模式后,RX 6900XT在4K分辨率下运行《极限竞速:地平线4》的平均帧率达到175fps,不仅比默认状态下提升14%,同时还反超RTX 3090 FE。

综合来看,SAM+狂暴模式的确能给RX 6900XT带来比较可观的性能提升。通常情况下,如果玩家想要“免费”提升显卡性能,超频自然是首选,但对显卡进行手动超频需要足够的经验和耐心,同时也仍然存在损坏显卡的风险。相比手动超频,SAM+狂暴模式同样能给玩家带来非常明显的性能提升,而且操作简单,损坏显卡的风险也非常低,所以也更值得玩家们尝试。

满载核心温度及测试平台总功耗

我们在这部分测试中主要想考察RX 6900XT的散热性能和功耗。在RX 6800XT显卡的首发评测中我们发现,即使GPU频率超过2GHz,流处理器数量也大幅增加,但这款显卡在满载状态下的核心温度保持在80°C,比我们预期的要稍低一些。从理论上来讲,在散热方案基本保持一致的前提下,核心规格小幅提升的RX 6900XT在发热量上应该和RX 6800XT差距不大,而从测试结果也证明我们的推测是正确的。

我们使用Furmark(1080p分辨率,关闭抗锯齿)对这款显卡进行了半个小时的烤机测试。结果显示,这款显卡在烤机半个小时之后的核心温度为81°C(室温约21°C),与RX 6800XT在相同测试环境下的核心温度相差不大。而在功耗方面,RX 6900XT在满载状态下测试平台的总功耗在465W左右,略高于RX 6800XT,所以我们也建议玩家们至少为这款显卡搭配额定功率在850W或更高的电源。

小结

定位顶级游戏显卡市场,对标RX3090,或许不少玩家都对RX 6900XT的期待都比较高。然而GPU频率和顯存规格与RX6800XT保持一致,只是小幅提升流处理器数量和光线追踪单元数量,这让RX 6900XT的综合性能相比RX 6800XT仅有3%~4%的提升,所以这难免会让不少玩家失望。不过好在开启SAM和狂暴模式之后,RX 6900XT的性能得到明显提升,这能在一定程度上达到部分玩家期待的水平,同时还是能在部分游戏性能上比肩NVIDIA的RTX 3090。

价格方面,RX 6900XT的售价是7999元,而其竞品RTX 3090FE的售价是11999元。我们认为,AMD或许并不是想要凭借RX 6900XT与NVIDIA在顶级游戏显卡领域一较高下,而是试图让RX 6900XT来填补RTX 3090和RTX 3080之间的性能断层,从而实现错位竞争。与此同时,AMD还通过SAM+狂暴模式将RX 6900XT的性能,达到媲美RTX 3090的水平,从而在“秀肌肉”的同时,满足那些对RX 6900XT有较期待的玩家。

随着RX 6900XT正式上市,AMD和NVIDIA在消费级显卡市场的竞争也愈发激烈,综合这款显卡的性能和价格来看,RX 6900XT也有能力抢夺NVIDIA在顶级显卡的市场份额,那么NVIDIA将会如何应对呢?按照NVIDIA的一贯传统,他们应该会针对RX 6900XT推出一款相同定位的产品,这款产品有可能就是目前网上流传搭载20GB显存的RTX 3080。那么精准的产品定位加上更加亲民的价格是否能让RX 6900XT在顶级游戏显卡市场一展身手,AMD能否凭借这款显卡争夺更多的消费级显卡市场份额,NVIDIA将会以怎样的方式予以还击,从而巩固自己在消费级显卡市场的领导地位呢,让我们拭目以待吧。

猜你喜欢
功耗光线架构
基于FPGA的RNN硬件加速架构
基于任务映射的暗硅芯片功耗预算方法
功能架构在电子电气架构开发中的应用和实践
“你看不见我”
LSN DCI EVPN VxLAN组网架构研究及实现
数字电路功耗的分析及优化
淘气的光线
流动的光线
IGBT模型优化及其在Buck变换器中的功耗分析
一种基于FPGA+ARM架构的μPMU实现