联系我们

小丸工具箱官方网站

关于小丸工具箱多线程的信息

发布者:小丸工具箱发布时间:2021-10-07访问量:331

前言

AMD于一个月多前的台北电脑展上发布了新的Zen2架构锐龙3000系列处理器,代号“Matisse”。虽然之前大家已经收到许多消息,包括7nm工艺的进步,Zen2架构的chiplet多Die设计,IPC的提升等,但是对新处理器性能的表现还是有很大的期待。现在新的锐龙处理器3900X、3700X和X570主板已经来到PCEVA评测室,我们就一起来看看它的效能表现。

Zen2架构的设计

在实际测试前,还是要把理论过一遍。这次大家看到最明显的变化是Zen2架构所采用的chiplet多芯片封装的设计。在7 3800X及以下的8核心CPU中,封装包含一个7nm的CPU Die(CCD)和12nm的IO Die(cIOD)。在8核心以上的锐龙9 CPU中,每个CPU有两个7nm的CCD和一个12nm的cIOD。

其中,每个CCD含两个CCX,每个CCX四个核心,所以是8核心,这个设计和以前一样,此外每个CCX有16MB的共享排除式L3缓存,每个Die共32MB,比Zen、Zen+架构翻倍。更大的L3缓存可以降低内存延迟,对游戏性能的提升也有一定帮助。

Zen2每个核心内部的设计也有所变化。指令缓存由原先的64KB缩减到32KB,但位宽翻倍,分支预测系统也经过重新设计,可减少30%的误判率。L2缓存还是和原先一样512KB每个核心,同时AGU增加一个,达到和Intel一样4ALU+3AGU的设计,两组乘加器位宽从128bit上升至256bit,也就是原生支持AVX2,并且乘法器的延迟从4个周期下降至3个。

CIOD中实际上就是把多年来集成在CPU内部的传统“北桥”又拿出来,包括内存控制器、PCIE控制器和部分IO、负责电源管理的晶体管等等。肯定有人要问为什么要把北桥又挪到核心外面来?这应该是AMD权衡利弊之后的结果,眼下更重要的是7nm的良品率,把CPU Core单独拿出来使用7nm制造,可以更好提升每瓦效能,而cIOD这种没必要使用7nm的,优先使用更加成熟的12nm,这样整体的良品率都可以更好的把控;并且,把这些Die连在一起的Infinity Fabric总线已经更新到第二代,位宽从256bit翻倍达到512bit,把北桥拿出来不会对CPU、内存通讯造成太大的延迟。

在Sisoftware Sandra测试中,我们把3700X和2700X同时锁定4GHz,内存锁定DDR4-3400,可以看到3700X的内存缓存延迟均比2700X有明显下降。

Zen2处理器的周边提升

内存控制器现在挪到了cIOD,并且也是重新设计过的,内存和IF总线新增一个2:1的模式。在传统的1:1模式下,内存延迟比较低,在甜点DDR4-3733C17下大约可以达到67ns的水平;如果使用2:1模式,内存频率可以继续提升,带宽也会继续提升,但内存延迟略有升高,根据AMD的描述,DDR4-4200+可以轻松达到,目前在空冷下可达DDR4-5133的内存频率,这点对目前的Intel平台来讲也是难度很大的。所以,可见AMD的内存控制器设计已经赶上了Intel,并且更有弹性,是要带宽还是要延迟,AMD把选择权留给了用户自己。

Precision Boost升级到第二代,现在可以在XFR的最大频率基础上让单核频率再一次突破,最大可达200MHz,因此现在PBO可以说是成了名副其实的自动超频。这可以让锐龙 5 3600的Cinebench R20单线程性能由483分提升至504分,而高端型号的单线程频率会更高,因此提升相对就少点。

X570芯片组与PCIE4.0总线

PCIE4.0也是大家关注的重头戏,这也是AMD在PCIE总线速度上首次领先Intel。PCIE 4.0带宽提升到64GB/s双向,对显卡而言目前PCIE 3.0x16在绝大多数3D游戏和应用当中已经富余,所以PCIE 4.0x16对普通用户来说可能并不是可以直接提升游戏性能的要素,而是可以适应未来更快的SSD。例如这次群联发布的E16主控,可以做到5GB/s的读取,在不久的将来还会有更快的主控和固态硬盘,速度达到PCIE 4.0 x4的6.4GB/s上限。锐龙 3000系列处理器除了16条供显卡使用的PCIE 4.0通道外,SOC部分同样提供了两组4条PCIE 4.0通道,一组作为与芯片组通讯的总线,另一组可以直连高速固态硬盘。

我们使用海盗船MP600 1TB固态硬盘测试,读取速度达到5GB/s,写入速度4.4GB/s,全面超越PCIE3.0的旗舰。

使用技嘉AORUS NVMe Gen4 2TB固态硬盘测试,情况类似。

使用AMD Radeon RX 5700XT显卡运行3DMark PCI Express Feature Test,跑的是PCIE X16单向的带宽,可以看到开启PCIE4.0后带宽达到24.93GB/s,而PCIE3.0模式下带宽是14.02GB/s。

X570芯片组也是锐龙3000系列处理器的新座驾,它同样提供PCIE4.0的支持,并且额外提供8条PCIE4.0通道,此外还提供4个SATA6Gbps接口、8个USB3.2 Gen2接口和4个USB2.0接口。但是主板厂商可能会因为板型限制,不会做足全部的接口。

锐龙3000处理器规格介绍

锐龙3000系列处理器可以说是AMD再一次升级主流平台的核战争,现在加入了锐龙 9系列,最大核心数提高到16个,AMD本次最高只发布到12核心的锐龙 9 3900X,由于Intel主流平台目前只有8核心的9900K,实际上锐龙 9 3900X已经威胁到HEDT了,所以16核心的锐龙 9 3950X还要留在后面,以应对Intel将来发布的10核心CometLake主流平台处理器。

得益于7nm工艺,这代锐龙处理器比上代频率都有了显著提升,最大加速频率全面超越4GHz,按照AMD的说法,Zen2比Zen+单线程效能提升21%,当中有15%是IPC的提升,6%是频率提升的贡献。此外,三级缓存翻倍,对游戏性能提升有较大帮助,尤其是锐龙 9,因为有两个CCD,三级缓存达到64MB,相当于上代的四倍。AMD也把这个缓存叫GameCache(游戏高速缓存)。

这次发布的锐龙3000系列处理器盒装型号都会附带散热器,锐龙 7以上的型号附带的是Wraith Prism RGB,锐龙 5附带的是Wraith Spire。

定价方面,锐龙3000系列处理器还是继续走良心定价策略,锐龙 9 3900X的价格3999元,多四个核心比Intel i9 9900K还便宜100元,8核心的3700X价格2599元起,比上代2700X上市价格便宜100元,6核心的锐龙 5价格全面在2000元以下。

锐龙3000处理器和X570主板图赏

本次我们共收到两颗处理器,锐龙 7 3700X和锐龙 9 3900X,以及两张X570主板——华擎X570太极和技嘉AORUS X570 Master,同时还有一套芝奇8GBx2的皇家戟DDR4-3600C16内存,以及一块2TB的技嘉AORUS NVMe Gen4 SSD。

首先看我们的主角锐龙 7 3700X和锐龙 9 3900X,两颗CPU的包装盒正面还是醒目的锐龙 LOGO,但是两者包装盒外观不尽相同,锐龙 7 3700X是和上代近似的普通纸盒包装,锐龙 9 3900X的纸皮则要更厚一些,开启方式也是向上抽取式。

锐龙 9 3900X的CPU从顶部可以看到,打开封条后把上半部分取出,就可以很容易拿出CPU。可以看到在CPU包装盒内部有各国语言写的“专注性能,为赢而生”,不知道是不是AMD自信锐龙 9 3900X能打赢Intel i9 9900K的表现。

取出CPU包装盒内所有物品,除CPU外,还包括一个Wraith Prism RGB散热器,对应的RGB控制线,以及一本说明书。

CPU本体以及锐龙 9的贴纸。

CPU本体,生产周期19年22周,可见是最近才出厂的。

背面,和上代一样的AM4接口,能看出区别的地方只有中间无针脚处的走线不一样。

锐龙 7 3700X本体以及贴纸。

锐龙 3000系列的内存控制器有了进步,所以我们这次使用的内存也提升到3600的频率,使用芝奇皇家戟DDR4-3600C16 8GBx2内存,三星B Die颗粒。

本次测试使用的华擎X570太极主板,这是华擎X570系列中的高端型号,我们简单介绍一下这张主板。

供电方案采用ISL69147(X+Y=7相)+ISL6617倍相的方案,这里配置成6+1相,等效12+2相供电,在使用非APU的锐龙处理器时,12相给核心供电,2相给SOC供电。该主板配备3个M.2接口,都可以支持PCIE 4.0 X4 64Gbps的带宽,其中最靠近CPU的一个为CPU SOC直出,其余两个为芯片组提供,第三个可支持到22110规格,但与最后一条PCIE插槽共享x4带宽。

AMD X570芯片组,TDP达到11W,所以很多主板都做了风扇用主动散热的方案,华擎X570太极也不例外。

测试平台及CPU-Z识别信息

测试平台:

CPU:

AMD 锐龙 9 3900X

AMD 锐龙 7 3700X

主板:华擎X570 太极

内存:G.SKILL F4-3600C16D-16GTZR

显卡:MSI RTX 2080 VENTUS

硬盘:

LITEON 800NAS PCEVA定制版

Corsair MP600 1TB

散热器:Corsair H115i Platinum RGB

电源:Enermax Revolution 85+ 1050W

CPU-Z识别信息:锐龙 9 3900X,步进MTS-B0

CPU-Z识别信息:锐龙 7 3700X

CPU理论性能测试

根据规格来看,锐龙 7 3700X PK的是Intel酷睿i7 9700K,锐龙9 3900X PK 的是酷睿i9 9920X。但9920X价格太高了,而且很难找到,因此再测试中对比的是9900K。

首先看3900X和9900K的对比。多线程测试中3900X凭借多50%的核心线程数和提升的IPC完胜9900K,单线程测试Cinebench R20也胜过9900K,R15也基本打平9900K,整数运算的SuperPI和国际象棋还是比9900K略逊一些。功耗方面,在全默认状态下,锐龙 9 3900X在锐龙 Master里可以看到功耗限制是142W,所以满载功耗带上供电损耗跑到了155W左右属于正常水平,开启PBO之后解锁TDP可以跑到210W。而9900K在Z390主板上默认就解锁了TDP限制,所以功耗也跑到了185W。3700X和9700K的对比也是类似情况,只不过3700X的功耗限制是88W,加上供电损耗也不过100W,这对8核心处理器来讲是相当舒服了。

至于两颗处理器的功耗限制都比TDP增加了35%,不知道是AMD有意为之还是主板所为,有待后续确认。

再看3700X和上代2700X的对比。同样8核心16线程,频率3700X略高。可以看到整数和浮点效能都提升了20%以上,符合AMD说的21%性能提升。尤其值得注意的是7-Zip和国际象棋,提升幅度相当大,得益于缓存的优化和架构上的改进。

此外,针对几个红色的数据说明一下,国际象棋只支持16个线程,所以锐龙 9 3900X无法跑到满载,分数和3700X差不多;另外3700X的AIDA64内存写入也有问题,原因是AMD这次把内存从CCD写入cIOD的带宽由32B/Cycle改成了16B/Cycle,而AIDA64默认的算法是32B/Cycle,所以实际上跑出来的数值只有一半,针对这个问题,AMD已经和AIDA64在沟通并改进当中。

应用软件测试

AIDA64 CPU AES是一项基于SSE指令集的128bit浮点计算,AMD锐龙处理器由于向量运算单元设计上与Intel酷睿架构有所不同,可以同时做2x128bit的加法与乘法,所以实际上AMD锐龙处理器在运行AES时每个时钟周期可以达到Intel两倍的理论算力。从满载频率来说3700X应该比2700X高不了多少,但是性能提升7%还是比较可观的。

用Adobe Photoshop自带的Camera RAW把100张佳能6D拍摄的RAW文件转为JPG,可见Photoshop 2019对超线程的优化还是不太好,9900K比9700K慢很多,但是3900X和3700X表现不错,比2700X提升明显。

再做一些视频转码的测试,我们把一段松下GH5拍摄的4K视频用PR 2019转成1080P H264格式,码率50Mbps,PR 2019对新处理器的优化还是没有到位,3900X的12个核心似乎没有发挥作用,用时和3700X都是一样的,但也比2700X有明显提升。

用小丸工具箱把上面GH5拍摄的同一视频用H264编码进行压缩,可见小丸工具箱对多线程优化还是可以的,3900X仅用时68秒完成,3700X用时97秒,比9900K慢,但比9700K和2700X都快。

总的来说,锐龙处理器在一些现有应用软件上已经表现出不俗的性能,可以和Intel的处理器对标,但同时这些软件对新的锐龙CPU优化还没有到位,相信之后随着软件版本的更新,还会有进一步提升的空间。

游戏性能测试

得益于IPC的提升和高速游戏缓存,我们再来对比一下锐龙3000系列处理器和Intel平台的游戏性能差异。我们挑选几个网游和单机游戏,使用3900X和3700X对比9900K,显卡使用AMD Radeon RX 5700XT,分辨率1080P。

《古墓丽影:暗影》是一款对CPU优化较好的DX12游戏,自带Benchmark,这款游戏三个CPU跑出来的帧数基本相同,都是115的平均帧。

《地铁:离去》,原本打算去年随着NVIDIA RTX显卡一块发售,结果跳票到今年才推出的游戏,对硬件要求很高,但是对CPU并不敏感,三颗CPU基本上都在40帧。

《全面战争:三国》,今年推出的一款很多单位的即时策略游戏,配置弹性相当大,但总体还是比较吃CPU的,锐龙 9 3900X稍微领先9900K,但是差距都不大。

《CS:GO》,经典FPS游戏,对CPU主频和内存延迟要求比较高,这些都还是Intel的传统优势,所以9900K要更快。

DOTA2,和CS: GO情况类似。

PUBG,之前在锐龙二代平台上跑,帧数很吃亏,锐龙三代得益于IPC的提升,和Intel的差距已经缩小了许多。

总体来说,锐龙三代的游戏性能有进步,在大部分游戏中基本可以达到和Intel齐平的水准。 而且我们会在之后再进行多任务状况下的游戏性能测试,比如现在很常见的游戏直播,还可以加入直播录像,重点比较锐龙3000系列掉帧多还是酷睿掉帧多。

超频与稳定性测试

在默认状态下运行Prime95 Small FFT烤机,3900X的最高温度达到72.3度,功耗被限制在140W左右,所以频率也只有3.6-3.7G。

3700X更舒服,只有88W的功耗限制,但是不知道为什么跑P95 Small FFT会报错,我们跑Blend模式,温度只有51.5度,全核可以跑在4.25GHz,距离最大加速频率4.4G只有一步之遥,真的不用超频了。

我们知道,锐龙处理器在手动超频后会自动解锁TDP,并禁用自动加速频率和XFR,而锐龙3000的默认加速频率都相当高,例如3900X的最大加速频率达到4.6GHz,所以手动超频会损失单核心最大加速频率,有些得不偿失。

其实锐龙处理器在默认状态下已经是调教到最好的能效比状态,因此超频建议只超内存就好。如果不考虑功耗的话,建议开启精准频率提升(PBO)解锁功耗限制,这样可以保持单核心加速频率的基础上稍微提升一下多核心频率。锐龙 Master现在已经可以很方便地开启PBO,你不需要进BIOS去做任何改动,只要在它内置的两个Profile里点其中一个,再开启精准频率提升或Auto Overclocking(其实也就是PBO2)即可。

但是在华擎X570太极主板上,针对锐龙 3000系列的PBO功能似乎做得并不是很好,首先Auto Overclocking加0.2G的功能似乎并不生效,其次解掉功耗和电流限制后全核加速也相当保守,哪怕TDP、TDC和EDC都没有触发限制,CPU在满载时频率并没有比不开PBO提升太多,所以从前面的测试中,可以看到PBO2开启后多核心性能仅提升了1-3%。

在锐龙 Master里开启Auto Overclocking后再次用Prime95烤机,由于TDP限制解开,满载频率上升至4GHz以上,这时候3900X的满载温度上升到92.5度,功耗来到230-240W,带上供电损耗可达270W,但也就只是相当于9900K默认的水平而已,别忘了3900X还多四个核心呢。

3700X开启PBO之后,跑P95 Small FFT就不报错了,这时候全核频率大约在4.1G,CPU温度来到将近90度,功耗在150-160W左右。

内存超频方面,我们建议保持1:1的IF总线频率,以获得最小的内存延迟,尤其是针对游戏玩家而言,至于锐龙 Master里的游戏模式和创作者模式,在Win10 1903专门针对锐龙优化线程调度之后已经可以无视了。我们这颗3900X可以在内存超频到DDR4-3800时保持1900MHz的IF总线频率,但是在华擎X570太极的BIOS里,你需要手动把IF频率调到1900MHz,如果IF频率是自动,在超过DDR4-3733后IF总线会自动跳到2:1模式。例如我们锁定处理器频率4GHz,IF总线从1900MHz降到950MHz,除了导致内存带宽小幅下降,L3缓存读取速度小幅下降之外,还导致内存延迟从65ns左右上升至76.2ns。

总结

毫无疑问,锐龙3000系列处理器的性能表现给我们交出了满意的答卷,得益于7nm工艺、chiplet设计和改良的zen2架构,锐龙3000处理器的核心数、频率、IPC的全面提升,游戏性能也已经赶上Intel,再加上Win10 1903已经对锐龙的线程调度做出针对性优化,现在说锐龙3000系列处理器全面超越9代酷睿已不为过。同时定价上锐龙3000系列更有性价比,12核心杀入4000元以下,8核心继续保持与上代相近的价格,无缝升级的AM4主板,使得主流家用平台拥有更快的8核心以上处理器很容易成为现实,超线程方面又令人省心,不会时不时冒一些严重漏洞出来。总之,还有什么可犹豫的呢?在intel没有更好的CPU推出前,毋庸置疑民用级装机首选这代锐龙。

至于X570主板,毫无疑问最大的亮点就是PCIE4.0的支持,补足了前两代锐龙平台芯片组只有PCIE2.0的短板,让多个高速M.2设备可以在锐龙平台上更好发挥实力,同时对未来更快的设备提供超前支持,哪怕是未来主流级的B550主板,也会有PCIE3.0的支持。当然,X570主板全新上市,BIOS上肯定还有一些不成熟,也导致了我们的评测尤其是超频上没办法正常发挥,相信再给厂商一段时间,这些问题会逐步改进。