《微型計算機》評測室
北京時間2020年10月9日零點,本年度最受期待的一場處理器發布會:“WHERE GAMINIG BEGINIS”(游戲從這里開始)終于召開,AMD公司總裁兼CEO蘇姿豐博士正式發布了采用新一代Zen 3架構的AMD銳龍5000系列處理器,并帶來了一系列好消息:Zen 3核心架構的每時鐘周期指令數(IPC)性能比上一代Zen 2產品提升了多達19%;銳龍5000系列處理器的單線程性能得到大幅提升,銳龍5000系列處理器中的高端產品在游戲性能上已經全面超越現在的游戲處理器旗艦:酷睿i9-10900K。
如果真如AMD所言,這可是一次堪比從“推土機”到Zen之后的又一次重大升級,畢竟盡管Zen、Zen+、Zen 2架構的問世讓AMD處理器在總體技術水準上能與競爭對手平分秋色,但在處理器單線程性能、游戲性能上與對手相比一直略有差距,對手也總是拿這兩點來打壓AMD產品。那么Zen 3真能改變AMD處理器的以上不足,在單線程性能與游戲性能上形成反超嗎?AMD又是怎樣辦到的?AMD Zen 3處理器架構有何神奇之處?
如何實現19%的性能提升?
AMD Zen 3處理器架構技術設計解析
在AMD發布銳龍3000系列處理器也就是Zen 2架構之后,就公布了有關Zen 3架構的相關內容。當時AMD宣稱Zen 3相比Zen 2能帶來大約15%的IPC提升。考慮到Zen 2架構的銳龍3000系列處理器的頻率較低,因此業內普遍估計新的Zen 3架構應該是基于Zen 2架構的小改款,核心架構改變應該不算太多,其性能增加主要來自于緩存設計的改變和頻率提升。但是,在Zen 3架構和相關處理器發布后,人們驚訝地發現,Zen 3架構是基于Zen 2架構做出了重大架構更新和全面優化的處理器架構,值得深入研究。
Zen 3架構設計一覽
從宏觀來看,Zen 3架構采用的仍是基于SMT同步多線程技術的設計,每個核心擁有2個線程。在Zen 3上,AMD首先提到的就是全新的分支預測單元,Zen 3架構大幅度加強了分支預測設計,并宣稱其為目前最先進的分支預測單元。緩存方面,Zen 3的一級指令緩存和一級數據緩存都采用了8路設計,容量為32KB,Op緩存部分支持4K個指令排序,二級緩存采用了數據和指令混合的方案、8路設計,容量為512KB。
前端指令解碼方面,Zen 3每周期可以執行4個指令解碼(依舊是4發射設計)或者從Op緩存中提取8個指令——這里需要注意的是,AMD設計Op緩存的意義就在于,將之前使用過的指令結果直接存儲在Op緩存中,如果下次流水線中重新出現這樣的指令,那么Zen 3架構將會直接從Op緩存中取出結果進行宏指令執行,每次可以提取并派送8個結果。考慮到Op緩存可以存儲高達4K指令,因此有比較大的概率可以實現更寬的指令分派,并允許更多的指令進入后續的執行部分,這是一個非常巧妙的方案,后文我們還有針對這部分和Zen 2架構的對比。另外,對整數或者浮點數據而言,每周期可以分派6個宏指令或者微指令,這里Zen 3依舊采用了協處理器執行模型,且可以分別同時執行整數和浮點計算。
Zen 3的執行部分也經過了加強,現在Zen 3的整數執行單元有4個整數ALU單元、1個帶分支預測的ALU單元、3個AGU單元和1個專用分支預測單元。由于有3個AGU單元,在地址計算方面,Zen 3每周期可以進行3個地址計算。浮點計算部分是Zen 3加強的重點之一,Zen 3現在擁有6個浮點計算單元,每周期可以執行2個256bit的FP乘積累加運算單元(FMAC)。FMAC計算是目前最重要的浮點計算基礎方法之一,包括常見的卷積運算、點積運算、矩陣運算、數字濾波器運算、多項式的求值運算等都可分解為數個FMAC指令來進行求解。因此高效率、加強的FMAC單元可以有效提高處理器在這些計算中的效率。
最后則是內存單元部分。Zen 3的內存單元現在每周期可以執行3個數據加載或者執行1個數據加載、2個數據存儲,這樣的混合模式也提高了數據存儲效率。從Zen 3的宏觀架構來看,AMD試圖將Zen 3優化為一個更高效率、更低延遲和更為符合現代計算任務的全新綜合體,這一點在和Zen 2架構的對比中更明顯。
對比Zen 2:19%的IPC從何而來
在之前的發布會上,AMD宣稱Zen 3相比Zen 2帶來了大約19%的IPC提升,并且給出了一些詳細的數據。這一點在本刊之前的文章中也有一些解釋,包括Gache Prefetching(緩存數據預取)貢獻了2.7%的力量;Execution Engine(執行引擎)的改進貢獻了3.3%;更先進的Branch Predictor(分支預測)貢獻了1.3%;Micro-op Cache(微操作緩存)的改進貢獻了2.7%;處理器采用了新的Front End前端架構,為性能提升貢獻了多達4.6%的力量;在整數運算單元上,Zen 3架構提升了Load/Store(數據載入和存儲)帶寬,貢獻同樣高達4.6%,這些數據加起來高達19%。
不過,由于當時AMD沒有公布每個部分詳細的設計細節,因此這些性能提升如何還有待探尋。現在,AMD給出了整個Zen 3架構設計的簡圖,并給出了每個部分比較重要的改進以及相對于Zen 2架構的對比,人們終于可以一窺Zen 3內部架構設計的奧秘了。
從Zen 3和Zen 2的架構簡圖來看的話,前端部分,Zen 3的最大變化在于使用了Op排序單元和分派單元2個單元替換了原有的Micro-Op排序單元。具體來看,通過L1指令緩存、分支預測、解碼、Op緩存后,Zen 2可以每周期給出4個指令或融合后的8個指令(此處AMD將其描寫為Fused Ins,但應該還是MacroOps),Zen 3則是每周期給出4個指令或8個宏指令(此處AMD直接寫為Macro Ops)。這一部分看起來似乎沒有變化,但是AMD宣稱微操作緩存部分進行了改進,帶來了2.7%的性能提升。另外,AMD數據顯示,Zen 3相比Zen 2,在緩存數據預取和分支預測部分帶來了2.7%和1.3%的IPC提升。這部分內容后文還有詳細解釋。
值得注意的是,Zen 3相對于Zen 2,在前端架構設計上的重要變化在于Zen 2的指令進入了微指令排序單元(Micro-OpQueue)后,直接輸出6個微指令給執行單元的整數或者浮點部分。但是,Zen 3經過指令排序單元(Op Queue)和指令分派單元( Dispatch)后,每周期可以輸出6個宏指令給執行單元的整數部分或者6個微指令給浮點單元。
在這里,AMD所定義的“宏指令”可包含多條微指令,比如1條移動到某位置的內存數據,并和另外位置的數據直接相加的指令可以使用宏指令完成,但是實際上在執行時需要進一步解碼為多條微指令,包括定位地址、取得數據、移動數據、相加等。因此,Zen 3允許宏指令最多以每周期執行6個的方式發送給整數執行單元,使得前端最終輸出給整數執行單元的實際指令吞吐量大大提升(整數執行模塊的性能和指令并行度呈現高相關性,因此更多的指令有助于實現高效率的并行)。綜合來看,前端部分的改進是Zen 3 IPC提升的最重要部分之_,AMD數據顯示高達4.6%。
在執行引擎的整數部分,Zen 2擁有7個整數排序單元,Zen3精簡為4個,但是每個單元的性能有所變化。后端執行部分,Zen 2只有4個整數ALU單元和3個AGU單元,Zen 3則同樣使用了4個ALU(其中1個有分支預測功能)、3個AGU以及1個額外的分支預測單元。AMD解釋為,在執行部分新加入分支預測單元可以提供更多的分支吞吐量,并帶來關鍵延遲的降低。
在執行引擎的浮點部分,Zen 2架構只有1個浮點排序單元,Zen 3架構提升至2個。后端執行部分,Zen 2架構擁有2個MUL和2個ADD單元,總計4個浮點計算單元。Zen 3架構則改為2個ADD單元不變,但是2個MUL單元同時也可以執行FMAC計算,另外還增加了2個F21單元,主要用于將浮點數據轉換為整數,其中1個用于地址計算,另1個專用于轉換計算,總共6個浮點計算單元。根據AMD公布的數據,綜合了整數和浮點部分的性能提升后,新的執行引擎架構設計帶來了3.3%的性能增幅。
在數據存儲和讀取部分,AMD提到Zen 2每周期只能完成2次數據讀取和1次數據存儲,Zen 3將其提高為每周期3個數據讀取和2個數據存儲。AMD宣稱數據存儲和讀取部分的改進也帶來了高達4.6%的性能提升。上述所有的改進綜合起來,實現了前文提到的總計19%的IPC提升,值得一提的是,這個數據并不包含頻率或者其他方面的增益,是AMD采用了8核心、4GHz固定頻率的Zen 3架構處理器對比相同配置的Zen 2架構處理器,綜合了25個測試后得出的結果,其中最低的性能提升在9%,最高的在39%,其算數平均值是19%。AMD也給出了相關的測試對比。其中提升最大的部分依舊是1 1款游戲,包括《CS:GO》、《英雄聯盟》《絕地求生》《戰地4》《地鐵:最后的光芒>等,這些游戲的性能提升最低都高達20%。
從前端到后端:詳細解讀Zen 3架構進化
在基本了解了Zen 3架構的宏觀內容后,AMD還給出了從前端、執行到后端各個部分比較具體的性能提升情況。在整個指令拾取和解碼階段,AMD的設計目標是更快速的指令拾取,尤其是在面對分支預測和占據比較大空間的代碼的時候。其中分支預測器依舊是Zen 3設計的重點之一。
之前Zen 2發布時,AMD宣稱自己采用了基于神經網絡的分支預測器結構,還采用了TAGE分支預測器(Tagged geometriclength predictor標記幾何長度分支預測器)的設計。從分支預測器的發展來看,這幾乎是AMD能夠使用的最先進的分支預測器了。在Zen 3上,AMD繼續使用基于TAGE架構的分支預測器,但做出了相當多細節上的改進。比如重新分配BTB(分支目標緩沖器)以獲得更好的預測延遲。之前AMD在Zen 2架構上加大了BTB,其LO、L1、L2 BTB分別擁有1 6個、512個和7K個條目(entry)。在Zen 3上,L1 BTB進一步提高至1024條目,L2 BTB反而降低至6.5K條目。另外,Zen 3還使用了更大的ITA(Indirect Target Array,間接目標陣列),容量提升至1.5K,之前Zen 2為1K,更大的ITA有助于降低錯誤預測率。
除了上述內容外,AMD在Zen 3的分支預測器部分還反復提到更低的分支預測錯誤延遲和“無氣泡”模式。其中前者的改進主要來自通過前端宏指令發射的設計,這帶來了流水線級數的降低,從而間接降低了分支預測錯誤后重新填充流水線的損失。后者提及的“氣泡”,是指在現代超標量流水線處理器中,如果不同指令之間出現互相等待結果的情況,并且分支預測器又沒有給出分支預測信息的話,那么整個處理器都會停擺來等待相關指令的完成,由于這個等待周期的存在,程序員形象地稱之為“氣泡”。“氣泡”會帶來處理器性能的顯著降低。現在,AMD采用了新的“無氣泡”模式的分支預測器,會在很大程度上避免這種問題的產生——即使這種問題已經非常少見了。
另外,有關L1指令緩存,AMD提高了其拾取指令的速度和利用率。在Op緩存方面,AMD進一步加強了Op緩存拾取的速度,同時還可以在Op緩存和指令緩存之間更快速地切換,這有助于提高指令讀取的效率。
執行部分:更寬、更快
AMD在執行部分做出的改進也非常顯著,整個執行單元主要是效率的提升,而不是規模的擴張。先來看整數部分。AMD在Zen 3上使用了4個整數排序單元,每個整數排序單元分別擁有24個條目,4個一共96個條目。相比之下,之前Zen 2架構擁有7個整數排序單元共計92個條目。新的Zen 3架構稍微擴大了整數排序單元的條目數量。隨后的整數寄存器部分,Zen 3擁有1 92個條目空間,Zen 2則只有180個,也只是小幅度增加。后續執行部分,Zen 3的整數執行部分每周期夠執行1 0個操作,之前的Zen 2只能執行7個,增加了大約42%,這是增加最顯著的部分。ROB部分,Zen 3也進一步擴大至256個,之前Zen 2只有224個。
從AMD在Zen 3整數部分的設計來看,AMD沒有大規模增加計算資源,而是通過微調和對計算單元的合理設置,比如依1日采用4個ALU設計、共享ALU和AGU調度器以跨工作任務平衡負載、沒有大幅度增加寄存器端口或者旁路網絡輸入端口等,但是通過這些優化尤其是執行部分每周期可執行操作數提升了42%,帶來了整數部分性能的進一步提升。一般來說,整數部分的性能表現差異主要來自指令級并行是否能夠非常好地完成,之前Zen2的表現非常不錯,Zen 3自然不會有太大的問題。
在浮點部分,Zen 3的設計目標是通過更低的延遲和更大的結構來實現指令級并行,同時提高執行效能。具體的改進包括增加拾取帶寬、單獨的F21以及存儲單元、更大的排序窗口、更快的4周期FMAC單元等。另外,AMD還提到Zen 3的MUL和ADD單元還可以實現整數文件存儲和浮點寄存器文件處理,并且這兩者是獨立運作的,有助于同時執行不同的操作,來獲得更大的數據吞吐量。
最后再來看看讀取和存儲單元兩個部分。這個部分AMD的設計目標是提供更大的結構和更好的預取設計,以支撐更大規模的指令集并行。鑒于此目標,AMD在這部分做出了非常重大的改進。首先是存儲排序單元從之前的48條目提升至64條目,L2DTLB則保留了2K個條目的設計,這有助于提高這部分運作的效率。在32KB、8路的L1緩存方面:緩存Ops提升至之前設計的3倍,每周期可以執行3個操作,但是在執行浮點操作時,每周期則只能執行2個,執行存儲操作時更是回落至每周期1個操作。另外,AMD為讀取和存儲單元添加了新的指令,用于高效率復制較短的字符串,還改進了跨頁面邊界的預抓取操作的速度,以及更好的針對存儲、加載轉發關系的依賴等。
通過前文的介紹,AMD在Zen 3在前端、執行、讀取和存儲三大部分最重要的改進總結如下:
前端部分的改進包括:
2倍容量的L1 TBL,現在尺寸是1 024單位。
提高了分支預測單元的帶寬
分支預測單元的“無氣泡”模式
可以從錯誤預測中更快速地恢復
Op緩存更快的排序速度
更細粒度的Op緩存管道切換
執行部分
整數部分擁有專用的分支預測和地址選擇器
整數部分擁有更大的執行窗口(增加了32個單位)
降低了整數和浮點指令通過Ops選擇的延遲
浮點計算部分現在變化為6個單元
浮點部分MAC計算降低了1個周期
讀取和存儲單元
更高的讀取和存儲帶寬(分別增加了1個單位)
更為靈活的加載和存儲操作
改進的內存依賴性檢測
LB部分的walker表從2個增加至6個
總的來看,AMD在Zen 3架構上的改進是多方面的,這些細微的改進加起來共同帶來了整個Zen 3高達19% IPC的提升。從2017到2020,AMD通過Zen奠定的基礎以及Zen 2、Zen 3兩代架構的繼續努力,終于實現了CPU微架構效能的大提升,值得慶賀。
銳龍5000:全新的SoC架構設計
在AMD的定義中,Zen 3是CPU微架構的代號,CPU微架構要聯合其他部分,一起組成整個銳龍5000處理器。和之前的Zen 2-樣,AMD將處理器設計為CCX、CCD、Infinity Fabric以及cIOD等多個模塊,最終實現的銳龍5000處理器是以SoC的形式存在的。
現在,1個銳龍5000處理器將包含1個或者2個CCD,搭配1個cIOD來實現。CCD中包含了8個CPU核心組成的CCX和一個Infinity Fabric單元。其中前者采用Zen 3架構,8核心16線程,后者則執行總線功能,實現外部數據聯通。對cIOD來說,內部同樣包含了針對CPU通訊的Infinity Fabric總線,以及內存控制器、IOHub控制器等設備。
以AMD給出的2個CCD搭配一個cIOD的“2+1”的處理器為例,兩個CCD都可以通過Infinity Fabric總線以寫入16 Bit/周期、讀取32Bit/周期的速度和cIOD的Infinity Fabric總線連接,AMD還為cIOD的Infinity Fabric總線定義了fclk頻率。接下來,cIOD的Infinity Fabric總線又會以32Bit/周期的速度和UnifiedMemory Controller也就是統一內存控制器進行連接,同時以64Bit/周期的速度和IO Hub控制器連接。其中,統一內存控制器的頻率被稱為uclk, 10 Hub控制器的頻率被稱為lclk。
繼續深入每一個CCD的話,可以看出,Zen 3相對Zen 2的最大變化在于CCX采用了8核心16線程,32MB L3,之前的Zen2則是每個CCX 4核心16線程,16MB L3。AMD也特別提到,新的設計使每個核心可以訪問2倍的L3緩存,這樣做可以加速核心和緩存之間的通訊,對游戲應用非常有益,另外還降低了訪問內存的次數和延遲等。
更具體一些來看的話,AMD還給出了更詳細的Zen 3和CCD的緩存層次結構介紹。首先是緩存體系,Zen 3的每核心私有512KB L2緩存,同時8個核心共享32MB L3緩存。其中,L2緩存通過加強的讀取和存儲單元實現了帶寬的提升(前文已有介紹),這也有助于提高數據預取性能。在緩存模式設計上,Zen 3的L2和L3緩存采用了部分非包含式,L2中只包含了有關L3指針部分的篩選和快速緩存數據的標簽信息。換句話說,L2包含了L3部分信息的“標簽”,這有助于CPU在未命中L2緩存時通過查詢L2的方式快速尋找到L3內的信息,算是一個比較常見的優化做法。在信息處理方面,Zen 3每核心可以處理64個未在L2中命中的信息并轉而向L3查詢,L3一次可以處理192個未命中信息,并轉向內存查詢。
在緩存帶寬方面,核心每周期可以執行向32KB L1指令緩存的32Bit緩存拾取,針對32KB的數據緩存模式比較復雜,其模式是前文中提到處理器對普通數據每周期可以執行3個操作,執行浮點操作時每周期則只能執行2個,執行存儲操作時更是回落至每周期1個操作,每個操作都是256bit。L1數據緩存和L1指令緩存到L2的帶寬、L2緩存到L3緩存、L3緩存到Infinity Fabric等外部設施的帶寬分別都是每周期32Bit。
另外在Zen 3的CCD中,由于32MB L3要面對8顆核心,因此受制于較大的芯片面積占比,很難使用傳統的類crossbar總線。如果基于L3緩存分片區通訊,并采用mesh架構的連接方式又不太符合AMD目前介紹的情況。因此AMD在CPU核心和L3緩存的連接方面采用了常見的環形總線,也就是設計了通訊環來掛接每個CPU核心并連接至L3的各個區塊。環形總線的優勢在于設計簡單、實現方便,在優化得當的情況下能夠帶來多核心之間數據通信、緩存信息拾取等比較高效的信息傳輸。
最后再來看看Zen 3和銳龍5000系列處理器在安全性和新指令集方面的內容。安全性方面,由于之前包括英特爾“幽靈”和“熔斷”在內的CPU安全漏洞接連出現,因此現在人們也頗為關注處理器的安全設計。AMD在Zen和Zen 2架構設計上引入了SME、IBC、GMET、UMIP等安全特性,并得到了市場的廣泛好評后。在Zen 3上,AMD在繼承之前的安全特性的基礎上,又引入了名為CET(Control-flow Enforcement Techonlogy,控制流執行技術)的新安全方案,主要用于針對ROP攻擊。在指令集方面,之前AMD在Zen和Zen 2架構的處理器上,也添加了包括ADX、SMAP、SHA1、CLWB、QOS等指令,現在在Zen 3上,AMD加入了新的VAES/VPCLMULQD,正式宣布了對AV2×指令集的兼容和支持,使得處理器在運行支持AVX2指令的應用時,效能進一步提升。
從16核心到6核心 首發產品有四款
第一批上市的Zen 3處理器有四款,它們是銳龍9 5950X、銳龍9 5900X、銳龍7 5800X、銳龍5 5600X。其中銳龍95950X對應Zen 2旗艦,同樣采用16核心、32線程設計的銳龍93950X,L3緩存總容量也是64MB,TDP熱設計功耗為105VV,但最高加速頻率從銳龍9 3950X的4.7GHz提升到了4.9GHz,處理器在中國區的首發價格為6049元。銳龍9 5900X則是為了取代銳龍9 3900XT、銳龍9 3900X,對標酷睿i9 -10900K的產品,同樣采用12核心、24線程設計,L3緩存總容量仍為64MB,最高加速頻率達到4.8GHz,分別比銳龍9 3900XT、銳龍93900X高了100MHz、200MHz,其中國區售價為4099元,比酷睿i9-10900K還便宜了1 00元。
至于銳龍7 5800X則是為了替換現在的銳龍7 3800XT、銳龍7 3800X,對標酷睿i7-10700K的產品。單從規格上看,它與銳龍7 3800XT幾乎完全相同,最高加速頻率同為4.7GHz,L3緩存容量為32MB,TDP均為105W。當然就像我們在前面講的那樣,它們在內部架構上有大的區別,銳龍7 5800X采用單CCX設計,而銳龍7 3800XT需要兩個CCX才能實現8核心、32MB三級緩存的規格,目前銳龍7 5800X的中國區售價為3199元。
由于定位高端,以上三款處理器上市時都不會附送散熱器,用戶可以自行為它們購買高端風冷或水冷散熱器。作為面向主流用戶的銳龍5 5600X則會向用戶附送幽靈潛行(VVraith Stealth)65VV靜音版散熱器。作為替換銳龍5 3600X、銳龍5 3600的產品,它也采用了6核心、12線程設計。三級緩存總容量同為32MB,但最高加速頻率從銳龍5 3600XT的4.5GHz提升到了4.6GHz。其中國區售價為2129元。
最后,為了讓用戶能方便地使用Zen 3處理器,AMD表示現有500系芯片組主板,如X570、B550、A520等主板只需將BIOS中的AGESA(AMD Generic Encapsulated SoftwareArchitecture,AMD通用封裝軟件架構)升級到1.0.8.0,就能讓Zen 3處理器通過自檢、引導。當然如果想獲得更好的體驗,則需用戶將AGESA升級到1.1.0.0或更新的版本。
多核心性能沒有對手游戲性能秒掉i 9—1 0900K
16核心旗艦銳龍9 5950X首發測試
銳龍9 5950X+ROG CROSSHAIR ⅧDARK HERO主板展示
接下來,就讓我們通過實際測試來看看新一代Zen 3處理器到底具備怎樣的實力。我們首先將對本次Zen 3架構處理器中的旗艦:銳龍9 5950×進行測試。本著“好馬配好鞍”的原則,為了充分發揮出銳龍9 5950×處理器的最大性能,本次我們特別采用了ROG專為Zen 3處理器研發的X570游戲主板:ROGGROSSHAIRⅦDARK HERO。
在ROG主板中,HERO系列產品的定位偏主流、更凸顯性價比一些。不過在HERO前加入DARK即“變身”為黑暗英雄后,這款主板的各個方面相對以往的ROG X570主板都有一定的升級。首先在供電電路上,這款主板采用了與CROSSHAIRⅦHERO主板相同的14+2相供電設計。其中專為處理器核心供電的14相供電是由兩顆電感、兩顆一體式MOSFET通過兩兩并聯來實現的。雖然在電感部分它依然使用16顆粉末化超合金電感,但CROSSHAIR V_DARK HERO的MOSFET從.CROSSHAIRⅦHERO支持60A電流的IR3555M升級為了支持90A負載的Ti德州儀器CSD95410RRB Power Stages MOSFET,這也就意味著GROSSHAIRⅦDARK HERO的1 6相供電電路在理論上最高可支持高達1440A的電流,能輕松保證銳龍9 5950X處理器的正常工作與超頻。
在設計上,CROSSHAIR V_DARK HERO同樣有很大的改變。作為“黑暗英雄”,該主板采用了全板隱身黑設計,去掉了CROSSHAIRⅦHERO主板上原有的銀色元素,并在主板芯片組的“敗家之眼”LOGO與主板I/O部分的“ROG”英文設計了多顆Aura RGB LED燈珠,令主板的外觀更加炫酷。同時主板也支持AURA SYNIC神光同步功能,可連接其他支持AURA SYNIG技術的硬件或通過可編程接口、RGB接口,連接各類二代燈帶、5050燈帶以制造更加壯觀的“光污染”。CROSSHAIRⅦDARKHERO還擁有其他×570主板所不具備的靜謐性,在以往,由于X570芯片組完全支持PCle 4.0,技術規格提升的同時功耗也增加了,因此主板廠商往往為芯片組配備—具高速風扇進行散熱,但風扇的增加卻帶來了額外的噪音。因此在CROSSHAIRⅦDARKHERO主板上,工程師為其采用了一個超大面積的鋁合金散熱片,不僅覆蓋整個主板芯片組,更將散熱片延伸占據了兩根PCle 4.0x16顯卡插槽中間的空位。這個設計思維很簡單,通過擴大散熱材料與空氣的接觸面積來提升散熱性能。而根據華碩的官方報告來看,這個設計讓他們達到了目的,CROSSHAIR V_DARK HERO主板上X570芯片組的工作溫度只比采用主動散熱的X570芯片組溫度高了2.25%,但噪音卻得到了完全消除。
值得一提的是,在網絡方面CROSSHAIRⅦDARK HERO主板也采用了非常極致的設計。首先在無線方面,它搭配了支持最新WiFi 6技術(802.11ax)的英特爾AX200無線模塊。其不僅支持5GHz/2.4GHz雙頻和多用戶2x2 MIMO(MU-MIMO),峰值傳輸帶寬更達到2.4Gbps,比現有802.11ac標準的速度提升了至少37%。有線網絡部分,這款主板采用了雙網卡設計,除了傳統穩定的英特爾1211-AT干兆網絡芯片外,主板還板載了瑞昱RTL8125-GG 2.5G有線網卡,網速是普通干兆網卡的2.5倍,配合ROG最新的GAMEFIRST VI網游優化工具,在開啟Gaming First Mode后,可以強制將游戲數據包排列到隊列前面而不必檢查數據包,從而有效降低網游延遲。
音頻方面,這款主板也配備了SUPREMEF×電競信仰音效系統。其核心是一顆由瑞昱特供,輸出信噪比為120dB、輸入信噪比為113dB的81220 7.1聲道Codec,并搭配一顆可推動600Q高阻抗設備,具有偵測播放設備阻抗,提供合適放大等級的耳放芯片。為了讓電競耳機擁有更好的播放效果,GROSSHAIR ⅧDARK HERO主板的前置音頻輸出則交由諧波失真僅-94dB的ESS SABRE 9023 Hyperstream DAG芯片負責,可以為玩家帶來更精準的定位、更震撼的動態效果。當然像尼吉康音頻電容、專為防爆音設計的DE-POP MOSFET,以及鍍金音頻插孔等多種高品質元件在這款主板也得到了一一應用。此外,該主板還支持DTS Sound Unbound音頻技術,這是一種結合空間音頻與HRTF高級音效定位算法的音頻技術。它不僅可以提升游戲與電影的臨場感,還能增強玩家在游戲中聽音辨位的能力,從而在FPS射擊類游戲中更好地了解敵人的動向,先發制人。目前該技術支持《戰爭機器5》《無主之地3》《使命召喚:現代戰爭》《極限競速:地平線4》等12款游戲大作。
CROSSHAIR MIIDARK HERO主板產品規格
接口 Socket AM4
板型 ATX
內存插槽 DDR4 x4(最高128GB DDR4 5000)
顯卡插槽
PCle 4.0 x16 xl
PCle 4.0 x8×1
PCle 4.0 x4×1
擴展接口
PCle 4.0 xl×1
PCle 4.0 x4 M.2x2
SATA 6Gbps x8
音頻芯片 ROG SupremeFX S1220 8聲道音頻芯片
網絡芯片
瑞昱RTL8125-CG 2.5G有線網卡
英特爾1211-AT千兆網卡
英特爾Wi-Fi 6 AX200+Bluetooth v5.0無線網絡模塊
背板接口 USB 3.2 Gen l+USB 3.2 Gen2 Type-A/C+RJ45+模擬音頻7.1聲道接口+S/PDIF光纖輸出+Wi-Fi天線接口
參考價格 新品待定
充分發揮Zen 3處理器最大性能還有三員大將來助力
除了GROSSHAIRⅦDARK HERO主板,為了充分發揮出銳龍9 5950X處理器的最大性能,我們還請來了三員大將進行輔助,它們是:
三星980 Pr0 1TB NVMe M.2 SSD
從Pro的后綴就可以看出,它是三星最新的旗艦級SSD,采用了三星支持PGle 4.0技術的Elpis主控。該主控采用三星自研的8nm生產工藝打造,支持NVMe l.3c技術標準、PCle 4.0 x4傳輸帶寬。閃存方面,這款SSD使用了三星最新的1 36層堆疊V6 TLC閃存顆粒,相對上代的92層堆疊顆粒,增加了40%的存儲密度,并減少了15%的能耗,帶來了更強的性能。其處理讀取、編程請求的響應速度提升了10%。經我們實測在基于銳龍9 5950×的PCle4.0平臺上,其最大連續讀寫速度突破6700MB/s,單線程隨機4KB性能突破21000 IOPS,AS SSD BENICHMARK總分達到8987分。
美商海盜船復仇者LPX DDR4 4133內存16GB套裝
雖然低矮的外形、沒有RGB LED的設計讓這套內存從外表看起來很主流,但在性能上它卻超過了很多高端產品。該內存采用8層PCB設計,從軟件偵測來看,它使用了編號為“K4A8G085\NB-BGPB”的三星B-Die顆粒,因此其官標默認頻率就達到了DDR4 4133。值得一提的是,海盜船還隨內存附贈了一套內置風扇的主動式內存散熱器,可以安裝在內存上方,自上而下向內存輸送強勁的風力,使內存保持在很低的工作溫度。經我們測試即便在DDR4 4133下通過AIDA64內存烤機測試烤機半小時,內存散熱片上的工作溫度也不到36℃。
恩杰NZXTKraken海妖273360mm水冷
它是恩杰NIZXT散熱器中定位高端的水冷產品,采用長度在390mm、厚度在28mm左右的大型冷排,可安裝三把內置FDB液態軸承,采用倒角進氣口設計的高性能Aer P風扇,兼具靜音與散熱性能。更值得一提的是,這款產品還使用了由純銅打造、尺寸為79mmx79mmx52mm,提供六年質保的Asetek第七代水泵,讓用戶能安心使用。此外,該水冷的導液橡膠管由細尼龍網套包裹,能讓產品更加耐用。與其他水冷產品最大不同是,該水冷的水冷頭還內置了一塊24bit色彩的2.36英寸液晶屏幕,不僅可以顯示處理器的工作溫度,用戶還能加載自己的個人照片、搞笑GIF、標志性Logo,讓您的水冷在外觀上更具個性。
測試平臺
主板:ROG CROSSHAIRⅦDARK HERO主板
處理器:銳龍9 5950X、銳龍9 3950X、酷睿19-10900K
內存:美商海盜船復仇者LPX DDR4 4133 8GBx2
硬盤:三星980 PROITB
顯卡:GeForce RTX 3090
電源:ROG THOR1200W
接下來我們搭配目前性能最強的GeForce RT×3090顯卡對銳龍9 5950X進行了測試。我們還加入了其上代產品,同為16核心、32線程設計的銳龍9 3950X,以及在游戲性能上表現突出的英特爾酷睿i9-10900K與它進行了對比測試。
大獲全勝處理器性能測試
測試點評:從實際測試來看,銳龍9 5950X的表現顯然令人驚喜。對銳龍9 3950X、酷睿i9-10900K形成了碾壓,其測試結果完全符合AMD IPC性能提升19%的宣傳——在PerformanceTest10.0 CPU單線程性能測試中,銳龍9 5950X領先銳龍9 3950X達27.4%;在CPU-Z處理器單線程性能測試中,銳龍9 5950X的分數高達689.5,領先酷睿i9-10900K達12.9%;在Geekbench 5處理器單核心性能測試中,銳龍9 5950X也有15.9%的優勢。更讓人值得贊嘆的是,AMD處理器首次在Super Pi-百萬位測試中也戰勝了目前英特爾單線程性能最強的處理器,其運算時間比酷睿i9-10900K少了0.014秒。主要原因除了Zen 3架構帶來的技術升級外,從我們測試觀察來看,銳龍9 5950X的單核加速頻率其實也超越了官方標準,達到了最高約5.04GHz,AMD處理器也終于進入了5GHz時代。當然,酷睿i9-10900K借助TVB加速技術,其最高單核心頻率可以達到5.3GHz,但由于技術架構不敵Zen 3,因此頻率更高的它反而無法戰勝銳龍9 5950X。
大幅領先游戲性能超強的多核心處理器
測試點評:毫無疑問,銳龍9 5950X是我們所測過的1 2核心以上處理器中,游戲性能最強的產品之一。它的游戲性能不僅大幅領先于銳龍9 3950X,更超越了之前的“游戲專用處理器”酷睿i9-10900K,在1 0項測試中全勝。需要提及的是,我們的測試分辨率為1080p,并使用目前性能最強大的顯卡,可以完全排除顯卡性能瓶頸,充分體現不同處理器在運行游戲時的性能表現。而差異顯然是很大的,在《英雄聯盟》中,銳龍9 5950X的平均運行幀速比酷睿i9-10900K快了高達91.5fps;在《GS:GO》中,銳龍95950X的游戲運行幀速也比酷睿i9-10900K快了多達69.22fps;在《絕地求生:大逃殺》中的運行速度也比后者快了27.2%。兩款處理器在這三款熱門網游上的性能表現可以說是有質的差距。而在其他游戲中,銳龍9 5900X也擁有一定的優勢,如在《全面戰爭:特洛伊》中,它的運行幀速也快了多達24fps。
多核心配置優勢凸顯處理器應用測試
測試點評:在應用測試中,憑借Zen 3架構、更強的單核心性能,以及1 6核心、32線程的配置,銳龍9 5950X同樣在所有應用測試中都獲得了優勢明顯的勝利。如與同為1 6核心、32線程配置的銳龍9 3950X相比,它的V-RAY渲染性能、GINIEBENCH R20處理器多核心渲染性能分別提升了8.3%、14,7%,其Handbrake視頻轉碼速度提升了12.5%,7-2ip壓縮與解壓縮性能也提升了11.5%。與核心數只有1 0顆的酷睿i9-10900K舊比,它的優勢則是壓倒性的,其V-RAY渲染性能比酷睿i9-10900K領先了60.8%,7-2ip壓縮與解壓縮性能的領先幅度則高達93.1%,甚至在依賴處理器單線程性能的PhotoShop圖片處理中,酷睿i9-10900K的處理速度也慢了近8秒,銳龍9 5950X的速度快了8.8%。
滿載功耗不升反降處理器功耗與溫度測試
測試點評:在功耗與溫度測試上,銳龍9 5950X也為我們帶來了意外的驚喜,該處理器的滿載功耗、滿載溫度均小幅低于上一代1 6核心處理器銳龍9 3950X,體現出更好的能耗比,其在滿載烤機狀態下的全核心頻率也有約3.9GHz,但處理器的功耗與溫度都控制得比較好。
還可提升全核心性能處理器超頻性能測試
最后我們還使用ROG CROSSHAIR、Ⅷ DARK HERO主板對銳龍9 5950X處理器進行了超頻測試。從測試來看,由于該處理器在默認設置下的最高單核心加速頻率就可以達到5.OGHz以上,但要在水冷環境下再提升到5.1GHz左右就比較困難了,所以對于這款處理器在普通散熱環境下沒必要再進行以提升頻率為主的單核心超頻。不過在全核心超頻上,它還提供了一定的空間。從測試觀察來看,這款處理器在運行CINIEBENCH R20時的全核心頻率也就在3.8GHz左右。而如果將處理器的工作電壓設置為1.36V左右,我們則可將它穩定運行CINEBENCH R20時的全核心頻率提升到最高4.5GHz。在這個頻率下,銳龍9 5950X的CINIEBENCHR20多核心渲染性能提升到了11626pts,《魯大師》處理器性能提升到436925分,SiSoftware Sandra處理器算術性能達到683.7GOPS,較默認頻率下分別提升19.1%、15.4%、15.1%,提升還是非常顯著的。
兼具游戲性能與多核心性能的完美作品
綜合以上測試來看,得益于單核心性能的大幅提升,在游戲性能方面,銳龍9 5950X能在所有測試游戲中力壓之前的“游戲專用處理器”酷睿i9-10900K,而且在《英雄聯盟》《CS:GO》《全面戰爭:特洛伊>等游戲中還具備很大的優勢;在實際應用、多核心性能上,它也將同為1 6核心、32線程的銳龍9 3950X甩在身后,在基于雙通道內存的主流電腦平臺中,其多核心性能無人能敵,且并沒有增加處理器的功耗、溫度。毫無疑問,借助Zen 3架構、7nm生產工藝,AMD最新推出的1 6核心旗艦銳龍9 5950×就是兼具游戲性能與多核心性能的完美作品。
全面領先銳龍9 3900XT\酷睿i 9--10900 K
12核心次旗艦銳龍9 5900X處理器首測
銳龍9 5900X+技嘉B550 AORUSMASTER主板展示
接下來我們將要測試的就是本次Zen 3處理器中的次旗艦產品:銳龍9 5900X處理器。考慮到銳龍9 5900×的定位為次旗艦,因此在本次測試中,我們也采用了類似定位的主板來進行測試,它就是來自技嘉的B550主板:B550 AORUS MASTER。
雖然B550芯片組的規格比X570低一些,但型號上“AORUSMASTER”的出現則意味著這款主板的定位偏中高端,就像銳龍95900X-般,它也是一款僅次于X570 AORUS MASTER的次旗艦。首先從做工用料上來看,B550 AORUS MASTER主板的設計就遠好于其他B550主板。該主板采用了先進的14+2相直出式供電設計,我們知道,由于大部分PWM芯片難以直接控制、管理大于1 0相的供電電路,因此主板廠商要么需要增加倍相芯片,要么需要并聯設計來實現等效的多相供電電路。但這些方法可能會增加工作的步驟、多余的芯片,會造成一定的損耗。因此技嘉在部分高端主板上采用了直出式數字供電。所謂直出式就是通過新型PWM芯片直接控制每相供電電路,既不需要增加額外的倍相芯片,也不需要采用并聯設計,理論上可以精準地平衡每相供電電路的負載,精確地進行電壓調節,大幅提高供電效率,降低供電電路的發熱量。因此技嘉為B550 AORUS MASTER采用了具備直接支持1 6相供電能力的英飛凌XDPE132G5G PWM芯片,目前鮮有PWM芯片具有直接控制16相供電電路的能力,英飛凌XDPE132G5C是為數不多的產品之一。同時,技嘉還為B550 AORUS MASTER搭配了支持70A電流負載的英飛凌TDA21472-體式MOSFET、服務器級電感,日系FPCAP黑化版固態電容,并采用了8+4Pin供電接口。其內部由實心結構的GPU供電插針組成,相對普通供電接口內部的空心插針,它能有效降低阻抗與發熱量。整體來說,B550 AORUS MASTER可以輕松支持對TDP為105W的銳龍95900X、銳龍9 5950X的超頻,并保持較低的工作溫度。
在PCB部分,這款主板依然延續了技嘉傳統的兩倍銅即現在所稱的2盎司純銅電路板設計,即在印刷電路的電源層與接地層采用2盎司純銅箔材質降低PGB阻抗,提升PCB散熱性能與電源轉換效率。同時,這款主板在供電部分還搭載了內置直觸式熱管,比傳統鋁擠散熱片多三倍散熱面積的Fin-Arrays堆棧式散熱鰭片。該鰭片搭配1.5mm厚的LAIRD 7.5W/mK高導熱系數導熱墊,在同樣的工作時間下,可提供比傳統導熱墊更好的散熱效果。
存儲接口方面,除了6個SATA 3.0接口外,該主板還提供了三個M.2 SSD插槽。這三個插槽的帶寬都由CPU提供,都能支持PCle 4.0 x4,擁有多達8G B/s帶寬,最高支持長度為110mm的221 10大型M.2 SSD。當然,需要注意的是,其中兩個M.2 SSD插槽的帶寬來自GPU提供給顯卡的帶寬,因此在這兩個插槽上安裝SSD的話,顯卡帶寬會降低到PCle 4.0 x8,也就是相當于PCle3.0 x16。根據我們的測試來看,這對GeForce RTX 3000系列顯卡來說,幾乎沒有明顯的性能影響。此外,這三個M.2插槽還配備了技嘉特制的M.2合金散熱裝甲,以及幫助SSD與散熱片緊密接觸的導熱墊,可以有效降低SSD工作溫度,避免降速。
隨著近幾年FPS游戲的強勢崛起,玩家們也逐漸意識到游戲音效的重要性,所以越來越多的玩家看重主板在音效方面的表現,而B550 AORUS MASTER就是一款擁有出色音效的主板。其音頻系統以瑞昱ALC1220-VB音頻芯片為核心,同時輔以日系高品質音頻專用電容、WIMA發燒級音頻電容。不僅如此,B550AORUS MASTER還支持DTS:X Ultra,并且通過了Hi-ResAudio認證,讓用戶不論是在使用耳機還是音箱進行游戲時,都可以感受真實再現、定位精準的3D音頻體驗。
在網絡性能方面,B550 AORUS MASTER同樣走在時代前沿。這款主板搭載了瑞昱RTL8125BG有線網卡,其最大理論傳輸速率達到2.5Gbps,相比普通主板的干兆有線網卡,前者可提供比傳統干兆網卡更高的網絡帶寬,并且為游戲玩家們提供更快的聯網體驗。隨著Wi+i 6的迅速普及,目前不少高端主板都已支持Wi-Fi 6,B550 AORUS MASTER也不例外。它搭載了英特爾Wi+i6 AX200無線網卡,在5GHz@160MHz頻段下的理論傳輸帶寬可提升到2.4Gbps,相對帶寬1.73Gbps的Wi+i 5有明顯提升。
當然B550 AORUS MASTER主板也不會缺少技嘉傳統的RGB FUSIONI炫彩魔光燈效,主板I/O裝甲處設計了多顆RGBLED,并提供了12V 5050(GRBW) 4pin、5V 3pin RGB接口,可以連接各類燈帶、RGB發光設備,并通過RGB FUSION 2.0燈效控制軟件設置為相同的模式同步發光。
接下來我們通過技嘉B550 AORUS MASTER主板,搭配目前性能最強的GeForce RTX 3090顯卡對銳龍9 5900X進行了測試。為了讓大家更直觀地認識銳龍9 5900×的性能,我們還加入了其上代產品,同為1 2核心、24線程設計的銳龍9 3900XT,以及價格與其接近,目前售價為41 99元的酷睿19-10900K與它進行了對比測試。
技嘉B550 AORUS MASTER主板產品規格
接口:Socket AM4
板型:ATX
內存插槽:DDR4 x4(最高128GB DDR4 5200)
顯卡插槽:PCle 4.0 x16×1
擴展接口:PCle 3.0 x4 x2、PCle 3.0 xl、PCle 4.0 x4
M.2 SSD x3、SATA 6Gbps×6
音頻芯片:瑞昱ALC1220-VB 7.1聲道音頻芯片
網絡芯片:瑞昱RTL8125BG 2.5G有線網絡芯片
英特爾Wi-Fi6 AX200+藍牙5無線網絡模塊
背板接口:USB 3.2 Gen 2 Type-A/C+USB
2.O+RJ45+模擬音頻7.1聲道接口+HDMI+無線天線接口
參考價格:2098元
測試平臺
主板:技嘉B550 AORUS MASTERE主板
處理器:銳龍9 5900X、銳龍9 3900XT、
酷睿i9-10900K
內存:海盜船VENGEANCE LPX DDR4 4133 8GBx2
硬盤:三星980 PROITB
顯卡:GeForce RTX 3090
電源:技嘉AORUS 850W全模組金牌電源
優勢明顯銳龍9 5900X處理器性能測試
測試點評:從測試結果可以看到,就像銳龍9 5950X-樣,Zen 3架構為銳龍9 5900X的處理器性能同樣帶來了很大的提升。相對于第三代銳龍處理器中單核心性能最強的產品:銳龍93900XT,它的單核心性能在PerformanceTest 10.0 CPU單線程性能測試中提升了多達23.4%;在CPU-Z 1.94處理器單線程性能測試中提升了19.8%。與英特爾目前單核心性能最強的產品酷睿i9-10900K相比,銳龍9 5900X也毫無懼色,在絕大部分測試中都獲得了勝利,如在Geekbench 5的處理器單核心性能測試中,它的性能領先幅度高達12%,而在多線程性能測試上,憑借更多的核心數,銳龍9 5900X則實現了對對手的徹底碾壓。
唯一告負的是在Super Pi-百萬位測試中,銳龍9 5900X不敵酷睿i9-10900K,也不如之前測試過的銳龍9 5950X,消耗時間要稍多一點。從我們測試觀察來看,可能是為了區別定位,實測中顯示,銳龍9 5900X在單核心任務中的最高加速頻率在4.94GHz左右,雖然超出了其官方最高4.8GHz的指標,但仍比銳龍9 5950X在實測中單核最高可加速到5.04GHz,以及酷睿i9-10900K最高5.3GHz的頻率低。
壓到性的優勢適合游戲的處理器
測試點評:在游戲玩家最關心的游戲性能測試,就如銳龍95950X,銳龍9 5900X的優勢同樣非常明顯,在總計十款游戲性能測試中也都獲得了全勝。相比銳龍9 3900XT,單核心性能大幅提升的銳龍9 5900X優勢很大,畢竟目前能用到處理器全部計算線程的游戲很少,尤其是在《英雄聯盟》《CS:GO》《絕地求生:大逃殺》這類熱門網絡游戲上,因此單核心性能就成了保證游戲性能的關鍵。可以看到,銳龍9 5900X在這兩款游戲上的運行幀速分別比銳龍9 3900XT快了50.3%、41.8%、41.8%。即便與曾經的“游戲處理器王者”酷睿i9-10900K相比,銳龍9 5900X的幀速也分別快了40.2%、21.1%、26%,優勢非常大。同時在其他游戲中,憑借更強的單核心性能,銳龍9 5900X也有明顯的優勢。如在《坦克世界》中,它的平均幀速領先酷睿i9-10900K約16fps;在《全面戰爭:特洛伊》中,它的游戲平均運行幀速速度領先酷睿i9-10900K達21.2%。毫無疑問,優秀的單核心性能大幅提升了Zen3處理器的游戲性能,將對比處理器遠遠甩在身后。
多核心性能優勢凸顯處理器應用性能測試
測試點評:在實際的應用測試中,同樣IPC性能更高的銳龍95900X優勢明顯,在所有測試中獲得全勝。其中在CINEBENCHR20處理器多核心渲染性能測試中,它分別領先銳龍9 3900XT、酷睿i9-10900K達20.3%、34.5%。在實際的應用中,由于目前大部分應用都會調用處理器的多顆核心運算,因此在V-RAY渲染引擎測試中,銳龍9 5900X的渲染性能也大幅領先兩款對比產品,尤其是較核心數偏少的酷睿i9-10900K,其領先幅度更達到了36%。而在7-2ip壓縮與解壓縮性能測試中,銳龍9 5900X較酷睿i9-10900K的領先幅度更擴大到了驚人的63.6%。同時,在Handbrake 4K視頻轉1080p H.264視頻測試中,銳龍9 5900X的轉碼速度也比酷睿i9-10900K快了28%。同樣,在執行依賴單核心性能,包括色彩轉換、“調色刀”、“海綿”濾鏡等15項工作的PhotoShop應用體驗中,酷睿i9-10900K的運行速度也比銳龍95900×慢了7.5%,消耗的時間多了6.5秒。這意味著Zen 3在日常工作中也能幫您節約時間。
壓力不大功耗與溫度測試
測試點評:在功耗與溫度測試中,由于銳龍9 5900X與銳龍93900XT都采用相同的臺積電7nm工藝生產,因此不論是功耗還是溫度,它們的表現都非常接近,頻率更高的銳龍9 5900X的滿載功耗與溫度要稍低一些,體現出更好的能耗比。值得注意的是,在同時將CPU、FPU、CACHE三部分的負載提升到最大的AIDA64處理器滿載測試中,運行1 5分鐘后,技嘉B550 AORUS MASTER主板供電部分的溫度并不高,最高溫度只有60℃左右,顯示出其1 6相直出式供電的優異性。
處理器全核心超頻可達4.6GHz內存頻率輕松超越DDR4 4500
最后我們還通過技嘉B550 AORUS MASTER主板對銳龍9 5900X進行了超頻測試。從超頻測試來看,在使用恩杰NIZXTKraken海妖273-體式水冷的環境下,銳龍9 5900X進行全核心超頻所能設置的最高電壓還是在1.36~1.38V左右,能通過CINEBENGH R20的全核心超頻頻率為4.6GHz。CINEBENCHR20多核心渲染測試成績從默認的8525pts提升到9080pts,SiSoftware Sandra處理器算術性能從495.33GOPS提升到526.31GOPS,超頻提升幅度分別達6.5%、6.25%。當然你也可以關閉部分核心,對銳龍9 5900X進行單核或雙核心超頻,我們在只開啟兩顆處理器核心的情況下,也可以將銳龍9 5900X的頻率輕松超頻到5.05GHz左右,令其Super Pi一百萬位運算時間縮短到7.032秒。
此外,借助技嘉B550 AORUS MASTER主板,銳龍95900X也擁有很強的內存超頻能力,在1.5V內存電壓,20-25-25-45延遲設置下,最高可將美商海盜船VENIGEANCE LPX DDR44133內存超頻到DDR4 4733,在AIDA64 6.30測試中帶來接近70000M B/s的內存讀取帶寬。
在中高端市場更具購買價值
綜合以上測試,我們認為借助Zen 3架構,19%的IPC性能提升,銳龍9 5900X完美地完成了在中高端處理器市場狙擊對手,大幅提升游戲性能的任務——在所有測試游戲中,它的游戲性能都明顯強過酷睿i9-10900K,在《英雄聯盟》《CS:GO》《絕地求生:大逃殺》這類網游中還具備很大的優勢;同時單核心性能的提升,也讓它的多核心性能最終變得更強,在圖形渲染、視頻轉碼、壓縮與解壓縮等應用與競爭對手拉開了更大的差距,甚至在依賴單核心性能的PhotoShop中,Zen 3也能獲得優勢。價格方面,與售價仍在4199元的酷睿i9-10900K相比,它的售價更合理。對于那些需要同時獲得游戲性能、多核心性能,但預算不是太多的用戶而言,銳龍9 5900X就是比酷睿i9-10900K更合理的選擇。
不僅能超處理器,還能將Infinity Fabric頻率超上2000MHz!
Zen 3處理器+主流500系主板超頻實戰
七彩虹X570M GAMING FROZWN V14 主板展示
采用Zen 3架構的AM D銳龍5000系列處理器不僅大幅提升了單核心性能,還有效提升了處理器的游戲性能、多核心性能,令銳龍5000系列成為一款兼得游戲性能與多核心性能的完美產品。根據AMD的官方消息,采用500系主板就能支持Zen 3處理器,那么除了功能豐富、供電豪華的中高端500系主板,定價在干元左右的主流的500系主板能否很好地支持Zen 3處理器,是否還能對它進行處理器超頻與內存超頻呢?我們特別選用了一款來自七彩虹的X570M GAMING FROZENV14主板進行測試。
該主板采用Micro-ATX小板設計,售價僅1 099元,與不少僅部分支持PCle 4.0技術的B550主板差不多,卻板載完全支持PGle 4.0的X570主板芯片組,并提供了一個PGle 4.0 x16顯卡插槽,一個PGle 4.0 x4插槽,以及兩個支持PCle 4.0 x4標準的M.2 SSD接口、6個SATA 6Gbps接口,足以滿足主流用戶的需求。而這款主板之所以在型號上帶有“FROZEN”(寒霜)是因為整塊主板均配備了被稱為“寒霜散熱裝甲”的亮銀色鋁合金散熱模塊。
供電方面,它采用了4+2相供電設計。其中為處理器核心供電的每相供電包含有兩上兩下四顆MOSFET,兩顆電感,等效為8相供電。上橋MOSFET采用了來自萬國半導體的AON16414A,其內阻值在10V電壓下低于8mQ,典型承載電流值為30A,最高可達50A。下橋MOSFET同樣來自萬國半導體,不過型號換為A0N6354。這款MOSFET的性能更為優異,在10V電壓下的內阻小于3.3mQ,最高可承載電流達80A,在100℃高溫下也能達到52A。電感部分,這款主板采用的是全封閉F.C.G鐵素體電感,可以降低電感線圈對主板其他元器件的電氣干擾。電容上,根據七彩虹提供的資料,這款主板采用的是10K黑金固態電容,可以提升主板的工作穩定性。
在網絡部分,其網卡芯片采用了穩定、可靠的瑞昱RTL8111H干兆網卡,內置LDO低壓差線性穩壓器,支持AGPI高級配置和電源管理接口、高級電源管理技術。同時七彩虹還為這顆網絡芯片配備了EMI保護罩,可有效提升網絡穩定性,防止周邊電路和電磁波對網絡的干擾。音頻方面,這款主板則采用了支持7.1聲道輸出的瑞昱ALC 892音頻芯片,同時日系尼吉康專業音頻電容的采用,則能讓音質更加清晰、溫暖、逼真。音頻部分還采用了LED分割線設計,可以進一步降低主板上的高頻信號噪聲干擾。
七彩虹X570M GAMING FROZEN V14產品規格
接口:Socket AM4
板型:Micro-ATX
內存插槽:DDR4 x4
顯卡插槽:PCle 4.O x16×1
擴展接口:PCle 4.0 x4 xl、PCle 4.Ox4 M.2SSD×2、SATA 6Gbps×6
音頻芯片:瑞昱ALC 892 7.1聲道音頻芯片
網絡芯片:瑞昱RTL8111H千兆有線網絡芯片
背板接口:USB 3.2 Gen l Type-A/C+USB 2.O+USB 3.2
Gen 2+RJ45+模擬音頻711聲道接口+HDMI+DP+PS/2
參考價格:1099元
碾壓10900K正常發揮Zen 3處理器的最大性能
我們首先采用X570M GAMING FROZEN V14主板、GeForce RT×3090顯卡對銳龍9 5900X處理器進行了測試。值得贊嘆的是,作為主要主板廠商,七彩虹也早早為它的500系主板更新了BIOS,將AGESA(AMD通用封裝軟件架構)升級到1.1.0.0版本,使得主板可以輕松支持最新的Zen 3處理器。從默認頻率下的性能測試來看,X570M GAMING FROZENI V14主板顯然可以充分發揮出銳龍9 5900X處理器的最大性能,不論是單核心性能還是多線程性能、游戲性能,銳龍9 5900X在各項性能測試中的表現都遠遠超越酷睿i9-10900K,展現出了Zen 3架構的技術實力。如在SiSoftware Sandra處理器算術性能測試中,銳龍95900X領先酷睿i9-10900K達23.2%,在《英雄聯盟》游戲性能測試中,銳龍9 5900×的平均運行幀速比酷睿i9-10900K快了高達40.5%。
只需三步主流主板可輕松提升Ze n 3處理器多核心性能
接下來,我們使用X570M GAMING FROZEN V14主板對銳龍9 5900X的超頻性能進行了測試。根據我們的多次嘗試來看,在普通散熱環境下,用戶能有效提升的是銳龍9 5900×的多核心性能,但難以大幅提升它的單核心性能。原因很簡單,銳龍95900X在默認設置下的單核心最高加速頻率就達4.9GHz左右,已經接近單核心穩定運行的極限(在5.05GHz左右),另外超頻時還需要關閉其他核心,才能令程序強制使用超頻后的那顆核心,因此這樣的單核心超頻實用意義不是太大,所以能有效提升多核性能的全核心超頻更具實用價值。
而在運行CINEBENGH R20這樣的渲染測試時,銳龍95900×的最高頻率在4.3GHz左右,因此進行全核心超頻的目標是必須高于4.3GHz。而經我們的多次測試來看,在使用恩杰NIZXT Kraken海妖273 360mm水冷散熱器的環境下,X570MGAMING FROZEN V14主板最高可將銳龍9 5900X的所有核心超頻到4.6GHz,帶來明顯的多線程性能提升,其方法也非常簡單:
首先在AMD官方網站下載并啟動最新版本的RYZENMASTER,點擊選中“Profile 1”,再點擊右上角的“手動”,你就可以對處理器進行手動超頻了。
接下來通過RYZEN MASTER你也可以看到Zen 3處理器最大的不同之處——只有—左一右的兩個CCD大方框,也就意味著處理器內部只有兩個CCD模塊。此時點擊CCD 0方框左側的紅色圓形標識,將其變為綠色也就意味著你開啟了“將一個核心的頻率鏡像到所有核心”的功能,此時你只要設置一顆核心的頻率,就能同步對其他核心進行相同的設置。
最后任意設置一顆處理器核心頻率為4600即可將處理器的目標頻率設置為4.6GHz,然后進行最重要的一步,小幅提升處理器的工作電壓。銳龍9 5900X在運行CINIEBENCH R20時的處理器工作電壓在1.34—1.35V左右,要想提高頻率后繼續穩定地運行渲染測試,需要我們將處理器工作電壓調節在1.36—1.38V這個區間。要達到這個電壓,在X570M GAMING FROZEN V14主板上,我們只需要將RYZEN MASTER的“電壓控制”數值設定為“1.29375V”即可。可能由于軟件的偵測誤差,也可能是主板處理器核心電壓存在一個小幅加壓,雖然設置的這個電壓數值低于1.3V,但處理器運行CINIEBENCH R20的實際電壓數值在1.376V左右,而這一電壓也可以保證處理器超頻后穩定地運行各類多線程軟件,并帶來性能上的提升。如CINEBENGH R20處理器多核心渲染性能從8471pts提升到9120pts,提升幅度達7.6%。
可對lnfinity Fab rIc總線超頻內存可輕松超頻到DDR4 4000以上
除了處理器超頻,我們發現X570M GAMING FROZENV14主板還具備一個非常強勁的能力,可對處理器的Infinity Fabric總線超頻,增強處理器對高頻內存的支持能力,并減少延遲。InfinityFabric總線是銳龍處理器內部芯片之間的互聯總線,其默認最高工作頻率一般在1800MHz左右,處理器內部需要通過它將內存數據傳送給處理器,因此在默認設置下,Infinity Fabric的總線時鐘頻率與內存時鐘頻率以1:1的方式捆綁在一起。簡單來說,工作在1800MHz下的Infinity Fabric總線的等效數據傳輸帶寬與DDR43600內存相同,但如果用戶使用頻率更高的內存,如DDR44000,而Infinity Fabric總線頻率仍保持為1800MHz的話,那么就必須等待速度慢的Infinity Fabric總線將數據傳輸完畢后,才能進行下—次傳輸,造成額外的延遲。
而在Zen 3處理器上,AMD提升了這一代處理器的InfinityFabric總線時鐘頻率的超頻能力,在普通散熱環境下最高可以達到2000MHz,也就是說能對DDR4 4000內存提供完美支持,不過需要主板BIOS進行相應的更新。而在Zen 3發布之初,經我們測試,七彩虹X570M GAMING FROZEN V14主板完美地實現了這個目標。超頻方法也很簡單,只需兩步:
首先根據自己所用的內存體質,在七彩虹X570M GAMINGFROZEN V14主板BIOS中設置內存電壓,在這里我們設置的電壓為1.5V。
接下來在RYZEN MASTER“Profile 1”選項卡中開啟手動模式的情況下點擊“內存控制”,將“耦合模式”設置為“開”,保證內存頻率與Infinity Fabric總線頻率可以同步超頻,接下來將內存頻率、Infinity Fabric頻率同時從“1800”設置為“2000”,并根據自身所用內存體質設置各個延遲參數后,點擊應用重啟即可。
可以看到,在七彩虹X570MGAMING FROZEN V14主板將處理器Infinity Fabric總線時鐘頻率超頻到2000MHz,與DDR4 4000同步后,處理器的內存性能有了明顯的提升,與1800MHz下的DDR4 4000內存相比,內存的讀寫、復制帶寬都有明顯增長,更值得一提的是,內存的訪問延遲從65.3ns大幅降低到55.4ns,減少了接近10ns。
當然如果您只追求內存頻率,也可以將Infinity Fabric總線時鐘頻率固定在1800MHz,只提升內存頻率。根據我們的測試,在使用海盜船VENGEANCE LPX DDR4 4133內存,1.5V電壓設置,22-22-22-52延遲設置下,七彩虹×570M GAMINGFROZEN V14主板最高可將內存頻率超頻到DDR4 4400,令內存的讀取帶寬接近65000M B/s。
主流500系主板就能玩轉Zen 3處理器
綜合來看,采用七彩虹X570M GAMING FROZEN V14這類主流主板,我們就能很好地使用Zen 3處理器,充分發揮Zen 3處理器優秀的單核心性能、游戲性能、多核性能。而借助RYZENMASTER超頻軟件,我們既能簡單、輕松地對Zen 3處理器進行全核心超頻,也可以對Infinity Fabric總線時鐘頻率、內存頻率進行超頻,有效提升AMD平臺的內存性能。因此對于預算有限的用戶而言,選擇一款像七彩虹X570M GAMING FROZEN V14這樣做工扎實、BIOS更新快的干元級主流主板就能讓您輕松玩轉大部分Zen 3處理器。