通過新的Zen處理器,AMD希望能夠打破英特爾的主導地位。由于采用了眾多新的設計,Zen處理器至少在計算速度上可以與其對手最好的處理器一較高下。
個人電腦是每一個家庭最主要的電腦設備,因而英特爾和AMD之間的競爭影響著所有的人。大約5年前,AMD推出的Bulldozer芯片架構以失敗告終,不得不退出與英特爾的競爭。從那時起,英特爾成為了個人電腦用戶愛好者唯一的選擇:如果我們想組建一臺強大的個人電腦,英特爾的Core i處理器將是唯一的選擇,因為它們是最強大的處理器,同時也代表著最佳的性價比。不過,現在AMD又回來了,其新的芯片架構Zen預期將有能力與Core i處理器一較高下。
兩個因素確保了這一點,此前AMD芯片的效率明顯要低于英特爾的芯片。與AMD合作的晶圓代工廠Global foundries(格羅方德)公司直到最近仍然在使用32nm的晶體管工藝。而英特爾2012年就已經生產了22nm的晶體管,現在的晶體管尺寸更是縮小到了14nm。每次縮小尺寸,芯片的效率可以提高約40%,這導致AMD一直處于劣勢。而隨著Global foundries 2017年開始生產14nm的芯片,AMD公司的芯片效率將大幅度提升。
AMD的“回到未來”
第二個因素與洞察力有關:AMD當時的副總裁安德魯·費爾德曼(Andrew Feldman)在2013年表示,Bulldozer已經“徹底失敗”。AMD在Bulldozer芯片架構上不再采用一個處理器中多個完整核心的概念,而是將處理器劃分為核心模塊,模塊由執行整數運算和浮點運算的兩個計算核心構成。這導致出現兩個核心競爭浮點資源,在多媒體應用程序等多種應用上出現處理器性能下降的問題。
而在Zen架構上,AMD不再采用這個模塊的概念。相反,Zen處理器的每個核心都有一個整數和一個浮點單元。此外,AMD引入了名為“對稱多線程”的超線程。像Core i處理器一樣,Zen的每個核心都可以同時處理兩個線程。在新的架構下,AMD還調整了為內核傳送或記錄數據的緩存。兩個L1高速緩存已經被加大,同時L1數據高速緩存根據“回寫”原理保存,其內容不再鏡像(直寫)到較慢的L2緩存。這解決了Bulldozer數據緩存不足以及兩個核心共享L1緩存的問題。
L1指令高速緩存和L2緩存的大小現在是過去的兩倍,L2緩存現在是每個核心512KB,這是Skylake處理器的兩倍。因此,Zen核心一般不怎么需要依靠最慢的L3高速緩存。雖然AMD犧牲了可以用于投入于更多計算單元的芯片面積,但是根據AMD的介紹,與上一代Bulldozer相比,Zen的L1和L2緩存的訪問時間明顯降低。L3緩存方面Zen架構下每個內核2MB,這與Skylake處理器相同。Zen處理器可以將4個核心組合為一個基本單元,可以與圖形單元或4個以上的內核對接形成一個相當于8內核Skylake 6700或Broadwell E的處理器單元。
復制英特爾并超越它
AMD在新的處理器中開始加入了微指令緩存:來自緩存的指令對于計算單元來說太長了,不可能直接進行處理,解碼器必須將它們轉換成更小的微指令。為此,AMD在Zen架構中加入了一個微指令緩存,它將負責保存解碼了的微指令,形成一個微指令的隊列。微指令隊列能夠分別對兩個計算單元進行饋送,提高整數和浮點計算單元的利用率。這將可以避免核心浪費額外時間從緩存中獲取指令,并改進指令隊列的分支預測,對提升核心的執行效率效果非常明顯。在微指令緩存的輔助下,芯片每個時鐘最高可以處理6個指令。而對于英特爾來說,從SandyBridge開始一直都是這樣做的。
Zen的最大劣勢在于其浮點單元,合并4個128位浮點單元不等于一個完整的512位單元。在處理英特爾推出AVX2指令集的256位指令時,由于每個單元只有128位,所以這使得Zen必須將兩個單元合并起來,這將不可避免地產生一定的時間延遲,而Skylake處理器則無需如此。為此,Zen的回退隊列將包含每個時鐘兩個計算單元的8個結果,這是Skylake處理器的兩倍。
AMD在一項測試中證明,一個Zen8核處理器與相同時鐘的BroadwellE一樣快。很快AMD將推出其新一代的Zen架構的處理器,預計我們將能夠在2017年的春季可以買到。新的處理器使用AM4插座,主板支持新的接口(M.2、USB 3.1)和DDR4內存,在眾多的改進下,我們很可能可以在2017年組裝一個基于Zen的高性能個人電腦。
責任編輯:金雅文jin_yawen@chip.cn