可樂



AMD Kaveri APU開創了AMD全新的異構計算時代,為AMD未來的發展鋪平了道路。在硬件上,Kaveri APU在GPU和CPU部分都做出了重大改進,全新的壓路機CPU架構和強大的GCN GPU架構使得APU在性能上達到了一個巔峰。在軟件方面,借助于統一內存尋址技術和HSA異構加速的強大魅力,APU能夠以前所未有的態勢展現出其在應用程序加速、并行計算等方面的獨特優勢。
1 全新的CPU和GPU架構
Kaveri APU在硬件上的優勢在于全新的硬件架構。它的CPU部分采用了AMD在推土機架構上大幅度加強、重新調整設計的壓路機架構。而GPU部分,桌面顯卡上流行的GCN架構的加入,使得Kaveri APU成為史上圖形性能最強大的處理器產品。
壓路機架構:IPC大幅度提升
AMD之前的的推土機架構設計存在些許遺憾。而在Kaveri APU上,AMD經過全新調整推出了壓路機架構,總的來看,Kaveri APU的壓路機構相比同檔次的推土機和打樁機架構,綜合性能提升大約15%~20%。
根據AMD官方資料,壓路機架構指令部分大幅度加強,指令緩存追蹤失敗幾率降低30%,分支預測失敗幾率降低20%,每個線程增加了25%的數據調度寬度,為每個整數單元配備了獨立的解碼單元。在執行部分,壓路機增加了5%~10%的調度效能,提升了L1數據緩存的存儲性能。此外,壓路機還引入了動態調整大小的L2緩存、增加了微解碼操作隊列,提升了L1和L2緩存的接口,上述改進使得壓路機的性能相比之前的推土機有了明顯的提升,尤其是額外增加的整數解碼單元,使得壓路機的整數性能明顯提升,在執行日常操作時性能表現更為出色。
GCN架構:史上最強的融合GPU
AMD官方數據顯示,新的GCN架構融合獨顯核心帶來了最多30%的GPU性能增加。Kaveri APU完美支持DirectX 11.2、Open GL 4.3等一些新技術,也支持AMD諸多特色技術,如Mantle、TureAudio、UVD等,堪稱史上規格最全面、性能最強悍。
Kaveri APU最多可以集成8個CU單元,每個CU單元有64個流處理單元, 最多擁有512個流處理單元,規格堪比目前桌面獨立顯卡。AMD宣稱Kaveri APU的頂級型號A10-7850K可以在1080P分辨率下以中等畫質以每秒30~40幀的速度比較流暢地運行《戰地4》。此外,AMD還額外強調了兩個數據,856GFLOPS和47%的GPU面積。Kaveri APU的計算能力目前最高可達到856GFLOPS,與此相對應的是上一代Richland APU的最高浮點計算能力為779GFLOPS。從數據來看,雖然Kaveri APU只想對Richland的絕對值提升了約10%,但是由于CPU和GPU架構的改進以及統一內存尋址、HSA等技術的引入,Kaveri APU在實際的計算能力上相比前代的Richland還是有更大幅度的進步的。此外,Kaveri APU中GPU部分的面積越來越大,目前已經達到了47%(浮點計算貢獻能力約86%)。更大的GPU面積可以提供更強大的浮點計算能力,也能夠使得APU在運行圖形應用以及有關并行計算時效能表現更為出色。
2 新工藝提升能耗比
在這一代新的Kaveri APU上,AMD采用了全新的28nmSHP工藝。全新的工藝擁有超高的晶體管密度。之前的Richland APU的晶體管數量有13億個,核心面積為246平方毫米,但是在Kaveri APU上使用了GlobalFoundries新的“半代工藝”后,擁有高達24.1億晶體管,但是核心面積卻只有245平方毫米,晶體管密度幾乎提升一倍。
更小的核心面積有助于降低產品的成本。不僅如此,Kaveri APU借助于全新的28nm SHP工藝,功耗表現也非常令人滿意,最高功耗僅有95W,最低功耗甚至只有15W。更低的功耗加上更強悍的性能,大幅度提升了APU的性能功耗比,擴展了APU的市場范圍?,F在AMD可以提供高性能、低功耗以及超低功耗等多個版本的APU產品,各個類型的用戶都可以得到自己想要的選擇。
3 異構計算魔力初現
對Kaveri APU而言,硬件架構的進步只能說是常規性的。而Kaveri APU對統一內存尋址(Heterogeneous Uniform Memory Access,簡稱為hUMA)的支持,則完全可以堪稱對整個業界尤其是異構計算發展的革命性推動。Kaveri APU是目前全球首款能夠支持CPU和GPU統一尋址的處理器,也是AMD未來發展HSA(Heterogeneous System Architecture,異構系統架構)的核心產品。
在傳統的理念中,由于巨大的結構差異,CPU和GPU各有所長,將它們融合在一起進行智能調度并發揮各自的優勢,一直都極為困難。傳統的CPU+GPU的分離式架構通過PCI-E總線調配CPU和GPU中的數據,并且CPU和GPU各自有擁有本地存儲,這樣就造成了兩者之間數據的共享和傳輸存在瓶頸,還給編程人員和程序編譯帶來了巨大的困難。
為了解決這樣的問題,AMD在Kaveri APU上支持hUMA,使得CPU和GPU能夠使用統一的內存空間,數據存放于CPU和GPU公共的空間中,可以被CPU和GPU同時調用和讀取,完全沒有任何帶寬和數據存儲上的阻隔,效率相比傳統的CPU+GPU分離式設計有了翻天覆地般的提升,同時為異構計算本身的發展打開了大門。為了更進一步發展Kaveri APU統一內存尋址的強大潛力,AMD還專門組建了HSA聯盟,并從軟件開發和硬件底層兩方面下手支持HSA異構計算的發展。根據AMD展示的一些例子,在HSA的支持下,Kaveri APU相比傳統CPU,在JPEG解碼速度上的提升高達87.3%。此外還有諸如人臉識別、圖形加速等強大的功能,在HSA和Kaveri APU的加持下都能獲得極為明顯的性能提升。
4 奏響APU最強音
從硬件、軟件以及架構設計和規格來看,Kaveri APU不愧是目前AMD最強的APU產品。借助于全新的打樁機架構、GCN融合顯卡,Kaveri APU實現了性能的飛躍。在軟件方面,HSA架構以及相關軟件的配合,使得Kaveri APU開啟了一扇通向未來異構計算的大門。這也是AMD布局多年后希望得到的結果。總的來說,Kaveri APU是AMD未來發展的核心,也是AMD未來進化的基礎。