Dying
大型3D游戲的日益增多以及手機、平板同液晶電視互聯(lián)互通應用的日益頻繁,對手機、平板等移動設備性能要求也越來越高,當我們在討論平板電腦CPU處理器向四核芯邁進的時候,移動GPU已悄然向八核芯發(fā)起了沖擊——
圖形性能與計算性能的取舍
“消費大眾對于智能手機、平板電腦以及智能電視寄予更高的視覺計算標準,希望它毫無縫隙的連接到個人的數(shù)字生活與資訊內(nèi)容。而GPU計算便可達成這項目的,因為它能夠擴大移動設備在電池續(xù)航能力內(nèi)可操作的功能。ARM持續(xù)地透過整合市場領先的CPU和GPU技術,致力于系統(tǒng)全面優(yōu)化的實現(xiàn),促使高性能和低能效同時實現(xiàn)。”
——ARM多媒體處理部門總經(jīng)理Pete Hutton
同桌面PC使用的GPU顯卡一樣,隨著技術的進步,移動GPU同樣面臨著圖形性能與計算性能間的平衡與取舍。ARM顯然注意到了這一點,將最新發(fā)布的Mali-T600系列GPU分為兩條線,一條追逐更高的圖形性能,另外一條則為圖形與GPU計算優(yōu)化。
50%的性能提升
Mali-T600系列開發(fā)代號為Midgard,是ARM的首個統(tǒng)一著色器架構。已公布的Mali-T628、Mali-T624、Mali-T604和Mali-T601四款型號都是強調圖形性能的,而Mali-T678和Mali-T658兩款型號則是為計算而優(yōu)化的。ARM通過架構增強使得同樣的內(nèi)核面積能提供更高的時鐘頻率、更高的IPC(每時鐘周期指令數(shù))、更高的能效,從而使每個型號的性能都可以提升50%。新的Mali-T600系列不但支持OpenGL ES 1.1/2.0/3.0、DX 11/11 FL 9_3,而且OpenCL并行計算能力向桌面GPU看齊,不再局限于移動嵌入式的Emebedded Profile,此外還支持Google RenderScript計算語言。而對于一致性的追求,自動將任務分配給合適的模塊,實現(xiàn)異構計算系統(tǒng)性能和能效的最大化(有些類似AMD APU了)。
兼顧畫面與功耗的ASTC
ARM在Mali-T600系列中加入了一項名為適應性可擴展紋理壓縮的紋理壓縮技術,該技術由ARM開發(fā),Khronos Group已將其納入OpenGL ES規(guī)范的紋理壓縮技術,能在系統(tǒng)級別提高效率,并改進紋理質量和彈性。依靠此技術,開發(fā)者能夠通過應用程序使用紋理壓縮,并且為每個用例選擇適合的格式以及比特率。該壓縮標準不僅使開發(fā)者開發(fā)更加容易,而且還能減輕應用程序處理時候的性能消耗,因此也延長了設備的使用時間。
走近Mali-T600
Mali-T624、Mali-T628和Mali-T678是ARM較早發(fā)布的三款Mali-T600系列產(chǎn)品,三者的二級緩存都是32-256KB(推薦每核心32KB),內(nèi)建MMU(內(nèi)存管理單元)支持虛擬內(nèi)存,支持4/16x FSAA全屏抗鋸齒。Mali-T624是一個基礎型號,核心數(shù)量1-4個。Mali-T628核心數(shù)量4-8個,每個Shader里有兩個ALU(算術邏輯單元)、一個LSU(本地存儲單元)、一個紋理單元,圖形性能最高達Mali-T624的兩倍。二者主要面向智能手機、智能電視應用。Mali-T678是旗艦型號,核心數(shù)量1-8個,ALU數(shù)量翻倍,計算性能可達Mali-T624的四倍,主要用于平板機市場,可滿足計算攝影、多視角透視、增強現(xiàn)實等應用。