
GPU引起的軍備競賽
我們都知道,智能手機/平板電腦專用的ARM“處理器”實際上就是一整套SoC(系統級芯片),包含CPU(決定運算性能)、GPU(決定圖形性能)、內存控制器(決定I/O性能)、基帶射頻芯片(決定網絡支持)等諸多組成部分。由于ARM處理器大都以Cortex-Axx(如A15、A53等等)架構設計,所以在架構、核心數量和主頻相近時,各大品牌的處理器很難拉開CPU性能上的差距。此時,GPU的強弱,則會直接表現在具體游戲中的流暢度。

因此,無論是高通(驍龍)、三星(獵戶座)、聯發科、華為(海思)、英特爾(凌動),大家最新款移動處理器都紛紛武裝上了最新GPU技術(表1)。論及表中的GPU性能,專為蘋果iOS優化的PowerVR GX系列GPU擁有毋庸置疑的優勢,而其他GPU芯片則會受核心頻率以及渲染單元數量的影響而互有優劣。比如Mali-T628MP6和Mali-T760MP2,雖然看起來“Mali-T760”是“Mali-T628”的升級版,但由于Mali-T628MP6配有6個(MP6)處理單元,因此它的實際性能可能就要在僅有2個(MP2)處理單元的Mali-T760MP2之上。
從開普勒到麥克斯韋
就在各大ARM處理器廠商為各自采用GPU技術的強弱而爭論不休之際,NVIDIA始終是頗為淡定的。作為以做顯卡起家的NVIDIA來說,從2011年初試啼聲的Tegra2開始,其處理器所集成的GPU就始終領先于同期的其他ARM處理器。這也難怪,作為NVIDIA的“主場優勢”,如果連GPU技術再拿不出手實在有點說不過去。
沒錯,NVIDIA能在GPU性能上領先的秘訣,就是源于在臺式機/筆記本領域做顯卡的經驗。以上代Tegra K1為例,NVIDIA首次將與桌面平級的開普勒(Kepler)架構引入到了移動領域,憑借核心架構以及高達192個流處理器的優勢,讓Tegra K1在GPU性能上足以媲美蘋果A8X。要知道,Tegra K1的上市時間要早于A8X半年以上。
而NVIDIA Tegra X1則在K1的基礎上,將開普勒架構替換成了最新的第二代麥克斯韋(Maxwell)架構,與我們熟悉的GTX750/750Ti、GTX980/970、GTX850M/GTX970M等臺式機/筆記本領域的大放異彩的獨立顯卡一致!如果以時間為線索,開普勒架構在誕生近2年后才被NVIDIA領進了移動領域,而二代麥克斯韋剛剛在桌面上亮相半年就被強行拉到了移動市場,由此可見NVIDIA對Tegra X1的重視,以及鞏固其GPU性能優勢的決心(圖1)。
對DIY玩家而言,麥克斯韋絕對是顯卡中的“神器”,其最大特色就是在提供比開普勒更強性能的同時卻降低了功耗和發熱量。如今,繼承麥克斯韋核心競爭力的Tegra X1不僅具備架構上的優勢,在其他規格上也是遠勝前輩Tegra K1。
Tegra K1強悍的GPU性能
Tegra K1使用了一組陣列(SMX),而Tegra X1則改用了兩組(SMM)(圖2),也因此讓X1獲得了更多的CUDA、光柵和紋理單元數量(表2),這些參數上的改進可以讓其更容易驅動4K級別的顯示設備。如果說2015年有哪些ARM處理器帶得動4K屏幕,那Tegra X1自是當仁不讓之選。
對ARM處理器來說,顯存帶寬始終是制約GPU性能發揮的瓶頸所在。因此,Tegra X1保留了麥克斯韋架構特有的第三代Delta色彩壓縮和端到端壓縮技術,并輔以最新LPDDR4內存,徹底解決了內存(顯存)帶寬不夠用的問題。除此之外,Tegra X1同樣支持保守光柵化算法、體積區塊資源(DX11.2)、多幀抗鋸齒(MFAA)等等新架構特有的圖形技術。
光說不練假把式。國外媒體已經曝光了Tegra X1的跑分成績(圖3),并與NVIDIA上代Tegra K1和蘋果最新的A8X進行了對比(表3)。從成績可見,Tegra X1具備“完虐”A8X的性能優勢,而且其GPU部分的功耗只有1.51W,遠遠低于蘋果A8X GPU部分的2.67W!可見,麥克斯韋的高性能低功耗特色被Tegra X1完美地繼承了下來。

相對保守的CPU架構
雖然Tegra X1的GPU架構非常激進,用最新桌面級的麥克斯韋秒殺了眾多競爭對手,但它在CPU的架構選擇上卻顯得有些保守(圖4)。我們知道,NVIDIA上代Tegra K1引入了自主研發多年的64位“丹佛”,而最新的Tegra X1卻選擇了已被ARM規范化的“四核Cortex-A57+Cortex-A53架構”,與驍龍810相同。
需要注意的是,在A57和A53“協同工作”方面,Tegra X1并沒有采用普遍的big.LITTLE技術,而是選擇了自家的互連總線技術,同樣可以讓全部八個核心同時運行,供系統和應用隨意調用。在其他方面,Tegra X1還支持HDMI 2.0、HDCP 2.2、4K級別解碼、eMMC 5.1等特色技術或功能。
小結:功耗決定最終勝負
據NVIDIA表示,Tegra X1與三星旗艦級的Exynos 7410處理器相比,在同等功耗下性能會高出40%,在同性能時功耗則會下降50%。由此基本就能奠定Tegra X1在ARM移動處理器領域的霸主地位了。可惜,決定某顆ARM處理器能否成功的關鍵永遠不是性能,要知道NVIDIA上代Tegra K1就因沒能解決性能和功耗的矛盾,最終僅在平板電腦領域小有建樹。而Tegra X1的A57+A53架構會帶來更高的功耗和發熱,只能借由20nm工藝加以緩解。最樂觀的估計是,Tegra X1有望成為新一代旗艦平板的殺手锏,但想塞進更纖薄的智能手機中,很可能會采用降頻方案來緩解電池續航和機身發熱的壓力。
