2019年5月底對處理器產業的影響無疑是巨大的——英特爾發布了基于10nm工藝和Sunny Cove微架構打造的第十代移動酷睿lce Lake平臺,AMD通過7nm工藝讓Ryzen3000系列的消費級處理器進入了12核時代。作為X86陣營的最大競爭對手,ARM自然也不能讓兩大X86廠商獨美于前,意欲通過全新的Cortex-A77CPU和Mali-G77 GPU,進一步釋放移動設備的計算潛力。
不同的聚焦點
在近十年的X86處理器之爭中,AMD-直扮演著英特爾跟隨者的角色,直至Ryzen(銳龍)誕生才真正影響到了英特爾在該行業的霸主地位。得益于7nm制程工藝,全新的Ryzen 3000(桌面版)終于實現了對英特爾同級別處理器的性能反超(圖1),并通過更低的售價博得了一眾DIY玩家的青睞,為在英特爾陰影下匍匐已久的用戶“伸張正義”。此外,AMD最新的移動版Ryzen 3000(U系列)也具備不俗的實力,其CPU性能可以媲美八代酷睿,GPU性能則堪比入門級獨立顯卡,并在輕薄本領域闖出了不小的聲望。


然而,英特爾的布局較之AMD更加深遠,除了追求更強的性能之外,英特爾近年來更專注于制定、完善和優化計算設備的生態系統和周邊環境。以最新的lce Lake平臺為例,它雖然定位于超低功耗的輕薄本戰場,但卻集Wi-Fi 6 GIG+、雷電3、DLBoostAl加速于一身,并通過“ProjectAthena”(雅典娜計劃)來推動統一的質量標準(圖2)。符合雅典娜計劃標準的設備都將具備一流的便攜性、快速響應、持久續航和高速連接的特性,擺明了就是要入侵原本屬于ARM的平板電腦領域,彌補當年英特爾通過Atom與ARM競爭失利的遺憾(英特爾曾推出過適用于手機和平板電腦的Atom處理器,但均以失敗告終)。
ARM原本就在智能手機、穿戴式和嵌入式等移動設備領域占壟斷地位,從近年來Cortex-A系列CPU和Mali-G系列GPU的迭代更新來看,ARM更加專注于性能和效率的提高,并不斷提升足以影響未來的Al運算能力。如今,ARM也不再滿足于傳統的移動設備戰場,正在試圖染指Windows和Mac設備,讓更多的筆記本、二合一、臺式機用上ARM架構的處理器。
以高通在2019年主打的驍龍8cx 5G移動平臺(采用由Cortex-A76架構魔改而來的Kryo 495核心)為例(圖3),其就已經具備了不錯的性能和電池續航能力,同時還擁有支持5G網絡和更低延遲等方面的優勢。當Cortex-A77被塞進筆記本后,無疑可以進一步縮短與傳統X86PC在實際體驗上的差距。
難以預見的未來
X86和ARM現在正上演類似“圍城”的大戲,英特爾和AMD都想擠入移動設備的圈子,而ARM卻想跳出移動設備的圈子。至于最終誰能先人一步,還得看Windows系統和軟件生態對ARM架構的優化程度,以及X86處理器何時能在功耗上降至接近ARM處理器的水平了。當然,這些都是后話,咱們接下來要討論的,則是ARM最新CPU和GPU的特色,看看它們在鞏固移動市場的壟斷地位之后,是否還有余力去染指原本屬于X86的蛋糕呢?

ARM不再是唯一
除了我們熟悉的ARM和X86以外,還有一種名為“RISC-V”的架構正逐漸崛起。RISC-V是一種基于精簡指令集( RISC)原則的開源指令集架構(ISA),它沒有ARM架構高昂的授權費,憑借開源、開放、精簡、靈活的特性,受到了包括谷歌、華為、IBM、鎂光、英偉達、高通、三星、西部數據和特斯拉在內的數百家高科技企業的加盟。
按照SiFive當前的設計能力,開發ARM架構的芯片往往需要1年甚至更久,而開發一套RISC-V架構的新IP卻僅需1個月到3個月,這就是RISC-V極為精簡技術特性的魅力。目前,我國已經相繼成立了“中國RISC-V產業聯盟”和“中國開放指令生態系統(RISC-V)聯盟”,華米公司自研的面向穿戴式設備的黃山一號處理器就是基于RISC-V架構打造的(圖4)。隨著前不久ARM與華為終止合作的傳言,勢必促使更多科技企業進入RISC-V的生態圈,作為未來可替代ARM架構的“備胎”,而我們也希望RISC-V有朝一日可以成為繼ARM和×86之后的又一種主流架構。
在解讀Cortex-A77之前,我們需要先來回顧—下它的兩個前輩,如此才能更好地了解這個全新的CPU架構。
站在巨人的肩膀上

在ARM近些年的CPU架構更新中,Cortex-A75和Cortex-A76都是極具歷史地位的。其中,Cortex-A75在big.LITTLE的基礎上引入了DynamIQ技術,最大限度提升了架構的靈活性與擴展性,讓2(大核,即A75) +6(小核)、3+5、1+7這種更高效大小核的組合變成了可能(圖5)。同時,同步升級到Cortex-A55架構的“小核”也不再是性能孱弱的代名詞,當不同數量的小核和大核搭配后,可以達到一個相對完美的(性)能(功)耗平衡。
作為Cortex-A73和A75的接班人,Cortex-A76采用從零開始、全新打造的CPU微架構(基于ARM v8.2指令集設計),并與臺積電7nm制程工藝強強攜手,帶來了ARM史上最大的性能和效率的飛躍——驍龍855較之驍龍845、麒麟980較之麒麟970都有著超過40%的CPU性能提升,同時電池壽命也有所延長。用ARM的話來說,Cortex-A76是一款“筆記本電腦”級別的高性能處理器架構,同時還具有高效能,高通“驍龍牌筆記本”主打的“Always Connected PCs”概念就是這一優勢的表現所在。

ARM最新發布的Cortex-A77,其代號為“Deimos(戴莫斯,畏懼之神),采用了和A76一脈相傳的CPU微架構,并在其基礎上進行了一定的優化(圖6),并最終獲得了更高的IPC性能提升(有關IPC性能,請參考本刊上期的特別話題欄目)。可以說,A77架構是站在“巨人肩膀”上的迭代之作,其性能自然值得期待。
再度提升的性能
由于Cortex-A77繼承了源自A76的微架構,所以兩代核心在設計上存在很多共性。用ARM的話來說,就是芯片供應商(如高通、聯發科等)在構建核心時可以非常容易地升級SoC的IP設計,不會花費太多精力和成本,從而縮短了開發周期。
和Cortex-A76相比,A77核心的前端擁有更高的讀取帶寬,分支預測器的目標緩沖容量提升了33%,從而降低了分支的誤判,提高了預測精度。同時,A77還帶來了全新的Macro-Op緩存結構,添加了額外的整數ALU,新增了一個名為“系統感知預取”的功能,可避免不必要地沖擊共享緩存,從而提高整體系統性能。
根據ARM公布的數據來看,在同樣使用7nm制程工藝、同樣運行在3GHz頻率下時(僅限于理論,實際量產的旗艦SoC主頻多在2.6GHz-2.8GHz之間),新的Cortex-A77比起前代的Cortex-A76,內存帶寬提升了20%,在SPEC int2006和Geekbench 4有著20%的性能提升,浮點性能則有30% -35%的提升(圖7)。在智能手機領域,網頁瀏覽恰巧是考驗浮點運算的殺手級應用,所以A77浮點性能的大幅提升應該可以進一步提升實際體驗。參考當前驍龍855和麒麟980的表現,Cortex-A77的CPU性能應該足以超過蘋果A12,并有望和蘋果還未發布的A13以及三星的下一代自研貓鼬M5核心競爭。
你被ARM Cortex-A77較前輩A76有著20%-25%的IPC性能提升且能耗保持不變驚到了?實際上,ARM最新的Mali-G77 GPU較前輩提升的幅度更大。
全新架構的誘惑

與高通和蘋果SoC集成的GPU相比(如Adreno GPU),ARM自家的Mali系列GPU一直處于不溫不火的狀態,如果不是ARM的“親兒子”,其影響力可能還不如PowerVR系列GPU。為了彌補自家GPU在圖形領域的遺憾,ARM Mali-G77放棄了從Mali-G71到G76始終在“Bifrost”架構上縫縫補補的策略,而是改用了名為“Valhall”的新一代架構(圖8),其支持全新的ISA總線和計算核心設計,針對Al運算設計了獨立的單元,著重增強了抗鋸齒、高分辨率以及Al輔助計算方面的性能,可以更好地適配未來4K分辨率的屏幕以及支持HDR游戲的頂級設備和標準。

根據ARM的官方數據顯示,Mali-G77較之Mali-G76可以提升30%的性能和能效,Al性能更是提升了60%,每平方毫米的性能是G76的1.4倍(圖9)。和更早期的Mali-G72相比,Mali-G77的功耗還下降了50%,當然,這個功耗部分大家不必太過在意,畢竟與Mali-G72搭配的還是10nm工藝,而Mali-G77即將用上最新的第二代7nm EUV工藝,功耗下降是必然的。
換句話說,Mali-G77終于有了和高通855集成的Adreno 640 GPU抗衡的底蘊。但是,ARM Mali系列GPU性能到底可以發揮幾何,最終還得看芯片供應商為其配備多少計算核心,比如麒麟980和三星Exynos 9820都集成了Mali-G76,但麒麟980只為其準備了10個計算核心,也就是Mali-G76MPlO,而Exynos 9820則用上了12個計算核心,即Mali-G76MP12,所以就3D性能而言還是后者更占優勢。
此外,Mali-G77即將面對的競爭對手,也將升級到驍龍865和蘋果A13,這些對手的GPU只會更強,屆時它們和Mali-G77相比孰優孰劣?還得等時間來驗證。
目前,聯發科已經正式發布了全球首款采用Cortex-A77 CPU和Mali-G77 GPU打造的5G移動平臺(圖10),而高通下一代驍龍865也將繼續基于Cortex-A77核心“魔改”。作為消費者,我們當然期待ARM官方給出的性能指標不合水分,讓下一代旗艦手機可以更強。


至于ARM全新的CPU和GPU架構能否威脅到X86在筆記本領域的統治?答案是很難,因為英特爾已經對主打低功耗的U系列移動酷睿全面升級到了四核時代(圖11),結合AVX512、DL Boost等新指令集和Gen 11核心顯卡的加持,ARM面對的將是一個更強悍的對手。ARM在傳統PC領域最大的機會,應該是極致輕薄、持久續航、專注輕辦公應用環境的細分市場,它們只能作為原有市場的補充,而不是扮演現有產品替代者的角色。