邱豪 賀乾明
盡管人人都能用上手機,但PC處理器依然是現代生活的計算中心:近20億人每天打開個人電腦工作、學習。這些電腦里的處理器再加上被裝在數據中心和超級計算機里的數億顆PC處理器在無形的數據世界里計算著一切,從推薦視頻、記錄股市交易,到分析戰場情報,找到下一個轟炸目標。
過去20年里,這個重要的基礎設施的競爭格局長久地維持靜態。
上一場芯片大戰后,幾家頭部公司牢牢控制著自己的位置。大多數時候,英特爾控制著超過三分之二的市場,決定著明年CPU計算能力提升8%還是10%;英偉達是在虛擬世界里描繪畫面的首選,高通決定信號如何在空氣里傳播。三年前,蘋果M1芯片推出,一度以超出想象的性能打破平靜。但它的成功更多被外界歸因于資本實力——果然只有錢最多的公司才可能造好芯片。
這一局面在過去一周幾乎被徹底改寫,并且向世界重復了一個樸素真理:純粹的商業世界里,技術終會前進、壟斷不可能永遠持續,此前芯片市場的平靜不過是在等待技術積累。
七天以來,一場圍繞個人電腦的芯片戰爭在美國市場逐漸成型。至少六家市值數千億美元的公司參與其中,向本來沒有競爭關系的公司,甚至是合作伙伴發起進攻。
10月25日,高通發布筆記本電腦芯片Snapdragon X Elite,宣稱其性能超過蘋果的M2Max和英特爾的同級別處理器,還說要為世界上其他筆記本電腦制造商提供“與蘋果競爭的領先解決方案”。
同一天,蘋果預熱了新的發布會,并在10月31日推出新的M3系列處理器。以別無二家的3納米技術,刷新了筆記本電腦的性能基準。
與此同時,多家美國媒體報道了英偉達和AMD的新計劃:研發高性能、低功耗的筆記本電腦芯片方案,在兩年內上市與蘋果、高通競爭。
新的競爭正在向同級別市場擴散。英偉達要用最新的車用芯片DRIVEThor解決從車內娛樂到自動駕駛的一切需求。特斯拉則像蘋果一樣,一顆一顆地將自家產品里的芯片換成自己的。
一場決定未來計算形態的芯片戰爭正在爆發,而戰場又回到了硅谷。
不論蘋果的M3系列、還是高通的Snapdragon X Elite,它們的結構看上去都不像是傳統電腦的芯片,而更像是手機芯片——雖然尺寸會大一些。
傳統的電腦中,不同公司生產的CPU、顯卡、內存條等零件被送去工廠,焊接在電路板上。蘋果和高通的處理器都是SoC(System Ona Chip,片上系統)——CPU、GPU、內存、控制器等處理器內核都被集成在一個芯片封裝里。臺積電工廠就可以完成大部分生產工作。
類似的,英偉達下一代汽車芯片Thor也轉向SoC設計。對性能要求更高的服務器芯片則是下一個突破目標。
轉折點發生在2020年底,蘋果發布采用SoC設計的M1芯片。一開始蘋果只在入門級的電腦里用了新處理器,但性能已經追上前一年的頂級配置英特爾處理器電腦,續航還多出幾個小時。
此前14年,蘋果一直在Mac電腦上使用英特爾的CPU。從2015年起,英特爾處理器的性能提升跌入個位數的百分比。這一度被視為摩爾定律行將就木的必然結果。
“SoC里,CPU、GPU、內存等計算單元距離最多不過1厘米,可以通過晶圓直接互通,相比傳統通過外部的PCB板的電路的方式,信息傳輸效率會大幅提升,也能降低功耗。”《芯片簡史》作者汪波博士說。


如果把電腦完成一項任務看作做菜,傳統的電腦中調度芯片就像是去不同的超市、攤位買食材,再做菜。SoC相當于從一個冰箱里拿食材做菜。而M1芯片的“食材”更豐富,蘋果針對人工智能、音視頻編碼、加密存儲等一系列特定用途訂制了專用的計算單元,以更快解決常見問題。這些功能都需要和CPU協作,縮短信息傳輸距離頗為必要。
2021年,蘋果陸續發布性能更好的M1Pro、M1Max、M1Ultra。《連線》雜志稱這些產品“讓摩爾定律保持了活力”。
英特爾也早早意識到了行業向SoC轉移的趨勢,并在2012年推出了適用于智能手機和上網電腦的SoC平臺Atom,但它對英特爾x86架構、自身芯片代工廠的依賴,都讓它與蘋果、高通等公司支持的Arm架構+臺積電競爭中捉襟見肘,最終在2016年放棄嘗試。
“x86屬于復雜指令集,基于它的CPU性能強但功耗也大。GPU同樣是高功耗的處理器,把它們放一起做SoC,散熱會是一個極大麻煩。”汪波說。
而且Windows筆記本電腦市場品牌眾多、個人配置需求千變萬化,一定程度上也限制了英特爾,它要盡可能提供同時滿足多種需求、價格更低的CPU,很難像蘋果那樣迅速迭代。
英特爾CEO(首席執行官)帕特·基辛格(PatGelsinger)同樣意識到了蘋果的威脅,他在2021年初告訴員工:“我們必須向PC生態系統提供比一家生活方式公司更好的產品。”
但它面臨的對手不只有蘋果。2020年推出搭載M1芯片的MacBook后,蘋果在筆記本電腦市場的銷售份額翻了一倍到11%。M1的成功讓高通等迫切想要進入的新公司們明確了接下來該怎么做,以及找誰做。
回頭看來,各種設備上的芯片向SoC進化是理所當然,但期間過程極其復雜。從組建芯片設計團隊到推出M1,蘋果花了12年。
在此期間,蘋果通過高薪和并購網羅了曾在英特爾、高通、博通、Imagination等芯片公司工作過的人才,進而一步一步將芯片里的計算單元替換為自研產品。先是棄用Arm公開發售的CPU內核設計,再是以自己的GPU取代了Imagination的設計,并自研了處理圖像、編解碼音頻和視頻、加速人工智能算法、加密存儲等各種專用計算單元,推動著iPhone芯片每兩年實現一次性能飛躍,才有了M1超過英特爾芯片的可能。
一個偉大產品的誕生往往也是一場超長馬拉松結束。蘋果第一代Mac電腦和第一代iPhone發布后,大批工程師在短時間里離職。蘋果創始人史蒂夫·喬布斯和微軟創始人比爾·蓋茨(微軟深度參與第一代Mac的軟件研發)都將不止一次在采訪中提及這樣的離職潮,來說明自己的團隊付出了多么超常的努力,并最終工作到力竭。
蘋果芯片工程師則發現,一場馬拉松的結束是下一場的開始。
根據The Information報道,蘋果內部的芯片項目數量在過去十年中從個位數增加到幾十個,但員工人數卻沒有以同樣的速度增長。
10月31日的發布會就是蘋果工程師負擔持續加重的例證。M1系列芯片有四個規格,但蘋果工程師只做了兩個完整設計——M1和M1 Max,發布相隔近一年。M1 Pro是M1 Max的縮水版,而M1Ultra是M1 Max的拼接版。而10月31日蘋果則同時發布了三個完全不同的設計——M3、M3 Pro、M3 Max。這讓M3 Pro可以尺寸更小更便宜,M3Max可以追求極致性能。蘋果的芯片更精確地服務了不同價位段的產品,但增加了芯片團隊的工作量。
一位蘋果芯片工程師在接受采訪時稱,為了滿足公司各個產品線迅速、穩定且大幅迭代芯片的需求,蘋果的芯片工程師每周工作近80個小時——996不過是72小時,通常還有午休——才能按時完成任務。
根據多家媒體統計,過去兩年有數百名蘋果芯片工程師離職。他們也把做高性能處理器的經驗擴散開。
2019年,蘋果芯片部門平臺架構高級總監杰拉德·威廉姆斯三世(Gerard WilliamsIII)牽頭創辦了芯片公司NUVIA。他于2010年加入蘋果,此前在Arm工作了12年。在蘋果的9年,帶隊開發了蘋果所有SoC的CPU,也是蘋果M1 Pro、M1 Max的首席架構師。
與他一起創辦NUVIA的另外兩位芯片專家分別是:約翰·布魯諾(John Bruno)和馬努·古拉蒂(Manu Gulati),都有豐富的芯片工作履歷。
根據NUVIA官網介紹,這批蘋果芯片元老的目標是開發性能更強的CPU,處理指數級增長的數據和不斷增長的需求。他們的技術路線與蘋果一致——從頭設計一款兼容Arm生態的CPU內核。
M1系列成功后,NUVIA得到了一批大型科技公司的收購邀約。2021年,高通從微軟、英特爾、Meta等公司競爭中勝出,花14億美元收購。三位NUVIA創始人能從這筆交易中獲得數億美元收入——比蘋果CEO蒂姆·庫克(Tim Cook)的年收入還高。
NUVIA團隊帶著上百名員工加入高通,其創始團隊均擔高通的高管。兩年不到,高通新處理器的性能已經超過蘋果M2系列。
曾經限制一家公司制造出高性能芯片的還有制造。在芯片60多年歷史的大多數時間,掌控了芯片制造工廠基本上就等于掌控了芯片本身,英特爾一度靠獨占的先進晶圓廠壟斷了芯片市場,競爭對手即使能設計出好的芯片,也沒法用先進技術造出來。
直到2017年,英特爾建立的芯片垂直整合體系開始出現裂縫。靠著龐大的iPhone訂單和蘋果每兩年大幅迭代芯片性能的要求,臺積電的芯片制造工藝迅速超過英特爾。這一年,臺積電造出10納米制程芯片時,英特爾還在使用14納米工藝。之后幾年,臺積電按照穩定節奏推動7納米、5納米芯片變成現實,保持領先。
相同制程下英特爾的x86架構芯片性能好過SoC芯片中普遍使用的Arm架構,但雙方制程的差距給Arm方案補上了性能短板。蘋果在2020年發布的M1芯片使用了5納米的工藝,而同年英特爾的筆記本電腦芯片還停留在10納米(晶體管密度與臺積電7納米工藝相當)。
臺積電的公開代工屬性決定,任何一家希望做芯片的公司,不用大幅投入就能獲得頂尖的制造工藝。高通的XElite緊跟著蘋果用上了4納米工藝,雖然比最新的M3使用3納米有一些差距,但已經超過了M系列的其他產品。
芯片研發需要不間斷的巨額投入,所以這也是為什么挑起競爭的總是那些巨頭。巨頭們不僅需要資深的芯片管理者,還需要成百上千的工程師團隊。因此,研發人員和工程師的薪酬、福利是研發投入的一大部分。
2019年開始,原本每年“只”愿意投50多億美元做研發的高通,研發費用以大約每年10億美元的規模遞增。在截至今年三季度的12個月里,累計研發投入近90億美元。
支撐這些公司如此密集投入的原因各不相同,但本質上它們都有非常穩定的“稅”收,才有機會借著芯片技術帶來的性能提升,帶來更多收入,形成良性循環。
蘋果每年賣出2億多部iPhone,每自研一個芯片不僅提升產品競爭力,還能拿走原本屬于芯片供應商的利潤。同時它的芯片又被用于電腦、手表、耳機,以及Vision Pro。
高通依靠自己在移動通信領域擁有的大量專利和領先地位,從幾乎每一部智能手機里收稅——也包括蘋果。根據分析機構測算,蘋果每賣出一部iPhone就要向高通支付13美元的無線專利授權費和25美元的基帶芯片費用。每一年高通光是向蘋果收的“稅”差不多就撐得起全年研發費用。高通再把這些費用來研發更先進的驍龍芯片,讓更多設備商離不開它。
類似的,AIGC和大模型的需求爆發意味著,計算廠商和AI初創公司未來幾年都需要大量采購英偉達GPU。英偉達有了可靠的現金流,可以支持自研CPU,在汽車和電腦市場更進一步。
一旦離開了如此高關聯度的主業支撐,再有錢的大公司也要認真算賬。Google 2016年就想給自己的Pixel手機自研SoC,之后從高通挖來SoC工程師史蒂夫·莫洛伊(Steve Molloy)擔任芯片主管,在印度招聘了大量芯片工程師。
但Pixel系列手機發布至今七年,全球累計出貨量為3790萬部,還趕不上iPhone一個季度的銷量。Google的創始人們早已將權力分給CFO(首席財務官),不會給沒有回報前景無限資源。Google自研Pixel芯片的量產計劃已經推遲到2025年。
同樣不順的還有Meta。Meta于2018年組建了一個名為Facebook Agile Silicon Team的芯片團隊,希望從易到難設計芯片,最終在Quest系列虛擬現實設備用上自研芯片。但Quest持續虧損,于是Meta將定制芯片的設計任務先后外包給了三星和聯發科,最后放棄定制芯片,直接購買高通XR芯片。
Meta Quest2已經是迄今最暢銷的XR設備,一年也不過賣1000萬臺左右。蘋果即將發售的VisionPro初期銷量不會比它好,但其所需要的芯片研發成本,早已被年銷2億部的iPhone和2600萬臺的Mac攤薄。
大約60年前,美國加州舊金山灣區南部的一串小城開始被稱為“硅谷”。這里一批企業推動了晶體管和集成電路的應用,催生芯片產業。他們的第一批客戶是政府和軍隊。
20世紀80年代后,隨著計算機普及、互聯網誕生,消費者、企業取代政府機構成為硅谷的最大客戶。蘋果、英偉達、Google、Meta等科技公司在此誕生。科技巨頭們盤踞一方,賺走各自行業里的大多數利潤,也離“硅”越來越遠。一度,美國最重要的科技公司都專精于軟件或互聯網。
如果芯片需求依舊只停留在現有視頻、表格、游戲,無論蘋果、高通,還是英偉達、AMD,可能都不會如此全力以赴。但AI、汽車和XR催生出新的計算需求,而消費電子市場的停滯則加劇了競爭的急迫性——每家公司都需要擠出更多利潤。
目前AI已經有一些實際應用誕生。微軟想把名為“Copilot”的AI助手塞進Office365、Bing搜索、Outlook郵件等幾乎一切生產力工具里;蘋果在用Transformer模型改進輸入法(中文還不行);Adobe的AI工具Firefly也將集成進Photoshop、Illustrator、Premiere等設計軟件當中。
但是訓練和推理大模型的算力資源消耗和成本非常夸張。無論是自己采購GPU、還是向云計算商租用服務器,提供AI服務的公司們都面臨嚴重的算力短缺和昂貴的運營成本。通過大模型普及的必經之路是用上每臺電腦、每個手機的處理器。
這也是為什么從高通到蘋果的發布會,都在強調新的芯片可以更好地支持移動設備本地跑大模型。蘋果稱M3Max能夠支持運行包含數十億各參數規模的Transformer模型;高通則表示,首款搭載驍龍XElite的PC將支持130億參數模型的本地推理。
在可預見的未來,個人電腦依然是最重要的生產力工具。行業研究機構Counterpoint預計,AI將為已經消沉多年的PC市場注入新的活力,到2026年,全球AIPC的滲透率將超過一半。在這個市場,蘋果要用芯片留住最愿意花錢買電腦的顧客,高通要讓PC廠商賣出更多電腦給自己交稅,英偉達則要從GPU做到CPU,拿走更多PC廠商的利潤,三家公司在這里碰撞。
另一個潛在市場需求來自XR。很難說這會是多大的市場,但蘋果今年發布的Vision Pro已經為其他廠商指明了方向——借助屏幕“透視”功能實現增強現實(AR)效果。要讓它的視覺體驗達到我們已經習慣的“視網膜”標準,需要單眼屏幕分辨率達到6K。
Vision Pro目前還只有4K,已經需要把M2芯片戴在頭上,再加一顆R1芯片實時處理傳感器信息,內置風扇、外接電池。在6K精度下的實時渲染復雜畫面,需要今天各家芯片所無法達到的性能和功耗。
汽車對于芯片算力的需求也在增長。隨著電動化和智能化的加快,以及智能座艙和自動駕駛的普及,這些“輪子上的數據中心”吸引了一批芯片廠商的進入。汽車芯片也已經從原來通用、分散的單一功能芯片轉向集成的多功能SoC。
早前高通已經借驍龍8155將7納米先進制程帶入汽車芯片;而英偉達去年發布的下一代SoC芯片Thor,單片算力最高可以達到2000TOPS,是其現款產品Orin的近8倍。高通要參與自動駕駛、英偉達則要做汽車的主芯片,特斯拉則不希望依賴其中任何一家。
新的環境驅動著這些科技公司轉向芯片之爭,而芯片之爭很可能將決定之后誰才是科技公司。