丁海驁
Graphcore公司中國總部最近搬了新的辦公室,一處擁有眾多IT行業知名企業的寫字樓群。其中一座寫字樓上,懸掛著另外一個芯片廠商名字。已經裝修完的Graphcore新辦公室,據說與其英國總部保持了同樣的風格,而且很多辦公設備都是從英國運來的。最有趣的是:新辦公室的名字:哪吒、女媧、木蘭……都是中國傳統意義上,挑戰權威,打破慣例,具有典型開創型色彩的人物。這種無意的設置,與大樓外懸掛的巨大LOGO形成了一種有趣且微妙的呼應:因為身處一個AI應用越來越深入廣泛的時代,Graphcore作為后來者,事實上就是整個芯片行業的一個秩序挑戰者。
“今天AI計算的主流:一部分在CPU上,還有不少業務在GPU上,IPU是另外一部分。三者之間的關系可以理解為三個互相交叉圓:中間有交錯的部分——長期來說,IPU和GPU是很不一樣的,他們彼此之間應該有各自覆蓋的范圍,有自己的領域。”盧濤,Graphcore大中華區總裁兼全球首席營收官在任何場合都會首先強調IPU并非是為了取代CPU或GPU,因為他們之間有“很大的不同”。
IPU,Intelligence Processing Unit,智能處理單元,是一類專司AI的芯片處理器,也是Graphcore誕生的起點:作為一家成立于2016年的年輕公司,Graphcore公司創始人Nigel Toon和Simon Knowles之前曾經共同創建了一家專注于打造3G modem芯片的Icera公司。之后,這家公司在2011年被英偉達以3.7億美元的價格收購——Graphcore是兩人再度聯手創建的第二家公司,而且直接將目標鎖定在打造一款專為機器學習工作負載而設計的處理器——IPU。
“我們設想中未來一個大規模數據中心有三部分構成:CPU、存儲和AI計算。”在盧濤看來,IPU與傳統的CPU芯片之間的關系,是平行且解耦的,“AI計算并不一定是要附在CPU上面,它和CPU是并行的:兩者之間的關系是動態可調配的。”
而對于業界經常拿來做對比的IPU和GPU,盧濤認為兩者之間從芯片架構上就有這巨大的差異。“第一,從計算核心的角度,IPU有1400多個處理器核,每個內核可以運行6個線程;第二,從存儲架構上,GPU用顯存或者HBM,是片外的大存儲;IPU采用的是片內的分布式架構,如GC200就擁有900MB處理器內存儲;第三,從通信角度看,兩者在跨芯片多核通信調度的時候也是不一樣的:GPU內的SM核是多核多線程呈現給開發者,因此程序員需要關注彼此的線程,以及隨時處理通信過程中的數據同步問題;IPU則是采用一套BSP(Bulk Synchronous Parallel)的軟硬件結合算法,讓一個芯片一千多個核,甚至多個芯片跨IPU連接。”他進一步解釋:“打個比方,有一萬個人在排隊,IPU的做法是把隊伍整理好了,再往前走,到下一個集合點再把隊伍整理好,再往前走。這樣做的好處在于:當系統進行大規模并行時,就不再需要把系統的復雜性顯示給程序員和開發者。”
技術的后發優勢,以及其架構理論的先進性,讓Graphcore的IPU從一開始就得到了整個IT行業的普遍關注:不僅投資者幾乎涵蓋了整個IT行業內的知名企業和知名投資機構,而且還被ARM公司聯合創始人、英國半導體之父赫爾曼·豪瑟認為是“第三次運算架構革命”。因為在他看來,代表著“傳統”的CPU和GPU,都是在AI技術突飛猛進之前出現,因此這些芯片架構都不能適應AI對于芯片的需求,“AI和機器學習正在因為硬件受限而阻礙發展,應該針對此技術發展相應的處理器”。
而Graphcore也的確沒有讓業界失望。在成立的第二年,2017年7月,Graphcore就宣布推出了他們的第一個芯片Colossus GC2,并且在2018年正式上市。此后,Graphcore進入高速迭代期——不僅是技術和產品,而是整個業務模式都在不斷成長和迭代——2020年7月Graphcore對外公布了其第二代IPU GC200,對產品形態進行了重大調整的,第二代的Graphcore AI芯片不再是PCIe形態的“半成品”,而是通過將其整合成一個產品,直接交付給終端用戶,從而加快了IPU進入市場的周期,實現了從技術到產品,再到實現商業價值的完整通路。
而如何將這種理論上的商業模式變成真正得到市場驗證的競爭優勢,則可能成為Graphcore下一個階段最關鍵的核心。就在不久之前,盧濤的職位發生一些改變:其職務從中國區總經理變成了大中華區總裁,且兼任全球首席營收官——也就是說,擺在Graphcore面前的商業邏輯實踐之路,將由其負責開拓。
“營收,包含了很多東西:例如全球的銷售組織、商務拓展組織、技術支持組織,AI應用開發的組織……不是一個簡單的純銷售團隊,銷售組織占中間很小一部分。”盧濤強調,在其規劃中,Graphcore的商業邏輯,應該從擴大用戶數量開始:“我在很早就與公司CEO談起過:對于Graphcore而言,第一個優先級的問題,是要有人用我們的產品;第二,是有人用了這個產品并真正服務于他的業務;第三才是業績;第四是利潤——先后順序不能弄錯。這就需要我們的策略制定,眼光要長一點,久一點,之后自然就會有大的進展。”
而這一“大發展”的短期目標,盧濤認為是在2022年,Graphcore希望從以往的市場霸主挑戰者,成為“多個維度的市場領導者”。

在盧濤看來,2022年,對于整個AI芯片產業而言,將是競爭更加激烈,但是市場區分也會逐漸清晰的一年。憑借以往在技術、硬件、軟件、生態建設、部署合作、OEM合作等方面所作出的努力,Graphcore將在2022年贏的更多的優勢:“假如說,今天的巨頭是在珠穆朗瑪峰上,從下向上需要經過七個臺階進行追趕:第一個臺階是組建團隊,第二個臺階是宣講理念,第三個臺階是有芯片產品,第四個臺階是有芯片且能夠給客戶送樣品做測試,第五個臺階是有產品且有落地的應用,第六個臺階是有產品且有很多落地的應用,第七個是有很大的市場份額。那么,我認為Graphcore目前處在第五至第六個臺階的階段。”換句話說,距離峰頂,Graphcore也許只有一步之遙。
技術的趨勢可以預測,但是市場的競爭態勢卻無法預知。沒人能知道Graphcore是否能如愿登頂,我們能感受到的,是其表現出來的整個IT領域已經許久未見的勃勃生機:從入場到挑戰權威,再到立志成為領導者,Graphcore只用了5年時間。
采訪過程中,盧濤談到Graphcore在2021年下半年在中國市場的幾個成功過案例:與安捷中科合作,利用IPU進行氣象預測、精準灌溉、防災減災;與升哲科技合作打造基于IPU的城市ESG方案;與深勢科技合作,完成分子動力學模擬軟件DeePMD-kit向IPU硬件的遷移,將分子動力學應用于新藥的研發、新材料的研發等。也談到了在2021年12月,Graphcore和百度飛槳宣布全面支持IPU在百度飛槳上進行訓練和推理。
“2022年,我們會有與國內公有云廠商的IPU產品發布,也會有新的硬件產品的發布。同時,我們會持續深耕本地的合作伙伴,拓展更多AI平臺的合作。另外,在相關AI應用領域中也會進一步加深,如AI輔助科研、自動駕駛等領域,都將是Graphcore在2022年AI應用或垂直領域中比較重要的方向。”盧濤說。