近年來,不少科技公司開始自主研發計算機芯片,旨在節省服務器成本,并提高機器學習模型的處理和訓練效率。
據悉,臉書也加入了這一行列,并正在為其數據中心自主開發一套定制芯片。
其中,一個芯片處理器用于優化視頻轉碼,或進一步提升其用戶觀看視頻的體驗;而另一個芯片處理器將用于內容推薦等機器學習任務。
這樣一來,臉書將逐漸減少對外部芯片制造商的依賴,比如英特爾、高通和博通等;另一方面,由于臉書數據中心的碳足跡處于不斷增長的趨勢,轉向定制芯片可以有效幫助其減少碳足跡。
此外,臉書并不打算讓自研芯片完全取代原本的芯片處理器,新芯片將與其目前正在使用的第三方處理器一起運行。
定制芯片并不是一個新命題,比如,自2016年以來,谷歌一直擁有用于機器學習的TPU(Tensor Processing Unit)定制芯片。該芯片正在為Google的許多應用程序提供支持,包括用于提高搜索結果和街景相關性的人工智能系統RankBrain,進一步提高了谷歌地圖導航的準確性和質量。
值得一提的是,在與圍棋世界冠軍李世石的對弈中,由TPU提供支持的谷歌DeepMind AI程序以4:1的總比分獲勝。


2020年12月,據外媒報道,微軟也在為其Surface設備和云基礎設施開發內部的ARM芯片處理器,并開始自研用于數據中心的芯片。
一直以來,微軟的Azure云服務都是使用英特爾的處理器來驅動。雖然Surface設備在PC市場中所占的份額相對較小,但微軟開始自研芯片的這一舉動仍對英特爾造成一定打擊,致使其股價在該日收盤前下跌約6.3%。
臉書表示,他們一直在與芯片合作伙伴共同探索提高計算性能和能效水平的方法。關于未來的計劃,目前尚未有更多可公布的新訊息。
事實上,對臉書來說,涉足定制芯片并不是一件容易的事,不過此前該公司已經進入半定制芯片領域。
2019年,臉書宣布正在開發一種用于視頻轉碼和推理工作的專用集成電路(ASIC)。
據了解,臉書每月需為超過27億用戶提供應用和服務。為支持如此龐大的用戶量,該公司設計并構建了先進且高效的系統來擴展其基礎設施。
然而,隨著工作負載的增長,僅由傳統的通用處理器為用戶提供服務已遠遠不夠。在臉書看來,或許只有開發新的專用加速器和整體系統級解決方案,才能進一步提高系統的性能、功率和效率。
因此,臉書與其他公司合作開發了分別面向人工智能推理優化、人工智能模型培訓和視頻轉碼的解決方案。
2019年3月14日,臉書宣布推出用于AI模型培訓的“Zion”平臺、用于AI推理優化的專用集成電路“Kings Canyon”以及用于視頻轉碼的“Mount Shasta”。

臉書用于人工智能推理解決方案的構建塊
其中,作為臉書的下一代訓練硬件平臺,“Zion”平臺具有強大的計算能力。在進行AI模型培訓的過程中,不僅能夠有效處理CNN、LSTM和SparseNN等一系列神經網絡,而且可提供高內存容量、高帶寬以及靈活的高速互連,以支持臉書的關鍵工作負載。
需要注意的是,在臉書訓練工作負載增加的同時,其推理工作負載也在不斷增加。而臉書當前使用的標準CPU服務器由于很難繼續擴展,因此并不能跟上人工智能推理優化的進程。基于此,臉書與多個合作伙伴合作開發了可在其基礎設施中部署和擴展的推理ASIC。
據了解,該推ASIC擁有四個主要組成部分,分別為國王峽谷推理M.2模塊、雙湖單路服務器、Glacier Point v2載卡、優勝美地v2機箱。這些組成部分利用已經發布到OCP(Open Compute Project,開放計算項目)
的現有構建塊,加快了開發時間且依靠其通用性降低了風險。
據統計,臉書的平均直播數量每年都在翻倍增長。尤其自2018年8月在全球推出以來,Facebook Watch服務的月觀眾人數已超過4億,每天約有7500萬人使用。
針對觀眾不同的可用互聯網連接,臉書生成了多種輸出質量和分辨率(或比特率)來優化視頻觀看,這一過程稱為轉碼。要完成此轉碼過程需要大量密集型的計算,而通用CPU的效率遠遠不及臉書視頻擴展基礎設施的增長速率。
因此,臉書與其芯片供應商Broadcom和Verisilicon合作設計了針對轉碼工作負載進行優化的定制ASIC。這其中包含用于轉碼工作流程每個階段的專用芯片,能夠支持分布在不同數據中心位置的異構硬件設備,平衡視頻轉碼的工作負載。
自研芯片的勢頭正逐漸擴大,整個科技行業的芯片布局是否會因此發生變化?目前仍需繼續觀望。(摘自美《深科技》) (編輯/克珂)