鄧 睿
(吉林工業職業技術學院,吉林 吉林 132000)
AI服務器采取異構方式。常見的構成形式有CPU+加速卡、CPU+TPU、CPU+GPU等。傳統的普通服務器數據處理核心較為單一,以CPU為主[1]。
人工智能服務器有著深度學習的功能。針對使用者使用需求的不同,于特定場景,可在特定學習過程中,自動調整模型。在兼容度方面,可同步兼容FPGA/AISC,使用者同樣可根據自身使用要求,對于使用頻次較高的應用,提供專屬加速通道,具備智能化的數據處理優先級劃分程式,服務器運行時發生崩潰的概率將得以降低;在計算密度方面,將突破以往各代人工智能服務器,整體項目的TCO明顯降低。
在數據表達配置方式上,人工智能服務器采用的方式則更為靈活為優化后的異構拓撲配置方案。當前數據處理最常應用的3類拓撲形式為cascade,common和balance。
以傳統單純CPU視角下,審視人工智能條件下數據處理核心的架構方案。采取異構方式,強化CPU綜合性能,將其稱之為CPU+。針對服務器整體,不必整體全部改造;針對無改造意義的模塊,仍可應用傳統CPU架構;針對數據處理核心,人工智能計算負載核心,則應用多核心處理方案。基于阿姆達爾性能定律,當前人工智能技術架構可按此導向開展:針對整體數據與計算結果,借助CPU完成初步匯總與歸納;而針對數據的細化分析處理,則由GPU加速部件完成。由于這類數據在基于異構方式下,數據處理的效率可得到提升,因此也就實現了性能提升的效果。雖然從全局上看,人工智能與普通服務器均是基于CPU架構模式,但在不同應用場景下,兩者間的設計方案仍存有一定差異[2]。例如邊緣推理場景,涉及的計算量與場景限制內容會較多,此時智能服務器在數據處理效率上將占據優勢,調動的數據集呈現出較高的數量級。云端推理場景下,其在瞬時數據吞吐量、瞬時性、能效性上要求更高;在VR云端訓練場景下,需要具備低時延,高性能、高存儲、高性能,雙向數據處理時間越同步,應用效果越佳。因此,人工智能服務器在部件構造技術應用方面,需根據處理核心調動水平的不同,開展有針對性的優化。將涉及思路予以歸納總結,列舉如下:(1)數據傳輸連接時延性低。應用場景中包括服務器→服務器間、數據處理部件→數據處理部件間,用戶→云端數據處理中心間的聯系[3]。高帶寬、低延遲是實現最基本要求。(2)計算能力與存儲層次相匹配。只有兩者達到同一處理高度后,數據處理中涉及的緩存、內存、外存等功能的實現才不會遇到架構上阻礙,性能才能根本性的得到提升。(3)并行處理能力延伸。CPU仍需作為服務器數據處理主要模塊,設計人員需在此基礎上,植入同樣可執行并行式數據加速模塊,如ASIC,FPGA,GPU等。
人工智能服務器運行時需搭載計算性能更為出色的計算機芯片類型,現今市面上應用的主要有ASIC,FPGA,GPU等。(1)ASIC主要起到運算優化,提升運算效率的作用。普通芯片在運算邏輯上相較于人工智能算法模式,較為冗余,是拖長運算時間的主要因素。ASIC在應用時通過對上述運算模式與神經網絡運算中尚且無須應用計算模塊剔除。將運算重點放在加速支持,性能優化算法上,如DNN運算中使用的加法、乘法運算等。(2)FPGA主要起到自動編程的作用。人工智能,智能化的重要體現即為自動性[4]。用戶使用時,輸入相關參數,相關底層配置文件,并設定邏輯規則,系統將自動輸入出多種優化計算形式。用戶不僅能夠對芯片內部構造,如存儲器與門電路間的連接形式進行優化,也能實現不同時刻最為適配的加速方案輸出。不僅如此FPGA還可完成多任務執行與多任務數據同步傳輸的指令,這正是人工智能實時處理數據,快速表達數據的有效渠道。但是這項技術由于功能遠優于其他芯片類型,技術含量較高,故其應用時對技術人員編程水平要求較高。受限于我國當今在本領域發展時間較短,相關技術尚未成熟,當今這項技術仍存在著計算占比低及成本高的問題。且當今國內尚未有廠商內生產此項芯片,主要由Intel、Xilinx公司掌握核心技術。(3)GPU適用于處理數據間無依賴、數據類型高度一致,且運算過程連續的數據類型。如渲染曝光照片,并行渲染全局像素等。其在并行性表現上是當今性能較為優越的類型之一,得益于其運算效率高,圖像文件渲染效果好的優勢,未來其在人工智能服務器將占據不可或缺的地位。但在應用GPU時,一定要注意運行環境的匹配性。例如人工智能算法的推理,分析其運算形式,只涉及輸入與輸出,并不屬于并行性運算的類型,故其在性能表現上將處于一般水平,適配的運行環境應用,其并行運算的優勢才能得到充分發揮[5]。當今國內尚未有廠商內生產此項芯片,主要由AMD、NVidia公司掌握核心技術。
將其予以匯總,包括以下三大類型:網絡I/O技術、主板線路技術、與存儲技術。(1)網絡I/O技術主要起到網速提升的作用。這項技術具備著高擴展性、低延時與高帶寬的優點。技術原理的適配性使得其在以太網領域有著廣泛的應用,超高網速100 Gbit/s的網速,以及可提供更加統一的接口標準,使得此技術發展方向較為明晰,也可在傳統以太網技術的發展下,應用原有設備,實現新舊網絡的平滑融合。(2)主板線路技術主要起到線路優化,滿足海量數據處理需求的作用。應用點對點的傳輸形式,且在傳統PCIe總線編碼方式基礎上,實現跨GPU節點的內存操作,數據的處理與儲存不再受限于內存,突破現有技術連接慢的現狀。(3)存儲技術主要用于提升單位存儲單元容量,采用QLC與SSD技術。實現了每單元存儲量為4 B,但可擦寫次數下降。SSD技術中訪問性能上有所提升,當前主要應用NVMe接口。應用相關技術的同時,要在設計方案上予以優化,例如人工智能加速服務器在應用上,功耗較高,故在制冷散熱、電源設計方面需重點考慮。為從全局上優化服務器機房整體運行功率以及機房中影響因素如稱重差、配電低、空間小的因素,則可在整體服務器設計方面專門定制。上述涉及的每一項技術,都是行業發展的一項重大變革。
人工智能技術于各行各業的不斷滲透下,服務器產業被推向了新的高度。而鋪天蓋地的人工智能改變世界的宣傳也為人工智能服務器產業領域的發展加上了一層美好的濾鏡。相信在不久的將來,有關服務器核心架構方面的技術將得到突破性的進展,人類社會也將因為AI技術而產生天翻地覆的變化。但當前人工智能服務器領域仍存在不少痛點:(1)經濟方面,人工智能技術引入成本較為高昂,普通企業引入存在困難。(2)工程化布點困難,與之匹配的相關技術認為發展至適配水平。(3)算法場景應用局限大,僅能在有限場景開展應用,普適性不強。(4)缺乏深度應用以及頂層設計內容。故在未來的發展中,人工智能服務器核心技術的研發仍將是熱點領域,經由建設滿足實際應用的評估體系與行業標準能夠促使核心技術更為穩定的發展。AI服務器可以說是趨勢,但目前人們也還有一條較長的路要走。