朱洪斌,周春云
(揚州萬方電子技術有限責任公司,江蘇揚州,225000)
隨著我國高新技術的發展,機器視覺、智能分析、深度學習等人工智能技術在金融科技的發展、國家的治理、工業的推動等方面發揮著越來越重要的作用[1]。
黨建工作是國家治理的重要組成部分,黨的建設與人工智能的融合,是人工智能重要發展方向之一。黨建工作應主動融合人工智能平臺發展的趨勢,在充分吸收AI(人工智能)技術的前提下,結合黨建工作、黨建活動、百姓互動的行為特征,給黨的建設提供科學化的支撐。人工智能給黨建工作帶來創新。在黨建工作或活動中,可以結合人工智能和大數據分析,創建智能化成教育工作平臺,在云端將黨建工作、學習、知識等信息和數據進行存儲和模型構建,組成知識圖譜;在端側將黨員和群中聯系在一起,使得AI賦能黨建,形成黨建工作新局面。
人工智能技術不僅能夠服務于工業信息化領域,也能夠服務于基層等基層管理平臺,為建設智慧型城市提供技術支撐。而隨著國產軟硬件技術的不斷成熟,已具備融合人工智能的應用研究和設計能力,但目前仍處于起步階段[2]。為適應我國“新基建”概念落地,將信息化、國產化與智能化有機融合,大幅提升電子信息系統的自主安全和先進水平。本文結合國產自主可控和人工智能芯片現狀,構建了國產人工智能平臺,提出了技術架構和實現途徑,面向電子化辦公、基層黨建管理、工業自動化多個領域進行了人工智能應用推廣。其中,在推動智能化黨建管理平臺建設,可以對信息采集存儲,發揮智能化決策和分析能力,輔助黨員和群眾對黨建知識的學習,采用算法模型,加速對自然語言的理解,同時結合網絡技術,有效提升黨建工作效能。
在我國“十四五”發展規劃中,把人工智能作為核心賽道,提出了系列化的要求。目前,我國電子信息化產業的智能化發展正處于一個非常關鍵的時刻。在傳統信息化平臺基礎上,運用人工智能和數據分析技術,政府部門可以實現黨建信息資源融合共享,提升新時代黨建工作的科學化水平;工業部門也可以精確化完成質檢、分析預測等工作,提升工業智能化水平,推動我國“工業4.0”的創新技術發展。
AI技術(人工智能技術)的發展給自主可控的發展帶來了新機遇和新挑戰[3]。通過融合國產基礎硬件和人工智能芯片,適配基礎層驅動和運行環境,打造的一個集數據處理、模型加工、訓練推理、智能化應用的基礎平臺。一方面用于提升國產化計算機和服務器的計算算力;另一方面也是為了充分發掘國產計算平臺融合AI模塊后的應用潛力,為后續大規模應用提供基礎論證和技術服務支持。
國產人工智能平臺主要由國產化基礎硬件(國產處理器+國產AI芯片)、基礎環境、AI服務、集成開發環境(IDE)、統一運維管理組成,各模塊組件需要結合國產處理器特點,完成各場景模型適配移植、編譯優化、測試驗證等工作,其技術架構如圖1所示。

圖1 國產人工智能平臺架構
(a)國產化底層硬件平臺主要基于國產處理器,融合了人工智能芯片,構建了異構人工智能環境。AI芯片是人工智能平臺的關鍵模塊[4],采用百度昆侖和華為昇騰等國產品牌,在國產飛騰平臺上開展了驅動適配、環境移植、深度學習框架的適配、算法模型開發、模型驗證提優等工作。
(b)提供一站式集成開發環境,包括應用開發/調試/編譯、模型轉換、網絡移植/優化/分析等主要功能,為AI開發帶來了極大的便利。同時,還需集成豐富的IDE環境,方便開發者自行編寫和調試代碼,并按照流程完成模型開發。
(c)提供高性能SDK開發環境,支持圖像、視頻的快速編解碼,提供了計算高性能編程庫,同時提供AI自定義算子開發接口,通過SDK充分調度硬件算力,發揮硬件性能。其中,算子開發難度較大,本平臺可以提供豐富的算子開發指導,輔助用戶進行第三方算子開發,降低了算子開發的門檻,并提高算子開發及調試調優的效率。
(d)為AI應用開發和使用人員提供統一的運維管理功能以及完整的AI解決方案。AI統一運維管理模塊提供多種場景部署能力,從多類型虛擬機,內置管理板,到裸機場景部署,支持對于服務器全生命周期管理的要求,從而更好地管理設備;同時支持面向邊緣計算、云邊融合、邊端協同等場景部署。
人工智能平臺主要運行在國產處理器硬件平臺之上,主要對內存及硬盤容量、AI加速卡有一定需求。主流國產硬件可選用飛騰2000+、龍芯3A4000,操作系統為國產麒麟操作系統,AI芯片選用成熟的AI加速卡或按需進行封裝定制。
人工智能平臺屬于系統Paas層,是基于國產AI芯片和主流深度學習框架構建,提供較為豐富的開發環境和開發語言支持,滿足人工智能開發部署和運行支撐。
開發流程主要面向訓練和推理場景,可分為訓練開發和推理開發兩部分。在開發過程中,首先需進行數據處理、模型建立、模型訓練和模型測試等流程。緊接著,需要將模型轉換為可在AI處理器中運行的模型格式。推理應用開發過程包含數據處理、模型裝載、結果輸送或顯示等流程。
其中,因國產處理器和國產人工智能芯片對深度學習框架、算子、模型等方面有特殊要求,需要首先對深度學習框架進行適配移植,可選用Tensorflow、Caffe、PaddlePaddle、PyTorch、MindSpore等開源深度學習框架。平臺支持多種訓練方式,支持在國產龍芯或飛騰平臺的CPU以及支持訓練的AI卡進行訓練。模型訓練過程中,可對資源及性能進行實時查看。同時,解決模型開發過程中遇到的算子缺失、框架不支持、模型生成失敗等諸多問題。當模型訓練完成時,開發者通過模型評估模塊對模型進行評估。離線部署需要針對不同的AI卡選取不同的模型轉換工具進行模型轉換,轉為可在目標設備中運行的離線模型。

圖2 人工智能應用開發流程
最后,結合實際應用場景,若精度或效果仍未達到預期,開發者可重新修改模型、算法或訓練超參數進行重新訓練,若精度已達預期,可對模型進行保存。
圍繞提升信息化系統智能化競爭力的迫切需求,新一代人工智能平臺的應用部署要以模型為核心,以數據和國產硬件為基礎,以提升應用效能為重點,形成開放兼容、穩定成熟的AI應用模式。針對不同應用場景,人工智能平臺提供共性基礎支撐,僅需進行模型和算子的設計開發,即可完成平臺的應用推廣工作。
遙感作為當代高新技術的一個重要組成部分,在國防安全上具有重要應用價值,利用遙感影像處理技術從遙感影像中識別出飛機、艦船等重要目標信息,從而獲取敵方軍事目標的空間分布、地理坐標等重要情報信息。由于淺層的機器學習分類模型無法充分學習到遙感圖像中的復雜信息,因此分類的精度也不高。深度學習技術的出現為遙感圖像分類的問題提供了一個新的解決方案。常用的算法有LeNet,VGG和ResNet。
目標檢測應用領域廣泛,如人臉識別檢測、車道檢測、衛星圖像物體檢測、醫學圖像病灶分析等,因此具有非常大的價值。常用目標檢測網絡模型有YOLOv3、SSD、CNN、Fast R-CNN等。通過在國產平臺適配移植上述模型,結合場景數據進行訓練推理驗證,得到較為準確的基礎模型。
語言Bert模型是最典型的NLP(自然語言處理)模型,是文本分析的典型算法模型,在實際場景中應用廣泛。通過預訓練得到通用語義表示,再結合簡單的輸出層,應用到下游的NLP任務,在多個任務上取得了SOTA的結果,基于Bert模型,利用昆侖K200卡進行訓練,生成文本分析模型。用戶利用百度昆侖或華為Atlas卡進行模型推理,完成文本分析應用場景的實現。
面向故障預測領域進行應用創新,使得國產AI計算平臺能夠應用于設備運維和故障維護,也是對國產化先進技術的一次良好的應用示范。傳統的智能故障診斷方法通常包含特征提取、特征選擇和故障分類三個步驟。通過引入AI卡,規避了國產平臺中CPU算力不足的問題,從而提高了人工智能應用在國產平臺中運行的效率,增強了對國產平臺中設備的運維能力,提升了數據中心運維效率,提高了數據中心的安全可靠能力,保證了設備集群的穩定運行。常用的故障預測模型包括LSTM、Xgboost、MLP等。
本文基于國產處理器平臺,融合國產人工智能芯片,打造平臺化、組件化、一體化的基礎平臺,并提供訓練推理開發環境和開發工具,滿足用戶訓練推理使用。通過重點研究黨建電子信息化、智慧城市、黨政辦公等人工智能應用場景[5],結合算法模型發展能力,形成軟硬件一體的解決方案,對各型電子信息化系統智能化起到指導借鑒作用。本文研究成果還可結合容器化、邊緣計算等先進技術,應用到手機、平板等邊緣端,進一步推動國產人工智能平臺的有效發展和推廣應用。