




摘 要:在物聯網和人工智能飛速發展的大背景下,針對高校網絡設備運維中存在的問題,基于物聯網和人工智能,從設計目標、系統架構和應用場景幾個方面對運維新方案進行闡述。方案依托自主研發的網絡設備管理器,獨立于需要維護的校園網絡,無需改造現有校園網架構和設備,成為高校網絡設備運維的一種新模式。
關鍵詞:物聯網;網絡設備;運維方案;人工智能;高校;網絡設備管理器
中圖分類號:TP399 文獻標識碼:A 文章編號:2095-1302(2025)02-0-03
0 引 言
高校是一個高度依賴網絡的單位,其網絡組成又具有一定的復雜性。高校網絡一般由校園網絡、運營商網絡、各部門專網和托管網絡等構成。網絡設備分布較松散,這給網絡設備運維帶來了較大的挑戰。鑒于當前物聯網技術已趨于成熟,本文將研究使用物聯網技術監控和維護高校網絡設備。
1 高校網絡設備管理現狀
1.1 網絡設備管理方式
當前網絡設備運維方式主要分為:現場運維和遠程運維[1]。現場運維時,工作人員需到現場并通過網絡設備調試接口對設備進行人為問題分析和處理。遠程運維指工作人員通過網絡設備自身提供的SSH、Telnet、Web等管理服務對設備進行維護。在此基礎上網絡設備廠商提供了集中管理設備的平臺,但這些平臺只局限于通過設備自身提供的服務和現有的網絡環境進行設備狀態的監控和設備管理。
1.2 網絡設備管理中存在的問題
高校當前網絡設備管理中存在的問題如下:
(1)使用自身網絡環境運維自身網絡設備。在遠程運維環境下,如果用于進行設備管理的網絡環境已經出現問題,工作人員無法通過現有遠程運維手段進行有效運維。
(2)網絡設備自身提供的網絡管理服務(SSH、Telnet、Web等)本就存在服務故障,而這些服務也占用了網絡設備的有限資源。
(3)現場運維人工成本逐年遞增。
針對上述存在的問題,需要尋求一種不依賴于自身網絡通信,并能很好接管現有網絡設備的遠程設備運維方案。
2 網絡設備運維方案
2.1 方案設計目標
本方案設計的目標是為了解決以下幾個問題:
(1)網絡設備運維使用外管模式。在外管模式下,網絡設備運維的通信環境不能依賴需要運維的設備,即不能使用設備自身的通信環境來運維設備。運維通信必須與需運維的設備通信環境獨立。
(2)不改變當前校園網絡結構和架構,以一種較低成本的方式增強網絡運維能力。設備運維能力的增強不應改變當前校園網絡的架構。方案只是以最低的成本和在不改變現有網絡的基礎上增強網絡設備的運維能力。
(3)減少運維系統與校園網絡的關聯。當運維系統出現故障時,不會影響校園網絡的正常運行。
(4)方案應考慮人工智能的應用,以提供智能運維能力。
2.2 方案簡介
方案使用自主研發的網絡設備管理器(核心設備)。核心設備通過CONSOLE口連接網絡設備,并通過CONSOLE口對網絡設備進行監控。核心設備基于多種物聯網通信協議與MQTT(Message Queuing Telemetry Transport)消息隊列通信。MQTT協議是一種基于發布/訂閱(Publish/Subscribe)模式的“輕量級”通信協議[2-3],該協議構建于TCP/IP協議上。MQTT消息隊列集群主要負責核心設備與系統數據庫之間的信息(監控信息)傳遞工作。系統數據庫采取多類型數據庫異構集群的方式,通過異構的方式充分發揮各數據庫的特性。方案具備設備故障預警、設備監控儀表盤、設備遠程維護、設備環境監測、設備故障預測、設備故障智能維護等功能。
2.3 系統架構
運維系統由網絡設備接入層、異構數據庫集群、傳統運維平臺和AI運維構成。運維系統架構如圖1所示。
2.3.1 網絡設備接入層
網絡設備接入層由核心設備、網關和MQTT集群組成。核心設備是管理網絡設備的設備。它通過RJ 45接口與網絡設備的CONSOLE口連接,通過RS 232通信方式監控網絡設備。核心設備除了可以管理網絡設備外,還可以搭載設備環境傳感器。核心設備通過環境傳感器(如:溫度、濕度、氣體傳感器等[4])監測網絡設備的存放環境。網絡設備真實的存放環境參數有溫度、濕度、有毒氣體體積分數、磁感應強度等。這些參數能從物理參數的角度反映設備是否出現故障或出現故障的可能性。這是傳統網絡設備運維方案無法實現的。
核心設備選用國產ESP32S3芯片作為主控芯片。主控芯片通過UART1連接RS 232串口通信芯片,將網絡設備標準命令下發到網絡設備,并獲取網絡設備返回信息。主控芯片使用5G通信模塊或其他物聯網協議通信模塊與MQTT集群傳輸監測信息。圖2所示為核心設備的硬件框架。
核心設備主要負責監測網絡設備和控制網絡設備。核心設備工作流程如圖3所示。
2.3.2 異構數據庫集群
異構數據庫集群是系統數據庫和系統的數據核心。其用于存儲網絡設備輸出的原始監控日志、通過AI模型處理后的向量數據、系統配置和顯示數據等。這些數據大部分不是傳統的關系型數據,所以需要使用一種異構的方式將非結構化數據、向量數據和關系型數據存儲起來,發揮各類型數據庫的特長。
NoSQL(Not only SQL)是對不同于傳統關系型數據庫的數據庫管理系統的統稱[5]。NoSQL的類型有:鍵值數據庫、內存數據庫、文檔數據庫、圖數據庫、向量數據庫和時間序列數據庫等。
方案將不同類型的非關系型數據存儲到對應的NoSQL數據庫中。表1列舉了方案中主要的非關系型數據項和對應的數據類型、數據庫。
2.3.3 傳統運維與AI運維平臺
設備運維平臺應具備以下幾個主要功能:
(1)故障預警。故障發生時,第一時間將故障通知發送給管理和維護人員。
(2)設備狀態儀表盤。通過直觀的方式顯示各個被監控設備的運行狀態。
(3)遠程維護。當故障發生時,能通過遠程方式恢復設備運行。
隨著人工智能的發展,從技術層面已具備將特定領域的大數據應用到自然語言處理、機器學習模型和大語言模型中的能力,從而實現自動化執行、簡化工作流程和預測的目的。實現網絡設備AI運維的總體思路如下:
(1)收集并匯總網絡設備的運行日志(特別是故障日志)、設備操作手冊、故障處理手冊等大數據。
(2)篩選清洗數據,去除“噪聲”數據[7],識別與系統性和可能性問題相關的數據,并標注數據。
(3)將篩選和標注后的大數據應用到具體的AI模型中進行訓練。
(4)將訓練后的模型運用到實際的問題中,對比模型預測值和實際值,調整優化模型參數和數據,再訓練模型,直至模型能覆蓋絕大多數問題。
3 方案應用場景及衍生和運維新模式
3.1 作為NMS的備用方案
網絡管理系統(Network Management System, NMS)的目的是管理網絡,使網絡高效運行。各大廠商NMS有eSight(華為)、RIIL(銳捷)、iMC(H3C)等[8]。圖4描述了基于物聯網的網絡設備運維方案與傳統NMS管理手段的不同。本方案管理手段直接作用于網絡設備的物理層面,更加直接、高效和穩定。本方案核心設備安裝方便,直接與網絡設備的CONSOLE口連接,無需配置和改造網絡設備。
傳統NMS是內管模式。網絡設備使用自身的SNMP服務管理自身的控制接口。SNMP是廣泛應用于TCP/IP網絡的網絡管理標準協議,該協議能夠支持網絡管理系統,用以監測連接到網絡上的設備是否有任何引起關注的情況[9]。網絡設備SNMP服務運行在很小的網絡設備上,常因設備資源不足而出現問題,如老舊網絡設備因SNMP版本過低而出現安全問題等。SNMP協議是基于TCP/IP協議研發的,即SNMP與NMS的通信基于自身網絡設備的網絡環境。如果網絡設備出現故障,且已經影響SNMP的正常通信,那么必然導致NMS出現問題。在這種情況下,唯一的維護辦法是工作人員到設備現場通過控制口處理設備故障。而本方案使用外管模式。獨立的設備維護通信線路(物聯網:4G、5G、 ZigBee、藍牙等[10])完全獨立于需要管理的網絡設備,管理服務也完全獨立于需要管理的網絡設備。本方案不論是作為傳統NMS的替代方案,還是作為一種備用方案都具有較好的可行性。
3.2 提供網絡設備云托管服務
網絡設備托管服務商可以向服務對象提供核心設備,通過4G或5G直接提供遠程運維服務。此應用場景具有部署簡單,不影響服務對象現有設備、配置和網絡環境等優勢。服務對象只需將需要托管的網絡設備接入核心設備即可,無需考慮VPN等隧道問題,維護人員可直接在場外維護高校的網絡設備。
3.3 網絡設備存放環境監測
本方案提供了環境傳感器,可以將核心設備部署到需要檢測網絡設備存放環境的區域,用于檢測本區域的溫度、濕度、有毒氣體體積分數和磁感應強度等物理參數,將這些參數作為運維的輔助參考。
3.4 網絡設備運維新模式
本方案討論了一種建立在物聯網專網上的網絡設備運維模式。設備運維使用外管模式。外管模式指的是設備管理獨立于被管理設備本身和其運行環境。本方案中設備運維服務獨立于被管理設備,設備運維網絡獨立于被管理設備網絡。在外管模式下,網絡設備運維具有低依賴性、部署靈活、高擴展性和不影響原有網絡等特點。
4 結 語
本方案依托自研的核心設備,通過物聯網協議創建了網絡設備運維物聯專網。此專網獨立于需要維護的校園網絡,無需改造現有校園網架構和設備,部署方便快捷。本方案暫未對物聯網安全做出討論研究。
參考文獻
[1]王利平,龐曉艷,朱雨,等.基于物聯網和移動互聯的二次設備運維技術研究與應用[J].中國電力,2019,52(3):177-184.
[2]姚丹,謝雪松,楊建軍,等.基于MQTT協議的物聯網通信系統的研究與實現[J].信息通信,2016(3):33-35.
[3]任亨,馬躍,楊海波,等.基于MQTT協議的消息推送服務器[J].計算機系統應用,2014,23(3):77-82.
[4]錢志鴻,王義君.面向物聯網的無線傳感器網絡綜述[J].電子與信息學報,2013,35(1):215-227.
[5]申德榮,于戈,王習特,等.支持大數據管理的NoSQL系統研究綜述[J].軟件學報,2013,24(8):1786-1803.
[6]靳強勇,李冠宇,張俊.異構數據集成技術的發展和現狀[J].計算機工程與應用,2002(11):112-114.
[7]蒲天驕,喬驥,韓笑,等.人工智能技術在電力設備運維檢修中的研究及應用[J].高電壓技術,2020,46(2):369-383.
[8]段海新,楊家海,吳建平.基于Web和數據庫的網絡管理系統的設計與實現[J].軟件學報,2000(4):468-472.
[9]張杰.基于SNMP的網絡管理系統的研究與實現[D].上海:東華大學,2008.
[10]王保云.物聯網技術研究綜述[J].電子測量與儀器學報,2009,23(12):1-7.
作者簡介:程 通(1982—),男,四川成都人,碩士,工程師,研究方向為物聯網和系統設計。
收稿日期:2024-01-23 修回日期:2024-03-01