房 杰
(中鐵通信信號勘測設計院有限公司,北京 100036)
城市軌道交通專用通信系統是滿足軌道交通運營、管理需求的綜合業務通信網,主要包括傳輸系統、公務電話系統、專用電話系統、無線通信系統、廣播系統、時鐘系統、乘客信息系統、辦公自動化系統、電源系統以及接地等,可以保障列車安全運行[1]。
目前,城市軌道交通專用通信系統通過建設集中告警系統實現本系統的設備監測和告警。集中告警系統是利用計算機網絡技術和計算機本身的數據處理能力對專用通信系統中的各子系統進行集中管理,將各子系統的告警信息集中顯示在告警終端,使通信維護人員能及時、準確地了解整個通信系統設備的運行狀況和故障信息。該系統可以滿足早期專用通信系統運維的需要,但隨著各地區城市軌道交通建設規模越來越大、運維體系越來越龐大,傳統的通信運維體系維護效率低、強度大、工作成本高,難以滿足未來可持續發展的需要。本研究依托大數據分析、人工智能等技術手段建設通信智能運維系統,實現專用通信系統設備從計劃修轉為狀態修,滿足未來城市軌道交通通信運維的需要[2]。
通信智能運維系統在城市軌道交通的線路控制中心設置智能運維系統設備,用于采集、匯總、分析、顯示、存儲并打印通信各子系統的設備運行狀態信息,從而進行集中監測預警、狀態預判、故障定位以及故障處理指導。此外,該系統還能將各子系統的設備運行狀態和告警信息集中反映到告警設備和移動終端設備上,同時記錄下收到的故障信息并保存到數據庫中,具有訪問權限的維護人員可以近程或遠程登錄網絡平臺,以快速準確掌握設備運行狀態或及時處理各系統設備故障,為軌道交通安全運行提供保障[3]。
通信智能運維系統可以對告警信息和設備工作性能參數實時采集,且采集周期可調。
2.1.1 告警信息采集
(1)網元告警。通信各子系統的網管系統應實時采集各子系統網元設備上的所有報警信息,其中網元設備覆蓋通信系統的所有網元。(2)性能超限報警。通過通信各子系統網管系統,實時采集各子系統的性能超限報警。(3)連接告警。當某一通信子系統網管系統持續一定時間不響應通信智能運維系統時,通信智能運維系統自動生成通信連接告警。
2.1.2 設備工作性能參數采集
(1)設備實時電流、電壓及功耗。采集UPS輸入電壓、輸出電壓、電流、電池組電流、單節電池電壓以及內阻等參數,其他各子系統采集服務器、交換機、存儲設備、PIS播放控制器、廣播功放、廣播控制器、錄音設備、母鐘設備以及接口擴展箱等設備的實時電流、電壓與功耗參數[4]。(2)交換機參數。采集各子系統交換機的端口實時速率、CPU利用率、CPU溫度、內存使用情況、設備溫度、端口在線狀態、IP沖突、風扇狀態、光口收發光功率等參數。(3)服務器和工作站相關參數。采集CPU利用率、CPU溫度、內存使用情況、網口實時網速、應用進程及占用CPU和內存資源以及硬盤使用情況等參數。(4)電源系統相關參數。采集交、直流輸出電源的電壓、電流、頻率等參數;采集UPS的輸出電壓、電流、頻率等參數;采集蓄電池組與單節蓄電池的電壓、內阻、溫度以及電池充電量等參數。
智能運維系統應能采集通信子系統的工作性能參數,跟蹤參數變化趨勢并加以分析。系統可對設備參數設置預警和告警閥值,在設備參數接近該閾值時進行預警,指導維護人員提前介入。預警功能要采集、統計及展示的性能參數包括:①各系統服務器、交換機、錄音設備、視頻監視終端以及各系統網管終端等的CPU利用率、CPU溫度、內存使用情況、應用進程、占用CPU和內存資源的情況、網口實時網速、硬盤使用情況以及實時電流、電壓、功耗等;②電源系統兩路輸入電源和交/直流輸出電源的電壓、電流、頻率等;③開關電源設備的各路交流輸入電流電壓頻率、負載電流電壓、整流器狀態、免維護電池電壓、電池內阻以及電池充電量等。
拓撲顯示功能提供良好用戶界面,以圖形方式顯示網絡拓撲,設備的運行狀態在網絡拓撲上實時動態顯示。在拓撲圖上動態反映各通信子系統網元預警和告警,當前網絡的運行可以通過聲音和顏色的變化來反映。同時還顯示選定對象的基本信息,包括名稱、位置、狀態、當前告警條數、當前告警的級別、告警內容以及原因的簡單描述等[5]。
(1)信息即時推送。智能運維系統設備能對通信各子系統的運行狀況進行24小時不間斷信息采集,并將告警信息通過App即時推送到預定管理人員的移動終端。(2)告警信息過濾。通信智能運維系統可以控制告警接收條件實現告警過濾功能,可以設置接收到哪些報警或未接收到哪些報警,便于對一些不重要或不關心的告警信息進行過濾,使維護管理人員能夠集中精力對網絡中重要的告警信息進行監視和處理,提高工作效率。(3)告警信息輸出。通信智能運維系統可以根據告警源、發生地點、告警級別、告警狀態、告警類型以及產生時間等條件對告警信息進行查詢和統計,查詢統計結果以報表、圖形方式顯示,并可對其進行存儲和輸出打印。
移動終端App支持巡檢、日常任務處理、歷史信息查詢、專家庫幫助、現場圖像或視頻采集、維修記錄上傳以及備品備件查詢等,移動終端App功能通過運營商公網實現。
專家庫對常規問題提供必要的幫助,同時維修人員可通過該功能查詢工程相關資料(設備產品說明書、產品維修手冊、竣工圖紙、歷史維修記錄等)。通過智能運維系統收集通信各子系統的相關資料添加至專家庫,并不斷完善專家庫。
智能通信運維系統應具有檢測和控制用戶登錄和操作系統的功能,確保只有具有相應權限的用戶才能注冊和操作。
通信智能運維系統主要由兩部分構成,即中心智能分析處理部分與底層信息感知部分,如圖1所示。中心智能分析處理部分負責完成運維數據整合、數據分析、數據處理、數據應用;底層信息感知部分完成結構化、半結構化信息采集,一部分數據通過其他通信子系統主動上傳獲取,另一部分信息通過主動感知獲取。

圖1 通信智能運維系統
在中心智能分析處理部分設置中心服務器區、監控管理調度工作站、告警終端、數據存儲設備,并通過網絡安全隔離設備與公網對接。
3.1.1 中心服務器區
中心服務器區主要由應用服務器、智能分析服務器、應急預案服務器、接口服務器以及網管服務器等構成,可以完成運維數據的采集、管理、分析,實時掌握現場情況,準確判斷故障對運營的影響,及時做出恰當的處理,完成生產組織管理、維修計劃及規程管理、工單管理、應急案例庫、現場人員定位、設備及物資管理以及重大故障應急調度等工作。
本系統可以自動推送維修任務,統計展示維修進度、工單進度跟蹤和設備運行信息,自動統計生成檢修月度和年度報告。利用手持終端設備對現場人員賦能,提高對通信設備的檢修、搶險、救援等作業效率,實現故障搶修、緊急救援場景下的人員及物質統一調配指揮等。
3.1.2 監控管理調度工作站
監控管理調度工作站包括集中監控工作站、智能運維調度工作站、應急預案工作站以及網管工作站。工作人員可在集中監控工作站監視通信各子系統的工作狀態與通信機房的運行狀態,包括線路地圖、故障地點展示、人員位置顯示、備品備件位置顯示、值班室位置顯示、故障詳情及疑難問題跟蹤管理等。在智能運維調度工作站,工作人員可以完成報表統計、日常維護計劃制定以及運維物資管理等工作。在故障情況下,由應急預案工作站下發應急預案、調配救援物資、記錄現場搶修過程等。網管工作站主要完成本系統的狀態監測、運維管理、系統配置等功能。
3.1.3 告警終端
本系統設置聲光告警設備,對故障信息可以進行聲音、光電顯示告警,并可以根據故障等級顯示不同的聲、光信號。此前,重要故障信息可以推送至相應維護人員的移動終端。
3.1.4 數據存儲設備
數據存儲設備一部分記錄底層信息感知部分上傳的通信各子系統的設備運行狀態信息、通信各子系統的設備運行環境信息,另一部分記錄各類告警信息,可供智能分析服務器周期性調取,形成設備健康評估及壽命預測報表,為狀態修/預測修提供指導。此外,為特定的通信智能運維人員配備手持終端設備,通過公網接收智能運維系統下發的派班任務,并可在移動端上傳作業現場圖片和反饋處理結果,實現派班任務的閉環處理。
底層信息感知部分主要采集通信各子系統設備運行狀態與運行環境信息。全面采集各終端設備的運行狀態及設備工作參數信息,通過通信各子系統的網管服務器多維度自動且不間斷上報。設置傳感器監測機房環境溫濕度,設置自動巡檢機器人代替人工巡檢,并可周期性地將網管服務器無法監測到的設備運行狀態信息上傳至中心智能分析處理部分。
通信智能運維系統綜合運用物聯網、大數據、人工智能等多種技術,提供設備實時狀態監測、智能分析與數據挖掘、設備健康評估及壽命預測、運營指標統計分析與質量評價、生產維修與應急指揮調度、運維信息化跟蹤以及運維信息可視化展示等功能,可以有效滿足未來軌道交通智能運維的需求,實現運維模式從“計劃/故障修”轉變為“狀態修/預測修”,大大降低了人力成本,提高了運營效率和運維質量。