荊晶
摘 要:現(xiàn)在社會上各行各業(yè)都在進行智能化改造,智能化程度都在不斷提高。本文在全面了解目前軌道交通行業(yè)通信系統(tǒng)運維現(xiàn)狀的基礎(chǔ)上,并參考國內(nèi)外通信運營商的系統(tǒng)運維現(xiàn)狀,針對軌道交通行業(yè)的通信系統(tǒng)提出一些智能化網(wǎng)絡(luò)運行維護的應(yīng)用需求場景和建設(shè)思路。
關(guān)鍵詞:智能運維;數(shù)據(jù)中臺;故障診斷;質(zhì)量評價;應(yīng)急指揮
1 通信系統(tǒng)運維現(xiàn)狀
目前軌道交通行業(yè)涉及眾多的通信系統(tǒng),包括傳輸、數(shù)據(jù)網(wǎng)、無線網(wǎng)、電話交換及接入網(wǎng)、調(diào)度系統(tǒng)、動力環(huán)監(jiān)、視頻監(jiān)控、漏纜監(jiān)測、應(yīng)急通信、光纜監(jiān)測、車載監(jiān)測、以及各種監(jiān)測檢測系統(tǒng)。在運行層面構(gòu)建了多樣化的專業(yè)網(wǎng)管和監(jiān)測檢測系統(tǒng)網(wǎng)管,有針對性地提供各個專業(yè)及通信子系統(tǒng)的網(wǎng)絡(luò)監(jiān)控、配置和狀態(tài)采集、查看能力,主要服務(wù)對象是網(wǎng)管中心、監(jiān)控中心等專門崗位。
雖然在網(wǎng)絡(luò)規(guī)模上沒有運營商的網(wǎng)絡(luò)規(guī)模大,但其實際維護難度卻常常超過運營商。
隨著大數(shù)據(jù)、云計算、人工智能等技術(shù)的飛速發(fā)展,國內(nèi)外的標準化組織、運營商及服務(wù)商都在積極探索網(wǎng)絡(luò)智能化運維的需求、架構(gòu)、算法和應(yīng)用場景,并逐步由概念進入落地階段。
本文在以上現(xiàn)狀分析的基礎(chǔ)上,提出一些針對軌道交通行業(yè)通信系統(tǒng)智能運維的建設(shè)思路。
2 遇到的問題
目前,為了提高對各通信系統(tǒng)的支撐效果,已經(jīng)建立了若干運維支撐類系統(tǒng),包括綜合網(wǎng)管、專業(yè)網(wǎng)管、各類監(jiān)測檢測系統(tǒng)。這些系統(tǒng)均相互獨立,客觀上以“數(shù)據(jù)孤島”的形式存在,之間的數(shù)據(jù)無法互通,缺少有效的聯(lián)動。雖然這些系統(tǒng)提升了運維效率,但依然高度依賴維護及管理人員的經(jīng)驗、精力和責任心,運維工作量大、效率低、效果參差不齊。
隨著大數(shù)據(jù)、云計算、人工智能等技術(shù)的飛速發(fā)展,國內(nèi)外的標準化組織、運營商及服務(wù)商都在積極探索通信網(wǎng)絡(luò)智能化運維的需求、架構(gòu)、算法和應(yīng)用場景,并逐步由概念進入落地階段。
3 智能運維系統(tǒng)的規(guī)劃
首先通過從各專業(yè)網(wǎng)管的北向接口,對各系統(tǒng)網(wǎng)絡(luò)運行數(shù)據(jù)進行采集和存儲,實現(xiàn)對各通信系統(tǒng)數(shù)據(jù)進行實時采集和集中管理;在實時采集網(wǎng)絡(luò)運行數(shù)據(jù)的基礎(chǔ)上,網(wǎng)絡(luò)綜合監(jiān)控、故障診斷、質(zhì)量評價、應(yīng)急指揮等功能。
3.1 通信系統(tǒng)數(shù)據(jù)集中管控
通信系統(tǒng)數(shù)據(jù)統(tǒng)一集中管控是實現(xiàn)通信智能運維的核心與基礎(chǔ)。主要實現(xiàn)數(shù)據(jù)集成、數(shù)據(jù)存儲、數(shù)據(jù)維護、數(shù)據(jù)服務(wù)等功能,形成實際上的通信系統(tǒng)數(shù)據(jù)中臺。
首先面向各專業(yè)網(wǎng)管、監(jiān)測檢測等系統(tǒng)進行數(shù)據(jù)收集;所收集數(shù)據(jù)包括各系統(tǒng)實時告警信息、設(shè)備及業(yè)務(wù)資源信息、系統(tǒng)性能指標等。然后分專業(yè)系統(tǒng)進行數(shù)據(jù)集成,實現(xiàn)采集結(jié)果數(shù)據(jù)的抽取、清洗、轉(zhuǎn)換及加載等過程。再按照數(shù)據(jù)類型進行存儲,包含事件類數(shù)據(jù)(如告警事件、接口信令、故障記錄等)、指標類數(shù)據(jù)(如性能指標、質(zhì)量分析結(jié)果、話統(tǒng)計數(shù)器等)和對象類數(shù)據(jù)(如設(shè)備資源、網(wǎng)絡(luò)資源等)。除上述結(jié)構(gòu)化生產(chǎn)數(shù)據(jù)之外,還包括對非結(jié)構(gòu)化生產(chǎn)數(shù)據(jù)的存儲能力,如圖片、視頻等。
另外對于無法自動采集的基礎(chǔ)數(shù)據(jù),可通過人工維護的方式將站點、設(shè)備放置點、機房、機架、光纜線路等信息進行錄入或?qū)搿?/p>
3.2 設(shè)備綜合監(jiān)控
通過所收集的實時告警信息,進行標準化處理,將不同專業(yè)、不同廠家的告警按統(tǒng)一的標準進行分類,并統(tǒng)一呈現(xiàn)。根據(jù)實際需求對不同類型的告警重新設(shè)置告警級別,并在監(jiān)控界面中顯示。
通過資源信息,呈現(xiàn)各系統(tǒng)的設(shè)備拓撲連接圖、設(shè)備面板圖、業(yè)務(wù)承載信息等。配合GIS地圖,以電子地圖為背景顯示通信站點及機房的分布情況,在GIS地圖上查看站點、機房及設(shè)備分布情況。當設(shè)備有告警時,可在GIS圖層上查看告警提示。
3.3 故障智能診斷
通過實時告警監(jiān)控、告警標準化處理、工程告警管理、告警診斷分析、告警統(tǒng)計分析等功能,實現(xiàn)通信網(wǎng)絡(luò)故障的全面展現(xiàn)和智能診斷。
工程告警管理:用戶可根據(jù)施工停機計劃,將相應(yīng)的通信設(shè)備設(shè)置為工程模式,在此模式下的通信設(shè)備將不顯示任何實時告警。用戶也可將施工停機計劃導(dǎo)入系統(tǒng),系統(tǒng)自動將計劃內(nèi)的設(shè)備設(shè)置為工程模式。待施工結(jié)束后,取消設(shè)備的工程模式,實時告警聲光提示重新生效。
告警診斷分析:通過自定義相關(guān)規(guī)則,對多個告警事件進行相關(guān)性分析,自定義的規(guī)則包括時間相關(guān)性(間隔時間)、資源相關(guān)性(告警對象是否一致)、事件相關(guān)性(告警名稱因果關(guān)系);根據(jù)規(guī)則對當前所有活躍告警信息進行關(guān)聯(lián)分析,呈現(xiàn)分析結(jié)果,包括告警定位信息、根源告警和衍生告警等。根據(jù)告警名稱、告警對象關(guān)聯(lián)出一段時間內(nèi)的歷史告警信息、影響業(yè)務(wù)信息、原因分析、處理建議等。
故障工單收發(fā):在實時告警界面選擇需要派發(fā)的告警一鍵生成工單信息并直接派發(fā),可將告警相關(guān)信息自動填充到工單中,并關(guān)聯(lián)出在歷史故障處理過程中形成的故障處理建議;處理人員收到工單并完成故障處理后,進行工單回復(fù)。可以根據(jù)工單完成時間、工單狀態(tài)等維度對不同單位的故障工單進行統(tǒng)計,統(tǒng)計對象包括區(qū)域、工單受理人、工單處理時間等。
3.4 質(zhì)量評價健康管理
通過收集專業(yè)網(wǎng)管、設(shè)備檢修記錄等多來源數(shù)據(jù),進行數(shù)據(jù)處理和評價,最后對各系統(tǒng)進行評價結(jié)果的展現(xiàn)。評價結(jié)果包括設(shè)備質(zhì)量、工作質(zhì)量、系統(tǒng)運用質(zhì)量。設(shè)備質(zhì)量是指設(shè)備的客觀狀態(tài)質(zhì)量,包括機械強度和電氣性能;設(shè)備質(zhì)量的評價以設(shè)備檢修記錄和網(wǎng)管動態(tài)指標為評價依據(jù)。工作質(zhì)量是指維護、管理人員在生產(chǎn)活動中所達到的質(zhì)量,包括技術(shù)水平、工作態(tài)度和維護管理任務(wù)的執(zhí)行程度;工作質(zhì)量的評價以生產(chǎn)計劃的完成情況和問題庫的解決情況為評價依據(jù)。系統(tǒng)運用質(zhì)量是指通信系統(tǒng)在使用過程中的動態(tài)質(zhì)量,是運用中的系統(tǒng)、設(shè)備及電路在規(guī)定的技術(shù)條件下所能完成其功能的程度;運用質(zhì)量以網(wǎng)管動態(tài)指標為依據(jù)。
3.5 作業(yè)過程管控
對各專業(yè)的設(shè)備設(shè)施信息進行規(guī)范化處理,制定統(tǒng)一的檢修過程數(shù)據(jù)模型,對所有檢修項目進行規(guī)范化和標準化,實現(xiàn)各維護單位檢修計劃的自動編制和檢修對象表自動生成。現(xiàn)場檢修人員按照標準化的記錄格式逐項勾選、填記,填寫檢修結(jié)果,最大程度的實現(xiàn)檢修過程標準化,并且通過上傳照片、視頻等形式,實現(xiàn)管理部門對檢修結(jié)果的可視化管理。一線檢修人員可通過移動終端進行檢修結(jié)果的記錄和上傳。
3.6 應(yīng)急調(diào)度指揮
以應(yīng)急指揮為核心,應(yīng)急資源管控和應(yīng)急調(diào)度為支點,建立應(yīng)急調(diào)度指揮體系,實現(xiàn)應(yīng)急視頻指揮、現(xiàn)場情況反饋、專家遠程支持、資料分享等。為指揮中心和應(yīng)急搶險作業(yè)提供實時的音視頻交流手段,有效保障指揮的有序性和即時性,并對指揮過程進行全程錄制和保存,以供事后總結(jié)和分析。
4 新技術(shù)的應(yīng)用
建設(shè)私有云平臺,將各專業(yè)網(wǎng)管系統(tǒng)統(tǒng)一部署在云平臺上,發(fā)揮云平臺彈性計算、部署簡單、穩(wěn)定可靠等優(yōu)點,建設(shè)通信智能運維平臺。同時保證私有云平臺與公網(wǎng)之間的網(wǎng)絡(luò)安全。
5 結(jié)束語
通信系統(tǒng)運維工作向智能化方向演進,已是行業(yè)發(fā)展的大勢所趨。但是如何進行智能化運維、采用哪些先進技術(shù)達到智能化效果,卻沒有統(tǒng)一的標準或規(guī)范供運維人員參考。本文是從集中監(jiān)控管理的角度提出了通信智能運維的一些想法。
參考文獻:
[1]龍章勇,卜愛琴.鐵路通信概論[M].中國鐵道出版社,2014.
[2]藍茜英,蔣笑冰.鐵路專用通信[M].中國鐵道出版社,2011.
[3]劉治民.地鐵通信智能運維系統(tǒng)應(yīng)用和實踐[J].中國新通信,2019,21(11):18.
[4]胡建華.面向業(yè)務(wù)的智能運維系統(tǒng)探索與實踐[J].2018.
[5]徐良燕.電力通信運維中關(guān)于智能化支撐的探索[M].中國期刊網(wǎng),2020.