羅 浩,趙 穎,關則彬
(中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)
鐵路企業各類業務信息系統經過多年的應用,已積累大量數據,鐵路提質增效對運用大數據技術挖掘數據價值的需求十分強烈。鐵路大數據平臺總體方案[1]的提出為鐵路大數據應用開發提供了頂層設計和指導,鐵路各專業基于自身業務需求也在積極推進大數據應用研發。
鐵路通信專業主要承擔通信基礎設施、通信線路、各類通信設備的維護、運用和管理工作[2],現已建成大量檢測、監測信息系統,積累了海量數據,亟需運用大數據技術對這些數據進行挖掘利用。鐵路通信設備技術狀態大數據平臺可提供通信設備電子履歷管理、狀態綜合管理等大數據綜合應用功能[3],但通信指標、頻譜、檢修計劃等數據尚未有效利用。
鐵路電務大數據平臺采用“平臺+應用”模式,由平臺匯集電務各專業數據,在其基礎上運用大數據技術研究和開發智能運維應用。依托鐵路電務大數據平臺,研究開發通信智能運維應用功能,整合通信專業現有設備履歷、告警、故障等數據,采用數據可視化技術[4-7],提供直觀、易于理解的數據展示,更好地幫助業務人員掌握設備運維狀況;同時,提供設備全壽命周期管理[8]、綜合運維管理、故障智能診斷、應急調度等功能,為提升作業質量與管理效率,降低事故故障發生概率提供支持。
鐵路電務大數據平臺采用“平臺+應用”模式建設,平臺負責數據匯聚、清洗、共享,應用聚焦于實現業務需求。鐵路電務大數據平臺架構如圖1 所示。

圖1 鐵路電務大數據平臺架構示意
(1)數據規范化平臺:按照接口規范,通過具有安全隔離的數據接口,匯聚電務專業現有信息系統的各類數據,完成數據整理與關聯,保證數據格式符合要求、質量可控;數據規范化平臺一個是邏輯概念,在不同應用場景中可以不同方式實現,如通信專業設備檢測類數據可通過通信綜合網管系統實現規范化,電務檢修類數據可由信號集中監測系統(CSM)完成數據規范化。
(2)數據服務平臺:將數據規范化平臺處理后的各類數據統一接入數據服務平臺,對數據進行清洗和整合處理后統一存儲,為各類大數據應用功能開發提供數據共享、數據計算、數據分析等服務。
(3)數據應用:根據具體業務需求,從數據服務平臺中獲取所需數據,利用地理信息技術和數據可視化技術,為業務人員提供滿足業務需求的智能運維應用功能。
用戶主要包括鐵路局集團公司、站段、車間、班組通信專業管理人員和現場作業人員。
(1)鐵路局用戶,包括鐵路局集團公司領導、通信專業人員和其他相關人員,他們需要掌握全鐵路局通信專業數據,從多個維度分析和監測設備運行狀況,了解設備健康總體狀態,綜合分析設備運維質量。
(2)站段、車間、班組用戶,包括基層主管領導、通信專業人員、現場作業人員和其他相關人員,他們需要及時掌握職責范圍內相關通信設備詳細的運維狀況和運行狀態,對設備實施全生命周期管理,對故障進行智能診斷,減少人工分析工作量,實現標準化檢修流程。
設備全壽命周期管理和設備告警管理是2 類主要的數據綜合應用功能。全壽命周期管理涉及設備履歷、網絡拓撲、綜合監控、健康評價等,對應的業務流程如圖2 所示。設備告警管理包括告警查詢、故障診斷、應急處置、作業管理等,對應的業務流程如圖3 所示。

圖3 設備告警管理業務流程
通信大數據智能運維應用的主要功能如圖4 所示。
(1)設備綜合監測:可在電子地圖上,從車站、系統、設備類型等多個角度展示設備運行情況;根據登錄用戶的崗位職責和權限,將與其相關的設備告警實時推送給用戶;按照網絡拓撲圖形式,展示設備運行狀態和告警,每臺設備均可查看端口狀態詳情面板;對設備近期告警進行分類統計。

圖4 通信大數據智能運維應用主要功能
(2)全壽命周期管理:為設備建立覆蓋設計制造-施工-驗收運營-維護-故障維修-報廢退網的全生命周期電子檔案,并與設備關聯性分析、故障信息等動態資料相關聯,提供設備全壽命周期內各類信息的檢索與查詢,實現對設備全壽命周期管理,包括設備分布、電子履歷、設備障礙管理、檢修維護管理等子功能。
(3)故障智能診斷:設置故障處理規則,規范告警處理過程,對多種告警數據進行融合處理,共享告警處理規則;將告警處理指南、廠商維護手冊及各種割接切換方案等設備維護知識轉化為電子文檔;提供故障和告警成因關聯、頻次閾值關聯分析、接入適配、工程標注、告警標準化處理、告警統計分析等。
(4)運維綜合分析:對存在內在聯系的事件進行綜合統計及預測分析,展示指標間關聯性,推測網絡服務質量變化趨勢,及時發現網絡狀態劣化傾向,形成統計報表、維護指導意見,包括有線通信指標分析、無線通信指標分析、質差分析、無線信號綜合評價、線路自檢分析、頻譜分析、網絡業務分析、維護質量分析等。
(5)應急調度指揮:包括應急預案和應急調度指揮子功能;應急預案功能實現相關應急管理辦法和應急預案的電子化,供用戶快速瀏覽和下載;應急調度指揮子功能直觀展示通信應急資源的地理位置和庫存狀況以及可供調度的人力資源,幫助用戶在緊急狀況下快速獲取各類可支配資源的相關信息,提高應急響應能力。
(6)檢修作業管理:包括維護計劃編制、作業過程卡控、檢修數據記錄、問題庫管理、數據統計分析等;維護計劃編制支持作業編制計劃、檢修作業、記錄工作的全過程管理;作業過程卡控通過匹配作業記錄與檢修計劃,使用戶實時掌握通信檢修作業年計劃、月計劃、天窗計劃以及每日工單完成情況,并以數據可視化方式展示計劃完成情況、當日作業狀態、工單進度信息;此外,還提供了移動App,方便作業人員隨時上報作業記錄。
(7)設備PHM 管理:根據設備性能指標、維護過程記錄對設備維護質量進行評價,評分項點權重可按需要動態調整;由設備評分計算出系統評分,形成完整PHM 評價體系;以可視化方式綜合展示通信專業核心網、接入網、傳輸網、數據網、FAS 等的評分及年內評分變化趨勢。
(8)車地閉環分析:通過對無線超時分析和車載無線通信設備車地聯合分析,當發生故障時,可以利用跨專業的數據進行設備關聯性分析,準確定位故障點,查明車載-地面設備結合部故障的原因。
通信智能運維各項應用功能模塊之間通過信息流相互聯系,如全壽命周期管理模塊除了利用履歷數據,還要結合現場作業數據和故障診斷結果;設備綜合監測模塊綜合分析故障、告警、履歷、運維的數據以后,要為應急調度提供數據支持。主要功能間的信息流如圖5 所示。

圖5 通信智能運維應用的主要功能模塊間信息流
從鐵路數據服務平臺接入的數據可分為靜態數據和動態數據;靜態數據(如設備履歷、組織機構、人員信息等)的數據量相對穩定,變動不頻繁;動態數據(如告警、檢修、障礙等)的數據量不斷增長,數據增、刪、改較為頻繁。
RESTful 是一種基于HTTP 的網絡應用程序的設計風格和開發方式,RESTful 風格的接口前后端分離,能減少通過網絡傳輸的數據,同時以JSON 作為數據交換格式,可避免數據注入等安全問題,適于接入靜態數據。Kafka 是一種高吞吐量的發布訂閱消息系統,具有高吞吐量、低耦合、擴展性強等特點,可用于傳輸動態數據。
鐵路地理信息平臺是鐵路數據服務平臺的重要組成部分,統一管理國家基礎地理信息數據、鐵路專業公用地理信息數據[6]。利用鐵路地理信息平臺提供的電子地圖服務,以2 種方式實現地理信息應用:(1)直接訪問鐵路地理信息平臺提供的電子地圖服務,在網頁上以遙感圖、矢量圖、3D 圖、實景圖等方式展示機房、鐵塔等設備的地理信息;(2)通過二次開發,定義設備及其及其異常狀態(告警、障礙、故障)的自定義圖符,這些自定義圖符作為一個圖層在電子地圖上顯示,當用戶點擊自定義圖符時,可以展示對應設備的靜態和動態數據,并可關聯該設備所有相關功能。
通信智能運維應用基于CSS、JavaScript、HTML5 原生前端開發方式,利用ECharts 組件實現數據可視化展示。在實現數據可視化展示時,考慮以下3 個要點。
(1)合理選擇可視化展示形式,力求視覺效果直觀、易于理解;如設備全壽命周期功能中,采用瀑布流形式,在時間軸上展示設備出廠、安裝、上線、告警、故障、檢修等事件,揭示設備“全壽命”過程;比較事物/現象的不同分類時采用柱狀圖,同一數據不同分類的展示采用餅狀圖,展示事物/現象變化趨勢時采用折線圖,展示定性數據采用熱力圖。
(2)靈活運用形狀、色彩、尺寸、位置等可視化元素來展示數據;如在地理信息應用功能中,為機房和鐵塔等設備設施設計了自定義圖符,用戶從圖符外觀就能分辨出設備種類;在展示設備告警信息時,嚴重告警使用紅色標記,一般告警使用黃色標記;用熱力圖展示設備數量時,設備數量多時用深藍色,設備數量少時用淺藍色;在設備健康管理中,設備質量總評分顯示在頁面正中,且字體加粗加大,各分項評分則排列在總評分的下方,且字體較小。
(3)提供多層次、多路徑鏈接展示數據,方便用戶瀏覽和查看感興趣的數據;如在展示全局的設備時,點擊設備圖符即可鏈接到站段、車間、工區的設備統計頁面;在全壽命周期功能中,點擊設備的每一個事件圖符可進入詳細信息頁面;在作業卡控功能中,月計劃完成情況頁面上的熱點可鏈接到日工單完成情況統計頁面,進而鏈接至每日檢修詳情頁面。
依托鐵路電務大數據平臺,研究開發鐵路通信智能運維應用,實現設備綜合監控、設備全壽命周期管理、故障智能診斷等功能,可綜合利用各類通信數據,以多種可視化方式展示數據,為通信專業管理提供豐富、直觀的信息支持和準確、可靠的決策依據。
通信大數據智能運維應用功能已經集成到電務大數據平臺中,自2019 年1 月在懷邵衡鐵路上線試用,應用效果良好。目前,應用功能尚存在一些不足,如設備健康評價模型需結合設備維修反饋加以改進,對故障、告警等設備異常狀態只能提供歷史數據統計分析,尚不能進行預測與預警,數據可視化也需繼續完善和擴展。