蘇爾慈,劉 敏,李 平,馬小寧,李 鑫
(中國鐵道科學研究院集團有限公司 鐵路大數據研究與應用創新中心,北京 100081)
大數據技術普及的時代已經到來,人們對數據價值挖掘的重視程度與日俱增。大數據技術在金融、電信、醫療、影視、電商、政務等行業發揮著越來越重要的作用[1-2]。大數據時代的海量數據為數據的綜合處理帶來了新的挑戰[3],同時也為大規模、多維度的鐵路工務設備安全數據分析創造了新的契機。
既有的鐵路工務專業主要采用動態檢測與靜態檢測2 種方式對工務設備進行安全狀態排查[4-5]。動態檢測采用巡檢作業車,在行進過程中對工務設備運轉狀態進行檢測并收集探測數據;靜態檢測以軌檢小車或者巡檢儀等方式進行檢測。目前鐵路工務設備安全狀態的數據分析主要根據以往的人工檢修經驗,對數據進行簡單的分析排查,從而判斷工務設備的安全狀態。這種方式存在3 點不足:(1)工務專業設備安全數據經過多年沉淀,數據量龐大,既有方法無法對海量數據進行有效的分析并深度挖掘數據價值;(2)工務設備狀態數據分析只針對單個系統內個別種類的設備,難以探知不同設備檢測數據之間隱含的相關性;(3)由于不同業務系統的數據標準存在不統一的現象,對同一類數據的定義在不同系統中可能不一致,面對海量數據時,快速高效的數據治理往往難以實現。
本文基于鐵路數據服務平臺,匯集鐵路工務專業各業務系統數據,對大量的結構化、非結構化數據進行高效的集成,利用大數據治理手段對采集的數據進行有效的整合優化,運用平臺當中融合的機器學習框架對鐵路工務設備監測檢測、養護維修等數據進行挖掘分析,以多維度的方式展示分析結果[6-7]。以客觀的大數據分析結果輔助工務專業現場作業人員快速定位設備缺陷,消除設備安全隱患,防范設備安全風險,提升鐵路工務設備安全管理的效率和質量[8-9]。
鐵路數據服務平臺是基于Hadoop 架構的分布式大數據平臺,主要為鐵路數據治理相關工作提供平臺能力支撐。鐵路數據服務平臺在數據集成端提供結構化數據與非結構化數據的接入能力,同時支持PB級離線數據的分析;在實時數據分析端,支持TB 級數據的實時分析。同時,平臺引入了鐵路專業相關的自助分析算法模型,以及數據可視化功能[10],并根據鐵路行業數據特征,建立了單獨的數據分類體系,可滿足鐵路各專業大數據應用分析的建設需求。該平臺業務數據流向如圖1 所示。

圖1 鐵路數據服務平臺業務數據流向
鐵路數據服務平臺主要由數據集成、數據共享、大數據存儲與分析等功能模塊組成,支撐市場營銷、運輸生產、智能決策、運輸安全、外部服務等業務應用,如圖2 所示。

圖2 鐵路數據服務平臺功能架構
(1)數據集成:該功能提供輕量化和可擴展的數據接入方式,將結構化、半結構化、非結構化數據接入到數據服務平臺。
(2)數據存儲與分析:該功能將接入的數據存儲于企業數據倉庫當中,平臺提供了統計分析、數據挖掘服務、可視化服務等功能,利用數據倉庫和數據集市等構建面向業務人員的統計分析功能組件。增加對大數據分析的支持,提供“拖、拉、拽”形式的分析和可視化環境,用戶根據業務需求選擇封裝后的算法組件和可視化組件,即可得出分析結果。
(3)數據共享:平臺面向全類型數據(結構化、半結構化、非結構化)進行海量規模存儲和快速查詢讀取。融合關系型數據庫存儲技術和大數據存儲計算技術,完成結構化數據及非結構化數據的存儲計算,并實現對數據表的申請、授權等管理??梢葬槍Σ煌脩羯刹煌臄祿蚕聿呗?,粒度控制到字段級。
鐵路數據服務平臺可針對工務專業各類設備檢測數據進行實時采集,按照大數據治理需求,對設備安全狀態數據進行同步數據質量監控,在數據集成的源頭就開始進行數據篩選和清洗的工作,提升有價值數據的比重。利用平臺的存儲組件,對海量工務設備歷史檢修、檢測數據進行同步抽取,沉淀進入鐵路數據服務平臺的文件系統當中,采用大數據分析挖掘算法對工務設備安全狀態開展動態分析研判。
本文設計開發的鐵路工務設備安全畫像是基于鐵路數據服務平臺的數據集成、數據存儲與分析、數據共享3 大功能建設開發的,在既有的人工經驗基礎上,綜合各系統數據,建立關聯關系,從整體上把控鐵路工務專業各設備的安全態勢,通過大數據分析對潛在的安全隱患提前預判并給出警示。
本文以工務設備安全態勢評價的需求作為出發點,梳理了工務專業涉及設備安全評價的主要數據項點和數據源,包含工務安全生產管理系統、工務管理信息系統(PWMIS)、探傷與鋼軌損傷管理系統等7 個系統。經初步測算,總共需接入數據條目約為943 萬條,既有的關系型數據庫在數據匯集運算環節無法提供高效穩定的支撐,需引入大數據平臺與技術,對數據進行抽取、清洗和轉換。
本文借助鐵路數據服務平臺,對工務數據進行集成與分析,可有效發揮大數據技術對海量數據抽取和運算的優勢。
鐵路工務專業各系統數據經過網絡交換環節,以JDBC 或Web Service 等數據接口的方式實時匯聚到數據邊緣節點服務器,由鐵路數據服務平臺封裝的Kafka、Flume 等組件設定數據采集任務,以并行的方式對各系統的結構化數據進行抽取轉換,并以文件形式存儲于大數據集群的HDFS 和HBase 當中,如圖3 所示。

圖3 數據集成示意
工務數據在集成過程中進行了基本的清洗和標注,對數據結構進行了二次梳理和簡化,清除了許多不必要的“臟數據”,保留下來的數據比各子系統的源數據更加貼近核心業務,同時數據結構更加清晰,便于后續的數據分析。
工務數據在經過集成轉換之后,利用數據平臺當中融合的機器學習框架,對工務數據開展深度挖掘和算法分析,發揮大數據平臺的獨特性能,即可完成既有關系型數據庫不具備的高效數據分析工作,如圖4 所示。

圖4 數據分析示意
整合工務各類固定設備的基礎數據、檢測監測數據、運營維護數據等,建立科學的多維度安全評價體系,構建影響安全因素的關鍵特征標簽體系。應用人工智能算法,實現設備安全狀態時空預測,開展面向事故故障防范的故障自動檢測與識別研究,形成工務專業設備設施全生命周期管理機制,使得設備設施修護具有針對性,故障防控具有超前性,安全預警具有時效性。
工務設備安全畫像體系主要以1 km 線路為刻畫對象,制定工務線路設備安全狀態評價體系,對每公里單元線路設備狀態進行及時客觀地綜合評價;展示每公里單元線路設備狀態不同等級占比,對高危設備進行預警;預測下一周期線路設備安全態勢,給出預警提示及閉環管理;統計分析單元區間內的重要動、靜態檢測指標,并以可視化方式展示;以每公里單元線路設備的安全狀態為標準對安全能力進行排名,便于重點盯控。
應用功能包含設備狀態指標統計分析、單元設備狀態安全評價、關鍵指標及安全態勢趨勢預測、高危設備及不良態勢安全預警等4 個方面,以多維度的安全綜合分析及預警助力業務部門和站段深入了解工務設備的性能,提前排除設備安全隱患,便于系統內部重點監督管控,提升安全綜合管理效率,達到工務設備狀態的整體監控及超前預警的目的。
3.2.1 單元線路設備評價
該功能以1 km 線路為刻畫對象,制定基于鋼軌、橋梁、隧道、涵洞、路基等維度的工務線路設備安全狀態評價體系,對每公里單元線路設備及各維度設備安全狀態進行評價,以不同等級進行劃分,對于高危的線路設備進行預警。并整合所有單元的評價結果,形成每公里區間內的工務設備綜合評價等級占比。
3.2.2 線路設備安全狀態展示
該功能將每公里區間內的工務設備綜合評價等級占比以餅狀圖的形式進行可視化展示,并基于歷史等級占比情況,從時間、空間上預測未來安全走勢,以柱狀圖、餅狀圖、折線圖、儀表盤、散點圖等可視化形式展示工務安全態勢。在此基礎上,基于歷史信息預測相應病害發生的時空規律和發展趨勢。
3.2.3 動靜態檢測指標統計
展示各類檢測方式的最新檢測時間,以及動、靜態病害的重要提醒,例如軌道質量指標(TQI,Track Quality Index)報警、偏差等級報警等。
將重要動、靜態檢測指標按類別進行統計分析,并以可視化形式展示。
智能統計的檢測指標包括:
(1)最新一次TQI 趨勢;
(2)任意時間范圍的TQI 趨勢分析;
(3)最新一次動檢等級分布;
(4)任意時間、任意等級和超限類型的動檢等級統計;
(5)最新一次車載等級分布;
(6)任意等級和超限類型的車載等級統計。
3.2.4 線路設備安全能力排名
該功能將每公里單元線路設備安全狀態由低到高排名,便于重點預警及盯控。列表字段包括序號、線名、行別、公里、安全狀態(等級)、分值。工務安全態勢包含設備狀態指標統計分析、關鍵指標及安全態勢趨勢預測2 個方面。
3.2.5 工務電子地圖
該功能將工務設備基本臺賬、動態檢測、靜態病害、周邊環境等信息通過地理信息系統(GIS,Ge o g r a phic Information System)電子地圖進行實時動態展示,實現時間、空間維度的信息搜索及目標定位,便于鐵路局集團有限公司決策層、業務處室、站段直觀地掌握全局工務設備安全態勢,及時發現安全狀態不良的設備并掌握其問題詳情。
(1)突出重點,實現高鐵線路安全多維管理。通過將高鐵線路各類靜態數據、檢查信息、維修信息與電子地圖有機結合,實現鋼軌、道岔、路基、橋梁、隧道、通道門、防護柵欄、攝像頭、聲屏障等高鐵設備在電子地圖上的精準展示,從而以友好的可視化交互方式查看不同設備的位置、基本信息、安全狀態。將軌檢小車、人工檢查所獲取的各級靜態偏差數據及故障點的修理信息在電子地圖實時展示,便于安全管理人員全方位的把握高鐵設備安全狀態。
(2)全面防護,確保普速線路安全保障全覆蓋。普速鐵路的GIS 電子地圖綜合展示功能將鋼軌、道岔、路基、橋梁、隧道、涵渠、護網等多種工務設備納入統一管理,并進行個性化展示。與高速線路管理相似,將動檢、靜檢、修理信息所涉及的各類故障數據通過電子地圖及時展示出來,為線路故障的及時掌握提供支持。此外,相較于高鐵GIS 展示,根據普速線路承載通過總重偏大的特點,增加大修信息的歷史查詢和預警功能,做到普速安全管控全覆蓋。
(3)實時預警,及時把控設備安全狀態。電子地圖中的動態預警模塊針對工務外出作業頻繁、設備經常性維修等特點,實現了防洪信息、天氣信息、大修預警等預警信息的GIS 展示,便于各級業務管理部門直觀地掌握工務系統安全狀態,實現預警即響應。
本文闡述了利用大數據平臺對工務系統數據進行數據集成、存儲、分析、共享的全流程,設計了鐵路工務設備安全畫像應用,并給出了整體設計思路和詳細功能設計。給予作業人員及安全管理人員更客觀的數據分析視圖,幫助安全管理人員更好地預防事故故障的發生,提早消除重點安全隱患。結合大數據技術,對工務設備狀態數據開展多維度綜合分析及展示,可拓展工務設備安全狀態評價的方式。