趙方霞,王 瑞,包 云,王嬌嬌
(中國鐵道科學研究院集團有限公司 電子計算技術研究所, 北京 100081)
鐵路行車環境復雜,包括沿線風、雨、雪、地震等自然災害及落石、落物等異物侵限和人為入侵等行為。多年來,國內外鐵路因自然災害及侵限引起的事故頻發,嚴重威脅著鐵路的行車安全,并造成了巨大的經濟損失,因此各國都開展了對高速鐵路防災技術的研究[1-2],并建立了相應的防災系統對危及列車運行安全的自然災害及侵限事件進行監測[3-8],但這些研究大多數是災害監測系統的理論研究,目前關于災害監測系統監測數據的挖掘分析及運用研究還比較少,因此有必要開展災害監測大數據分析方面的工作,以指導災害監測系統的建設、運用、維護和標準編制等工作。
目前,開展災害監測大數據分析工作已經具備條件,我國高速鐵路自2008年京津城際鐵路開始建設自然災害及異物侵限監測系統(簡稱:災害監測系統),已開通運營的高速鐵路均同步建有災害監測系統,建設早的線路災害監測系統已經運行了近10年,積累了大量的監測、報警以及設備狀態數據,為大數據分析提供了基礎條件。此外,云計算、大數據等新信息技術及應用的快速發展[9-12],使高速鐵路災害監測大數據分析應用成為可能。
高速鐵路災害監測系統是為了保證高速鐵路行車安全,對危及列車運行安全的自然災害及異物侵限事件進行實時監測,全面掌握災害報警信息,實現及時準確的災害報警和預警功能,從而防止或減輕因災害引發的損失。
高速鐵路災害監測系統目前存儲的數據包括:風監測及報警數據、雨監測及報警數據、雪深監測及報警數據、異物侵限電網狀態監測及報警數據、設備狀態數據、監控單元設備狀態數據、監控數據處理設備狀態數據、鐵路局中心設備狀態數據、氣象數據、日志文件、雪深視頻數據等。具體如表1所示。

表1 災害監測系統數據列表
高速鐵路災害監測大數據分析技術架構主要是由數據層、存儲層、分析層和展示層組成,如圖1所示。各層之間相互協作,貫穿數據的產生、聚集、存儲、分析和應用各個階段。技術架構還包括標準規范和安全保障體系,用于規范化數據處理流程和提供安全可靠的訪問機制。高速鐵路災害監測大數據分析環境技術組件主要以目前成熟的產品為主進行集成,由Hadoop、MapReduce等開源產品及技術構成。
(1)數據層。大數據處理服務器從鐵路局中心系統數據庫服務器提取相關的分析數據,包括結構化數據:監測數據、報警數據、設備狀態數據、氣象數據;半結構化數據:日志文件;非結構化數據:雪深視頻數據等,共同構成了高速鐵路災害監測大數據分析的數據源。
(2)存儲層。根據數據的不同分類而選擇有針對性的數據交換工具,實現對結構化、非結構化數據的全面預處理。利用ETL實現數據的抽取、轉換及加載,主要運用Sqoop對關系型數據庫中的數據進行抽取,運用Flume實現文件數據的采集。采用分布式文件系統(HDFS)、分布式數據庫(Hbase)等存儲技術,對災害監測相關數據提供大數據存儲支持。
(3)分析層。基于MapReduce分布式計算框架,利用工作流、分析算法和模型工具等數據分析引擎組件來實現大數據的處理和分析,并開展大數據分析模型構建,不斷驗證和檢驗這些模型,通過持續訓練模型來提高分析準確性,為應用展示提供數據分析服務。在模型工具方面,Spark和MapReduce各有優缺點,Spark在內存中處理數據,速度雖然快但需要很大的內存容量。而MapReduce是通過map和reduce操作在磁盤中處理數據。當涉及需要重復讀取同樣的數據進行迭代式計算時,適合選擇Spark,但是當涉及單次讀取,類似ETL(抽取、轉換、加載)操作的任務,比如數據轉化、數據整合等時,適合選擇MapReduce。
(4)展示層。是與最終用戶直接相關的一層,利用分析層提供的服務,結合用戶實際應用需求,經過簡單的封裝加工后,以直觀、簡便、可視化、便于操作的方式為各類用戶提供基于大數據的各種應用展示服務。
(5)標準體系及安全保障體系。標準體系主要保證按統一的標準進行信息整合,提升數據的唯一性和一致性。安全保障體系主要為數據安全提供可靠保障。
(1)災害規律分析
利用已有的災害監測及報警的數據,建立災害分析大數據模型,以此分析災害發生的時空分布及變化規律,主要分析大風、暴雨、暴雪時空分布規律;通過分析某一時間周期內,災害報警次數、影響時長等參數對災害報警進行規律挖掘。
(2)災害預警
利用已有的災害監測及報警數據,結合氣象局的氣象數據,利用機器學習以及氣象預報相關算法,建立災害預測模型,對未來一定時期內災害發生概率及發展變化趨勢進行預測和評估,對大風和降雨量進行預警。

圖1 災害監測大數據分析技術架構
(3)運用規則優化
分析高速鐵路沿線風、雨、雪持續規律,結合車輛傾覆時間,在保證安全的情況下,以“提高列車運行效率”為目標,得到最優的報警/解除時限、限速區段設置。
(4)監測點布設優化
對既有災害監測點布置進行評估和優化,對新建災害監測點進行設置,主要對風、雨、雪等災害監測點布設進行優化分析,確定相應的監測點布設及補設方案。
(5)設備選型
綜合考慮涉及設備選型的各個因素,建立相應的設備選型決策模型,對各種災害監測設備性能指標進行統計和對比分析,從而選取精度高、適應性好、可靠性高的設備,包括風、雨、雪監測設備選型。
(6)設備狀態分析
針對災害監測系統的各臺設備,從各個特征維度進行歸類,統計分析該類設備在各個維度上的表現情況,在此基礎上對設備重點故障、故障關聯因素、故障原因等進行分析,并通過大數據深度學習算法,提取設備故障關聯性最大的特征,建立設備故障預警模型,對設備故障進行預警,對設備的維護工作提供參考。災害監測大數據分析實現功能具體如圖2所示。
以大風規律和設備狀態數據為例,說明大數據分析在災害規律分析和設備運行狀態分析方面的應用,為災害監測和設備維護提供支持。
以某線路L1和L2為例,統計風速超過15 m/s的記錄進行分析,結果如表2所示。從表2可以看出,L1介于15 ~16 m/s之間的大風占49%,大于20 m/s的只占1.01%,未發生大于30 m/s的風速值。L2線介于15~16 m/s占58%,大于20 m/s的只占1.11%。因此,如果可將現有大風一級報警閾值從15 m/s提高至16 m/s,大風報警將減少約50%左右,從而大幅度降低調度人員工作量。
對線路L1和L2報警次數以及報警等級分布進行統計分析,結果如表3和表4所示,從表中看出,線路L1每個監測點每月平均報警達到了141次;從報警等級看出線路L1和L2一級報警比例最高,其中,線路L2甚至占到了98%。
根據對2013—2016年全路災害監測系統調研數據分析,災害監測系統的主要故障為電源故障、防雷模塊故障、風速風向計故障、監控主機故障、通信模塊故障及雨量計故障等,具體故障原因統計如圖3所示,從中可以看出,電源故障是系統的主要故障。電源故障包括外電斷開無法自投自復故障、UPS故障、專用電源故障、電源模塊自身故障等情況。災害監測設備狀態分析有助于認識設備運行規律,為系統維護提供數據支持。

圖2 災害監測大數據分析實現功能

表2 線路L1和L2風速統計分析

表3 線路L1和L2報警次數統計分析

表4 線路L1和L2報警等級統計分析

圖3 2013—2016年災害監測系統故障原因統計
在建立高速鐵路災害監測系統大數據分析框架的基礎上,通過搭建大數據分析環境,實現高速鐵路災害規律的挖掘分析和設備運行狀態的統計分析,研究有助于發揮大數據對災害監測系統的系統設計、優化、運用維護、新技術研發、標準制定等工作的數據支持。下一步將通過大數據技術深入挖掘高速鐵路災害規律,進行災害預警和設備狀態健康管理。