陸人杰
(蘭州交通大學 自動化與電氣工程學院,甘肅 蘭州 730070)
隨著城市軌道交通各系統獲取的數據量飛速增長,對海量數據進行有效存儲并發揮這些數據的價值成為一個難題,而應用數據挖掘技術能很好地解決此類問題[1-2]。鑒于此,對數據挖掘技術在城市軌道交通信息系統中的應用進行分析具有重要意義。
隨著3C技術(計算機、通信、控制技術)的發展[3],城市軌道交通系統已成為一個擁有較高自動化程度的集成系統。目前,城市軌道交通信息系統主要由6大模塊組成,具體如圖1所示。
城市軌道交通數據挖掘平臺的設計基于Hadoop分布式架構。Hadoop平臺具有擴展性良好、計算能力高速便捷等優勢[4]。HDFS文件系統和MapReduce并行計算機接口是整個架構的核心部分,前者為底層的數據存儲提供支持,后者為搜集錄入的海量數據提供計算支持。依據城市軌道交通大數據的整體特點,設計基于Hadoop框架的城市軌道交通數據挖掘平臺,總體架構如圖2所示。
隨著時間、氣候等條件的變化,城市軌道交通中的客流數據動態變化[5]。城市軌道交通客流具有很強的隨機性和不穩定性。隨機性體現在城市在舉辦相關大型體育賽事或文藝活動時,容易引起客流變化;而不穩定性體現在早高峰、晚高峰以及不同城市區域的客流差異上。
自動售檢票系統AFC能記錄乘客每天乘坐的地鐵信息,通過Hadoop數據分析平臺采集AFC系統中的數據,統計分析各個車站和各條線路在一天內的客流量數據,以便幫助運營調度人員安排合理的列車行車計劃。在客流信息預測方面,出行者的出行偏好可通過統計學方法分析模擬,為出行者提出符合其出行習慣的建議。采用大數據技術能迅速有效地找出數據內部規律,分析城市軌道交通客流數據的變化趨勢,為運營人員作出準確的決策信息提供支持。
根據城市軌道交通運行評價指標體系,基于各項數據評價列車運行的平穩性、安全性以及乘客的舒適性程度,建立基于大數據的地鐵運行評價平臺十分必要。通過采集平穩性、安全性和舒適性3個評價指標體系的相關內容,確定列車的總體運行狀況。從長期發展的角度看,利用地鐵列車運行過程中的大數據環境,完善列車運行評價機制,其作用程度日益凸顯。

圖1 城市軌道交通信息系統

圖2 城市軌道交通數據挖掘平臺架構
通過大數據檢測的方式,當某項設備數據被檢測到的參數超過預先確定的警戒值時,人工需對其進行干預并維修處理,從而大大縮短傳統檢修模式中查找問題所耗費的時間。利用后臺設備運營的相關數據和數據中心接入的設備基礎數據,以便設備檢修。例如,在Hive數據倉庫中建立各種信號設備維修指標的相關實體表,通過實體表實時監測各信號設備的使用狀態和對設備連續工作時間的統計設置閾值,達到閾值即有報警提示,以提醒工作人員及時對信號設備進行維修處理。
隨著大數據的發展,城市軌道交通中的大數據研究是地鐵管理升級的需要,也是滿足乘客多種需求的必然要求。通過數據挖掘技術,深入探究城市軌道交通信息系統的運維和數據規律,指導運營實踐和規劃,對提升城市軌道交通的運營管理水平具有重要的理論和現實意義。