李世野
【摘 要】大數據是一個國家的重要的戰略資源。城市軌道交通憑借其大容量運輸和高效率運輸水平,在緩解交通擁堵方面有重要作用。如何在軌道交通中挖掘和發揮大數據的創新價值,如何利用大數據挖掘、預測、可視化等技術服務軌道交通行業有著重要的意義。本文系統地闡述了大數據技術在軌道交通領域的研究現狀,總結了大數據在軌道交通應用中的研究難點和挑戰,為軌道交通信息化和大數據應用拓展提供支持。
【關鍵詞】軌道交通;大數據;數據挖掘;機器學習
隨著互聯網的高速發展,大數據已成為一個國家的重要的戰略資源。由于國家戰略層面的重視,近年來大數據技術越發成熟,大數據應用得到了快速增長。大數據是指無法用現有的軟件工具提取、存儲、搜索、共享、分析和處理的海量的、復雜的數據集合。大數據具有4個特征:數據體量巨大、數據類型繁多、價值密度低、處理速度快。大數據是需求驅動的,目前國家是大數據應用的主要推動者。
快速發展的城市軌道交通在城市交通中發揮著巨大的作用,積累了海量的數據規模。這些原始數據有多源異構、周期變化大,傳播速度快,動態的數據體系等特點,具有明顯的大數據特征。如何在軌道交通管理中挖掘和發揮大數據的創新價值,如何利用大數據挖掘、大數據預測、大數據可視化等技術分析軌道交通大數據,有助于發現軌道交通中潛在的數據規律,分析決策需求,優化數據采集和處理。軌道交通大數據技術能更好的服務于軌道交通行業的管理,提升效率,促進發展,已成為軌道交通業內研究和拓展的新領域。
一、軌道交通大數據研究現狀
目前,大數據技術在軌道交通領域中的研究主要可分為5方面:基于大數據的軌道交通客流預測,基于大數據的軌道交通規劃優化,軌道交通大數據分析,軌道交通調度和節能優化和軌道交通狀態監測與可視化研究。
(一)基于大數據的軌道交通規劃優化研究
在城市軌道交通中,大規模事件往往會引發大量的客流,給附近的交通運輸和管理帶來極大的壓力。因此,針對城市軌道交通網絡中客流,進行有效的評估和傳播研究變得很有意義。通過捕捉復雜地鐵線網中客流的時空特征,文獻中提出了一種有效動態交通規劃方法。通過設計隨便效應函數和多項分對數模型,該方法能較好的進行客流規劃,優化交通運輸成本。
(二)軌道交通大數據分析研究
大數據分析(BDA)廣泛應用于鐵路運輸和工程領域。通過一個新的分類框架,全面綜述大數據在鐵路工程和運輸領域的最新應用。從鐵路運輸的三個領域(運營、維護和安全)的大數據分析應用進行了系統研究。對大數據分析的層次、大數據模型的類型以及各種大數據技術進行了分析。
(三)軌道交通調度和節能優化研究
由于環境和社會問題的不斷增加,在軌道交通系統中,如何節能是一項具有挑戰性的問題。現有文獻在設計時間表和能耗過程中,往往忽略了每個車站乘客需求的時變特征。基于時間相關的智能卡自動收費數據,提出一種基于時間依賴客流量的城市軌道交通雙目標時間表優化模型,最大限度地減少了旅客等待時間和純能源消耗。在模型公式中,旅客等待時間受限于滿載情形下的列車容量,純能量消耗由牽引能量消耗與給定時期內再生能量的差值表示。數值實例表明: 相對于現行的時間表方案,該模型能顯著改進客運服務,有效地減少能量消耗。
(四)軌道交通狀態監測與可視化研究
自然災難、惡意攻擊和誤操作事故是軌道交通網絡的重要威脅。軌道交通網絡的脆弱性受到了越來越多的行業專家和管理者的重視。針對該問題,在軌道交通網絡脆弱性分析過程當中綜合考慮了乘客流量和使用特征,提出了一種基于站點的網絡脆弱性測量方法。從軌道交通網絡數據、客流數據和車站周圍的土地利用數據入手進行系統數據分析。結果表明,軌道交通網絡的脆弱性受其網絡拓撲結構、客流、土地利用變量等因素的共同影響。有助于軌道交通管理者及時了解網絡脆弱性,關鍵站和鏈路的實際狀態。
二、軌道交通大數據研究所面臨的挑戰
目前,軌道交通大數據分析和處理有著豐富的應用,但仍有一些潛在的問題需要解決,下面從數據收集、數據隱私、數據存儲、數據處理和數據共享這5個方面進行分析。
(一)數據收集
由于車輛和行人的頻繁移動,在特定地點或在某些時間,在軌道交通中收集的數據可能不準確,不完整或不可靠,如車輛沒有嵌入提供實時定位數據的設備、道路傳感器收集的道路交通數據可能丟失。解決這一難題的一個可能途徑是投入新的數據采集技術,提高數據采集能力。隨著物聯網技術的發展,新的傳感器技術應運而生,有助于提高數據采集和數據質量。此外,采用數據捕獲自動化來最小化手動數據輸入也是提高數據質量所必需的。
(二)數據隱私
在大數據時代,最具挑戰性和最關心的問題是隱私問題。個人隱私可能在數據傳輸、存儲和使用過程中泄露。以往的軌道交通系統收集的數據是非個人數據,如車輛數據、交通流數據。而現有的數據收集涉及到個人隱私數據,如個人和車輛的位置信息。如果不嚴格保護這些數據,竊取這些數據的人將損害數據所有者。因此,隱私問題一直備受關注,隱私保護是其大數據應用的重要內容。為防止未經授權的個人隱私信息泄露,各國政府和交通部門應采取相應的措施提高數據的安全級別。
(三)數據存儲
目前,大數據的數據量已經從TB級躍升到PB級,數據存儲容量的增長速度遠遠落后于數據增長速度。特別是在軌道交通運維中,將每天從各種傳感器產生各種數據。傳統數據存儲基礎設施和數據庫工具已經無法應對日益龐大和復雜的海量數據。因此,設計最合理的數據存儲體系結構已經成為一個關鍵的挑戰。主要的公共云存儲提供商,如谷歌和微軟,通過提升大數據集成能力來改進其服務,多云存儲和混合存儲正在成為大數據存儲的關鍵領域。它們的計算能力在處理計算密集型分析工作負載中極具優勢。
(四)數據處理
軌道交通中的大數據應用有很強的時效性,需要及時、快速地處理數據。這些大數據應用包括交通數據預處理、交通狀態識別、實時交通控制、動態路徑引導和實時交通調度。軌道交通數據包含大量的來自不同數據源的異構數據,同時必須與歷史數據進行比較,并在短時間內進行處理。數據處理系統必須能夠處理更復雜和日益擴大的數據。
三、結束語
城市軌道交通的快速發展,能有效的緩解交通擁堵,是現代交通運輸發展的重要方式。具有運輸容量大、運輸水平高效等特點。應用大數據技術,通過數據采集、數據預處理和存儲、數據計算和分析等關鍵環節,深入探索軌道交通系統的運維和數據規律,指導運營實踐和規劃,是一個重要的研究領域。針對該研究熱點,本文系統闡述了大數據技術在軌道交通領域中的研究現狀,分別從基于大數據的軌道交通規劃優化,軌道交通大數據分析,軌道交通調度和節能優化和軌道交通狀態監測與可視化研究4個方面進行展開研究。分析了軌道交通大數據應用中數據收集、數據隱私、數據存儲、數據處理這4方面的研究難點和挑戰。研究成果對提升軌道交通的運營管理水平和乘客服務水平具有重要的理論和現實意義。
【參考文獻】
[1]宋杰,孫宗哲,毛克明,等.MapReduce 大數據處理平臺與算法研究進展[J].軟件學報,2017,28(3):514-543.
[2]毛國君胡殿軍,謝松燕.基于分布式數據流的大數據分類模型和算法[J].計算機學報,2017,40(1): 161-175.
[3]李得偉,張天宇,周瑋騰,等. 軌道交通大數據運用現狀及發展趨勢研究[J].都市快軌交通,2016,29(6):1-7.