
摘要:本文全面分析了數據挖掘技術的整體概念理論,闡述了城市軌道交通信息系統的概念和發展態勢,總結了城市軌道交通信息系統中數據挖掘技術的應用基礎,從軌道交通運行評價、客流信息數據處理和設備維修檢測三個維度研討了數據挖掘技術在城市軌道交通信息系統中的具體應用。
關鍵詞:數據挖掘;城市軌道交通;信息系統
引言
城市軌道交通線路新增和客流上漲,對城市軌道交通信息系統的智能化、自動化以及全面化發展提出了更高要求。數據挖掘技術是現階段基于數據庫管理系統的新興的網絡信息技術,隨著網絡信息技術的不斷成熟和發展,數據挖掘技術與計算機技術、數據庫技術、機器學習、統計學管理、模式識別等進行了深入廣泛的融合。這就保證了數據挖掘技術在大數據信息管理、信息分析、信息提取以及事務管理中重要作用的發揮,有效解決了數據管理中復雜性和多樣性引發的管理困難和障礙。
1. 數據挖掘技術的整體概念理論
1.1 數據挖掘技術的基本概念
數據挖掘技術是基于信息技術、網絡技術、多媒體技術、大數據技術等應運而生的一種新型技術手段。具體來說,數據挖掘技術是指在體量較大、數據信息不完備、數據信息隨機的數據“庫”中進行甄別、篩選、識別,并獲取有用的數據信息或者資料信息[1]。因為充分結合了大數據技術、網絡技術、信息技術等,所以數據挖掘技術自身具有廣泛性、多元性的特征,還將數據資料統計、模式判定技術、模糊數學、神經網絡等融合其中,所以其本質屬于多樣化技術、多元化學科交叉而生成的一項技術[2]。
1.2 數據挖掘技術的具體劃分
根據數據挖掘技術的技術核心和組成,現階段數據挖掘技術的類別主要從四個維度進行劃分,即統計學理念、神經網絡理論、數據資料庫、人機交互。從統計學理念來看,數據挖掘技術又包含了判定解析、遺傳算法等內容;神經網絡理論又將數據挖掘技術解構為競爭學習、自主神經網絡等;數據庫資料往往需要對數據挖掘技術過程進行全方位多角度的數據信息解析,且保證數據信息的可視化;人機交互主要針對的是機器學習實現數據挖掘。
因此,隨著我國城市軌道交通的不斷發展,數據挖掘技術能夠在城市軌道交通信息系統中產生重要價值,對軌道交通通信、軌道交通網絡管理、軌道交通運行數據管理、軌道交通檢票系統等都能實現操作,提高城市軌道交通信息系統中信息流動的速率[3]。比如,依托數據挖掘技術,城市軌道交通信息系統能有針對性地進行乘客資料歸納整理、出行高峰時間判斷、列車運行時間規劃等,幫助城市軌道交通進行可視化管理。此外,傳統城市軌道交通信息系統中,數據資料或者數據結果往往會受到一些突發情況的干擾,如果出現突發情況影響運行數據,信息系統就會出現誤差。依托數據挖掘技術,有效規避了突發情況的信息干擾和數據異常干擾情況,提高了城市軌道交通信息系統運營的客觀性和穩定性[4]。
1.3 數據挖掘技術的應用價值
1.3.1 乘客信息管理
對于城市軌道交通信息系統而言,不僅承擔了軌道交通規劃、軌道交通運行的主要任務,還在乘客信息管理、票務資料管理方面有著重要價值。所以,數據挖掘技術在城市軌道交通信息系統中的運用,首先可以進行乘客數據資料的細致化管理和有效管控,針對乘客的出行習慣、出行時間、出行偏好、出行支付方式等進行數據挖掘和數學分析,進而為城市軌道交通的運營提供支持[5]。這樣,依托乘客信息挖掘、乘客信息分析,城市軌道交通信息系統就能通過信號系統、列車管理系統等調整列車班次和發車時間,發揮價值。
1.3.2 解析運營消耗情況
城市軌道交通屬于公共資源、公共服務,其運營消耗與運營時間、通勤頻率、功能比例、乘客數量等有著密切關系。所以,依托數據挖掘技術中的分類解析、回歸解析,可以搭建城市軌道交通的運營消耗情況預測模型。根據乘客通勤時間、乘客通勤數量、列車損耗情況等因素規律,以城市軌道交通整體運營時間作為函數,就可以通過數據挖掘技術和時間排序預測城市軌道交通系統的運營消耗情況,為列車安全管理、軌道交通基建管理等提供數據支撐[6]。
1.3.3 檔案信息數據的管理
對于城市軌道交通信息系統,檔案信息數據的管理是其智能化、數據化、自動化運營的關鍵和核心,也是軌道交通安全運維評價的基礎。所以,基于數據挖掘技術實施城市軌道交通信息系統的檔案信息數據管理具有重要價值。具體來說,數據挖掘技術可以根據城市軌道交通信息系統中的數據資料進行數據分析、數據歸類、數據傳遞、數據甄別和數據管理,并以此建立數據管理模型。在數據搜集過程中,可以依托數據管理模型的邏輯架構、管理語言、信息語言等整體解析城市軌道交通信息系統中出現的數據,再根據數據特征進行分類篩選和分類管理[7]。
2. 城市軌道交通信息系統的概念和發展結構
城市軌道交通信息系統是基于控制技術、通信技術、網絡技術和計算機技術發展并成熟起來的,具備自動化、智能化和數據化的特征。具體來說,城市軌道交通系統主要由信號系統、通信系統、自動化檢票系統、乘客信息管理系統、綜合安全系統以及監控系統組成。所以,城市軌道交通信息系統是交通信息的多角度全方位呈現,也是交通綜合管理的數據信息平臺[8]。城市軌道交通信息系統的發展不是一蹴而就的,它是一個循序漸進的過程,更是與軌道交通基礎建設、軌道交通綜合服務、軌道交通基礎業務相匹配的共同發展。所以,城市軌道交通信息系統的發展首先需要強化現有信息系統在運維安全、物資保障等方面的推動,其次需要升級信息化管理、智能化管理、數據化管理水平,匹配新的軌道交通發展要求和網絡信息發展要求等。
3. 數據挖掘技術在城市軌道交通信息系統中的應用基礎和應用要求
3.1 數據挖掘技術在城市軌道交通信息系統中的應用基礎
數據挖掘技術在城市軌道交通信息系統中的應用主要是依托于“Hadoop”分布式架構進行系統更新和平臺設計。相比其他架構和平臺,“Hadoop”平臺的計算能力更快、擴展性更好、計算方式更便捷[9]。其中,“MapReduce”和“HDFS文件系統”是并行于計算機接口的核心部分架構,“MapReduce”主要提供數據錄入、數據搜集支持,“HDFS文件系統”提供底層數據的儲存支持。所以,針對城市軌道交通信息系統中信息量大、信息種類龐雜多樣的特點,基于“Hadoop”框架構建的城市軌道交通數據挖掘平臺是具有可行性的[10]。
3.2 數據挖掘技術在城市軌道交通信息系統中的應用要求
3.2.1 可讀性和維護性要求
數據挖掘技術在城市軌道交通信息系統中的應用,需要貼合城市軌道交通信息系統的實際情況,根據涉及列車運行情況、運力分布情況、乘客承載情況等,搭載相對應匹配的數據挖掘技術,進而實現數據挖掘技術應用和城市軌道交通信息系統的有機融合,確保在城市軌道交通信息系統的運行過程中數據使用和運行方便,且數據具備可讀性和可維護性[11]。依托于數據庫應用的可讀性和維護性,城市軌道交通信息系統還可以輔助實現系統管理的簡化,提升系統運行的整體質量。
3.2.2 穩定性和安全性要求
現階段城市軌道交通信息系統中數據挖掘技術的應用基本成熟,加之大部分城市軌道交通信息系統的數據構造和信息庫設計相對簡單,運行和操作也相對比較簡單,便于開展日常維護和拓展。為了確保城市軌道交通信息系統的順利運行,數據挖掘技術在城市軌道交通信息系統中的應用也要滿足自動化運行和智能化運營,且保證數據挖掘技術自身內部具有一定的冗余設置和糾錯能力,進而保證城市軌道交通信息系統的穩定和安全。這樣,城市軌道交通信息系統的運行過程才能符合要求,促進各項信息數據能夠系統化管理,確保城市軌道交通順暢運行[12]。
3.2.3 自動化和大容量要求
數據挖掘技術在城市軌道交通信息系統中的應用是基于該系統工作流程的,且與系統的設置完全吻合,能適配系統中運行評估、客流數據分析、運維數據分析的具體要求。因此,城市軌道交通信息系統中數據挖掘技術的應用還需要滿足自動化和大容量要求。當數據庫需要存儲和傳輸大量數據的情況下,如果提取部分數據信息,那么最佳的解決方法是通過臨時數據挖掘技術進行數據調度。此外,城市軌道交通信息系統涉及多臺服務器運行,每個服務器都會產生許多臨時文件和工作日志,數據挖掘技術可以對服務器進行分類,后續再進行詳細分析。
4. 數據挖掘技術在城市軌道交通信息系統中的應用策略
4.1 軌道交通運行評價中的運用
城市軌道交通中列車運行的安全性、平穩性、舒適性、時效性等構建了城市軌道交通運行評價的指標體系。因此,構建基于數據挖掘的軌道交通運行評價平臺具有重要意義。基于數據挖掘技術的城市軌道交通信息系統所呈現出的數據內容是城市軌道交通信息化管理和列車安全運維的數據基礎體系和參考指標。這樣,列車運營過程中的安全性、時效性、舒適性有了數據支持,整個評價過程有了相對應的標準。
4.2 客流信息數據處理中的運用
城市軌道交通中的客流量往往伴隨著通勤時間、天氣狀況等條件進行變化,這使得客流信息數據具有動態化的特征,這就給軌道交通客流信息數據處理帶來不穩定和隨機性的難題。比如,某個城市在開展大型文藝活動或者體育賽事,極易造成客流變化,主要體現在早晚高峰、城市區域等客流差異上。客流信息數據處理難度的增加,給客流峰值預估造成偏差,影響城市軌道交通運行的效率。城市軌道交通信息系統中的自動化檢票系統可以將不同乘客在不同時間、不同地點乘坐城市軌道交通列車的信息呈現出來,這是運營人員進行數據判斷的基礎。在客流信息數據處理中,“Hadoop”可以通過統計學分析、模擬識別等將乘客的出行偏好、出行情況模擬分析出來,并構建乘客的出行習慣。這樣,依托于數據挖掘技術,通過數據內部規律分析,運營人員就能獲取較為精準的客流數據變化。
4.3 設備檢測維修中的運用
城市軌道交通信息系統依靠的設施設備多,通過數據挖掘構建的海量信息系統設備數據信息,可以將諸如網關設備、路由設備、數據存儲設備等的型號、故障數據、維修數據、預警數據等與軌道信息系統聯系起來。一旦某個設備即將出現問題時,數據挖掘技術將會通過故障代碼、故障原因、故障記錄時間、故障預警數據等反映出設備檢測維修的特點,并開啟人工維修通知和設備關停預警。比如,通過“Hive數據倉庫”搭建城市軌道交通信息系統中的信號設備、網絡設備的維修指標數據庫,通過數據庫將檢測信號設備、網絡設備等相關設備的工作時間、工作狀態、工作效率等反饋出來,一旦某個設備即將出現問題,數據挖掘技術將會按照“原始數據處理—數據庫篩選—數據值梳理—算法分析—預處理(維修)結果分析”的流程,引導工作人員進行提前預防性處理,真正實現了設備的狀態維修。
結語
數據挖掘技術在城市軌道交通信息系統中的運用,順應了我國當下城市軌道交通發展迅猛的趨勢,有效優化了城市軌道交通信息系統運維緩慢和運維過程極易出現的問題。同時,數據挖掘也提升了城市軌道交通信息系統的數據管理水平、數據分析能力,推動了城市軌道交通信息系統的發展,提升了城市軌道交通的運營維護水平和安全保障水平。因此,結合數據挖掘技術特點,依托城市軌道交通網絡運營的要求實現數據挖掘的應用,是當下城市軌道交通信息系統發展和軌道交通建設規劃的新方向。
參考文獻:
[1]王瑋,龐婷婷.基于數據挖掘的城市軌道交通信息安全檢測[J].微型電腦應用, 2022,38(2):113-115.
[2]宋大治,張浩,徐鐘全,等.基于MPP和Hadoop的城市軌道交通線網指揮平臺設計[J].鐵路通信信號工程技術,2021, 18(8):47-53.
[3]魏萬旭,方勇,胡華,等.基于視頻數據挖掘的城市軌道交通車站行人交通行為特征提取系統研究[J].鐵道運輸與經濟,2021,43(8):119-125.
[4]陶雨濛,王亮軍,衛妍.城市軌道交通信號設備智能運維系統設計[J].中國新技術新產品,2021,(15):25-27.
[5]李文鋒,閆濤.改進的Apriori算法在集中告警系統中的應用研究[J].金陵科技學院學報,2021,37(2):7-11,32.
[6]楊培盛,侯飛,李俊偉,等.軌道車輛空調智能運維系統在濟南地鐵線路上的應用研究[J].制冷與空調,2021,21(8):54-58.
[7]楊愷鶴,丁小兵,劉志鋼,等.城市軌道交通客流時段OD對挖掘及快慢車停站方案確定算法研究[J].智能計算機與應用,2021,11(4):39-43,48.
[8]高明亮,高珊,于闖,等.融合RCM、PHM和數據挖掘的城市軌道交通車輛維護決策技術研究[J].城市軌道交通研究,2021,24(2):64-68.
[9]向紅艷,袁發濤.基于自動售檢票數據的軌道車站客流識別模型[J].科學技術與工程,2021,21(4):1568-1573.
[10]馬旭,尹航.智慧城市軌道交通運營管理信息化建設研究[J].交通世界,2020,(33):112-113.
[11]張婷曼,丁凰.依賴不確定性關聯規則的城市交通流大數據挖掘[J].國外電子測量技術,2020,39(11):39-45.
[12]王亮軍,陳燕飛,陶雨濛,等.城市軌道交通列車司機駕駛狀態監測系統設計[J].鐵道通信信號,2020,56(10):79-82.
作者簡介:趙俊,本科,副高級工程師,研究方向:云數據中心搭建、數據挖掘、軌道交通及運營商行業信息化系統。