田科
摘要:數據挖掘技術的推廣應用為高速公路運營的管理和服務水平提升帶來了便利。近年來,隨著我國經濟的不斷發展,高速公路的通車里程不斷增加,車輛通行量逐年攀升,傳感設施的建設也越來越多,使得在高速公路運營管理的各種系統中存儲的數據資源越來越多。文章對數據挖掘在高速公路運營管理中的應用進行了探討。
關鍵詞:數據挖掘;數據分析;高速公路;運營管理;數據資源 文獻標識碼:A
中圖分類號:TP311 文章編號:1009-2374(2016)12-0049-02 DOI:10.13535/j.cnki.11-4406/n.2016.12.023
隨著我國高速公路的通車里程不斷增加,方便了司乘人員的同時也對管理者提出了新課題。高速公路運營管理過程中產生了大量的數據,占用了存儲資源,卻不能進行有效的融合分析,如何對這些海量的信息進行處理并對提升決策水平提供依據,是目前高速公路管理者需要解決的問題。通過數據挖掘技術,可以有效地解決這些問題,利用這些數據進行融合分析,為高速公路安全暢通提供了決策支持。
1 背景探析
從高速公路信息化數據量來看,我國高速公路具備大規模數據應用的基礎。截至2015年,全國高速公路總里程達120000萬公里;就河南省而言,高速公路通車里程約為6300公里,從2004年開始運營的高速公路聯網收費系統至今已過去12年,累積的流水數據已達數百億條,而且還以每天數萬條流水的速度在增長,這些數據就像一片待開發且肥沃的土地一樣,充滿無限的可能和生機。
2 數據挖掘及其應用
數據挖掘可從大量亂序的、隨機的、不確定的數據中根據需求,提取出隱藏較深并且有利用價值的信息。數據挖掘是一種涉及范圍較廣的學科,它不僅包含數據統計、模式發現、神經網絡等內容,而且囊括了可視化、知識庫系統等其他領域。現階段,數據挖掘技術隨著科技的不斷進步逐漸完善,已經被普遍應用于各個行業:
2.1 在體育競技方面的應用
美國一家科技公司研發的大數據挖掘軟件曾被美國的多個籃球教練所使用,數據挖掘技術能夠通過對籃球隊中隊員的排列情況進行分析得出有效的隊形和戰術。
2.2 在商業銀行中的應用
數據挖掘在金融領域的應用越來越普遍、廣泛,金融行業可利用數據挖掘系數對客戶的信息進行分析和篩選,同時也進行一定的金融風險評估,通過數據挖掘軟件不僅能夠制定吸引客戶的營銷戰略,而且對客戶、信用卡以及投資產品等項目進行分類,以便為客戶提供最適宜的金融項目。
2.3 在電信行業中的應用
電信行業會將數據挖掘軟件應用于客戶在年齡、入網時間、注冊產品等數據的統計中,比如對客戶是否使用了電信公司提供的某種產品進行統計,可以清楚地得出該產品是否被廣大用戶所接受,借此進行下一步產品營銷的規劃。
3 數據預處理方法
數據挖掘首先要對數據進行預處理,包含了多種功能和處理方法,下面針對高速公路數據特點對數據處理方法進行探討:
3.1 數據清理
因為高速公路管理和系統設計等問題,數據庫中往往存儲了大量雜亂的信息內容,并不是所有的信息都有利用價值,如果數據中存在很多冗余數據,就會增加大數據挖掘的難度,影響分析結果,所以要進行數據清理工作,按照一定規則將錯誤的、有沖突的、不完整的數據進行清理。例如,高速公路中聯網收費數據整理時,就會發現很多車牌識別錯誤、計重明顯有偏差、車型判斷錯誤等“臟數據”,可設計預處理功能將這些沒有利用價值的信息進行清理,從而提升大數據挖掘的效率和準確率。不同的數據要采用不同的清理方式,在處理一些缺失的數據時,比如巡邏日志的登記有很多缺失的字段,要結合業務特點將可能丟失的數據進行填充,對于重復數據的清理則應根據實際情況進行清理后核對。
3.2 數據集成
根據數據挖掘的任務與目標,需要將不同來源、格式、性質的數據進行集中,為用戶提供數據綜合分析和共享,強化信息的使用效率并可以在不同角度提供決策支持。比如對高速公路的數據分析中,需要將分散的巡查日志、超限信息、施工信息、監控信息等數據進行匯總,為下一步的數據挖掘工作提供數據支持,這種集成能夠將相關數據進行綜合處理和分析。
3.3 數據轉換
數據挖掘中需要進行數據格式轉換,因為各個系統設計的時間較早,沒有按照統一的格式和發展規劃進行建設,造成數據的結構相差很大,部分模擬信號還沒有進行數字化分析存儲,為提升數據挖掘的效率,需要將數據進行統一處理,例如高速公路監控和各種車感器信息是非常好的信息來源,其中往往蘊含著各種事故信息、危險路段、惡劣天氣等的規律,可為應急指揮提供決策支持,面對這些信息我們可以利用數據提取算法,提取其中的有價值信息,按照統一的格式進行數字化存儲,為數據挖掘提供資源,對于其他較為復雜的信息來說,同樣需要結合業務要求和規律進行分析和提取工作。
3.4 數據歸約
將數據集成和轉換存儲后會形成海量的數據,除了設計建設高效的大數據分析平臺外,對數據的規約也是精簡數據量的有效方法,利用特征歸約、樣本歸約、特征值歸約等方法,可以將數據集上的分析挖掘更有效,且不影響分析結果。同時可利用信息可視化技術,建立可視化的信息分析模型,使得信息的分析結果形成抽象程度高、規律性特征清晰、展現能力強的可視化形式,為輔助決策提供多元化參考。
4 數據挖掘在高速公路管理中的應用
隨著智能交通的發展,高速公路信息化建設和應用已經非常廣泛,我國在該領域中投入了大量的人力和財力,數據挖掘的應用規模也在短期內增長迅速。
4.1 高速公路通行信息的數據應用
第一,通過對省內各高速公路收費站車輛來往信息,能夠根據進出站、行駛路段、行駛時間等因素對車流量的情況進行分析,得出車流的分布特點,為高速公路收費系統的優化,提高通行效率提供數據依據;第二,通過對省內高速公路的收費數據進行歸納和篩選,與當地各項經濟指標進行對比,建立預測模型,能夠對未來一段時間內的聯網收費情況進行預測;第三,通過對省內高速公路指定區域內的車流量數據信息,得出該區域路段的車輛密度,預測道路養護費用,降低運營單位成本投入;第四,通過對交通量等歷史數據的分析并結合高速公路網模型,能夠分析出各時段車輛分布圖,遇到突發情況,可進行高效的指揮調度;第五,通過對車輛通行信息、氣象信息、道路路況信息等融合分析,能夠制定出安全駕駛的相關提示,最大限度地減少交通事故的發生;第六,通過對省內高速公路車輛通行記錄和收費情況等數據的分析,能夠提供高速公路未來規劃依據。
4.2 對高速公路人員及管理的數據應用
通過對高速公路聯網收費系統中收費人員的日常操作信息進行分析,比對通行車輛的統計數據,能夠預防收費員出現違規收費的現象,同時還可通過工作人員的操作日志,如在崗時間、操作的具體步驟、操作流程、設備使用情況等數據進行分析,從而為升級現有系統提供參考依據,避免工作人員的操作失誤,提升工作效率。
4.3 對高速公路司乘人員的數據分析
全省每天在高速公路上行駛的車輛數萬計,通過對這些車輛通行信息的分析,統計不同種類車輛的分布和行駛規律等,調整服務區的設置和功能,為司乘人員提供個性化的服務,尤其是我國正處于全面發展高速公路電子不停車收費的今天,我們要努力提高管理效率,增強服務意識,發掘潛在用戶,推動高速公路智能化的健康發展。
5 結語
綜上所述,隨著計算機技術的飛速發展,全國各地的高速公路都逐漸從信息化向智能化的發展方向,基礎硬件設施投入不斷加大,我們更應該在高速公路智能化管理上下功夫,利用數據挖掘技術結合行業特點能有效地為提升高速公路服務質量做出貢獻,因此,我們需要投入更多的精力在數據挖掘的研究和推廣中,全面地推動我國高速公路的智能化建設。
參考文獻
[1] 郭劉恒.基于聯網收費數據的實時滑動、動態校核的高速公路交通量預測方法研究[J].公路,2014,(12).
[2] 武兆偉.高速公路聯網收費數據在路網監控中的應用研究[J].科技信息,2014,(14).
[3] 余豐茹.基于全車牌識別的高速公路聯網收費數據挖掘系統框架研究[J].公路與汽運,2014,(4).
[4] 李猛.基于RFID技術多義性路徑識別系統在高速公路聯網收費中的應用[J].廣東科技,2013,(16).
[5] 孫軼軒.基于數據挖掘的道路交通事故分析研究[D].北京交通大學,2014.
[6] 申寧.高速公路收費數據處理技術分析[J].中小企業管理與科技(上旬刊),2013,(2).
(責任編輯:蔣建華)