文/李榮送,廣東省高速公路有限公司深汕西分公司
隨著經濟的不斷發展,高速公路已慢慢成為我國重要的交通紐帶,在一定程度上提高了經濟的發展。從目前來看,我國的高速通車總路程已突破12萬km,因此在進行管理和掌控時在一定程度上增加了難度系數。隨著我國高速公路的慢慢延伸,高速公路收費系統慢慢走向現代化,使得高速公路的收費成果得到一定程度的提升。使得各系統發生了一些數據上的改變。在對高速公路交通安全應急以及出現服務和市場監督方面實行著重點建設時,就要對高速公路中的數據進行仔細探討,以此提升高速公路的運營成果以及管理水平。
大數據簡單來說是一種想象,并不是一種技術,大數據中的大是指數據體量大,同時是說數據類別大[1]。由于數據來源于許多不同的數據源,目前數據種類的不斷增加,使之表現出眾多不一樣的格式,目前所擁有的數據種類一方面包括結構化數據,另一方面還包括了半結構化數據和非結構化數據。其中結構化信息一直占據著非常主要的領導地位。
高速公路大數據主要有以下幾個特點:⑴規模大。當車輛通常收費站時,監控系統都會進行拍照,圖片將會占據一定的空間在加上各種應用系統等數據,使得數據規模增大[2]。⑵數據變化多樣化。由于高速公路數據品種多樣化,有來自應用系統發生的結構化數據以及收費出入口拍攝的一些數據,還有各種服務數目以及地質災害等數據。⑶數據價值密度較低。雖然數據較多,但有用的數據信息卻相當少。在進行監控時會發生很大的數據信息,但能用的信息數據卻比較少,因此不同的數據實行檢測可以看出路網的不同情況。⑷高速性。當收費站發生數據變化時要快速使之到達結算中心。當在道路中間發生緊急事件時,系統要能準確取得信息并能進行一定的分析。
目前,大數據時代的來臨,數據分析中的使用在高速公路數據分析中擁有一定的地位,比如,在進行運營管理和聯網收費以及識別偷逃通行費用等方面,都可以通過數據分析獲得[3]。通過對收費數據進行分析,對于那些常常計重逃避交費以及持有綠色收費卡違規的現象發生進行了較大力度的檢查,并通過對車牌進行抓拍以及對出入口車牌的不一樣和超時間以及進行替換卡等問題進行處理。當然也可進行分析四周人口情況以及產業結構和每年經過的車流多少,以此預測流量和大致的收入分析。
我國高速公路的不斷發展,聯網收費系統擁有較大的收費數據量,使得數據挖掘這一項新的技術能在一定程度上從許多的歷史和在線數據中探測中隱藏的聯系和發展方向。
目前進行數據挖掘技術最為突出的單位就是與交通行業較為緊密的高校和研究所,然而目前的研究成果主要傾向對整個框架和一些整體的方法進行設計。沒有研究人員和單位能有效運用交通行業的特點,對收費書籍中的主題實現更加深入的探討研究,于此同時將其隱藏在高速公路收費數據中對其有利的數據挖掘出來[4]。總之,高速公路系統雖然在進行改善,并進行積累眾多的信息數據,但是有關資源運用的能力還是要進行不斷的提升。
高速公路通行費的收費情況進行預測是高速公路在進行路網建設中不可分割的一部分,同時對項目進行實地研究以及國家的交通運輸等方面都具有非常重要的作用。目前,我國計算機技術得到質的飛躍,同時添加了眾多的方法和相應的軟件進行一些交通規劃,其中應用比較廣泛的有遺傳算法以及數據挖掘等相關的技術。
由于我國在進行建設高速公路時,相對來說比較晚,同時在發展方面速度較慢,根據我國相關的預測法規,提出了兩種預測方案,一種是較為常見的類比法和平均增長率以及指數曲線等預測模型方法。另一種方案時包括一元回歸曲線以及多元回歸曲線和趨勢曲線法等各種預測法。
目前我國高速公路事業得到質的飛躍,同時使得高速公路的收費問題出現了眾多的問題,其中值得注意的是進行計量收費后,司機逃費的方法源源不斷,使得通行費用有流失的問題存在[4]。在進行全新的收費環境下,對其進行一定的預測未來收費金錢的趨勢,能在一定程度上幫助管理人員更加有效的對高速公路的車流量和收費情況進行分析探討。
在進行回歸分析方案預測中又可以稱之為因素分析法,它主要的運行原理是尋找出一個變量和一些當做是變化因素的變量之間的數量關系,簡單來說就是建立相關的模型。同時通常一些方法對以后的一些時間的外在變量給出一些數值并將其引入到模型中,計算出變量的未來數值,即我們通常所說的預測值。
通過對大數據分析在高速公路收費管理中的應用進行分析可得,根據車輛流的不確定和高度非線性,可以導致單純的預測方案,隨機性干擾較大,不能進行很好的預測效果,本文通過分析并進行了有效的預測,降低了隨機干擾帶來的誤差,并對以后的收費金額實行了一些準確的預測,旨為高速公路管理提高一些數據支持。怎樣正確的選擇模型,并解決一些不定時的干擾,可以使得預測更加的準確,值得研究人員進行深入研究。