李紅梅,唐 嵐(西華大學 汽車與交通工程學院,成都 610065)
?
基于weka的交通流預測研究
李紅梅,唐 嵐
(西華大學 汽車與交通工程學院,成都 610065)
摘 要:隨著智能交通系統ITS的廣泛研究和應用,對智能交通系統采集的海量交通數據進行數據挖掘成為國內外專家學者研究的熱點。數據挖掘是一門實驗性非常強的學科,Weka工作平臺匯集了當今最前沿的數據預處理工具和學習算法,它為數據挖掘實驗的整個過程提供了廣泛的支持。本文主要研究基于weka平臺的M5P模型樹對交通流數據中的交通速度進行預測,包括對數據的準備、預處理、結果的表達及解釋。
關鍵詞:智能交通系統; Weka; 交通流預測研究
城市路網信號監控周期一般在120-300s之間,最長不會超過600s,而車輛的行駛速度一般在10-60km/h之間,每個監控路段內的行駛時間一般為1-5分鐘。本文中使用的數據為四川某市2014年8月的交通流數據,其中包含多個路段,數據錄入間隔為5分鐘。內容如圖1所示。
從圖中看出有多個字段,由于本文主要分析交通流數據中的速度數據,故只提取與本文速度預測相關的字段。包括VID_LANE_ ID(設備采集信息),LANEID(第幾條道),SPEED(速度),TRAFFICDATA(時間)。將數據整理成本文所需內容,并將日期標準化后如圖2所示。
將數據另存為基于weka的交通流預測.csv格式保存,在weka中打開基于weka的交通流預測.csv文件,并另存為基于weka的交通流預測.arff,這樣就保存為weka可以打開直接處理的數據格式了。
本文數據為隨機選取的某一天的某一路段數據,因此在預測過程中可以將日期和前兩個屬性去掉。
2.1 算法的發展
時代的進步依靠的是科技的進步與發展,無論是在什么技術領域,它都隨著科技的進步而發展,其中算法技術就是其中的一種。通過我們對算法的調查研究之后發現,現階段應用較為廣泛的就是M5P算法,它相對于其他算法而言約束條件少,運算便捷。那么什么是M5P算法呢?下面就讓我們從具體的應用之中來了解一下吧。
2.2 M5P算法
(1)樹的生長。M5P模型樹是將輸入和輸出參數之間的非線性關系換成了分段式線性關系。M5P模型樹的劈分思想與決策樹的思想是基本相同的,但劈分的原則不同。決策樹的劈分原則是信息增益原則,而M5P模型樹的劈分原則是樣本屬性差異化原則,即SDR(Standard Deciation Reduction):
(2)樹的修剪。M5P算法就通過回歸線方程的建立將樹木的枝丫、節點與樹木整體進行連接,通過方程的建立來規劃最優修剪位置,同事在修剪的時候應該遵循預測誤差減少量的原則。
(3)樹的平滑。Quinlan提出樹葉子節點的平滑方法。在每個葉節點處都有一個按線性回歸算法擬合的多元線性回歸方程,該方程能有效的彌補相鄰兩葉子節點之間的不連續性。
2.3 基于M5P模型樹預測交通速度
基于weka,運載M5P模型樹算法,并將預測結果加以顯示,可以看到預測結果與真實值之間的差距。如圖3所示。
查看預測準確率和絕對平均誤差值分別為85.44%和0.083%,得到了較好的預測效果。
參考文獻:
[1]馬壽峰,賀國光,劉豹.智能交通系統中短時交通流預測系統的研究[J].預測,2004,23(02):28-34.
DOI:10.16640/j.cnki.37-1222/t.2016.12.251
作者簡介:李紅梅(1987-),女,四川渠縣人,碩士研究生,研究方向:汽車性能測試技術、汽車大數據挖掘等。