楊凱茜 劉瑋蔚
摘 要:隨著社會的進步道路交通狀況越來越擁擠,交通擁堵幾乎成為了所有發達城市所面臨的問題。因此改善交通狀況變得尤為重要。文章旨在從數據的角度建立模型,來進行交通流預測。在閱讀了大量文獻的基礎上,首先對數據挖掘技術的國內外研究情況進行基本了解,對所有數據進行預處理。然后通過線性回歸分析,分別研究了單一因素和多因素對交通流預測的影響,得到各因素的影響因子,建立了模型。并進行了實例分析,結果擬合良好,驗證了模型的準確性。最后,對本次模擬進行了總結,為今后的改進方向提供了思路。
關鍵詞:交通流預測;線性回歸分析;單一因素分析;多因素分析中圖分類號:U4691.1+12 ?文獻標識碼:B ?文章編號:1671-7988(2020)11-87-03
Abstract:?Along with the progress of the society, the traffic situation is getting more and more crowded, the traffic jam has become the problem that all developed cities have to face. Crossroads is important in urban transportation network nodes, the accurate prediction of intersection traffic flow can help to improve the intersection cluttered traffic, urban traffic congestion problem solving, optimize the urban road network operation, also in the field of intelligent transportation research, applica?-tion, implementation and promote the urban healthy, harmonious and stable has important significance. This paper aims to build a model from the perspective of data to predict traffic flow. On the basis of ·reading a large number of literature, first of all, we have a basic understanding of the research situation of data mining technology and preprocess all the data. Existing prediction methods analysis include: based on neural network prediction method, based on the statistical theory, based on the method of multiple linear regression model, based on the prediction method of wavelet model method and new technology. This paper used linear regression analysis. Through linear regression analysis, the influence of single factor and multi factor on traffic flow prediction is studied, and the influencing factors of each factor are obtained, and the model is established. This paper also gave an example to verify the accuracy of the model. Finally, the simulation is summarized, which provides ideas for future improvement.
Keywords: Traffic flow prediction; Single factor analysis;?Multi factor analysisCLC NO.:?U4691.1+12 ?Document Code: B ?Article ID: 1671-7988(2020)11-87-03
引言
基于數據挖掘的交通流預測系統研究就是將大量的數據運用到交通流預測模型中,為決策者提供幫助來引導交通系統的暢通。從近幾年國內交通治理的情況來看,單純增加交通道路及路面硬化的方法已經不可能從根源上解決交通壓力[1]。交通流數據采集系統在很長一段時間內通過人工和自動數據收集、積累了大量數據,使用數據挖掘技術人們不僅可以存儲歷史數據,還可以為決策系統和導航系統提供數據等等。現在已經有模型應用于交通流預測中。為了提高預測的精度和可靠性,應結合其他可靠的方法和模型來研究適合我國的交通流預測模型。智能交通系統研究的目的是使人、車、路與環境和諧共處[2]。將數據挖掘技術運用到交通流預測對交通系統的擁堵、交通事故都會有很大的改善。
1 方案設計
1.1 數據預處理
數據預處理是數據挖掘中一個非常重要的步驟。這個過程可以剔除異常數據,使得數據挖掘的結果更加準確。預處理方法一般包含有數據清洗、數據變換和數據規約等。它們各自有優點和缺點[3]。
1.2 程序設計及計算
交通是一個大工程,影響它的因素有許多種。因此,需要從單一因素及多因素分別研究對交通流的影響。
1.2.1 單一因素對交通流的影響
一個地區如果要進行土地開發利用,交通必將是先導;反過來一個地區的交通便捷程度也決定著這個地區的土地利用率的大小[4]。土地利用是對交通影響最重要的因素之一。因此,本文首先選擇土地利用率作為單一因素,對交通流的影響進行研究。
土地利用率與交通流的關系如下表1所示:
先做散點圖以確定回歸函數的類型:用Matlab編程得出散點圖,如圖1所示:
由圖1知其模擬結果符合線性回歸,運用回歸分析在Matlab中實現。其殘差圖中存在數據對應的殘差圖不過0線,因此去掉第16個數據后繼續做回歸。直至所有殘差圖過零線。如圖2。
從圖2可知,數據可以使用。以此為數據庫進行模擬,得到仿真結果為y=13.8986+78.1208X。其中X為土地利用率。
1.2.2 其它多因素對交通流的影響
眾所周知交通系統是一個復雜的系統,影響交通流的因素非常之多,道路的寬敞程度、周圍商圈的繁華程度等等。它都影響著交通流,并對經濟也有一定的促進作用。交通是一個城市的基本骨架,它伴隨著城市的發展不斷地演化、擴大;也是社會活動的一個載體,影響著經濟的發展。居民收入也是影響交通流的一個主要因素,經濟情況的好轉,對車輛的購買欲增強,也就是增加了交通流。交通流的影響因素如下表2所示:
數據殘差圖如圖3所示。
由圖3知所有的殘差圖均過0線,且顯著性概率為0,因此,回歸效果顯著。仿真結果為:
y=22.4680+5.3205X1+ 3.9334X2-0.0092X3
其中,X1為車道數,X2為當地居民收入,X3為交通流量。
2 實例分析
2.1 單一因素驗證
下表是臨泉縣濱河大道近幾年土地利用與交通流之間的關系,通過上一章所得出的方程來進行數據驗證,以此來驗證方程的準確性。如表3所示:
將該表中的數據帶入上一章的一元線性回歸模型y= 13.8986+78.1208X中進行驗證,得到驗證結果。并且對于單一因素對交通流影響的預測值要進行偏移率的計算來測定該方程的合理性及預測的準確性,所以驗證結果和偏移率如下表4所示:
在此實驗中,是一元線性回歸模型通過模擬出的散點圖可知道土地利用率與交通流呈線性關系,通過編程模擬出其殘差圖,根據結果繼續模擬,直到其數據都過0線為止,最后得到其回歸方程。通過數據驗證及偏移率數值分析,其符合結果。
2.2 多因素驗證
下表是濱河大道多種因素與交通流之間的關系,如表5所示:
將該表中的數據代入上一章的多元線性回歸模型y= 22.4680+5.3205?X1+3.9334?X2-0.0092?X3驗證結果。并且對于多因素對交通流影響的預測值要進行偏移率的計算來測定該方程的合理性及預測的準確性,所以驗證結果和偏移率如下表6所示。
在此實驗中,是驗證以上三種影響因素對交通流的影響,通過上一章的統計分析及編程得到模擬結果,并得到其多元線性回歸方程。通過數據驗證和偏移率的數值分析,其符合結果。
3 總結展望
數據挖掘已經成為決策支持、道路交通、金融等行業的主要研究方向。在這個到處都是大數據的現代社會中,每年都會產生新的技術及方法,也由于人們對它的廣泛應用和深入研究,算短了技術換代的時間,促進了挖掘技術的快速發展。但是數據挖掘技術仍存在許多問題,如數據挖掘方法的效率有待提高,尤其是超大規模數據挖掘的效率。本文從數據挖掘的角度出發,深入研究了數據挖掘中數據預處理技術及一元和多元線性回歸模型在交通流預測系統中的應用,并對它們進行了分析對比。
本文是基于數據挖掘的交通流預測并且得到一定的研究成果,但是由于時間及各種原因造成不能更進一步的深入研究,況且交通系統本身就是一個巨大且復雜的系統,所以還有很多地方需要完善和改進。
(1)交通流數據本身有其內在的關系,速度、流量和占有率是最重要的三個屬性,它們之間是相互聯系、相互作用的,本文僅對流量的影響因素進行分析,今后可以對三者之間的影響關系進行分析預測,并通過交通流預測模型為交通系統提供決策支持,同時它將更加的合理和準確。
(2)本文僅使用了線性回歸模型,可以考慮將多種模型混合使用,提高預測結果的準確性。
(3)今后還應對不同路段、路面的種類因素等進行分析研究。同時惡劣天氣、交通事故等因素也是未來需要進一步研究的方向。
參考文獻
[1] 高雅.短時交通流預測模型及預測方法的研究[D].上海:華東師范大學,2011.4.
[2] 許兆霞.基于數據挖掘技術的交通流數據分析研究[J].淮海:淮海工學院,2009.3.
[3] 郭敏.道路交通流短時預測方法綜述[A].北京:北京科技大學,2009.2.
[4] 李明江.數據挖掘技術及應用[A].都勻:黔南民族師范學院,2010.
[5] 國家統計局.中國統計年鑒[J].北京:中國統計出版社,2010.
[6] 國家統計局.中國統計年鑒[J].北京:中國統計出版社,2007.