孫紅影
摘 要:隨著我國城市化率的逐年提高和經濟的飛速發展,交通擁堵問題已經成為城市和經濟發展的桎梏。研究者們致力于對交通擁堵狀態的預測,文章就預測過程中需要的交通流數據的采集與處理分析方法進行討論,為交通流數據從采集到處理過程提供思路。
關鍵詞:交通流;數據處理;數據分析
中圖分類號:U491 文獻標志碼:A 文章編號:2095-2945(2018)12-0123-02
Abstract: With the increasing of urbanization rate and the rapid development of economy, traffic congestion has become the shackles of urban and economic development. Researchers are committed to the prediction of traffic congestion. This paper discusses the methods of collecting and processing traffic flow data needed in the process of forecasting, and provides ideas for traffic flow data from collecting to processing.
Keywords: traffic flow; data processing; data analysis
引言
隨著城市化率的逐年提高和經濟的快速發展,城市交通容量已經達到現有設計容量的閾值,汽車的保有量已經趨于飽和,其表現形式為城市交通的流量越來越大,平均車速越來越低,道路運送能力越來越低,因而城市交通的擁堵已經稱為城市和經濟法則的桎梏。在現有城市道路設計容量狀況下,對城市道路交通進行精確控制,是提高城市道路利用率的重要手段之一。而對城市道路交通進行精確控制的核心問題之一是對各交通樞紐進行交通流預測。這里提出的交通流是一般指交通工具流量,交通流的數據特性是千變萬化的,交通流狀態很難用確切的數字來說明,例如交通工具、目的地、駕駛員的駕駛特點、規劃的路線等都是不盡相同的,它具有較強的不確定性,而整個交通流又會隨著時間段、交通環境、道路運行狀態的變化而改變。但道路系統的運行從大量的觀測數據來看,它還是遵循一定規律的,例如較為明顯的早高峰、晚高峰,早進城、晚出城等。本文分析了交通數據流的特性,并對其預處理方法進行了研究。
1 交通流基本特征
獲得交通流的方法和手段很多,最常用的是全自動交通流量觀測儀,按照監測類型可以分為接觸式和非接觸式,接觸式一般有地感線圈和壓電流量儀,非接觸式有超聲波式、微波式、視頻式以及超聲波-微波復合式流量儀。通過安裝在不同交通位置的裝置,采集各交通斷面的交通數據流,再進行數據分析和處理,可以預測未來一定時間段的交通流量變化情況,從而對道路交通進行精確的疏導和控制。目前,多數文章都是針對單個交通斷面進行預測研究,缺少對多斷面的交通流數據研究。但是整個城市的交通網絕不是孤立的,它在時間和空間上都有相關性,因此需要進一步的探討和研究道路網的多斷面交通數據流處理及預測。多斷面交通數據流預測以單個斷面的交通流預測為基礎,利用交通流的實時數據,結合道路交通網的一系列特性,例如是否主干道、周邊社會資源分布、公共交通資源分布、紅綠燈分布等多項因子,著眼于道路交通網多斷面交通流狀態,以及道路網中多斷面交通流狀態的時空相關性,來實現道路網中多個斷面的同時預測。這種對交通流的多斷面預測更加符合實際,是今后研究的重要方向。要實現交通流的多斷面預測,首先應解決以下問題。
1.1 交通流數據的準確性
前文已經提到,目前有多種方法可以實時采集交通流數據,無論是接觸式還是非接觸式、是視頻流量數據還是超聲探測數據,這些都為今后的智能交通以及交通流量精確控制提供了有力的保障。但是電子儀器的誤差總是存在的,可能會發生軟件故障、硬件故障、通信干擾、環境噪聲、數據模糊等情況,得到的實時數據并不能保證都是真實、可靠、有效的。甚至道路突發的車輛故障、交通肇事都會對數據造成巨大影響。這些包含丟失數據、錯誤數據、突變數據的交通數據流,必須加以識別和預處理,否則就會直接影響下一步研究的準確性。因此,在進行交通流數據分析之前,應采取平滑過濾、奇點剔除、插值補漏等數據預處理方法對實時采集的交通數據進行預處理,確保數據的真實可靠有效。
1.2 多個斷面交通流數據之間的相關性
城市交通網是一個龐大的系統,在同一個交通網中又存在著多個斷面,這些斷面之間的交通流數據看似毫無關系,其后卻存在密不可分的聯系,例如無分叉路口的主干線相鄰兩個紅綠燈斷面之間是有絕對聯系的,而相鄰兩個十字路口的八個斷面之間也存在或強或弱的關聯性,它們之間的關聯性受時間、各交通斷面的資源分布等影響。當對某一個交通斷面進行預測時,不可能對所有關聯斷面都進行預測,這種計算量和工作量會十分龐大,因此有必要對各個斷面的相關性進行分析,找出對要預測的交通斷面影響最大的一個或者幾個交通斷面進行計算預測。采取這種強相關性預測方法,能在滿足預測精度的前提下減小預測工作量,對于實際應用具有重要意義。因此,在對交通流進行預測之前應當采取關聯分析的方法,對輸入端的數據進行分析處理,以提高預測的精度。
2 交通流故障數據的識別
交通流預測的過程中,交通流數據的準確性對預測的結果的精準性起著不可忽視的作用。交通流數據因為是動態的,在采集過程中往往會由于采集設備的軟硬件故障、環境噪聲、數據模糊以及數據傳輸過程中系統故障而引起數據異常。為了所建立的模型的精度更為精確,就需要更有效地分析交通數據的規律。因此在數據分析和使用之前應該對其進行異常點剔除、平滑濾波、線性插值等方法進行相關的預處理。通過對大量的交通流數據進行分析,可知數據的異常通常是由兩個方面引起,一是傳感器前端故障,二是通信過程干擾。引起的后果也是兩種,一是數據錯誤即非真實值,二是數據丟包。
2.1 錯誤數據預處理
因自動交通流量觀測儀的軟件故障、硬件故障、環境噪聲、數據模糊等引起的錯誤數據是不可以直接用來使用的。需要將采集到的錯誤數據進行預處理。處理方法大概分為以下兩種:一種是將錯誤的數據剔除。這種情況僅在錯誤數據相對很少的情況下可以采用,剔除個別錯誤數據不會影響數據的完整性和趨勢性,但如果錯誤數據所占比例較大,就不能采取剔除法,因為過多剔除錯誤數據會破壞數據的完整性和其趨勢性。第二種就是對數據進行修復。方法是首先剔除明顯異常的錯誤數據,然后采用平滑濾波、插值法將剔除掉的數據補上,使整個數據的完整性和趨勢線不受影響。
2.2 丟失數據預處理
引起數據丟失的原因也是兩個,一是因為軟硬件因素在檢測端就沒有檢測到數據,二是在數據通信時產生了丟包現象。在實際使用中,會因為車輛過度的密集而引起交通流檢測儀器數據采集不準確,數據在傳輸中出現故障等等諸多原因而導致采集到的數據會出現空白,如出現某個時間點、一段時間或者幾段時間內的數據丟失。這種情況就需要對丟失的數據進行相關與處理。針對影響因素特征序列的單位及數量級不統一的實際情況,用初值化算子對其進行無量綱化處理,然后利用插值、平滑等算法對數據進行修復。
3 交通流數據的處理步驟
STEP1:提取一個特定路口的多個斷面每天的數據。
STEP2:對于錯誤的數據進行剔除跟修復。當數據采集到的數據為0或者遠遠超過平均值的時候。假設當數據采集的時間間隔為5min,根據先驗值,流量限制的最大的合理流量在200臺/5min。按照高峰期與非高峰期之分,可以設定為一個是數據采集點一天采集到的數據若在[700-720]之間,則保留數據。否則就作為錯誤數據,將全天的數據全部剔除。然后利用平滑法、插值法,對于保留下來的數據樣本進行處理,將缺失的數據進行補齊。
STEP3:數據關聯性分析及整合。首先進行數據關聯性分析,對于不重要的可有可無的數據可以忽略不計,對于有重大關聯的數據進行保留。另外在數據處理過程中,可能會出現幾個車道的數據進行合并的情況。
4 多斷面交通流數據的相關性分析
短時交通流數據進行預測,就是指在具有不確定性與隨機性變化的交通流中,根據檢測到的數據,對數據的剔除跟修復后,找出來規律來建立模型。用來預測未來的交通流變化。其要求實時性,又要求精準度。然而,只是考慮一個斷面的交通流數據,又不能充分的體現這一路口的實際交通流情況,結果是片面的,不符合實際的,所以就需要考慮多個斷面的數據。多個斷面的數據看似毫無關系,其實內在是有個密不可分的聯系的,因此,我們可以運用數據關聯度分析:主要是針對交通系統影響因素過多的現狀,利用灰色關聯分析,將影響因素按照灰色關聯度大小進行排序;按照灰色關聯度從大到小的順序,分別取1,2……n個影響因素序列,根據預測的需要,選取適合的影響因素序列的個數。以達到預測的目的。
5 結束語
交通流數據是智能道路交通系統中進行道路交通流量情況預測的核心因素。因為數據本身具有的實時性,不確定性以及數據錯誤及缺失。在預測之前就必須對數據進行分析及預處理。本文從交通流數據的特性出發,分析了錯誤數據識別與處理的方法。最后給出了多組數據相關性的分析。為交通流數據處理提供了思路。
參考文獻:
[1]賀國光,李宇,馬壽峰.基于數學模型的短時交通流預測方法探討[J].系統工程理論與實踐,2000,20(12):51-56.
[2]宗春光,宋靖雁,任江濤,等.基于相空間重構的短時交通流預測研究[J].公路交通科技,2003,20(14):71-75.
[3]徐啟華,丁兆奎.交通流量的遞歸神經網絡實時預測模型研究[J].公路交通科技,2004,21(10):99-101.
[4]田晶,楊玉珍,陳陽舟.短時交通流量兩種預測方法的研究[J].公路交通科技,2006,23(14):103-106.
[5]邵春福,熊志華,姚智勝.道路網短時交通需求預測理論、方法及應用[M].北京:清華大學出版社,2011.
[6]馬國旗.城市道路交通流特征參數研究[D].北京:北京工業大學,2004.
[7]楊兆升.城市交通流誘導系統理論與模型[M].北京:人民交通出版社,2000.