芮偉 謝泰 沙琨
(海軍軍醫大學海軍衛生信息中心 上海 200433)
目前,城市交通問題日益突出,積極推動智能交通信息系統(ITS)建設是解決問題的有效途徑之一。而城市道路交通流量的預測是智能交通系統的重要基礎,為個人出行服務、各個區域之間交通信號的聯合控制、制定特定的出行計劃和城市道路建設規劃管理分析等各個場景進行數據支撐。因此,構建科學的交通流預測模型,以實時和歷史交通流數據為基礎,對車流量預測這一關鍵問題進行深入研究分析,可以為緩解和預防城市交通擁堵提供有效幫助。
交通流理論[1]是多學科交叉的一門學科,通過物理學、統計學、力學、交通工程等多學科的協同分析,可以實現交通流準確、快速的預測。為了更好地進行交通誘導和交通控制,需要及時準確地掌握交通流預測信息和數據。關于交通流預測,國內外學者已經開展了一系列的相關研究,其中元胞自動機[2](Cellular Automaton,CA)交通流模型能夠根據實際情況靈活設置車輛運行規則,具有良好的并行性。而灰色GM(1,1)模型可以對不規則的原始數據進行生成,得到規律性強的生成序列,且所需的數據量少,精度高。因而兩種模型在交通流研究領域都得到了廣泛應用。冉磊、蔡遠麗[3]在一維交通流元胞自動機Nasch模型的基礎上,提出一種改進的一維敏感駕駛元胞自動機交通流模型。錢勇生、曾俊偉[4]等建立了有意外事件影響的車道管制下的高速公路元胞自動機交通流模型,該模型考慮了交通事故和養護路段等意外事件對高速公路交通流的影響。葛紅霞、戴世強[5]在NaSch模型的基礎上,提出一種應用智能交通系統的交通流元胞自動機模型,模型考慮有效間距及剎車燈的作用,并引入可變安全間距的新概念。張敬裔,王曉原[6]將灰色模型與RBF結合并應用于短時交通流預測中,取得了較好的預測效果。游中勝、何麗等[7]對于城市短時交通流的預測提出基于改進累減還原方法的灰色模型,模擬及預測性能都取得了一定的提高。
Wolfram參照已有模型,通過大量的試驗分析與理論論證提出了184號模型,其實質上屬于一種一維交通流CA模型。該模型中車輛具有多種狀態,即向前進行元胞移動,或者停留在現有元胞,對于自由流和堵塞階段可以進行很好地描述,該模型的缺點是對于實際情況中的駕駛特性沒有加以分析,因此,更多地停留在理論分析階段,對于指導實際交通沒有太大優勢。1992年,德國學者Nagel和Schreckenberg在184號模型的基礎上構建了NaSch模型,該模型與184號模型相比,最大的特點在于將實際系統中車輛的加速與延遲等加入到模型之中。
NaSch模型作為CA模型的一種,元胞狀態都是離散的,包括其時間、空間以及速度等。假設一段距離為I的道路,將其離散化,分散成一個一個的網格,也就是元胞,任何一個元胞的狀態只有兩種情況:空、車輛占據。本文給出具體的演化規則如下。


上面,xn和vn分別代表第n輛車的位置與速度,dn=xn+1-xn-lve?表示第n輛車與前面車輛的距離,lve?則代表了車輛的長度信息。
在NaSch模型中,其具體的演化規則是:1)描述的是車輛加速,表示所有的駕駛者都希望在道路中以最大的期望速度進行行駛的行為;2)為了避免發生交通事故,保持與前面車輛的安全距離,需要在某些時刻降低行駛速度;3)在某些特殊的情況下,基于安全的考慮,以一定概率進行減速行駛;4)車輛位置的更新。
鄧聚龍教授通過大量分析論證,提出并創立了灰色系統理論[8]。本文在具體研究分析過程中,選取了GM(1,1)模型,運用時間序列預測方式,對時間序列構建完善、可行的模型并預測未來值。
首先,利用合理的方式來檢驗交通流時間序列,使其能夠利用灰色模型來實現建模,目前,初始序列為已知條件,具體為

計算該時間序列的級比為


此時數列的級比為

國內外眾多學者與專家為了進一步提升灰色模型的預測精度,將灰色模型建模機理作為著手點,結合實際情況,對灰色理論GM(1,1)模型進行了優化改進。劉常麗、屈紹建等[9]專家與學者主要借助模型背景值進行優化處理。黃克[10]則以遞推法作為基礎,通過大量的分析論證,求出一種簡單、便捷的序列長度計算方式,從多個步長存在較大差異的GM(1,1)模型之中確定最佳預測步長,進而提升預測精度。
經過改進優化的方式絕大多數是以建模過程中與之相對應數據序列為重要基礎,對于GM(1,1)模型參數的選取,式(8)中列出數據廣義級比間存在的關聯未進行深入的考慮與分析。因此,本文采用了孫波軍、尹偉石[11]提出的一種灰色模型算法,該模型基于日周期變化的數據特征,可自動選擇步長來進行城市道路交通流預測。
交通流數據存在一定的周期性變化規律,間隔單位一般為日,此種周期特性可以認定為不同日期下交通流數據在任一時刻與之呈對應關系的數據級比相近。第一步,通過科學合理的方式來分析交通流歷史數據級比;第二步,對GM(1,1)模型選取不同步長,對交通流進行預測;第三步,對步長不同模型參數a相對應的(1+0.5a)/(1?0.5a)值進行深入的觀察與分析,選擇同交通流歷史數據級比最相似的模型作為預測模型。模型預測步驟如下。
Step1:確定 GM(1,1)模型步長選擇范圍(s,d),s>3;
Step2:對歷史上t時刻交通流數據級比σ1(k)借助式(6)進行全方位、多層面的分析運算,k值則在區間(s,d)間進行選取。若為多個日期的數據,那么需要選取不同日期數據的平均數值;
Step3:利用科學合理的方式來精準預測t+1時刻交通流,然后把t定義為最后一個數據,那么向前則以此選取s,s+1,…,dt個數據,對于不同步長的數據,通過恰當的方式,并求出與之相對應的發展系數 as,as+1,…,ad,構建GM(1,1)模型;
Step4:從 as,as+1,…,ad與之相對應的(1+0.5a)/(1?0.5a)值之中,結合實際情況,確定與σ1(k)最相近的數值,并將其對應的步長定義為預測步長,然后充分利用該步長的GM(1,1)模型來精準預測t+1時刻交通流,并得出具體的預測值。
交通流特性[12~14]往往會受到多方面的影響,氣象條件就是其中不可忽視的因素之一,不同氣象條件會對車輛的速度、密度、流量等造成一定影響。單個模型預測的處理能力較差并且實用性較低,不能充分考慮到各種因素。基于此,本文將集成預測思想融于其中。
集成預測模型[15]的思想可以概括為結合實際情況,對不同預測模型進行組合處理,即賦予其不同的權值系數,并從各模型系統之中提煉一些真實、全面、有效的信息數據,充分應用各模型預測結果,對預測誤差、預測風險實施分散處理,從而使預測可靠性、預測精度得到進一步提升。不同模型的模型系數會隨著時間變化發生相應改變,同固定權值集成預測相比,利用單個動態變化的權值集成的獨立預測模型,其適應性將更好。
2.3.1 降雨條件下的CA交通流模型
設定道路由N個元胞組成,長度為L。任何一個元胞在任意時刻的狀態只有被占據或者無車兩種;由于車輛長度和安全距離的影響,一輛車可以占據多個元胞。第i輛車的速度vi(i=0,1,2…vmax),其中vmax為車輛最大期望速度,設定每個時間步長為1s。本文的研究僅僅針對小客車,同時,設定每輛車的最大期望速度和制動減速均為一樣。
在構建的模型中,車輛有三種狀態:
1)兩車間距遠遠大于安全距離,車輛進行加速,直至達到最大期望速度;
2)行駛過程中的車輛速度依賴于前方車輛的速度以及和前方車輛的距離,要保證安全的行車距離,以此進行速度的調節;
3)當兩車間距不斷縮小,駕駛員要減速保證安全。
降雨條件下對交通流的直接影響是車輛速度降低、車輛距離增加,因此,該模型引入一些參數:
β:降雨條件下的速度參數,取值0~1之間;
βi·vmax:i種降雨條件下的最大期望速度;
α:降雨條件下的間距參數,取值大于1;
α·ds:i種降雨條件下最小安全距離;
Ls:可視距離。
具體演化規則如下:


其中,vi為當前車輛i的速度;di為當前車i與前車間距;vmax為最大期望速度;ds為最小安全距離;xi為當前車i的位置。
2.3.2 組合預測模型算法
假定在分析、研究某一問題的過程中,設計創造了n種預測方式,那么此問題之中,某變量的N個實際觀測值則具體為Yt(t=1,2…,N),t為觀測時間。設集成預測方法的權值系數向量為W=,其中wi為第i種預測方法在集成預測模型中的權值系數,有假定第i種預測方式的預測值利用 fit進行表示,那么集成預測模型的預測 ft則可以利用式(14)進行表示,具體為

設元胞自動機模型在t時刻的預測值為L(t),GM(1,1)模 型 在 t時 刻 的 預 測 值 為 G(t),t=1,2,…n。根據式(14)得出兩種模型集成的表達式為

Y(t)為利用動態權值將元胞自動機和GM(1,1)模型的預測值進行累加所得的具體預測結果,其中w為動態權值,t為該預測數值產生的時間。
結合實際情況,求出最佳權值系數是實現模型集成的重要前提與基礎,本文的權值w則是在0~1之間所選取的11個數值。通過對圖1進行觀察與分析,了解集成兩種模型預測結果的詳細流程與步驟,具體為
Step1:從t=1時刻開始,分別將兩種模型的預測結果和各自權值系數w進行乘積處理;
Step2:把Step1中兩種模型乘積處理后的預測結果進行疊加,然后求得經過加權處理之后的時間點t具體預測結果;
Step3:重復Step1的流程,直至全部預測時間點的預測值均利用權值集成。
根據圖1中的步驟進行循環計算與分析,共對外輸出11組同權值w存在密切關聯的數據,從而獲得一組經加權集成處理之后的交通流預測數據,如式(16)所示:


圖1 元胞自動機和GM(1,1)模型組合過程
為了更加方便、快捷地明確權值w,本文引入關聯度概念。若因素或者事物變化的大小、趨勢十分相似,那么認定二者間存在較強的關聯度,若與此相反,則表明關聯度比較弱。本文以預測交通流曲線、實際交通流曲線二者形狀的相似度表示關聯度。若二者的形狀逐漸趨近,那么表明二者的關聯度較強,若曲線形狀差別比較大,那么兩者間存在的關聯度比較弱。所以,對關聯度進行評判時,可以將實際值曲線、組合模型預測值曲線形狀的相似度作為衡量標準。基于此,求得11組預測數據的實際值、組合模型預測值的關聯度,并結合實際情況,選出關聯度最大的預測數據,然后匹配相對應的權值,求出具體的預測結果。對關聯度進行分析運算的過程中,可以參照式(17):

由于GM(l,l)屬于特殊的動態模型,其處于一種動態變化之中,為保證權值系數的動態步調與GM(1,1)模型保持同步,當GM(1,1)的參數產生變化之后,需要借助EViews數據分析器進行再次分析運算,并得出新的權值系數。通過對11組實際值和組合模型預測值的關聯度全方位、多層面的研究分析,可以得到圖2的結果(橫軸為關聯系數r,縱軸為權值系數w)。

圖2 權值系數w對應的關聯系數r的值
通過對圖2分析可知,當權值系數w為0.6時,實際值、組合模型預測值的關聯度最大,集成預測精度最高。因此,可以將組合預測模型的權值系數確定為0.6。
為了全面、深入地掌握交通流預測過程中天氣對其產生的影響程度,本文實驗數據采用某城市交通檢測數據,每間隔1min系統進行檢測線圈數據采集。
數據集被細化為兩大部分,其一是訓練數據集;其二是預測數據集。鑒于冰雪和不同能見度的氣象條件與雨天條件類似,且天氣數據較少,實驗數據較難獲取,因此本次實驗選擇了雨天、晴天這兩種狀況作為研究對象。對于晴天模式,選取數據的時間范圍為2017年11月2日~18日,訓練集中共包括9395組數據,其中11月19日的數據,預測集共包含697組信息數據。對于雨天模式,選取數據的時間范圍為12月8日~16日,訓練集共包含3763組信息數據,其中12月17日的預測集共包含593組信息數據。
本文引進兩個評價預測擬合度指標來進一步提高預測的精度,通過把預測值與真實值進行對比分析,從而判斷預測方式是否合理。
1)平均平方誤差(MSE),主要是指實際數值、預測結果之間差值平方的算數平均數值:
2)平均絕對百分比誤差(MAPE),指實際測量值、預測數值之間的差值占實測數值百分比的算術平均數值:

上述公式之中,n、Y*i、Yi分別表示樣本數、預測值、實際值,平均平方誤差可以真實、充分、全面地展現預測精度,但是無偏性的衡量比較困難。而平均絕對百分比誤差則可以對預測模型的無偏性進行精準衡量,與平均絕對偏差進行配合應用,則可以實現良好互補,能夠真實全面、詳細、客觀地評價真實數據、交通流預測的擬合度。
圖3所示是基于氣象條件改進的CA和GM(1,1)組合交通流預測模型與單個模型預測結果和實際值的折現對比圖(橫軸為時間/min,縱軸為交通流量/輛)。

圖3 組合模型與單個模型的預測對比圖
由圖3可以看出,組合模型相比單個模型預測值更趨近于實際值,僅存在微小差別。結合實際情況,分別求出實際值、預測值的MAPE及MSE對比如表1所示。結果顯示,從MAPE或者是MSE指標上,相對于單個模型,改進后的組合模型預測方法雖然提高較小,但均有所改善。其中,MAPE值分別減少0.19%、0.55%,MSE值分別減少18.35、42.78,訓練時間也分別減少0.25s、1.79s。因此,基于氣象條件改進的CA和GM(1,1)組合交通流預測模型對于交通流量的預測情況較為理想,與單個模型相比較也具有一定優勢。

表1 組合模型與單個模型性能比較
本文提出一種基于氣象條件改進的CA和GM(1,1)組合交通流預測模型。首先針對氣象條件帶來的影響,引入了一些參數,更新了演化規則,然后將改進后的元胞自動機預測模型和灰色理論GM(1,1)預測模型進行組合。經實驗驗證,組合交通流預測模型對于交通流量的預測情況較為理想,與單個模型相比較也具有一定優勢。由于冰雪和不同能見度的氣象條件實驗數據較難獲取,本文僅針對降雨條件進行了實驗論證,因此今后的研究工作將會補充其他氣象條件的數據和實驗,進一步完善預測模型。