楊春霞,秦家鵬,王 慶,李欣栩
(1.南京信息工程大學 自動化學院,江蘇 南京 210044; 2. 江蘇省大數據分析技術重點實驗室,江蘇 南京 210044; 3.江蘇省大氣環境與裝備技術協同創新中心,江蘇 南京 210044)
交通流預測是利用人們行為產生的歷史交通流數據進行分析,是智能交通系統(Intelligent Traffic System, ITS)中的重要構成部分。多年來,在緩解交通擁堵、降低資源浪費等方面發揮重要作用,一直深受運輸領域學者的關注[1-2]。
利用歷史交通流數據隱含的特性進行短時交通流預測已經取得重要進展。從早期的統計模型到最近的深度神經網絡模型,很多學者[1]關注的是交通流長短程時間尺度上的相似性,如楊春霞等[3]引入交通流周時間尺度的相似性;傅成紅等[4]構建深度學習回歸機模型,學習交通流時間序列的深度特性等方法都取得了較好的效果。另一方面,也有學者關注空間尺度上的關聯性,如常剛等[5]利用區域路網交通流的時空依賴性,進一步提高了短時交通流預測精度。然而,幾乎未見有人關注同一路段不同車道上交通流的復雜關聯特性。多車道關聯性是指在多車道公路中受人們駕駛行為的影響,各個車道間交通流存在復雜的關聯性,如何剖析這種關聯特性是本研究重點關注的一個問題。
近年,深度學習因為能夠深入挖掘數據特性而逐漸受到各領域學者的關注[6-7]。在智能交通領域,Vythoulkas等[8]首次提出使用系統識別和人工神經網絡來預測城市道路網絡的交通狀況。Hochreiter等[9]提出長短期記憶網絡(Long Short-Term Memory,LSTM)模型,該模型能夠捕獲交通流數據中長期依賴性的內在特征;Cho等[10]通過簡化LSTM結構構造了一種門控循環單元(Gated Recurrent Unit,GRU)模型,該模型能夠適當減少訓練時間,LSTM/GRU模型在流量預測領域都取得了很好的效果[11-12]。然而LSTM/GRU僅能處理單向信息流動而無法學習上下時間信息關聯。Schuster等[13]提出雙向循環神經網絡(Bidirectional recurrent neural networks,BiRNN)模型,該模型可以通過正負時間方向上學習交通流的上下關聯。Huang等[14]用BiRNN來預測交通流,試驗表明該模型能夠有效捕捉交通流上下關聯。雙向長短時記憶網絡(Bidirectional Long Short-Term Memory,BiLSTM)受BiRNN的啟發在LSTM基礎上增加反向的LSTM,拼接正負時間方向上LSTM的結果從而獲得上下關聯交通流信息,并且在流量預測領域取得了很多成果[15-16]。綜合分析,采用BiLSTM模型進行短時交通流預測,提出一種考慮多車道加權融合的BiLSTM短時交通流預測模型,通過最大信息系數分析不同車道交通流和聚合交通流的關聯程度,構建BiLSTM模型對各車道交通流和聚合交通流分別進行短時交通流預測,并對預測的各車道交通流和聚合交通流加權融合為最終預測交通流。對比以往傳統預測模型的一些研究工作,本研究所提的多車道加權融合模型預測精度更高,并且對多數多車道路段均適用。本方法可以有效學習交通流數據前向、后向時間關聯特性,能夠融合各車道交通流對聚合交通流的關聯影響,進一步提高短時交通流預測效果。
不同車道間交通流受人駕駛行為[17]和駕駛規則影響存在某種程度時空關特性。時空關聯性是研究空間對象隨時間的變化規律,反映時空數據在時間和空間上的關聯,本研究采用最大信息系數(Maximal Information Coefficient, MIC)[18]來衡量不同車道交通流關聯程度。
最大信息系數主要是利用網格劃分法和互信息進行計算,它能夠廣泛度量變量間的依賴關系。將各車道交通流和聚合交通流訓練數據作為一個有限的有序對數據集D={(Xi,Yi),i=1,2,…,n},將Xi的取值范圍分成x段,將Yi的取值范圍分成y段,得到若干個x×y形式的網格,即稱為G。公式定義為:
MI*(D,x,y)=maxMI(D|G),
(1)
式中,D|G為數據D在x×y網格G進行劃分,式(1)表示在不同劃分方式中計算的最大化信息。然后將不同劃分下得到的最大歸一化MI值構成特征矩陣,特征矩陣定義為M(D)x,y:
(2)
設劃分x×y網格的上限為B(n),效果最好時B(n)=n0.6,那么最大信息系數定義為:
(3)
式中,xy2 模型原理
2.1 雙向長短期記憶模型理論
LSTM模型[9]屬于一種前向訓練模型,僅能捕捉前向歷史交通流數據的長期特性,但是交通流數據不僅依賴于過去信息,且和駕駛人未來航程規劃存在關聯,BiLSTM能夠從前后方向處理并整合數據,這更符合人的旅行習慣。本研究選用BiLSTM模型學習交通流上下關聯性。圖1給出LSTM模型框架。

圖1 長短時記憶預測模型Fig.1 Long short-term memory prediction model
LSTM各個門的狀態滿足以下公式:
ft=σ(Wf.[ht-1,xt]+bf),
(4)
it=σ(Wi.[ht-1,xt]+bi),
(5)
ot=σ(Wo.[ht-1,xt]+bo),
(6)
(7)
(8)
ht=ot?tanh(Ct),
(9)

BiLSTM從歷史數據的前向和后向訓練數據,在模型隱藏狀態輸出前拼接前向和后向學習的特征,其公式可表示為:
(10)
(11)
(12)

嶺回歸(ridge regression, RIDGE)是一種懲罰線性回歸,對處理多元數據占有一定優勢,它通過在線性回歸損失函數后引入懲罰L2正則化項,恰當地解決了線性回歸過擬合問題,嶺回歸損失函數為:
(13)
對此公式求導,表達如下:
(14)
令公式(14)等于0,根據給定的X和y,求得系數矩陣W:
W=(XTX)-1XTy,
(15)
式中X為給定的輸入數據,其給定形式表示X=[x0,x1,…,xM]T,加權擬合權重參數為w=[w0,w1,…,wM]T,X與w對應相乘輸出數據y=[y0,y1,…,yN]T。
多數公路是由多車道構成的,而且每個車道間交通流和聚合交通流受旅行者駕駛行為的影響存在很強的關聯性。基于此,本研究提出基于多車道加權融合預測模型,該模型分為兩個模塊:預測模塊和加權融合模塊。圖2給出了該模型框架。在預測模塊,假設各車道交通流和聚合交通流分別作為獨立的子模塊,對各子模塊構建訓練數據集,如取Lane1的訓練數據集X={x1,x2,…,xn}輸入BiLSTM模型中進行訓練預測,其預測結果為yLane1。同法,對剩余車道交通流和聚合交通流做出預測。

圖2 多車道加權融合預測模型Fig.2 Multi-lane weighted fusion prediction model注:圖中Lanei表示i車道的交通流,Agg表示Lanei的聚合交通流。
在加權融合模塊,整合預測模塊預測的各車道交通流和聚合交通流,然后作為不同變量輸入嶺回歸中得到各變量的融合權重,其加權融合公式為:
(16)
式中,wAgg,yAgg為聚合交通流的權重及預測值;wLanei,yLanei為i車道交通流的權重及預測值;yfusion為yLanei與yAgg的加權融合交通流。
本算法使用Adam優化函數來更新參數,采用交叉驗證法和Dropout函數來提高算法的測試精度,通過調整參數使算法不斷逼近期望輸出。多車道加權融合預測模型步驟如下:
(1) 樣本分類。取樣本數據Lanei與Agg作為不同子模塊分別劃分為訓練數據和測試數據。
(2) 樣本預處理。對各子模塊訓練數據X={x1,x2,…,xn}分別歸一化處理。
(3) 初始化網絡狀態。包括神經單元的細胞狀態C0、隱藏狀態h0,將步驟(2)處理的數據按子模塊分別輸入第一層BiLSTM神經元。

預設N=20,M=3,L=6,圖2和圖3分別為隨機選取單個SU的信道和功率策略概率演化過程.從圖中可以看出經過200次迭代后,用戶信道選擇概率向量由初始值{1/3,1/3,1/3}最終收斂到{0,0,1},并維持恒定不變.同時用戶在6個功率等級上的選擇概率也同樣的表現,結論與定理1和定理2相符.
(5) 判斷向前層和向后層的LSTM神經單元是否學習結束,沒有結束,繼續步驟(3)。
(6) 根據式(4)計算ht,保留ht并進入下一層BiLSTM神經單元計算中。
(7) 重復以上步驟計算下一層BiLSTM神經單元,BiLSTM神經單元訓練完后采用Dropout函數隨機丟失一部分特征,以防止過擬合,最后通過FC全連接層進行加權整合輸出,分別計算出各車道交通流和聚合交通流預測值yLanei,yAgg。
(8) 加權融合。把交通流預測值yLanei與yAgg作為不同變量輸入嶺回歸法中,通過訓練得到各變量的融合權重,然后通過公式(16)加權融合得到最終預測值yfusion。
采用經典的均方根誤差(RMSE)和平均絕對誤差(MAE)作為度量指標判斷預測結果的性能,以及選擇R平方(R2)用于判斷預測值與真實值的擬合程度。其中RMSE亦稱標準誤差,其與L2范數很類似,易忽略較小誤差值,對異常值很敏感;而對于較小誤差的累計,MAE比較敏感。RMSE,MAE,R2的公式如下:
(1)均方根誤差:
(17)
(18)
(3)R2的指標:
(19)

同文獻[3]一樣,試驗數據來自美國加州高速公路的性能測量系統(Caltrans Performance Measurement System, PeMS)數據庫平臺。平臺數據最小間隔時間為 5 min,能夠根據試驗需要聚合以5為倍數時間間隔的交通流數據。本研究選擇“1108717”與“407323”兩個主干道觀測站的交通流數據來驗證試驗的可靠性,取其中一個觀測站數據如圖3所示,Agg表示聚合交通流,Lanei表示i車道交通流,從圖3明顯看出Agg與Lanei存在趨勢相似性。文獻[3]給出證明,同“周幾”交通流擬合度要優于以工作日為尺度的交通流數據。基于此,本研究對原始交通流按同“周幾”劃分周時間尺度數據集,然后采用最大信息系數分析周尺度多車道交通流與聚合交通流兩兩間的關聯性。

圖3 各車道交通流與聚合交通流Fig.3 Traffic flow in each lane and aggregated traffic flow
如表1所示,表示了Agg與Lanei的關聯度,為了使試驗更具有嚴謹性,假設Aggi表示同“周i”的聚合交通流,對Aggi與Lanei進行全面的關聯性分析。從表1給出的最大信息系數來看,Aggi與Lane3的關聯性平均系數高達0.908,屬于強相關,反面表明Lane3被Aggi可替代性較強;而Aggi與Lane5的關聯性均值最低為0.762,從另一方面看出Lane5被Aggi可替代性較弱。總的來說Aggi與Lanei都具備較強的關聯相似性。由這種關聯性初步判定,Lanei各車道的交通流趨勢有助于輔助分析Aggi交通流的走勢。

表1 聚合交通流與各車道交通流間的關聯系數
本研究試驗平臺處理器是INTEL(R)Core(TM)i5-4460CPU@3.20GHZ 3.20GHz,操作環境為Windous10 64位,內存16 GB,試驗基于Keras深度學習庫,Keras庫模型搭建迅速且高效,能夠滿足多數神經網絡需求。本研究模型多層隱含層單元數均設為64,輸出節點設為1,試驗參數根據試湊法選擇最優參數,設置時間步長為12,訓練迭代600次,學習率0.001,損失函數為mse,在調參時每試驗5次以驗證調參的可靠性。本研究在全連接層輸出前加入了Dropout層,以防止模型過擬合。圖4為驗證集和Dropout層調參時的性能變化,當隨機選取其中3 d作為驗證樣本,且Dropout設為0.3時,模型表現最優。

圖4 不同參數的性能比較Fig.4 Comparison of performances of different parameters
根據Lanei和Agg分別進行歸一化處理。對Lanei和Agg而言,在訓練模型時,若xN為當天某任意時刻交通流,將前一段時間N時刻和當天N-1,N-2,…,N-12時刻的交通流數據輸入模型,當天N時刻的交通流數據作為目標輸出。選擇2月8日—8月23日交通流數據作為訓練樣本,預測30日N時刻的交通流。
為驗證本研究所提預測方法的可靠性,下面依次從兩個不同類型觀測站以5,10 min間隔時間交通流分析本研究所提方法的預測效果。表2中給出了LSTM,GRU與BiLSTM模型和本研究所提方法對五車道“1108717”觀測站交通流的預測結果評價指標。如表2所示,在5 min時間間隔內,各模型的預測誤差都很小,GRU,LSTM與BiLSTM模型的MAE,RMSE值分別為24.26,33.45,23.52,31.91,23.28,30.23。其中,GRU模型預測誤差最大,這是因為在學習數據特征時,GRU從上層只有一個輸出傳輸到下層,降低了對較長時間數據特征的記憶能力;LSTM模型相對GRU增加了一個記憶細胞,能夠記錄較長時間的數據依賴特性,因此在預測結果上有一定提升;BiLSTM模型在LSTM的基礎上融合了前向與后向數據特征的關聯性,進一步提升了預測結果。本研究所提方法的MAE,RMSE達到了21.93,28.98,相對BiLSTM模型預測誤差更小,因為本方法融合了BiLSTM的優點,能夠學習數據的上下時間關聯,并且在另一方面考慮了聚合交通流與各車道交通流的關聯性。在10 min時間間隔數據進行各模型試驗,結果表明所提預測方法預測誤差也是最小的,預測效果最優。以上初步說明在預測聚合交通流時,適當考慮各車道對聚合交通流的關聯性有助于提高交通流的預測精度。

表2 “1108717”觀測站的預測誤差對比
圖5對比了多車道加權融合預測方法與試驗中表現最好的BiLSTM模型預測效果。從圖中預測曲線和測試曲線的走勢來看,顯然本研究所提方法預測曲線與測試曲線擬合效果更好,特別在一些異常值擬合方面本研究所提方法更具有優勢,這是因為所提方法在預測時不僅考慮數據的上下時間依賴性,還融合了聚合交通流對各車道交通流的輔助依賴。在絕對誤差方面,本研究方法的絕對值基本低于75 veh,而BiLSTM模型的預測絕對誤差較多介于75~100 veh之間,在交通流特征學習上表明本研究所提方法更優,反方面也表明未考慮多車道交通流關聯的BiLSTM模型在波動劇烈的數據上,學習能力比較弱。試驗結果表明考慮了Lanei趨勢與Agg趨勢的關聯性,能夠更好地學習交通流的突變值,對提高交通流預測精度有一定幫助。

圖5 BiLSTM與BiLSTM-RIDGE模型預測結果對比Fig.5 Comparison of prediction results between BiLSTM and BiLSTM-RIDGE models
表3為各模型在三車道“407323”觀測站交通流的預測誤差對比。可以看出,“407323”觀測站總體預測誤差低于“1108717”觀測站,這是因為五車道交通流量略多于三車道,隨著交通流量的增多會增加數據的劇烈變化程度。

表3 “407323”觀測站的預測誤差對比
從表3各模型預測誤差對比方面,本研究所提預測方法在5,10 min時間間隔交通流的預測誤差中表現最優。但是本研究方法預測誤差相對未考慮各車道交通流關聯的模型并沒有降低很多,因為每個車道交通流量少,數據波動小,使模型能夠更好地學習交通流的特性,隨著車道數的減少,各車道交通流對聚合交通流的輔助作用也會有一定降低。綜合來說,本研究引入多車道與聚合交通流的關聯性,有助于提高交通流預測精度,同時也具有一定的魯棒性。
研究了多車道交通流與聚合交通流的關聯性,提出一種將多車道關聯與BiLSTM模型相結合的短時交通流組合預測模型,本方法適用多數多車道觀測路段。首先對試驗的交通流數據進行分析,發現車道交通流與聚合交通流存在相似關聯性。然后考慮這種關聯性,構建雙向長短時記憶模型分別訓練預測各車道交通流與聚合交通流,加權融合各部分預測結果。最后在兩種觀測站交通流進行試驗驗證,本研究所提預測方法明顯優于BiLSTM等模型預測結果。試驗證明,引入各車道交通流與聚合交通流的相似關聯性能夠進一步提高交通流預測精度,對緩解交通擁堵提供更高效的助力。
交通流變化受天氣、交通事故、上下游交通流等因素的影響,也會因車道限速而迅速變化。接下來將進一步挖掘交通流與以上因素的依賴性,利用這種依賴性來提高交通流預測性能。