黃 欣,謝文紅,陳耀鵬,李 翔,張素磊,4,*
(1.青島理工大學 土木工程學院,青島 266525;2.臺州市杭紹臺高速公路有限公司,臺州 318000;3.青島國信建設投資有限公司,青島 266000;4.青建集團股份公司,青島 266071)
隨著社會經濟水平的發展與城市規模的擴大,我國城市機動化水平日益提高,海底隧道里程也在不斷增加,交通擁堵問題愈發嚴重,交通事故頻發,因此迫切需要有效的交通控制和誘導策略。構建智慧交通系統(ITS)能夠更好地改善交通擁堵,縮短出行時間,提高通行安全性。交通量預測通過實時交通數據的信息滾動來預測未來的交通狀況,是對車輛進行精細化誘導及管控的重要依據。
目前,國內外針對交通量預測的相關研究提出了大量預測方法。WILLIAMS等[1]提出了季節性ARIMA模型并結合交通量周期性的特征,來提高交通量預測的精度;李文勇等[2]對ARIMA模型交通流預測方法進行改進,構建實際交通流量數據均值和方差之間的函數關系,并因此推導出交通量時間序列的方差齊次轉換函數。但由于傳統交通量預測模型為淺層結構,無法對特定函數族進行有效的表征從而獲取數據集的本質特征[3],且對于高維度數據集運用傳統預測方法會造成維度災難問題[4]。
隨著計算機技術的發展,研究人員提出了大量智能預測方法。羅向龍等[5]對交通流進行特征分析,在網絡頂層連接支持向量回歸模型進行交通量預測,相比于傳統交通量預測模型具有更高的預測精度;WANG等[6]結合實驗客運量數據,通過與基準預測模型進行對比,驗證了LSTM網絡能夠取得較好的預測性能,同時分析了各種參數設置對LSTM預測性能的影響;沈廟生等[7]通過對實測交通流量數據進行實驗,得到了考慮缺失值修復的Dropout-LSTM的高速公路流量預測模型相較長短期記憶模型預測精度更高的結論;溫惠英等[8]提出基于Bi-LSTM的方法,研究表明,該模型在非線性交通流數據中具有更好的預測性和廣泛性;SUN等[9]針對道路網絡交通流,提出了一種新的基于最大似然的選擇性堆疊門控循環單元模型( SSGRU ),得出應用于所有道路場景的多道路輸入基礎設施時,該模型比其他模型具有更高的準確性的結論。殷禮勝等[10]基于考慮短時交通流量時間序列的復雜非平穩性、空間相關性和時間依賴性特性,提出改進的VMD-GAT-GRU交通量融合預測模型,相較于基準模型,其預測精度及收斂速度均有所提升。汪鳴等[11]結合Transformer算法提出多時間尺度時空圖網絡模型,并通過消融實驗證明了該模型提升預測性能的有效性。
上述研究提出的模型僅關注高速公路短期交通量預測,訓練所用數據量較少,忽略了具有城市道路功能的海底隧道中短期交通量在時間跨度內的變化規律,且用于交通量預測算法更多集中于LSTM及其融合模型,針對新提出的GRU模型及Transformer模型研究較少。本文提出基于AGRU-Trans融合模型的海底隧道交通量預測模型,以小時為跨度、近一年交通數據量為訓練,對海底隧道交通量進行預測,通過結果分析,驗證了該模型相比其他基準預測模型具有更高的預測精度,為膠州灣海底隧道管理部門對車輛進行精細化誘導及管控提供了理論參考。
交通量預測模型的不斷優化進一步推動了交通流預測技術的發展,大量學者從多元時間序列聯合預測[12]、量化時間序列噪聲的隨機性[13]、分析不同觀測時間尺度的時間序列構成[14]等多個角度提出研究方法。單一模型預測無法很好地滿足預測的需要,為了提高預測精度,組合模型、切換模型、模型優化等方法被廣泛使用[15]。
長短期記憶(LSTM)模型[16]是循環神經網絡(RNN)的改進變體。相比于普通的RNN,LSTM能夠在更長的時間序列中有更好的表現。該模型通過增加遺忘門、輸入門和輸出門等門控單元來克服傳統的循環神經網絡模型梯度消失或梯度爆炸的問題[17]。其中遺忘門利用激活函數sigmoid對上一時刻的記憶狀態進行選擇性地遺忘或者保留,輸入門利用tanh函數生成該時刻記憶狀態的候選值,然后再通過與該時刻輸入門輸出值進行元素對位相乘,以控制該時刻的記憶狀態是否發生更新,而輸出門為控制記憶狀態輸出到LSTM的當前輸出值。LSTM的神經網絡結構如圖1所示,其計算公式如式(1)-式(6)所示。

圖1 LSTM的神經網絡結構
ft=σ(Wf·[ht-1,xt]+bf)
(1)
it=σ(Wi·[ht-1,xt]+bi)
(2)
(3)
(4)
ot=σ(Wo·[ht-1,xt]+bo)
(5)
ht=ot*tanh(Ct)
(6)

門控循環單元神經網絡(GRU)是由K. CHO等在2014年提出的,它同LSTM一樣也是傳統RNN的變體,能夠有效捕捉長序列之間間隔較大的依賴關系。GRU是對LSTM復雜模型結構的精簡改進,在獲取將來時段信息數據過程中,保證信息數據準確率的同時速度也得到提升。它的核心結構分為更新門及重置門兩個部分[18],GRU單元結構如圖2所示。其計算公式如式(7)-式(10)所示。

圖2 GRU單元結構
zt=σ(Wz·[ht-1,xt])
(7)
rt=σ(Wr·[ht-1,xt])
(8)
(9)
(10)

LSTM和GRU都通過門控機制保留了前一序列的有用信息,克服在長期傳播過程中丟失的問題。但由于GRU參數個數較少,所以GRU整體運行速度相比LSTM更快。然而GRU有著循環神經網絡結構本身不可并行計算的弊端,在未來數據量和模型體量持續增大的趨勢下,仍需進一步優化。
通過來自注意力機制的嵌入信息修改GRU架構后,AGRU可以有效地提取復雜查詢中的關鍵信息。AGRU使用權重來代替GRU的更新門,權重越大,當前時刻隱藏狀態更新的信息就越多,之前的信息遺忘的也就越多,該方式需要修改GRU單元內部的計算公式,計算見式(11)。
(11)
式中:h′t為AGRU時間步為t時隱藏層的輸出變量;at為權重。
除上述算法可以處理時間序列數據以外,近幾年由Google提出的Transformer算法同樣可以解決梯度消失問題以處理時間序列數據,其中的注意力機制運行原理實現了并行計算,相比于只能串行計算的RNN極大地提升了運行速度。基于以上特性,Transformer一經提出就引起了研究者的廣泛關注,在機器翻譯、閱讀理解、文本摘要等多個領域展現出了優異的應用效果[19]。本文將Transformer模型引入到交通量預測領域,為其增加了新的應用場景。該算法基于編碼和解碼構建,解碼部分比編碼部分多了一個交互層和一個被掩蓋的多頭注意力機制。由于編碼部分和解碼部分相差不大,為方便介紹,本文主要介紹Transformer算法的解碼部分。Transformer算法解碼部分的結構如圖3所示。

圖3 Transformer算法解碼部分結構
其中位置編碼計算見式(12)-式(13)。
(12)
(13)
式中:P為位置編碼;p為時間序列的位置;dmodel表示模型的維度。
基于以上分析,對LSTM,GRU,AGRU及Transformer 4種交通量預測模型間優劣進行整體對比分析,見表1。

表1 基準模型優劣比較
基于以上分析,本文提出了基于AGRU-Trans的融合預測模型,如圖4所示,操作流程如下:

圖4 AGRU-Trans融合模型結構
1) 對數據集進行劃分,分為訓練集和測試集;
2) 將數據集分別輸入至AGRU模型和Transformer模型中進行訓練;
3) 將Transformer模型輸出值進行降維后與AGRU模型的輸出值利用concat函數進行拼接;
4) 最后將拼接后的矩陣通過全連接層輸出相應的預測值矩陣。
本文所依托的隧道工程為青島膠州灣隧道,該隧道是連接青島市市南區與黃島區的雙向六車道海底公路隧道,全長7.8 km,隧道縱斷面最大坡度為3.9%,內凈空高10.391 m,寬14.426 m。該隧道的建成,不僅有效縮短了兩岸間的通行距離,而且極大緩解了交通運營壓力,縮短了人們的出行時間。
對具有城市道路功能的海底隧道中短期交通量在時間跨度內的變化規律進行研究。由于該隧道2021年6月底進行大區段增設可變道路段,為提高訓練精度,因此選取膠州灣海底隧道2021年7月1日到2022年5月18日時間跨度為1 h的交通量數據信息,經處理后的數據共有7464條,對處理后的交通量數據按照時間進行可視化操作,如圖5所示。交通量的數值雖然在0~4200 veh/h,但是主要的交通量數值還是集中在0~2500 veh/h。

圖5 膠州灣隧道交通量分布示意
為近一步了解目前膠州灣隧道內交通量的特性,且避免初始或結尾數據以及數據的偶然性對交通參數規律性造成影響,本文選取中間時間段2021年8月30日到2021年9月20日3周內的交通信息數據進行細化處理,并針對1周內的交通數據規律性進行分析。圖6為各交通量1周內的可視化數據。
從圖6中可以看出,交通量變化規律呈現出周期性和時間相關性,并非雜亂無章。1周內工作日通過海底隧道的交通量相較于休息日更多,休息日高峰期呈現滯后性,這突出反映了交通參數和人們的出行習慣具有很強的相關性。
本文采用平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)和擬合優度可決系數R2作為模型預測精度的評價指標。MAE表示的是真實值和預測值之間的絕對誤差的平均值;RMSE可以測量誤差的平均大小,是真實值與預測值偏差的平方與實測次數n比值的平方根;R2可以衡量預測曲線對于真實數據擬合效果的好壞,R2越大說明擬合效果越好,R2的最優值為1[20]。

(14)
(15)

(16)
設置超參數回溯時間窗為24,即每次輸入一個交通信息數據,模型都需要考慮前24 h數據的值;設置分批大小為32,即模型一次訓練所選取的交通信息數據數,可以減少模型訓練的時間,從而能及時反饋預測的值;學習率為5×10-4,用以反向傳播更新梯度參數和權重系數;隱藏層單元數設置為100個;層數設置為4層;最后設置迭代次數為100次。
為檢測模型精度,將所選模型和其余基準模型進行對比,基準模型包括:長短期記憶模型(LSTM)、門控循環模型(GRU)、Transformer模型。
本實驗采用青島膠州灣海底隧道交通量數據,以青島市市南區-黃島區作為研究對象。將2021年7月1日-2022年5月18日按時間跨度為1 h交通量數據信息進行劃分,將前面80%的數據作為訓練集,最后20%的數據作為測試集用以判斷訓練后模型的性能狀況。
分別通過4種模型對海底隧道交通量數據進行訓練和預測,如表2所示,在4種模型中,AGRU-Trans融合模型的MAE值和RMSE值相比基準模型最小,其R2也最接近于1,具有良好的預測性能與精度。

表2 各模型預測效果比較
通過表2可以看出4種模型的R2均大于80%,可以認為4種模型在交通量預測上均有較好的預測性,而Transformer模型預測誤差相對更大,究其原因為Transformer模型算法完全基于self-attention,對于位置之間的信息有一定的丟失。GRU模型的擬合程度略高于LSTM模型,這與時空序列預測的結論一致[21]。LSTM,Transformer,GRU模型的MAE值相比AGRU-Trans分別大了31.48%,67.55%,20.57%;RMSE值分別增長了35.64%,38.46%,32.03%。

由于交通量數據多、重復率高且交通量變化規律呈現出周期性和時間相關性,為更清晰展示模型預測結果,本文選取基準模型中預測性能最好的GRU模型與本文所提出的AGRU-Trans融合模型為研究對象,對某包含早晚高峰時刻的120個預測數據和真實數據進行對比。從圖7中可以直觀看出,AGRU-Trans融合模型的預測結果與真實數據貼合性最好,預測精度高于基準模型,在交通量波動大的時段預測結果更接近真實值。
1) 通過對循環神經網絡和Transformer算法的研究,結合GRU與Transformer模型算法優點并加入自注意力機制,提出一種基于AGRU-Trans融合模型的海底隧道交通量預測模型用以對青島膠州灣海底隧道交通信息數據進行預測,該模型預測結果與真實數據貼合性好,具有良好的預測性能和精度。
2) 選取膠州灣海底隧道市南區-黃島區交通數據,通過AGRU-Trans融合模型與3種基準模型對比發現,LSTM,Transformer,GRU模型的MAE值相比AGRU-Trans分別大了31.48%,67.55%,20.57%;RMSE值分別增長了35.64%,38.46%,32.03%。表明:AGRU-Trans融合模型的預測結果與真實數據貼合性最好,預測精度均高于基準模型。
本文提出的基于AGRU-Trans融合模型的海底隧道交通量預測模型對交通規劃及交通控制有積極意義,基于此方法可為膠州灣海底隧道管理部門對車輛的誘導及管控提供理論參考。