吳啟用, 廖嘉欣, 蘭小機
(江西理工大學土木與測繪工程學院,江西 贛州341000)
社會經濟的快速發展和城市規模的不斷擴大促使城市機動車保有量迅速增長,城市道路通行承載壓力不斷加大,交通擁堵現象已呈常態化蔓延趨勢。智能交通系統(Intelligent Traffic System,ITS)作為智慧城市的重要組成部分可以有效緩解交通擁堵,準確的短時交通預測則是其實現的關鍵。一般而言,對下一階段交通狀態預測的時間間隔不超過15 min稱為短時交通預測[1-2]。然而,交通狀態具有隨機性和復雜性,特別是隨著時間間隔的縮短,其呈現的非線性越強,預測難度也越大[3]。
目前,廣泛部署于城市內的各類傳感器為交通狀態的預測提供了可靠的數據支撐,按傳感器的運動狀態可將其劃分為固定位置的傳感器(微波傳感器、環路感應器、視頻檢測器、紅外檢測器及雷達檢測器等[4-5])和移動式傳感器(如GPS傳感器[6-7])。近年來,無線技術的快速發展使得配備有藍牙、WiFi等功能的智能移動設備大量普及,為交通信息的采集提供了新的思路。例如:Ahmed等初步驗證了無線探測技術在交通領域應用的可行性[8];文獻[9-10]研究了藍牙傳感技術在ITS中的應用,進一步揭示了無線技術服務于交通的潛力。
國內外針對短時交通狀態預測已開展了大量研究,相關方法可分為參數方法和非參數方法。常用的參數方法有自回歸綜合移動平均(Autoregressive Integrated Moving Average,ARIMA)和Kalman濾波模型,二者在處理平穩時序數據時表現良好,但由于交通狀態并非一直是平穩的,因此該方法不能很好地捕捉交通特征。非參數方法由于彌補了參數方法的這一不足而受到研究學者的關注,如傅貴等采用支持向量機回歸 (Support Vector Regression,SVR)構建預測模型,并以此預測交通流量[11];王雪菲等提出一種面向高速公路大數據的K近鄰(KNearest Neighbor,KNN)交通流預測方法,并驗證其相比ARIMA模型有更高的預測精度[12];薛紅軍等基于決策樹理論構建分類回歸樹模型,并對短時交通流參數進行了預測[13];Chen等將改進的小波神經網絡引入短時交通流預測模型中,獲得了更加穩定、準確的預測結果[14]。
從現有研究來看,交通預測建模大多采用的是傳統交通檢測數據,而鮮有涉及無線探測數據。為此本文利用WiFi探針獲取交通數據,結合長短期記憶(Long Short-Term Memory,LSTM)網絡進行交通預測建模,以交通狀態指數(Traffic State Index,TSI)作為道路交通擁堵預測目標,并通過試驗證明該方法的有效性和可行性,以期為未來交通預測方案提供新思路。
東莞市是珠三角區域中心城市之一,同時也是廣東省重要的交通樞紐和外貿口岸。近年來,東莞市汽車保有量不斷攀升,目前已突破300萬輛,交通擁堵現象時有發生。東莞大道是市內的主要交通干線,貫穿整個東莞的中心區,每天交通流量巨大。本文在東莞大道選取5個路段作為研究對象,每條路段兩端各安置一個WiFi探針,以東城中路路口至旗峰公園路口為待預測目標路段RP,其上游路段分別用RU1、RU2表示,下游路段分別用RD1、RD2表示,探針設備的分布地點如圖1所示。

圖1 探針設備的分布地點
信息技術的快速發展使得以WiFi為代表的無線通信技術逐漸普及,WiFi探針可根據WiFi技術的特點來捕獲周圍環境中可用的無線接入點(Access Point,AP)及開啟WiFi的終端所發出的請求幀信號,其中包含了部分不涉及用戶安全性的設備基礎信息,如媒體訪問控制 (Media Access Control,MAC)地址、信號強度、時間戳等[15-16]。WiFi探針的安裝和維護成本較低,其采樣頻率為毫秒至秒級,在實際中設備的漏檢率較低,因此,在特定的路口或路邊安裝WiFi探針可作為交通信息的采集工具。本文使用的WiFi探針數據為捕獲的車載AP發出的信號,其部分數據形式如表1所列。表1中gwid為探針的MAC地址;stamac為探針在某一時刻探測到的車載AP的MAC地址,可用作對車輛的唯一標識;ssid為車載AP的網絡名稱;ctime為時間戳;power為探測的信號強度。

表1 原始探針數據
由于收集到的WiFi探針數據集中存在部分低質量數據,需對其進行如下預處理:①剔除只出現一次的數據。該類數據無法構成有效的車流數據,故選擇刪除。②刪除異常記錄的數據。由于探針設備布設在路口,信號在傳輸過程中可能會受周圍環境的影響而產生異常,如同一個探測點在同一時間記錄兩條甚至多條相同的MAC數據,或在記錄過程中時間戳出現亂碼,這些數據對本研究無意義,故將此類數據也剔除。研究期間共獲得321 851 848條WiFi探針數據,經預處理后獲得有效數據175 970 793條。
當車載AP的MAC地址在某時刻被檢測點Oi探測到,在另一時刻又被其相鄰的下游檢測點Oi+1探測到,則可將此MAC地址記為一條數據流,在時間間隔T內該路段交通流數據可表示為fT={x1,x2,x3,…,xk}。為獲得更加接近實際車流量的樣本數,采用人工計數法輔以驗證,并通過式(1)獲得擴樣比例系數r。

式(1)中:fT表示15 min內通過MAC地址提取出的車流量;fK表示在同一時間段內通過人工統計的車流量,后經試驗得到比例系數r為0.25。
雖然交通流量是造成交通擁堵的一個重要因素,但車流量的大小與交通狀態并沒有直接關系,當車流量很小時,可能是路段擁堵嚴重無法通行或者路段空曠車輛較少[17]。目前不少城市采取交通狀態指數(TSI)衡量道路交通運行狀況,本文采用式(2)量化描述擁堵情況,并以此作為擁堵預測的目標。TSI的取值范圍為0~10,數值越大表示擁堵越嚴重。

式(2)中:vi表示路段i的平均車速,可通過探測到的MAC時差和連續探測點之間的距離進行計算;vi表示路段i的自由流車速,即指在交通量很小的條件下,車輛通過沒有信號交叉口的城市干道的最大速度。結合東莞大道實際情況,本文以該路段設計最大限速80 km/h作為自由流車速。
基于獲取的WiFi探針數據,以15 min為時間間隔構建完整的TSI時間序列。圖2展示了2019年11月第4周RP路段周四至周日的TSI變化趨勢。可以看出,周四與周五的TSI時間序列具有相似性,一天中TSI分別在8:00和18:00左右出現兩次高峰,即工作日具有明顯的早晚高峰,早晚高峰時TSI值較大,路況較為擁堵,而在周末則沒有表現出明顯的早晚高峰變化趨勢,圖2所描繪情況與實際情況較為吻合,可在一定程度上反映道路交通運行狀態。

圖2 工作日與非工作日TSI時間序列
長短期記憶(LSTM)網絡是一種基于循環神經網絡的變體網絡,其具備學習序列數據中長期依賴關系的能力,因此可以有效彌補傳統循環神經網絡的不足[18-19]。LSTM使用記憶模塊取代傳統的隱層神經元,并在其中添加細胞單元狀態用于存儲和訪問長期信息。單個LSTM記憶塊的結構如圖3所示。

圖3 LSTM模塊的結構
LSTM記憶塊結構的關鍵在于通過輸入門it、遺忘門ft和輸出門ot控制長期狀態c以達到長期記憶的目的。輸入門負責將即時狀態更新到長期狀態c,遺忘門負責控制前一時刻單元狀態中部分信息的取舍,輸出門負責控制是否將長期狀態c作為當前LSTM的輸出。當前一時刻的單元狀態ct-1沿圖3中最上方的記憶線傳播時,首先受到遺忘門ft的作用舍棄部分信息,保留下來的部分信息通過輸入門it和當前輸入的單元狀態c~進行信息的更新,最后經過一系列計算得到當前時刻的單元狀態ct;在記憶塊中的另一條主線上,前一時刻的輸出結果ht-1和當前時刻的輸入值xt在經過輸出門ot的運算后,與當前時刻的單元狀態ct共同確定了當前時刻LSTM的最終輸出結果ht。LSTM記憶塊結構中具體的前向計算過程如式(3)~式(8)。


其中,W和b分別為對應的權重矩陣和偏置向量;[ht-1,xt]表示將兩個向量連接成一個更長的向量;σ和tanh分別為sigmoid和tanh激活函數;?表示按元素相乘。
為更好地評估本文模型在WiFi探針數據上的表現及預測能力,選用均方根誤差(RMSE)、平均絕對誤差(MAE)和決定系數R2作為模型預測精度評定指標,計算公式為:

其中,yi和分別為實測值和預測值;N為測試數據集中的樣本數量。
神經網絡中不同超參數的設置會對模型的性能造成不同影響,本文將TSI數據集按照4∶1的比例劃分成訓練集和測試集,并選取以下幾個對LSTM網絡有較大影響的超參數進行調整,包括時間步長、最大訓練輪數、批次大小、學習率、優化算法和LSTM層神經元節點數量。其中,時間步長決定了需要通過前幾個時刻的值來預測下一刻的值,未來交通擁堵狀況不僅與當前時刻的狀態有關,還與前幾個時刻的狀態有關,若時間步長過長則會增加模型訓練時長,因此需通過不斷調整時間步長使模型性能達到平衡。經多次調整后,RMSE在時間步長為3時最小,故確定時間步長參數為3,如圖4所示。

圖4 時間步長參數的選取
在確定時間步長后,其余5個超參數采用網格搜索法進行優化選取。網格搜索法是目前相對直觀的一種參數優化方法,它可以通過枚舉搜索得到模型在限定網格內的全局最優解。本文中各超參數網設置如下:最大訓練輪數的取值范圍為[100,800],步長為100;批次大小的取值范圍為[10,60],步長為10;學習率的取值為[0.1,0.01,0.001,0.000 1];優化算法的取值為[SGD,RMSprop,Adam];LSTM層神經元節點數量的取值[16,32,64,128]。
表2列出了5種根據網格搜索法組合且具有較低RMSE的結果。當最大訓練輪數為800,批次大小為60,學習率為0.000 1,優化算法為Adam,神經元節點個數為64時超參數組合的RMSE最低,此超參數組合下模型的損失函數圖像如圖5所示,結合RMSE與損失函數二者變化情況來看即確定了整個網絡的各超參數。

表2 網格搜索調整結果

圖5 損失函數變化
通常LSTM神經網絡中擁有的層數越多,其相應的學習能力也就越強,但過多的網絡層數設置也越易造成過擬合,所需訓練數據也越多,訓練難度加大。因此,本文采用2個LSTM層捕獲時間序列特征,并在其后加入1個Dropout層防止過擬合,Dropout的比例依經驗設置為0.5其泛化能力最好,最后以1個Dense層對結果進行降維并輸出。整個網絡結構的可視化結果如圖6所示。

圖6 多層LSTM神經網絡結構
選取2019年11月1日—12月1日WiFi探針收集到的數據作為試驗數據集,并對該數據集以15 min為時間間隔進行處理,共得2 976條數據,其中前24 d的數據用于模型訓練,余下7 d數據用于模型測試,每條數據均包含該路段的交通流量、平均速度和TSI。
1)考慮流量/速度組合的TSI預測。對于短時TSI預測而言,其未來時刻的值不僅與當前以及前幾個時刻的TSI有關,還可能與流量、速度等交通信息相關,因此通過構建不同的組合方式作為模型的輸入可探究流量、速度對預測性能的影響。流量、速度及TSI這3個變量的不同組合形式如表3所列。

表3 流量、速度與TSI的不同組合
根據表3中的4種不同組合方式,分別對RU2、RU1、RP、RD1、RD25條路段用LSTM預測模型進行測試,其預測表現見圖7所示。從預測結果可以發現,A3和A4這兩種組合的表現要略好于A1和A2,而A3和A4均考慮了交通流量信息,因此可以推測流量對于模型提升TSI的預測精度有一定的影響。

圖7 不同組合的指標比較
2)考慮上下游信息組合的TSI預測。城市交通路網中每條路段都不是孤立的,在進行交通預測時,通常都會考慮時間和空間相關性。對TSI的預測不僅可以使用目標路段自身的歷史TSI數據,還可以使用其上下游路段的歷史TSI數據。在同時考慮歷史交通流量和TSI數據的基礎上,將目標路段RP與其上下游相鄰路段進行不同組合,并針對每一種組合使用LSTM模型進行預測,得到各個不同輸入變量組合的預測結果(表4)。由表4可知,組合4和組合9相較于其他幾種組合的預測精度要高,其中組合9使用全部5個路段的歷史交通流量數據和TSI數據作為預測模型的輸入,其預測精度最高。

表4 加入上下游信息的LSTM模型預測性能
表5列出了進行參數組合和不進行參數組合預測的對比結果,S1表示僅考慮目標路段的歷史TSI數據,S2表示考慮目標路段歷史交通流量和TSI數據,S3表示考慮目標路段及其上下游的歷史交通流量和TSI數據。可以看出,相比于不進行參數組合,即僅考慮歷史TSI數據的S1,進行了參數組合的S2與S3的各項評價指標均優于S1,但S3綜合了時空因素的影響,因此其預測精度要進一步優于S2,且相較于S1其RMSE降低了11.89%,MAE降低了12.22%,R2提升了3.6%。

表5 不同參數組合的預測結果對比
本文選取支持向量機回歸(SVR)和梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)兩種常用的機器學習方法與LSTM進行對比,以評估不同模型對TSI的預測表現。其中,SVR核函數采用徑向基函數,懲罰系數取值為200;GBDT的最大樹深度為5,弱學習器的最大數量為750。同時為方便比較分析,LSTM、SVR和GBDT均采用相同的變量輸入,即均以流量、TSI結合上下游信息作為組合變量輸入。3種模型的預測值、實際值和殘差在2019年11月29日的96個測試樣本上的表現如圖8所示,可以看出,3種模型均能較好地預測TSI的變化趨勢。

圖8 3種模型在2019年11月29日上的預測結果
表6列出了3種模型對1 d及7 d后數據進行預測獲得的各項評價指標,從整體上看LSTM的RMSE、MAE和R2均優于SVR和GBDT,即考慮時間傳播規律的深度學習模型對于原始數據的貼合性更好,證明了LSTM模型對短時交通擁堵預測的有效性。

表6 3種模型不同時長的預測結果
在數據驅動模式下的交通狀態建模中,存在數據采集設備成本較高、特定目標路段采樣量較少等問題,且以往關于WiFi等無線通信技術的研究多局限于室內客流檢測,對開放環境下城市道路交通狀況的檢測關注較少。為此,本文以WiFi探針作為一種新式交通傳感器獲取數據,并通過LSTM網絡建立城市道路短時交通狀態預測模型,基于東莞市東莞大道的TSI數據進行實證研究,得到以下結論:
1)用WiFi探針數據構建的交通狀態指數在一定程度上刻畫了道路交通運行狀態,其變化趨勢基本符合道路實際運行情況,表明WiFi探針數據在交通領域具有一定的應用潛力。
2)根據LSTM網絡結構及各種交通參數的特點,探究不同參數的最佳組合方式,發現在考慮空間相關性的情況下,交通流量與交通狀態指數組合作為網絡的輸入獲得的預測效果最好,說明該網絡不僅利用了歷史數據的時間相關關系,還利用了上下游路段的空間相關關系。
本文雖研究了WiFi數據在短時交通擁堵預測方面的應用,但由于無線通信檢測技術應用于交通領域的相關研究較少,而開展大量實證性檢驗的成本又過高,因此WiFi探針數據的效用情況還需通過其他手段(如融合GPS、微波雷達等多源數據)進一步驗證。同時限于當時所用探針數量,僅針對主干道路進行了研究,若日后進行大規模部署則可從更大尺度研究道路運行狀態。