徐先峰, 宋亞囡, 黃劉洋, 夏振, 潘卓毅
(長安大學 電子與控制工程學院,陜西 西安 710064)
經濟社會發展,交通運輸先行。隨著我國居民汽車保有量的不斷增加,給道路交通系統帶來的壓力也越來越大,交通事故和能源短缺等問題日益嚴重,對居民的出行造成了許多不便[1]。
早期的交通流預測研究主要都是基于參數化模型展開的。在具有噪聲和干擾的環境中,參數化模型的預測結果往往不盡人意。因此人們逐漸將重心從參數化模型轉移到非參數化模型的研究上[2-4]。但單一的預測模型預測精度很難達到要求,組合預測模型的思路是將多種預測模型進行融合,提高預測精度。Chen等人構建多個非線性LSSVR基本模型進行預測[5]。Cai等人提出了一種使用GSA搜索最佳SVR參數的混合交通流量預測模型[6]。Zhang等人研究應用門控遞歸神經網絡來預測考慮天氣條件下的城市交通流量[7]。
本文在充分利用交通流時空信息的基礎上,利用KNN算法完成待測觀測點的上下游觀測點空間相關性的遴選,在完成二維輸入數據矩陣的構造后,研究了基于卷積神經網絡的交通流空間特征的提取;結合Bi-LSTM對時間特征的提取,完成了KNN-CNN-BiLSTM預測模型的搭建;分析了用于交通流空間特征優化的最佳K值以及預測模型的超參數設置。與其他的主流預測模型進行性能對比可以得出,本文提出的KNN-CNN-BiLSTM模型預測精度高,是一種精準有效的交通流預測模型。
組合預測模型的輸入是從觀測點實測并經過預處理和KNN算法遴選后的交通流量數據,輸入為二維矩陣的數據形式。預測模型的前半部分是卷積神經網絡層,用于交通流數據的空間特征提取,預測模型的后半部分是雙向LSTM網絡,用于提取交通流數據的時間特征,模型使用全連接層來輸出最后的預測交通流量值。KNN-CNN-BiLSTM組合預測模型的體系結構如圖1所示。

圖1 KNN-CNN-BiLSTM組合預測模型示意圖
通常在KNN算法中使用較多距離,包括曼哈頓距離、歐式距離和最大距離等。在這三種距離計算方法中,歐氏距離通過計算兩組序列的差值平方和來衡量數據之間的距離,考慮了各個時間段之間序列的相似程度。本文選用歐氏距離用于計算序列之間的距離,運用KNN 算法對相關監測站點的交通流進行篩選,達到優化數據集的作用。
在交通流預測問題中,CNN常常用于預測模型的底端部分,對歷史數據的空間特征進行捕捉并以特征向量的形式傳送給時間序列預測部分。雙向LSTM模型可以同時考慮兩個方向的歷史數據,可以更好地利用時間序列數據中包含的所有信息。雙向LSTM的結構如圖2所示。

圖2 雙向LSTM結構示意圖
本文的交通流試驗樣本數據來自美國交通研究數據實驗室(TRDL),其編號包括了I35E、 I394和TH62等高速公路,由美國交管部門在各個高速公路上布置的檢測器來獲取全年的交通流量。本文以2016年2月1日至2016年5月31日共四個月的交通流量數據作為試驗樣本,采用間隔為15 min的交通流量作為樣本數據。
本文采用KNN算法對預測節點與上下游的觀測點進行重要程度的排序,實現有效觀測點信息的提煉析取和對無效信息的過濾清洗。通過模型提取時空特征來預測出下一個時間點的交通流,從而實現短時交通流預測。
由表1可知,當K值取6時,模型可以獲得最佳的預測性能。此時,選取的空間相關性最大的監測節點編號分別為S896、S898、S894、S895、S893和S899,均位于待測節點的上下游路段。

表1 不同組合情況下遴選的觀測點編號
圖3、圖4分別展示了不同預測模型的周內、周末預測效果,其中SVR模型的預測效果最差,而本文利用時空信息的KNN-CNN-BiLSTM模型預測效果最佳。

圖3 不同模型周內預測

圖4 不同模型周末預測
將本文提出的KNN-CNN-BiLSTM模型與目前主流的預測模型對比分析可以得出,本文提出的KNN-CNN-BiLSTM模型相比于目前主流的交通流預測模型,其預測精度提升明顯,對比結果如表2所示。

表2 各種算法預測性能對比表
最后,本文將經過KNN篩選后的數據集和未經過篩選的數據集分別送入預測模型的輸入。由表3可知,經過KNN算法篩選后的數據集可以更好地利用待測節點上下游節點的時空相關性,經過優化后的輸入數據集可以改善模型的預測精度,大幅縮短預測模型的運行時間。預測的具體結果如表3所示。

表3 KNN篩選對試驗結果的影響
本文提出了利用交通流時空信息的KNN-CNN-BiLSTM交通流量預測模型,并結合美國交通實驗室的實測交通流數據完成了模型搭建和精細調參。結果表明:KNN算法可以有效地對上下游觀測點進行遴選,經過遴選優化后的數據集可以改善模型的預測精度;在考慮交通流時空信息的情況下,將交通流的時空二維數據一起作為預測模型的輸入,根據交通流的空間相關性改變輸入數據的形式,提高了預測結果的準確性。因此,本文提出的基于KNN-CNN-BiLSTM的交通流預測模型是一種精準有效的模型,具有實際推廣應用價值。