殷禮勝 劉 攀* 孫雙晨 吳洋洋 施 成 何怡剛
①(合肥工業大學電氣與自動化工程學院 合肥 230009)
②(武漢大學電氣與自動化學院 武漢 430072)
短時交通流預測也稱為交通流量預測,是實現智能交通系統有效誘導和控制的關鍵,其研究對于提升道路管控水平和緩解路網交通壓力具有重要的意義[1,2]。短時交通流存在著較強的非線性、非平穩性以及時序相關性特征[3],各專家對此提出了許多行之有效的智能預測模型和算法。王博文等人[4]提出了結合自回歸滑動平均以及支持向量回歸優勢的組合模型,該組合模型對交通流量序列中非線性及線性分量均具備較好的預測能力,但忽略了路網交通流量中非平穩性、時序相關性對預測精度的影響。于德新等人[5]提出了一種基于門控循環單元與循環神經網絡的交通流量預測模型,其對時序特性的捕捉精度良好,但訓練時間過長且未考慮交通流量序列中的非平穩性特征。聶玲等人[6]基于自適應噪聲完全集合經驗模態分解與排列熵算法,對具備復雜性和非平穩性的交通流量序列分別建模預測,有效提高了非平穩性交通流量序列分離時的精度。Liu等人[7]將變分模態分解與數據處理分組方法相結合,有效降低了交通流量序列中的波動性與非平穩性,然而文獻[6,7]均增加了模型訓練的復雜度,導致預測收斂速度降低。Yang等人[8]提出一種基于經驗模態分解及疊加自動編碼器的混合多步預測模型,其在計算時間及非線性非平穩交通流量的預測精度方面更為穩定和準確,但其未關注疊加自動編碼器的結構與參數設置是否達到最優,尚需要更進一步的研究。
從交通流量序列的非線性、非平穩性及時序相關性特征考慮,以上模型從1或2個方面較好地提升了模型預測精度或收斂速度,但由于未將三者全面綜合地考慮,仍存在較大的改進空間。對此,本文將互補集合經驗模態分解(Complementary Ensemble Empirical Mode Decomposition, CEEMD)能夠細化交通流量時間序列非平穩性[9]優勢、麻雀搜索算法(Sparrow Search Algorithm, SSA)收斂速度快及尋優能力強[10]特點、雙向門控循環單元(Bidirectional Gated Recurrent Unit, BiGRU)深度挖掘交通流量序列中的時序相關性[11]優點三者相結合,擬提出一種基于互補集合經驗模態分解和改進麻雀搜索算法(Improved Sparrow Search Algorithm, ISSA)優化雙向門控循環單元的組合模型,將神經網絡與先驗特征相結合,創新點包括:
(1) 采用邊界局部特征延拓優化CEEMD過程中存在的端點飛翼問題,利用改進后的CEEMD算法將原始交通流量序列分解為一系列本征模態分量,細化了交通流量序列非平穩性,提取了其中的先驗特征。
(2) 采用ISSA對BiGRU網絡中的權值進行訓練,同時在SSA中添加記憶歷史最優權值參數信息以加快訓練收斂速度,在發現者位置更新公式中引入線性動態自適應權重以提高其全局搜索及局部開采能力。
CEEMD是一種分解非線性和非平穩信號的新方法[12],能夠有效地提取交通流量中的先驗特征[13],其通過向交通流量序列中添加符號相反的白噪聲,以減少交通流量分量中的殘余噪聲量。然而研究過程中發現,CEEMD雖然減少了模態混疊[14]的產生,但在序列分解時出現了明顯的端點飛翼現象,對模態分解精度造成較大誤差。本文將針對CEEMD過程中的端點飛翼進行改進,具體見4.1節,CEEMD具體步驟描述如下:
算法1 基于交通流量時間序列的互補集合經驗模態分解:
步驟1 向交通流量序列X=(x1,x2,...,xt,...,xn)T中加入符號相反的白噪聲±Nu,利用式(1)得到正噪聲序列和負噪聲序列,其中,xt為第t個采樣時刻的交通流量數據,n為交通流量序列采樣點總數
其中,u=1,2,...,o;o為添加交通流量高斯白噪聲的總組數;Nu為第u次添加的高斯白噪聲序列;
步驟2 由式(2)對交通流量正、負噪聲序列進行EMD處理,分別得m個正、負交通流量分量,
其中,v=1,2,...,m;m為交通流量模態分量的總數;(·) 為第v次運算的經驗模態分解函數;
步驟3 由式(3)得到第v個交通流量模態分量序列 IMFv與交通流量序列X間的關系式
其中,IMFg為編號為g的IMF交通流量模態分量序列;R為CEEMD分解后的交通流量殘差分量。
雙向門控循環單元將正反向傳播機制[15]與門控循環單元(Gated Recurrent Unit, GRU)網絡結合,使得BiGRU模型能夠較單向的GRU模型挖掘更多交通流量序列信息[16]。單個GRU由重置門rt和更新門zt來實現當前交通流量隱含狀態信息ht以及上個時刻候選隱含狀態信息ht-1的保留和更新[17],具體步驟描述如下:
算法2 基于雙向門控循環單元的交通流量預測算法:
步驟1 計算其中重置門rt及更新門zt輸出,過程如式(4)、式(5)所示
其中,wr和ur為重置門的權值系數;wz和uz為更新門的權值系數;br,bz表示重置門與更新門的偏置項;
其中,wxh和whh為網絡權值系數;bh為隱含層偏置項; Tanh為雙曲正切激活函數;
麻雀搜索算法是受到麻雀覓食和躲避狩獵者等一系列行為啟發而提出的一種新型元啟發式群體智能優化算法,具備全局搜索及局部開發能力強的優勢,其麻雀成員分為發現者、追隨者及警戒者3類[18]。
(1) 發現者主要負責尋找可能存在的食物,并為整個群體提供方向導向,發現者數量占據整體種群數量10%~20%,且發現者和追隨者在進化的過程中,在滿足進化規則的條件下,可以互換角色。
(2) 追隨者利用發現者獲取食物,當一部分追隨者監控發現者能力水平較高時,會主動地進行食物資源爭搶;如發現者本身能量水平較低時,前往其他區域繼續覓食。
(3) 警戒者在種群受到威脅時,及時向其他麻雀發出警報并采取反捕食行為。位于種群外圍的麻雀易受到捕食者威脅,因此需要更新位置向種群中心聚攏,位于種群中心的麻雀需調整位置,使其更接近鄰伴。
由于交通流量序列左右邊界處的兩端信號不一定為極值點,導致樣條曲線在端點處進行左或右微分時發散,這種情況稱為端點飛翼。端點飛翼的出現會嚴重影響信號模態分解效果,因此,本文使用邊界局部特征延拓優化CEEMD算法以改善端點飛翼問題,左邊界延拓示意圖如圖1所示,其中虛線為延拓交通流量信號,,分別為極大值,的時序點;,分別為極小值,的時序點。
圖1 交通流量左邊界局部特征延拓示意圖
本文根據信號邊界處局部鄰近極值點位置進行特征延拓,在左、右邊界處分別添加一對極大值、極小值點。由邊界處兩對鄰近極大值、極小值點分別計算延拓極值點的平均幅值及時序位置,具體步驟如下:
算法3 邊界局部特征延拓優化端點飛翼的改進CEEMD算法:
BiGRU網絡采用傳統的梯度下降法迭代網絡參數,在梯度下降過程中易出現預測精度不足的問題[19]。對此,本文通過3方面的改進以提升組合模型預測精度及收斂速度,其具體思想如下:
(1) 引入尋優能力及迭代速度在新型群體智能優化算法中較優的SSA對BiGRU網絡進行參數擇優。
(2) 為提高收斂速度,在SSA中添加記憶歷史最優權值參數信息,即在對待優化權值參數訓練前,將已訓練完成的歷史最優權值編碼寫入,從而降低優化各權值參數時重新、反復地進行參數計算造成的負荷。
(3) 發現者為麻雀種群提供搜索方向,但難以同時兼顧全局及局部范圍內的尋優。為提升麻雀搜索算法全局搜索及局部開發能力,在發現者位置更新公式中引入線性動態自適應權重wt,其迭代前期初始值較大以便于發現者的全局搜索,后期自適應地減小,將搜索注意力從全局轉移至局部,其表達式如式(12)
步驟8 若h <8,即8個權值參數未全部訓練完成,則令h=h+1后返回步驟3順序執行;否則,輸出第q個BiGRU預測子網絡中的最優權值參數集合
交通流量序列具有較強的非線性、非平穩性及時序相關性,單一方法難以達到理想的預測效果。對此,將改進CEEMD算法、BiGRU及ISSA相結合,模型結構及其流程圖分別如圖2所示,具體步驟如下:
圖2 改進CEEMD-ISSA-BiGRU短時交通流組合預測模型結構及其流程圖
算法5 改進CEEMD-ISSA-BiGRU短時交通流組合模型預測算法:
步驟1 采用算法3對交通流量序列X=(x1,x2,...,xn)T執行邊界局部特征延拓后,分解得到一系列體現路網趨勢性、周期性及隨機性的交通流量模態分量IMF以細化交通流量序列中的非平穩特性;
步驟2 對分解后交通流量模態分量分別建模,采用算法4對各BiGRU網絡權值反復訓練,最終得到最優參數集合及各性能最優的BiGRU預測子模型;
步驟3 采用步驟2訓練完成的BiGRU預測子模型,分別對交通流量測試集模態分量進行預測,得到交通流量測試集模態分量的預測序列Hq=(h1,q,h2,q,...,hn*,q)T,其中n*表示待預測交通流量數據總數;
步驟4 由式(3),交通流量真實值由各交通模態分量及殘差分量R于等系數下相加而成,因此,總交通流量預測序列Y由各交通模態分量的預測序列Hq直接相加得到,即
為驗證本文組合模型的有效性,選取合肥市蕪湖路與徽州大道交叉口東路作為數據采樣點,采用2018年6月1日-20日6:00~18:00時段內時間間隔5 min的共2 400個交通流量數據,其中,選取前1 920個交通流量數據為訓練集,后480個交通流量數據為測試集,取測試集中前92個數據點為實驗結果展示曲線。
同時采用平均絕對誤差(Mean Absolute Error,MAE)、平均絕對值百分誤差(Mean Absolute Percentage Error, MAPE)和均方根誤差(Root Mean Squared Error, RMSE)作為模型的評價標準,其表達式為
改進CEEMD過程中,高斯白噪聲的標準差設置為0.01~0.4,ISSA-BiGRU網絡訓練過程中,固定學習率 lr為0.01或0.001,BiGRU隱含神經元個數在{32, 64, 128}中選取,麻雀數量 Np為20~100,發現者、跟隨者數量占比為20%和10%。根據前期研究經驗及多次實驗修正,所選取最優仿真參數設置如表1所示。
表1 仿真參數設置
5.3.1 改進CEEMD仿真實驗分析
以交通流量 IMF1分量為例,分析改進CEEMD能否改善端點飛翼問題。由圖3(a)和圖3(b)優化前后左、右邊界局部特征對比曲線可知,依據鄰近極值點規律性進行延拓后,左、右端點偏移幅值分別由10, 15降至正常值0附近,樣條曲線在邊界處的微分不再出現無窮大的情況,有效防止了 IMF1左、右邊界處的幅值發散。結合表2可知,左、右邊界經過局部特征延拓后,各交通流量模態分量的預測精度明顯提高。
表2 各預測模型的誤差對比
圖3 優化前后左、右邊界局部特征對比曲線
交通流量序列的非平穩特性指由于內部隨機性、周期性及趨勢性分量相互混疊,使得交通流量序列變得難以分析和預測的特性,經過改進CEEMD處理后,其非平穩性被顯式地分離出來,圖4(a)、圖4(b)為波動頻率大且幅頻小的隨機性分量,圖4(c)-圖4(e)為重復性強且波動規律明顯的周期性分量,圖4(f)-圖4(i)為波動性小且變化規律明顯的趨勢性分量,由于混疊程度降低,各模態分量變得更加平穩。交通流量序列的非線性特性同樣得到分離,圖4(a)-圖4(c)為線性分量,圖4(d)-圖4(e)為波動較大的非線性分量,圖4(f)-圖4(i)為較平滑的非線性分量,改進CEEMD改善了線性與非線性分量混疊的現象,降低了其復雜程度。綜上,改進CEEMD能夠有效分解交通流量非線性及非平穩性,使得待預測曲線復雜程度降低。
圖4 各交通流量分量預測結果曲線
5.3.2 消融實驗對比與分析
分別將組合模型與GRU, BiGRU, SSA-BiGRU,CEEMD-ISSA-BiGRU預測模型以及文獻[1,4]預測模型進行消融實驗對比。各預測模型評估指標如表2所示,為更加直觀地展示各模型之間誤差情況,將各基準預測模型性能指標以如圖5柱狀圖進行展示,其中,SBiGRU表示SSA-BiGRU、CISB表示CEEMD-ISSA-BiGRU、ImpCISB表示改進CEEMD-ISSA-BiGRU,各預測模型預測曲線圖如圖6所示。
圖5 各預測模型預測值與實際值的預測曲線對比
圖6 各預測模型預測值與實際值的預測曲線對比
為更清晰地展示各基準模型預測結果與原始交通流量數據之間的誤差情況,選取圖6中交通流量數值較小的時序點1-時序點20片段進行局部放大并逐一比對分析,各預測曲線局部對比如圖7所示。
圖7 交通流量時序點1-時序點20片段各預測曲線局部對比
(1) 如表2及圖7(a)所示,BiGRU網絡由于引入了雙向傳播機制,交通流量中時序相關性特征的挖掘能力明顯強于GRU,預測模型獲得了更充足的時序特征,其預測曲線較GRU更加貼合原始交通流量曲線,預測精度顯著提高,表明了本文選用引入雙向傳播機制的雙向門控循環單元網絡作為基準模型的優勢。
(2) 如表2及圖7(b)所示,麻雀搜索算法具備良好的搜索能力以及較快的迭代速度,因此利用SSA替代梯度下降法訓練所得的最佳網絡參數Bi-GRU網絡相較于一般BiGRU預測模型預測更為精準,其MAE降低了1.27,MAPE降低了2.15%,RMSE降低了11.07,驗證了SSA對提高預測模型精度的有效性。
(3) 如表2及圖7(c)所示,由于添加了記憶歷史最優權值參數信息,ISSA-BiGRU網絡具備更快的收斂速度,相比SSA在第17代才找到最優解,其在第12代時就能找到全局最優解。同時,引入線性動態自適應權重后,ISSA-BiGRU網絡的最優適應度由10.45降至6.03,在收斂速度和精度上均有了明顯提升。
(4) 如表2及圖3、圖7(d)所示,采用邊界局部特征延拓對原始交通流量序列端點處進行特征延拓后,組合模型在交通流量初始位置的飛翼問題明顯改善,CEEMD改進前后組合模型的MAE, MAPE及RMSE分別下降了0.46, 2.46%以及3.49,預測誤差顯著降低,驗證了改善端點飛翼問題能夠提高模型預測精度。
(5) 如表2及圖7(e)所示,本文組合模型彌補了文獻[4]對非平穩性考慮的缺失以及文獻[1]對端點飛翼問題的忽視,因此預測性能更加突出,其MAE、MAPE及RMSE指標較性能相對更優的文獻[1]分別下降了1.44, 1.30%及6.80,該結果表明,本文提出的組合預測模型在交通流量預測方面具備相當優越的性能。
5.3.3 泛化性能實驗對比與分析
為驗證該組合模型穩定的泛化能力,選取美國加利福尼亞交通流量數據集PeMSD8(PeMS交通數據集獲取地址:https://pems.dot.ca.gov),再次與文獻[1,4]預測模型進行對比,其預測性能指標如表3所示。
表3 PeMSD8數據集下預測模型的誤差對比
由表3可知,本文模型在PeMSD8輸入集下同樣展示出良好的預測性能,與針對線性與非線性分量卻忽略交通流量非平穩性的文獻[4]相比,其MAE, MAPE及RMSE下降了2.92, 1.59%及2.83,與考慮非線性及非平穩性但未優化EMD端點飛翼的文獻[1]相比,其MAE, MAPE及RMSE降低了0.83, 0.31%及1.71。綜上,本文組合模型在兩種數據集下,預測精度均優于最新交通預測模型,具備良好的泛化能力。
本文提出一種基于改進CEEMD和ISSA優化BiGRU網絡的組合預測模型。實驗結果表明,模型各組件均能有效提高其預測性能。當本文組合模型采用陌生交通流量樣本PeMSD8數據集的預測精度依舊高于文獻[1,4],具備有良好的泛化能力,然而因未考慮到復雜路網的空間依賴性,模型對上述兩種簡單結構路網預測性能較優,對于復雜多路口的交通流量預測效果一般。綜上,本組合模型可用于預估簡單結構路口或高速公路路況,在提高道路管控水平方面具備可觀的應用價值。此外,該組合模型為短時交通流預測提供了一種新的建模思路,但未考慮天氣、假期等外部因素的影響,因此可作為本文下一步的研究內容。