
















摘" 要: 針對城市短時交通流隨機波動性強、可靠性低、預測精度差等問題,將變分模態分解(Variational Mode Decomposition, VMD)和改進麻雀搜索算法(Improve Sparrow Search Algorithm, ISSA)與長短期記憶(Long Short?Term Memory, LSTM)神經網絡相結合,建立一種短時交通流預測模型(VMD?ISSA?LSTM)。首先利用VMD對歷史原始交通流數據進行分解;然后采用佳點集、正弦函數擾動和Tent混沌映射等策略對標準的SSA算法加以改進,增強ISSA算法的尋優能力;最后,將每個分量送入ISSA?LSTM中進行預測,同時將預測結果線性疊加,得到交通流量預測值。以上海市中山北路?曹楊路口2018年11月1日—30日的歷史交通數據對模型進行驗證。結果表明,與LSTM、VMD?LSTM、VMD?SSA?LSTM等傳統預測模型相比,VMD?ISSA?LSTM模型的預測結果的平均絕對百分比誤差為1.278 4%,能夠更好地應用于短時交通流預測中。
關鍵詞: 短時交通流預測; 變分模態分解; 改進麻雀搜索算法; 長短期記憶神經網絡; 佳點集; 正弦函數擾動; Tent混沌映射
中圖分類號: TN711?34; U491.1+4" " " " " " " " " "文獻標識碼: A" " " " " " " " " 文章編號: 1004?373X(2024)08?0031?06
Research on short?term traffic flow prediction based on VMD?ISSA?LSTM
PANG Xueli1, SONG Kun2, YAO Hongyun1, LI Yibo1, CAO Zhifu1
(1. College of Traffic amp; Transportation, Chongqing Jiaotong University, Chongqing 400074, China;
2. College of Electronic and Information Engineering, Guangdong Ocean University, Zhanjiang 524088, China)
Abstract: In allusion to the problems of strong random fluctuation, low reliability and poor prediction accuracy of urban short?term traffic flow, a short?term traffic flow prediction model (VMD?ISSA?LSTM) is established by coupling variational mode decomposition (VMD) and improved sparrow search algorithm (ISSA) with long short?term memory (LSTM). VMD is used to decompose the historical original traffic flow data. Then, the standard SSA algorithm is improved by means of the good?point set, sine function perturbation and Tent chaotic mapping strategy to enhance the optimization ability of ISSA algorithm. Each component is sent to ISSA?LSTM for prediction, and the prediction results are linearly superimposed to obtain the traffic flow prediction value. The model is verified by the historical traffic data from November 1, 2018 to November 30, 2018 at the intersection of Zhongshan North Road and Caoyang Road in Shanghai. The results show that in comparison with the traditional prediction models such as VMD?SSA?LSTM, LSTM and VMD?LSTM, the average absolute percentage error of the prediction results of the VMD?ISSA?LSTM model is 1.278 4%, which can be better applied to short?term traffic flow prediction.
Keywords: short?term traffic flow forecasting; variational mode decomposition; improved sparrow search algorithm; long short?term memory neural network; good?point set; sine function perturbation; Tent chaotic map
0" 引" 言
隨著社會的持續進步,隨之而來的車輛激增和交通量的急速上升使得城市道路越來越擁堵,因此,精準且及時的交通預測變得至關重要。由于受到道路條件和人為因素的雙重影響,城市道路交通系統呈現出復雜性,主要影響因素有:人們的出行模式、上下班高峰期、氣候變化、節假日等,這些因素以非線性方式相互影響,共同作用于交通流量[1?2]。因此,如何準確預測交通流,一直是交通研究領域的焦點和難題。
近年來,由于深度學習模型對復雜非線性關系的建模能力顯著,它在交通狀態預測等多個研究領域得到了廣泛的關注。張陽等人改進了時間序列數據的小波包分解,并將分解后的子序列輸入到LSTM模型中進行預測,即使在小樣本情況下也能獲得較高的預測精度[3]。于德新等人針對短期交叉交通流特性,建立了GRU?RNN模型,利用循環神經網絡(RNN)對大量交通數據進行時空關聯的序列分解和重建,從而提高了預測模型的實時性和實用性[4]。羅向龍等人通過對交通數據的規律性和時空特性進行分析,提出一種KNN?LSTM預測模型,運用KNN算法從檢測點提取數據并構建數據集,輸入到LSTM模型中,得到了良好的結果[5]。L. Bharti等人針對BiLSTM模型預測精度的不足,采用PSO算法來尋找網絡模型更佳的參數,成功地提高了預測的精度[6]。然而這些方法在進行短期交通流預測時,仍然存在諸如算法穩定性不足、預測精度較低等問題。
為了應對上述問題,本文在交通流的時空特性基礎上,通過對高峰期的交通流進行分析,選擇LSTM神經網絡作為預測模型,提出一種VMD?ISSA?LSTM的短時交通流預測模型。
1" VMD?ISSA?LSTM交通流預測模型
1.1" 變分模態分解算法(VMD)
為了得到短時交通流數據在不同時間尺度上的變化情況,降低短時交通流序列的非平穩性,引入VMD算法[7]。VMD算法是一種自動自適應、非遞歸的信息處理方法,能夠將非穩定性和非線性的短時交通流數據集分解為多個相對平穩的子序列。VMD算法分解的具體步驟如下:
1) 通過希爾伯特變換計算相關解析信號并構建頻譜。
2) 估計各自的中心頻率,將模態頻譜轉移到基頻帶。
3) 通過梯度的L2范數估計帶寬,產生的約束變分問題為:
[min{uk},{ωk}k?tδ(t)+jπtuk(t)e-jωkt22s.t." kuk=f] (1)
式中:{uk}和{ωk}分別為子模態函數和對應的中心頻率;δ(t)為狄拉克分布。
為了得到變分模態的最優解[8],引入二次懲罰項a和拉格朗日乘數 λ,得到表達式為:
[L({uk},{ωk},λ)=ak?tδ(t)+jπt·uk(t)e-jωkt22+" " " " f(t)-kuk(t)22+λ(t),f(t)-kuk(t)] (2)
1.2" 麻雀搜索算法(SSA)
麻雀搜索算法是借鑒動物行為的群智能優化算法。在麻雀種群中,分為發現者、追隨者、警示者三組。其中,發現者擁有較好的適應度,為整個種群尋找更好的覓食區域和方向;追隨者利用發現者尋找食物;負責警示的麻雀發現危險,即大于所設定的安全值,發現者將帶領整個種群前往安全地帶。發現者、跟隨者、警示者位置更新公式如下:
[xt+1i,d=xti,d·e-iα·itermax," " " " " R2≤STxti,d+Q·L," " " " " R2gt;ST] (3)
[xt+1i,d=Q·exwti,d-xti,diw," " " " " " " " " " " " " "igt;n2xbtd+xti,d-xbti,d·A+·L," "i≤n2] (4)
[xt+1i,d=xbti,d+η·xti,d-xbti,d," " " " " figt;fgxti,d+K·xbtd-xwti,dfi-fw+ε," " "fi=fg] (5)
1.3" 改進麻雀搜索算法(ISSA)
1.3.1" 佳點集初始化種群策略
為了使麻雀搜索算法更快尋找到最優解,生成的初始位置需要盡可能地覆蓋搜索空間,故引入佳點集理論[9]。佳點集理論是一種可以在多維空間內生成均勻分布的數論方法,其原理是假設在s維歐氏空間中存在單位立方體Gs,若[r∈Gs],則有:
[Pn(k)={({r(n)1?k},{r(n)2?k},…,{r(n)s?k}),1≤k≤n}] (6)
式中:[Pn(k)]為佳點集;r為佳點;n為佳點數量;s為空間的維度。本文中r取值為:
[r=2cos2πkp," 1≤k≤S] (7)
式中p為滿足(p-ε[)2]≥s的最小素數。
基于佳點集理論構建的初始化種群具體計算公式如下:
[xij=ubj-lbj·rij·k+lbj] (8)
1.3.2" 正弦函數擾動策略
為了解決算法在迭代過程中麻雀傳遞信息不及時問題,在跟隨者中加入正弦函數擾動。新的位置更新公式如下:
[xt+1i,d=sin(2πQ)·exwti,d-xti,diw," " " " " igt;n2xbtd+xti,d-xbti,d·A+·L," "i≤n2] (9)
1.3.3" Tent混沌映射策略
在自然界中麻雀發現危險后,并不會采用理性的逃脫方式,而是以一種非理性的方式逃脫危險區域。為了模擬麻雀逃離危險區域行為,引入Tent混沌映射[10]方法來重新生成新的麻雀位置,即:
[ xt+1i,d=Tentxti,d," " " "fi=fgxt+1i,d= xt+1i,d," " " " " " " "fxt+1i,d lt;" fxti,dxti,d+Q," " " " " 其他] (10)
1.4" 長短期記憶神經網絡(LSTM)
LSTM[11]網絡由輸入層、隱藏層、循環層和輸出層構成。為解決循環神經網絡(RNN)的梯度消失和梯度爆炸問題,在隱藏層中添加記憶單元。隱藏層內有輸入門、遺忘門和輸出門控制單元。
設定序列x=x1,x2,…,xn,RNN網絡模型的迭代運算公式可以表示為:
[ht=fa(wxhxt+whhht-1+bh)yt=whyht+by] (11)
式中:w表示權重系數矩陣;b表示偏置向量;fa表示激活函數。
LSTM網絡模型的隱藏層結構如圖1所示。
LSTM網絡前向運算公式如下:
[it=σ(wxixt+whiht-1+wcict-1+bi)ft=σ(wxfxt+whfht-1+wcfct-1+bf)ct=ftct-1+ittanh(wxcxt+whcht-1+bc)ot=σ(wxoxt+whoht-1+bo)ht=ottanh(ct)] (12)
式中:i為輸入門;f為遺忘門;c為細胞狀態;o為輸出門;w為權重系數矩陣;b為偏置向量。
1.5" VMD?ISSA?LSTM預測模型
建立良好的LSTM模型的難點在于確定網絡神經元個數和學習率。本研究結合ISSA算法搜索LSTM網絡最優神經元個數和學習率,使得模型在測試集的平均絕對百分比誤差最小,從而提高預測模型精度。學習算法具體步驟如下:
1) 測試與訓練數據集數據歸一化處理。
2) 劃分測試集與訓練集。
3) 適應度函數初始化。
4) 采用ISSA算法搜索LSTM的神經元個數和學習率。
5) 運用神經元個數和學習率重新訓練LSTM。
6) 數據反歸一化得到預測結果。
2" 結果與分析
2.1" ISSA算法驗證
為了驗證ISSA算法的優化性能,選取F1、F2、F5、F6、F10、F11、F14、F15共8個測試函數進行實驗[12],相關參數設置見表1。
為了方便評估算法,本文將初始種群統一設置為30,最大迭代次數為50,每個算法獨立運行100次,以均值和方差作為評價標準,同時選擇多個較為完善的算法進行對比,包括PSO[13]、SSA、GWO[14]、DBO[15]。計算結果見表2。從表2可以得出,ISSA與PSO、SSA、GWO、DBO算法相比,總能準確找到最優解,具有較好的全局開發和局部開發能力。通過對比發現,提出的正弦函數擾動和Tent混沌映射策略能有效避免算法陷入局部最優解(最好的結果用加粗表示)。
圖2顯示了不同算法在迭代過中的收斂過程。在大多數測試圖中,ISSA算法無論是在收斂速度還是在收斂精度方面都擁有絕對的優勢。
2.2" VMD?ISSA?LSTM算法驗證
為了驗證模型的可行性,選擇上海市中山北路?曹楊路口2018年11月1日—30日的歷史交通數據對模型進行驗證。
首先將原始數據集按7∶3比例進行數據劃分,70%作為訓練集合,30%作為測試集合,再將訓練集與測試集的數據送入VMD中進行處理。
VMD分解結果如圖3所示。
其次將分解后的值送入ISSA?LSTM中進行數據預測,考慮到模型的實時性,將ISSA的種群數量設置為30,最大迭代次數設置為10次。為了以可靠的方式呈現實驗結果,本研究隨機抽取30個獨立樣本進行實驗,得到預測結果的相對誤差如圖4所示。
由圖4可得本文模型的預測值絕對誤差最低,更接近真實值。
為了進一步評估模型的性能,選取4種預測模型,統一采用均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、擬合優度(R2)進行評估,得到的預測結果如表3所示。
從表3可以得出,VMD?ISSA?LSTM神經網絡融合算法模型在擬合優度、均方根誤差、平均絕對百分比誤差三種性能指標上優于LSTM、VMD?LSTM、VMD?SSA?LSTM等傳統預測模型。
3" 結" 語
本文針對城市短時交通流隨機波動性強、預測精度低、穩定性差等問題,提出一種VMD?ISSA?LSTM的短時交通流預測模型。從實驗數據分析發現:經過VMD算法進行數據處理后,可以有效降低原始數據集中的噪聲;與LSTM、VMD?LSTM、VMD?SSA?LSTM等傳統預測模型相比,本文提出的預測模型既可以提高預測精度, 也具有良好的穩定性,能夠更好地應用于智能交通系統中。團隊下一步將考慮短時交通流多步預測,以提供更精確的交通信息。
注:本文通訊作者為姚紅云。
參考文獻
[1] 劉銘,魚昕.基于改進LSTM算法的短時交通流量預測[J].桂林理工大學學報,2021,41(2):409?414.
[2] 曾蓉,黃德啟,魏霞,等.改進WOA優化LSTM神經網絡的短時交通流預測[J].新疆大學學報(自然科學版),2022,39(2):242?248.
[3] 張陽,楊書敏,辛東嶸.改進小波包與長短時記憶組合模型的短時交通流預測[J].交通運輸系統工程與信息,2020,20(2):204?210.
[4] 于德新,邱實,周戶星,等.基于GRU?RNN模型的交叉口短時交通流預測研究[J].公路工程,2020,45(4):109?114.
[5] 羅向龍,李丹陽,楊彧,等.基于KNN?LSTM的短時交通流預測[J].北京工業大學學報,2018,44(12):1521?1527.
[6] BHARTI L, POONAM R, KRANTI K. Short?term traffic flow prediction based on optimized deep learning neural network: PSO?Bi?LSTM [J]. Physica a: statistical mechanics and its applications, 2023(2): 625.
[7] 孫國梁,李保健,徐冬梅,等.基于VMD?SSA?LSTM的月徑流預測模型及應用[J].水電能源科學,2022,40(5):18?21.
[8] 邴其春,張偉健,沈富鑫,等.基于變分模態分解和LSTM的短時交通流預測[J].重慶理工大學學報(自然科學),2023,37(5):169?177.
[9] LI G, CUI Q, WEI S, et al. Long short?term memory network?based wastewater quality prediction model with sparrow search algorithm [J]. International journal of wavelets, multiresolution and information processing, 2023, 21(6): 194.
[10] 李大海,劉慶騰,王振東.融合Tent混沌和維度學習的陰陽對算法[J].計算機工程與設計,2023,44(8):2320?2328.
[11] DAVID D O, MARIANA R, ZAGO G T, et al. Forecasting vehicular traffic flow using MLP and LSTM [J]. Neural computing and applications, 2021, 33(24): 17245?17256.
[12] HOANG?LE M, THANH S, GUY T, et al. Termite life cycle optimizer [J]. Expert systems with applications, 2023, 213(PC): 109.
[13] LI X Z, MAO K Z, LIN F F, et al. Particle swarm optimization with state?based adaptive velocity limit strategy [J]. Neurocomputing, 2021, 447: 10911.
[14] MIRJALILI S, MIRJALILI S M, LEWIS A. Grey wolf optimizer [J]. Advances in engineering software, 2014, 69: 46?61.
[15] XUE J, SHEN B. Dung beetle optimizer: a new meta?heuristic algorithm for global optimization [J]. The journal of supercomputing, 2023, 79(7): 7305?7336.
[16] 李書群,陳鈺,楊雨婷,等.基于佳點集人工魚群的點云配準算法[J].合肥工業大學學報(自然科學版),2023,46(9):1203?1209.
作者簡介:龐學麗(1996—),女,云南昆明人,碩士研究生,主要研究方向為交通運輸規劃與管理。
姚紅云(1976—),女,湖南株洲人,博士,教授,主要研究方向為公路、水路運輸。