









摘要:準確的短時客流預測可以為城市軌道交通的良好運營提供保障,但軌道交通的短時客流具有非線性和高隨機性等特點,為了提高對短時客流的預測精度,提出將ISSA算法和LSTM模型進行組合,構建城市軌道交通短時客流預測模型.針對SSA算法收斂速度慢,容易陷入局部最優解的問題,引入黃金萊維飛行策略,通過動態調整探索者移動步長的方法,使得它在未知范圍內搜索時,能夠覆蓋更大的范圍,提高SSA算法全局搜索的能力.通過使用ISSA算法對LSTM模型的隱含層、學習率和迭代次數的神經元個數進行優化,構建ISSA-LSTM組合預測模型,用于城市軌道交通短時客流的預測.將該模型與BP、LSTM和SSA-LSTM等3種短時客流預測模型進行對比,結果表明:在針對工作日和非工作日客流的預測中,ISSA-LSTM模型預測誤差最小,具有較好的預測效果.
關鍵詞:短時客流預測; 改進麻雀搜索算法; 長短時記憶神經網絡; 組合模型
中圖分類號:U121
文獻標志碼:A
文章編號:1001-8395(2025)01-0105-09
doi:10.3969/j.issn.1001-8395.2025.01.010
中國軌道交通具有客流量大、分布密度高、乘客坐乘時間密集等特點,因此全面分析交通運營的特點有助于準確把握客流的分布規律,減少資源浪費,同時也可以為居民出行提供參考.根據預測時間的長短可以將軌道客流量的預測分為3類:中長期、短期、短時.其中,中長期預測時間主要在未來3~10 a,短期預測時間主要在未來1 a以內,短時預測主要在未來15 min以內[1].中長期和短期預測主要應用在軌道線網規劃和建設的初期,而短時預測主要運用在日常運營方面,通過預測客流量在不同時間呈現出的不同規律,以便動態調控列車數量或者發車次數來控制交通運營成本.
短時預測由于容易受外界因素干擾,所以具有很大的波動性和不確定性,目前大部分學者對軌道客流的短時預測理論方法分為3類:基于數理統計模型、基于智能算法模型和基于多種混合模型[2].
1) 基于數理統計的模型[3].要求變量或者進行多次差分處理后的變量之間要具有一定線性相關性,對數據的統計學特征有一定要求,但是軌道交通的短時客流量由于時間間隔過短從而隨機性很大,往往并不滿足這些要求.除此以外,軌道短時客流量預測運用到實際中需要模型具有實時反饋、自適應等特性,傳統的線性預測方案在這些需求上存在不足[4].因此,能夠通過全局搜索達到動態調整的智能算法和針對性強的組合模型開始興起,并且廣泛被運用到軌道的短時客流量預測中.
2) 基于智能算法模型.智能算法主要包括決策樹、支持向量機、樸素貝葉斯、隨機森林、人工神經網絡等機器學習算法.Wei等[5]結合經驗模式分解以及反向傳播神經網絡(EMD-BPNN),用于預測軌道交通的短期客流.馮碧玉[6]提出了基于卷積神經網絡和長短期記憶神經網絡(CNN-LSTM)的短時客流預測模型.熊洋等[7]提出了通過列文伯格·馬夸爾特(LM)算法和遺傳算法(GA)對反向傳播(BP)神經網絡短時預測模型進行優化.使用智能算法對城市軌道交通短時客流進行預測的優點是可以提高預測的準確性和可靠性,減少預測誤差,提高預測效率;缺點是需要大量的數據和計算資源,耗時較長,容易受到噪聲干擾.
3) 基于多種混合模型.組合模型通過對數據的季節性周期性進行分解,結合不同算法在不同情況下的適應情況,選擇最優的組合方式對短時客流量進行預測.用于短期客流預測的組合模型有季節性差分自回歸滑動平均模型[8]、Ding等[9]建立的差分整合移動平均自回歸模型(ARIMA)和廣義自回歸條件異方差模型(GARCH)的組合模型等.由于組合模型集成了多數模型的優點,且能夠利用數據自身的分布特點,更具有針對性,所以在解決短時客流預測問題上,組合模型已經成為一種趨勢[10].
LSTM網絡通過引入門和記憶單元,解決了神經網絡在學習復雜序列時容易遇到的問題.在構建LSTM模型時,參數的選擇會對預測效果產生影響,通常通過反復嘗試或經驗分析確定[11].為了提高效率,引入了麻雀搜索(SSA)算法,對LSTM的迭代次數、隱含層神經元數量和學習率3個重要參數進行全局搜索尋優.通過SSA-LSTM模型,成功預測了城市軌道交通短時客流.
1 ISSA-LSTM短時客流預測組合模型的建立
1.1 改進SSA算法 "麻雀搜索算法模擬了麻雀群體的覓食和反捕食行為.其中,麻雀分為發現者和加入者兩大類,發現者負責為整個種群尋找食物并為加入者提供覓食的方向;加入者會跟隨最好的發現者一起捕食食物,有時會通過搶奪發現者的食物來提高自己的捕食率.同時,10% ~20%的麻雀被隨機挑選為感知者[12].
構建麻雀種族:
X=〖JB([〗〖HL(4〗
X11X21…Xd1
X12X22…Xd2
…………
X1nX2n…Xdn
〖HL)〗〖JB)]〗,
(1)
式中:d表示優化問題的維數,n表示麻雀種族的數量.
構建麻雀種族適應度函數:
Fx=f〖JB([〗〖HL(4〗
X11X21…Xd1
X12X22…Xd2
…………
X1nX2n…Xdn
〖HL)〗〖JB)]〗,
(2)
式中:Fx表示適應度函數值,適應度較好的發現者在搜索過程中優先發現食物.
發現者位置更新公式:
Xt+1i,j=〖JB({〗
Xti,j·exp(-ia·itermax), R2lt;TS,
Xti,j+Q·L, R2≥TS,
(3)
式中:t代表當前迭代次數,itermax為常數,表示最大迭代次數,Xi,j表示第i個麻雀在第j維中的位置信息,a∈(0,1)是一個隨機數,R2∈(0,1)和TS∈(0.5,1)分別表示預警值和安全值,Q是服從正態分布的隨機數,L是一個1·d的矩陣,矩陣內每個元素均為1,當R2lt;TS時,表示周圍環境安全,發現者可以擴大搜索范圍;當R2≥TS時,表示發現捕食者,麻雀種群需要飛到其他安全區域進行捕食.
加入者位置更新公式:
Xt+1i,j=〖JB({〗
Q·exp(Xtworst-Xti,ji2), igt;n2,
Xt+1p+|Xti,j-Xt+1P|·A+·L, 其他,
(4)
式中:Xp是目前發現者所處的最優位置,Xworst表示當前全局最差位置,A表示一個1·d的矩陣,矩陣內每個元素隨機值為1或-1,并且A+=AT(AAT)-1,當igt;n2時,表示適應度值較低的第i個加入者沒有獲得食物,處于十分饑餓的狀態,此時需要飛向別處覓食獲得能量.
當意識到危險時,麻雀種群會進行反捕食行為,公式如下:
Xt+1i,j=〖JB({〗
Xtbest+β·|Xti,j-Xtbest|, figt;fg,
Xti,j+K·|Xti,j-Xtworst|(fi-fw)+ε, fi=fg,
(5)
式中:Xbest是當前全局最優位置;β為步長控制參數,服從均值為0,方差為1的正態分布的隨機數;K∈(-1,1)是一個隨機數和步長控制系數,表示麻雀移動的方向;fi則是當前麻雀個體的適應值;fg和fw分別是當前全局最佳和最差的適應度值;ε是最小的常數,避免分母為0;figt;fg時表示此時麻雀處于種群邊緣,極易受到捕食者的攻擊,當fi=fg時表示處于種群中間的麻雀也受到了危險,此時需要靠近其他麻雀以減少被捕食的風險.
根據(3)式,當R2lt;TS時,每個發現者的每一維都會減小,這會導致算法在迭代后期的種群多樣性下降.為了解決這個問題,提出了黃金萊維飛行策略來改進發現者位置公式.這個策略不僅解決了每一維度變小的問題,還增強了發現者的全局搜索能力[13].
萊維飛行策略是一種以萊維分布為基礎的隨機游走算法.萊維分布是一種長尾分布,它的尾部非常長,因此它可以產生極端值.萊維飛行策略的思想是在搜索空間中隨機游走,以期望找到更優的解.一般使用Mantegna算法來計算萊維分布,其步長s的計算公式為:
s=μ|ν|I/β,
(6)
式中:μ和ν服從正態分布
μ~N(0,σ2μ), ν~N(0,σ2ν),
σμ={Γ(1+β)·sin(πβ2)Γ[1+β2]β·2(β-1)2}1/β,
(7)
σν通常取1,Γ(β)是Gamma函數,β的取值影響萊維飛行的飛行軌跡,為了擴大搜索者隨機搜索的范圍,使得麻雀搜索算法更容易搜索到全局最優解而不是局部最優解,這里的β取區間(0,2)內均勻分布的隨機數.
其次,通過將正弦函數與單位圓的關系引入,可以讓發現者遍歷圓上的所有位置.同時,引入黃金分割系數可以縮小解空間,從而獲取可能產生良好結果的搜索區域,加快算法的搜索速度.綜合運用萊維飛行和黃金正弦指引機制,可以對發現者在R2lt;TS時的位置進行更新,更新如下:
Xt+1i,j=Xti,j·|sin(r1)|+γ·levy(λ)dis,
(8)
γ=r2·sin(r1)·exp(-iα·M),
(9)
dis=|θ1·Xtbest,j-θ2·Xti,j|,
(10)
式中:r1和r2分別是r1∈[0,2π]和r2∈[0,π]的隨機數,θ1和θ2是引入黃金比例系數τ的特定解,
τ=( 5-1)/2,
θ1=-π+2π·(1-τ),
(11)
θ2=-π+2π·τ.
(12)
智能優化算法引入隨機性,避免局部最優解,簡單、靈活、高效,被廣泛用于解決全局優化問題.本文提出了黃金萊維飛行策略對SSA算法進行改進,能讓發現者搜索到更大的范圍,加快搜索速度.通過圖1可視化單個測試函數f1(x)=∑ni=1x2i的適應度收斂曲線,證明改進效果顯著.
1.2 LSTM模型 "長短期記憶網絡是一種特殊的循環神經網絡(RNN),主要是通過引入門單元和明確定義的記憶單元來解決長序列訓練過程中梯度消失和梯度爆炸等問題.簡單來說,就是相比普通的RNN,LSTM能夠在更長的(時間)序列中有更好的表現.
相較于其他的神經網絡,LSTM主要的特點就是引入了特殊的內部記憶單元c,通過結合神經元中的信息與上一時刻的單元狀態ci-1并進行了放縮(通過一個tanh激活函數進行變化)更新為當前的狀態ct.設c′t為當前單元的即時狀態,wc、Uc為權重矩陣,則公式表達為
c′t=tanh(wcxt+Ucht-1),
ct=ftct-1+itc′t.
(13)
神經元信息主要由3個單元組成[14]:
1) 輸入門it控制上一個節點輸入xt和神經元狀態ht-1更新到神經元中信息的數量.設wi、Ui為權重系數矩陣,bt為偏置,σ為激活函數,一般取Sigmoid或者rule,則公式表達為
it=σ(wixt+Uiht-1+bt).
(14)
2) 遺忘門f控制上一個節點輸入xi和神經元狀態ht-1中遺忘信息的數量.設wf、Uf為權重系數矩陣,bf為偏置,則公式表達為
ft=σ(wfxt+Ufht-1+bf).
(15)
3) 輸出門o控制當前狀態ct信息輸出到當前神經元狀態ht中的數量.設wo、Uo為權重系數矩陣,bo為偏置,則公式表達為
ot=σ(woxt+Uoht-1+bo),
ht=ottanh(ct).
(16)
通過引入遺忘門,模型可以“忘記”不重要的信息,控制傳輸狀態,對于需要“長期記憶”的任務非常有用.但由于引入了很多內容,參數變多,全局調優難度加大,同時需要更多資源才能運行[15].
1.3 ISSA-LSTM模型的建立 "建立ISSA-LSTM城市軌道交通短時客流預測組合模型(見圖2),將LSTM中的迭代次數、學習率和隱含層的神經元數作為ISSA算法的尋優目標,通過全局搜索得到最佳結果賦值給LSTM網絡,從而提高LSTM模型的預測精度.ISSA-LSTM城市軌道交通短時客流預測組合模型的構建過程需要注意以下幾個方面:1) 初始化SSA的主要參數.確定種群規模、最大迭代次數、生產者數量、安全閾值以及搜索緯度.我們的短時客流預測模型中待尋優的參數有3個,所以搜索的維度為三維.
2) 初始化種群的位置.隨機生成1個麻雀個體,則表示為Xt=(α,β,θ),α代表LSTM網絡的迭代次數,β代表學習率,θ代表第一層隱含層的神經元個數.同時確定LSTM的其他參數,預測方案為單步預測.
3) 確定種群適應度函數.用初始化后的種群參數構建LSTM,將訓練集的預測結果與實際值的均方根誤差RMSE作為種群的適應度函數.
2 客流預測實例分析
本文所使用的數據來自杭州市公安局提供的地鐵刷卡記錄和路網地圖數據,時間跨度為2019年1月1日至1月26日,共計26 d.通過計算機編程實現構建的模型并進行驗證.本文分別采用了反向傳播(BP)神經網絡模型、LSTM模型、SSA算法和LSTM模型組合(以下簡稱“SSA-LSTM模型”),以及結合Levy策略改進的SSA優化LSTM的模型組合(以下簡稱“ISSA-LSTM模型”)對杭州客流量最大的站點流量進行預測.在本文所使用的用戶刷卡數據中,包含了3條地鐵線81個站點約7 000萬條數據,81個站點編號分別為0號站點到80號站點,其中0~33是杭州地鐵1號線站點、34~66是杭州地鐵2號線站點、66~80是杭州地鐵4號線站點.此外,在中間位置還有第5、10、15、16、20、46號等換乘站.對這些數據進行處理后,可以得到圖3所示81個站點進出站客流量.
由圖3可以看出,其中杭州客流量前三的地鐵站為15號、9號、4號,分別對應1號線上的火車東站、龍翔路站、濱和路站,于是選擇火車東站的歷史客流數據作為短期客流預測模型的訓練數據并對其進行預測.
利用Person相關系數對客流在工作日和非工作日的數據相關性進行分析,得到結果通過熱力圖實現數據可視化,如表1所示,可以看出工作日和非工作日數據之間相關性非常顯著,屬于高度相關性,所以我們的模型需要從工作日和非工作日2個角度分別建模,進行客流預測.
短時客流特點包括非線性、噪點密集性、高度隨機性.對比客流預測間隔15、10、5 min的時間間隔更小,客流的變化更具有隨機性,預測難度更大.因此,選擇采用5 min時間間隔,時間范圍為0:00:00—23:55:00匯總一天當中289個時間段的客流數據.以火車東站的進站客流為例,1月1日至1月25日期間,共計19個工作日,6個非工作日,客流表現如圖4所示.考慮到1月1日為國家法定假日,在數據表現上也表示出了異常情況,于是選擇移除,將17個工作日的數據作為訓練集,余下1個工作日作為測試集;5個非工作日的數據作為訓練集,余下1個非工作日作為測試集.
LSTM模型的輸入層和輸出層均為1個神經元,利用Adam優化器訓練LSTM.LSTM和BP模型的最大迭代次數為20;SSA算法中種群規模為1,維度為3,最大迭代次數為20,Xt=(α,β,θ)中α的取值范圍為[100,500],β的取值范圍為[0.001,0.01],θ的取值范圍為[1,200].得到工作日和非工作日的BP模型、LSTM模型、SSA-LSTM模型和ISSA-LSTM模型預測結果如圖5所示,其中改進麻雀搜索算法的優化結果見表2.
對短時客流預測模型的精度進行判定,這里采用平均絕對百分比誤差(MAPE)、均方根誤差(RMSE),平均絕對誤差(MAE)和決定系數(R2)等4種評價指標進行誤差分析,其中MAPE、RMSE、MAE、R2的取值為模型獨立運行10次后的均值,得到4種預測模型的誤差值如表2所示.可以看出,ISSA-LSTM的預測誤差值在大部分情況下均小于其他3種模型.其中,相較于單一LSTM模型,在工作日客流量預測中,MAPE相對減少了95%,RMSE相對減少了32%,MAE相對減少了22%,R2達到了0.998;在非工作日客流量預測中,MAPE相對減少了98%,RMSE相對減少了46%,MAE相對減少了46%,R2達到了0.997.由此可見,相較于單一模型,ISSA的優化明顯提升了LSTM模型的預測精度,且預測結果的決定系數在0.997以上,明顯優于BP和SSA-LSTM,由此可知ISSA-LSTM模型的預測精度更高.
根據客流預測結果,對進站客流的晚高峰和平峰進行分析比較,結果表明,4種模型在早高峰時段的預測誤差絕對值如表3所示,在平峰時段的預測誤差絕對值如表4所示.從表3和表4的數據可以看出,ISSA-LSTM模型在晚高峰和平峰的客流預測方面表現較好.此外,相較于BP、LSTM、SSA-LSTM模型,ISSA-LSTM模型的誤差更小.
3 結論
ISSA-LSTM組合模型是一種將多種模型相結合的新型模型,通過對城市軌道交通短時客流進行預測,得到了以下結論:
1) 優化算法.本文利用麻雀搜索算法對神經網絡參數進行優化,可以提高城市軌道交通短時客流模型的精準度.該算法具有良好的全局和局部搜索能力,能使種群在最優值附近收斂,穩定性好,參數少.通過優化,軌道交通系統的整體運行調度效率得到提高,可以促進軌道交通與路面交通的協同,從而有效減輕道路交通壓力.
2) 組合模型優勢.將模型組合可以充分有效地利用3種模型的優勢.通過黃金萊維策略改進后的SSA算法可以更好地、更高效地確定LSTM模型的多個參數,以此預測模型精度.ISSA-LSTM模型對工作日和非工作日的客流預測都達到了較好的效果.
3) 未來的工作.由于工作日和節假日客流分布差異較大,本文分別對工作日和節假日客流數據進行建模、訓練和預測.未來可以考慮同時對工作日和節假日的數據進行建模,給出統一的預測模型,便于提高數據分析的簡便性.
參考文獻
[1] 袁健,范炳全. 交通流短時預測研究進展[J]. 城市交通,2012,10(6):73-79.
[2] 周慶梅,何希平. 地鐵乘客流量短時預測方法綜述[J]. 重慶工商大學學報(自然科學版),2020,37(1):25-32.
[3] 張春輝,宋瑞,孫楊. 基于卡爾曼濾波的公交站點短時客流預測[J]. 交通運輸系統工程與信息,2011,11(4):154-159.
[4] 張利田,卜慶杰,楊桂華,等. 環境科學領域學術論文中常用數理統計方法的正確使用問題[J]. 環境科學學報,2007,27(1):171-173.
[5] WEI Y, CHEN M C. Forecasting the short-term metro passenger flow with empirical mode decomposition and neural networks[J]. Transportation Research Part C: Emerging Technologies,2012,21(1):148-162.
[6] 馮碧玉. 基于CNN-LSTM組合模型的城市軌道交通短時客流預測研究[D]. 南昌:華東交通大學,2020.
[7] 熊洋,李淑慶,許浩,等. 城市軌道交通客流短時預測方法研究[J]. 電子設計工程,2022,30(1):46-50.
[8] 王夏秋,張寧,王健. 基于季節指數的城市軌道交通月度客流預測方法[J]. 城市軌道交通研究,2018,21(10):25-28.
[9] DING C, DUAN J X, ZHANG Y R, et al. Using an ARIMA-GARCH modeling approach to improve subway short-term ridership forecasting accounting for dynamic volatility[J]. IEEE Transactions on Intelligent Transportation Systems,2018,19(4):1054-1064.
[10] 林秀麗,李均利,田竟民,等. 基于卷積神經網絡的算法選擇研究[J]. 四川師范大學學報(自然科學版),2022,45(6):830-838.
[11] 聶君鳳,于卓然,李均利. 加權模型的復雜網絡的多目標魯棒性優化[J]. 四川師范大學學報(自然科學版),2023,46(6):826-836.
[12] 薛建凱. 一種新型的群智能優化技術的研究與應用:麻雀搜索算法[D]. 上海:東華大學,2020.
[13] 陳俊,何慶. 基于余弦相似度的改進蝴蝶優化算法[J]. 計算機應用,2021,41(9):2668-2677.
[14] 杜希旺,趙星,李亮. 基于LSTM的軌道交通進站客流短時預測研究[J]. 貴州大學學報(自然科學版),2021,38(5):109-118.
[15] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation,1997,9(8):1735-1780.
Passenger Flow Prediction of Urban Rail Transit StationsBased on ISSA-LSTM Model
ZHANG Kaiwen, HE Yong, YU Jiaxiang, CHEN Lin
(School of Mathematics, Physics and Data Science, Chongqing University of Science amp; Technology, Chongqing 401331)
Accurate short-term passenger flow prediction can provide a guarantee for the good operation of urban rail transit. However, the short-term passenger flow of rail transit has characteristics such as nonlinearity and high randomness. In order to improve the prediction accuracy of short-term passenger flow, this paper proposes to combine the ISSA algorithm and LSTM model to construct a prediction model of the short-term passenger flow for urban rail transit. In response to the problem of slow convergence speed and easy local optimum solution of the SSA algorithm, the Levy flight strategy is introduced to dynamically adjust the explorers moving step length, which enables it to cover a larger range when searching in an unknown range and improves the global search capability of the SSA algorithm. By using the relationship between the sine function and the unit circle and introducing the golden section coefficient to narrow the solution space, the explorer can traverse all positions on the circle and quickly search for the area where good results may be obtained, accelerating the search speed of the SSA algorithm. By using the ISSA algorithm to optimize the number of neurons in the hidden layer, learning rate and the iteration times of the LSTM model, we have constructed the ISSA-LSTM combined prediction model for short-term passenger flow of urban rail transit. This model has been compared with three other prediction models for the short-term passenger flow, including BP, LSTM and SSA-LSTM. The results show that the ISSA-LSTM model has the smallest prediction error and better prediction performance in predicting passenger flow on workdays and non-workdays.
short-term passenger flow prediction; improved sparrow search algorithm; long-short-term memory neural network; combination model
(編輯 余 毅)
收稿日期:2023-02-27 "接受日期:2023-03-31
基金項目:重慶市科技局自然科學基金(CSTB2022NSCQ-MSX0256),中國博士后第71批面上項目(2022M712619)和重慶市教委科學技術研究計劃重點項目(KJZD-K202201502)
*通信作者簡介:何 勇(1982—),男,副教授,碩導,主要從事數理統計的研究,E-mail:heyongmath@163.com
引用格式:張開雯,何勇,余家香,等. 基于麻雀搜索算法和長短期記憶神經網絡的軌道交通站點客流預測[J]. 四川師范大學學報(自然科學版),2025,48(1):105-113.