張婉凝,鄭明明,劉巖
大連交通大學交通運輸工程學院,遼寧 大連 116028
隨汽車保有量的增加,地面交通擁堵問題顯著。近些年我國大力發展城市軌道交通,高峰時段城市軌道交通面臨乘客數量暴漲、客流分布不均等問題,給運營部門的管理調度造成一定困難。預測城市軌道交通進站客流可為車輛調度和人員配置提供一定依據,幫助運營部門在高峰時段動態管理車站客流,防止車站人流擁堵。
目前預測短期客流的方法主要有5類:第1類是以統計學理論為基礎的線性預測模型[1-4],通常假設客流數據服從某種分布,用客流數據標定該分布模型,方法簡單,但基于學者的先驗認知選取客流分布模型,缺乏客觀性,軌道交通短時客流具有非線性特征,不適用線性預測方法;第2類是以非線性理論為基礎的預測模型[5-6],時效性低、訓練時間長,不能廣泛應用于短期客流預測;第3類是以機器學習算法為基礎的人工智能預測方法[7-12],數據處理能力強,能有效提取數據特征,自適應性較強,但需大量訓練樣本;第4類是考慮時空關系的預測模型[13-17],隨圖論和圖卷積神經網絡的發展,部分學者從時空相關性的角度預測進站客流,預測結果較準確;第5類是組合預測模型[18-21],一般將2個或2個以上預測模型組合,取長補短,降低預測誤差。人工智能算法相對數理統計方法更能捕捉數據的隨機性與非線性特征,組合模型能降低預測誤差。
本文采用粒子群優化(particle swarm optimization,PSO)算法確定變分模態分解(variational mode decomposition,VMD)的參數,采用貝葉斯優化(Bayesian optimization,BO)算法對長短期記憶(long short term memory,LSTM)神經網絡的超參數進行尋優,提出PSO-VMD-LSTM組合模型預測軌道交通短期客流,通過與誤差反向傳播(back propagation,BP)神經網絡、徑向基函數(radial basis function,RBF)神經網絡、LSTM神經網絡對比,驗證PSO-VMD-LSTM組合模型的有效性和預測準確度。
城市軌道交通進站客流指通過車站進入城市軌道交通系統的客流,反映車站對客流的吸引能力。某車站在時間t的進站客流量a(t)與時間高度相關,預測城市軌道交通進站客流即預測一維時間序列。通過構建組合預測模型,基于歷史進站客流量{a(1),a(2),…,a(t-1)}預測a(t),即:a(t)=F{a(1),a(2),…,a(t-1)}。
影響軌道交通客流量的因素較多,預測客流量前應先對原始客流數據進行降噪處理,以便更準確地提取客流特征。經驗模態分解(empirical mode decomposition,EMD)通過將歷史客流序列分解為若干不同時間尺度的本征模態函數(intrinsic mode function,IMF),降低噪聲對客流的影響[19,22-24],但EMD存在端點效應和模態混疊效應等弊端,變分模態分解(variational mode decomposition,VMD)通過鏡像延拓的方式求解IMF,能較好解決端點效應和模態混疊效應,提高非線性時間序列的預測準確度[25]。
VMD對原始客流數據進行降噪處理時需確定IMF的個數K和懲罰系數α,K決定原始信號分解分量的個數,α決定每個分量的帶寬。K過小不能有效分解信號,過大導致信號分解過度;α過小易丟失頻帶信息,過大會出現模態混疊現象。若通過參數調試確定K和α,難以避免人為設置參數造成的主觀性。本文采用PSO算法以包絡熵為適應度函數對參數K和α尋優。
VMD可將原始信號分解為若干不同帶寬和中心頻率的分量,通過構造變分模型將a(t)分解為K個本征模態函數u(t)。第k個本征模態函數[25]:
uk(t)=Ak(t)cosφk(t),
式中:Ak(t)為包絡幅值,φk(t)為瞬時相位。
包絡熵體現信號包絡起伏的幅度,幅度越小,包絡熵越小,反之則越大。原始客流序列經VMD分解后,若得到的IMF包含的客流特征較多,噪聲較小,信號波形呈較規律的周期性沖擊脈波時,信號包絡起伏的幅度較小,包絡熵較小;若得到的IMF包含的客流特征較少,噪聲影響較大,信號的周期性不明顯時,信號包絡起伏的幅度較大,包絡熵較大。包絡熵


循環神經網絡(recurrent neural network,RNN)能體現前一時刻的輸入對后一時刻細胞接收信息產生的影響,能較好地預測時間序列。當時間序列較長時,RNN反向傳播過程中參數更新緩慢,不能較好地展現長期記憶功能,因此需存儲單元來存儲記憶。為解決RNN存在的梯度消失和梯度爆炸問題,提出了LSTM神經網絡,通過引入門機制控制時間序列特征的增加和去除,結構示意圖如圖1所示[26]。LSTM神經網絡有遺忘門、輸入門和輸出門3個特殊的門結構:遺忘門過濾無效信息,輸入門保留當前數據中的有效信息,輸出門輸出當前時刻的信息。由激活函數Sigmoid和tanh控制3個門結構,信息有選擇地通過這些門結構。

圖1 LSTM神經網絡結構示意圖
采用PSO-VMD-LSTM模型預測客流包括客流數據分解及分量重構和LSTM神經網絡預測及分量整合2部分,具體分4步進行。
1)參數優化。以包絡熵為適應度函數,采用PSO算法對VMD的參數K和α尋優,降低噪聲對客流的影響,提取客流特征。
2)客流數據分解。采用PSO算法優化后的VMD分解客流數據,得到若干個IMF(分別記為u1,u2,u3,…,un-1,un)和1個余量。
3)分量相關性分析及重構。以皮爾遜相關系數為指標分析分量的相關性,根據系數確定相關程度,重構分量(記為u1′,u2′,…,un-1′,un′)。
4)客流預測。將重構后的分量劃分為訓練集、驗證集和測試集,采用BO算法確定LSTM神經網絡的超參數,將分量分別代入LSTM神經網絡(L1,L2,…,Ln-1,Ln)中進行預測,累加后得到客流預測結果。
PSO-VMD-LSTM模型的客流預測流程如圖2所示。

圖2 PSO-VMD-LSTM模型客流預測流程

圖3 沙坪壩站30 d運營時間的進站客流分布
重慶軌道交通1號線是高鐵站、公交車站乘客換乘進入市區的主要線路之一,運營時間為6:00—23:00,其中沙坪壩站地處商業圈和交通樞紐,全天客流量較大,乘客出行行為復雜,沙坪壩站30 d運營時間的進站客流分布如圖3所示。由圖3可知:沙坪壩站進站客流較大,客流波動幅度較小,日客流相對均衡,不存在明顯的早晚高峰時段,屬于典型的全峰型客流。選取2018-01-01—2018-01-30沙坪壩站客流量為研究對象,以時間粒度30 min將30 d的客流量數據劃分為1 020個樣本數據。訓練集、驗證集和測試集的劃分比例為6:2:2,即采用2018-01-01—2018-01-18的客流量數據訓練模型,2018-01-19—2018-01-24的客流量數據驗證模型,2018-01-25—2018-01-30的客流量數據測試模型。
以原始客流序列為樣本數據,采用軟件MATLAB R2020a編程實現PSO算法對K和α尋優,PSO的參數取值如表1所示,進化曲線如4所示。

表1 PSO算法的參數取值

a)對K尋優 b)對α尋優 圖4 PSO算法進化曲線
由圖4可知:最佳K為7,最佳α為1 416,即將原始客流數據分解為6個IMF分量(u1~u6)和1個余量。采用VMD分解原始客流數據,原始客流數據及分解后的各分量如圖5所示。
由圖5可知:u1~u6的頻率由高頻到低頻排列,頻率大的IMF周期較短,特征信息含量較多,如u1、u2、u3、u4;頻率小的IMF周期較長,體現客流變化的趨勢,是分量中較穩定的部分,如u5、u6、余量。從周期上看,u1~u4均能體現客流在不同時間的波動性,u1的波形與原始客流數據相似,體現客流的日變化特征;u2~u4對應沙坪壩站1 d內較突出的3個峰值時段的客流變化特征;u5、u6相對原始客流數據更平穩,周期約為7 d,體現客流的周變化趨勢;余量的均值約為原始客流數據的50%,體現客流的總體變化情況和變化趨勢。u1~u6表示原始客流序列的振蕩模式,疊加后體現客流的非平穩性。

圖5 VMD分解客流數據結果

表2 皮爾遜相關系數分析結果
根據皮爾遜相關系數采用軟件SPSS分析各分量與原始客流序列的相關性,相關系數分析如表2所示。由表2可知,各分量與原始客流數據存在顯著的正相關關系;u2~u6的皮爾遜相關系數較其它分量大,與原始客流數據的相關程度較高;u1和余量的皮爾遜相關系數小于0.300,與原始客流數據相關程度較低,因此將相關程度較高的分量u2~u6分別代入LSTM神經網絡中進行預測,將相關程度較低的u1和余量相加重構成1個分量代入到LSTM神經網絡中進行預測。
LSTM神經網絡有隱藏單元數、初始學習率和正則化參數3個超參數。隱藏單元數越小,LSTM神經網絡的信息處理能力和學習能力越差;隱藏單元數過多會增加網絡的復雜程度,導致學習速度較慢,且網絡在學習過程中易陷入局部極小點;初始學習率過大,參數會直接跳過局部最小值導致無法收斂;為防止模型過擬合,一般會在損失函數后額外添加正則化,本文取L2正則化防止過擬合。

圖6 訓練集和驗證集誤差曲線
BO算法可根據當前的結果預測下一個最優點的位置,在確定參數→訓練→得到結果中往復循環,相較于網格搜索可較快得到參數,減少迭代次數,節省時間。基于BO算法優化LSTM神經網絡的3個超參數,目標函數為使驗證集誤差最小。LSTM神經網絡的參數設置分別為:最大迭代次數為50,隱藏層單元數為[10,150],初始學習率為[0.001,1.000],L2正則化參數為[1×10-10,0.01]。通過MATLAB R2020a編程實現BO算法對超參數的尋優,得到隱藏層單元數為81,初始學習率為0.019,L2正則化參數為1.59×10-7。根據得到的超參數,訓練LSTM神經網絡,得到誤差曲線如圖6所示。由圖6可知:訓練集誤差和驗證集誤差曲線均先下降后趨于穩定,且二者相差較小,說明訓練集和測試集的誤差均收斂,模型擬合度較好。

圖7 不同模型的進站預測客流量

表3 模型評價指標
均方根誤差(root mean square error,RMSE)ERMSE和平均絕對百分誤差(mean absolute percentage error,MAPE)EMAPE可表現實際值與預測值的偏差,預測模型的ERMSE和EMAPE越小,模型預測準確度越高,越貼合實際。
根據參數設置構建6個IMF分量的LSTM神經網絡預測模型,進行模型訓練和預測。分別采用BP神經網絡、RBF神經網絡、LSTM神經網絡與PSO-VMD-LSTM模型預測2018-01-25—2018-01-30的進站客流量,結果如圖7所示。為驗證PSO-VMD-LSTM組合預測模型的預測準確度,計算不同模型的評價指標,結果如表3所示。
由圖7和表3可知:PSO-VMD-LSTM模型的ERMSE相較于BP、RBF、LSTM神經網絡分別降低268.03、204.41、221.66,EMAPE分別降低13.16%、10.21%、11.06%。BP、RBF和LSTM神經網絡的ERMSE和EMAPE相差較小,PSO-VMD-LSTM模型的預測準確度顯著提高。PSO-VMD-LSTM模型的魯棒性提高,原因是經PSO算法優化的VMD將原始客流序列分解為不同時間尺度且相對平穩的特征信號,有效保留原始客流數據特征,降低噪聲干擾,通過LSTM神經網絡預測重構后的分量,可有效提高模型的預測準確度。
采用PSO算法優化VMD,對原始客流序列進行降噪處理,根據BO算法確定LSTM神經網絡的超參數,構建基于PSO-VMD-LSTM的城市軌道交通客流預測模型。以重慶軌道交通1號線沙坪壩站進站客流為例驗證模型的預測準確度。結果表明:對原始客流序列進行VMD分解能清晰體現客流的特征變化,PSO-VMD-LSTM模型對沙坪壩站客流預測結果的均方根誤差和平均絕對百分誤差分別為64.03和5.13%,模型的預測準確度約為95%,相較于BP、RBF、LSTM神經網絡顯著提高,模型性能較好,預測結果較理想。
影響城市軌道客流的因素較多,如天氣、票價、特殊事件、站點間的空間相關性等,后續將研究多因素影響下的軌道交通短時客流預測。