黃海超,陳景雅,孫 睿
(河海大學土木與交通學院,江蘇 南京210098)
由于軌道交通安全、準時和環保等特點,已逐漸成為人們出行的首選交通方式,基于數據挖掘技術的客流量預測是城市智能交通系統的重要組成部分,不僅對人們出行和智能交通管控有著重要的指導意義,也有助于相關部門提前進行運營規劃和調度。
客流量預測模型主要分為以差分自回歸移動平均模型[1](ARIMA)和灰色模型(GM)為代表的參數模型與以支持向量機[2](SVM)和神經網絡[3]為代表的非參數模型。 但傳統模型收斂慢,時效性低,很難滿足交通大數據情況下智能管控需求[4]。 基于深度學習的長短時記憶神經網絡LSTM (long shortterm memory)不僅預測性能、收斂時間優于傳統參數[5]與非參數[6]預測模型,偏差分布波動與預測魯棒性也明顯優于傳統預測模型[7];針對非平穩的客流量數據,經驗模態分解[8](EMD)、集成經驗模態分解[9](EEMD) 被用于降低樣本噪聲干擾并有效提高預測精度。 變分模態分解(variational mode decomposition,VMD)作為最新提出的分解算法,雖然在交通領域應用較少,但在電力荷載[10]、期貨[11]等領域已證明其對非平穩信號良好的處理能力。
目前研究大多集中于短時客流量預測[12](15 min內),然而過短時間的預測不能為人們出行規劃預留充足時間,提供有價值的出行指導。 為此,文章創新性地將VMD 引入客流量預測領域,降低客流量信號的非平穩性,結合深度學習的LSTM 進行預測,提出VMD-LSTM 預測模型,實現對每小時軌道交通客流量的準確預測,提高LSTM 神經網絡的預測性能。
VMD 是一種全新的自適應、完全非遞歸時頻信號分解算法,通過構建變分模型,將原始時間序列s(t)分解為不同的具有有限帶寬的分量uk(t),對應的中心頻率為ωk,交替迭代更新尋找約束變分模型的最優解,在此過程中實現本征模態函數IMF 的有效分離,克服了EMD 存在端點效應和模態分量混疊的問題,其算法可表示為[13]
1) 對每一個uk(t)進行Hilbert 變換得到單側頻譜

式中:δ(t)表示Dirac 分布函數;*表示卷積運算。
2) 通過將每個模式的分析信號乘以估計的中心頻率e-jωkt,將頻譜移到基帶

3) 通過對解調信號梯度的L2 正則化進行高斯平滑估計,得到各模態函數的帶寬,約束變分模型可表示為

式中:?t表示求偏導;k 為分量的個數。

LSTM 是深度循環神經網絡的代表,通過門的開關實現時空記憶功能,能有效解決循環神經網絡的梯度消失和爆炸問題。 通過引入一個門控單元系統,可以控制何時忘記歷史信息或使用新信息更新單元狀態, 使LSTM 在解決非線性時間序列問題時效果極佳[14],其過程可表達為


VMD-LSTM 預測模型建立主要分為兩部分。 第一部分為數據預處理,首先將對原始數據中的重復、異常、 缺省值進行清洗獲得時序客流量數據。 基于VMD 分解原理,設定合適的超參數,將非平穩的每小時客流量數據分解為本征模態函數IMF 和余量信號R(t),弱化樣本噪聲干擾;第二部分為分量預測,首先選擇LSTM 神經網絡時間步長、 輸入層隱藏層神經元個數等基本參數,確定神經網絡的訓練方式與代價函數,獲得網絡拓撲結構。 建立與分解分量個數相同的LSTM 神經網絡,對分量分別進行預測,獲得仿真本征模態函數(SimIMF)最后將各預測值進行重構獲得最終客流量預測值, 并與真實客流量進行比較,評價模型性能。 模型建立流程如圖1 所示。

圖1 VMD-LSTM 神經網絡模型流程圖Fig.1 VMD-LSTM neural network model flow chart
采集明尼蘇達州明尼阿波利斯至圣保羅301站臺2017 年每小時軌道交通客流量,明尼阿波利斯與圣保羅分別是明尼蘇達州第一、 二大城市,旅客往來頻繁,客流規模大;301 站臺為圣保羅通往明尼阿波利斯及其他城市的主要站臺,人員出行規律復雜,因此采用該站臺作為研究對象。 對軌道交通數據中的異常數據進行預處理。 包括完全相同的記錄、明顯異常的記錄及缺失的記錄,數據清洗后共獲得10 605 條時間數據。 由于數據樣本較大,有效避免了機器學習過程中預測模型對個別樣本的偏好,無需對樣本進行抽樣訓練。
采用VMD 算法對非平穩交通量時間序列數據進行分解時,由于VMD 在軌道交通客流量預測領域應用較少,缺乏先驗知識確定超參數。 綜合考慮重構誤差與中心頻率分布,二次罰因子α 取1 000,分解模態數K 取11。分解得到10 個IMF 分量以及一個余量信號R(t),分解結果如圖2 所示。 分量頻率由高到低進行排列,更加清晰的呈現原始客流量數據在不同時間尺度下的變化規律,其中高頻信號表示客流量變化的細節,含有大量樣本噪聲;低頻部分則表征客流量的趨勢,頻率最低的余量信號R(t)也稱為趨勢項,表征全年軌道交通客流量的波動趨勢。
選擇前10 個月(8 880 條時間數據)作為訓練集,最后兩個月(1 725 條時間數據)用于測試模型性能。 時間步長取4,隱含層數取1,隱含層神經元個數取200;迭代次數取250。初始學習率設為0.01,同時為防止學習率過大,模型來回震蕩,采用衰減法動態調整學習率,每迭代50 次學習率衰減50%。損失函數采用均方根誤差,通過AdamOptimizer 優化器對模型進行優化, 得到LSTM 神經網絡的拓撲結構。
根據以上參數,建立11 個LSTM 神經網絡,對分解獲得的分量分別進行訓練、預測,根據VMD 算法對預測結果進行重構,得到最終每小時客流量預測值。 并繪制總體預測殘差,如圖3 所示,可以看出LSTM 神經網絡僅在初期前1%數據范圍內預測誤差較大,隨后殘差迅速變小并趨于穩定,表現出良好的魯棒性。
同時為驗證VMD-LSTM 神經網絡模型的性能,分別與LSTM 神經網絡、隨機森林(RF)、支持向量機(SVM)進行對比。 對比模型與原模型采用相同的參數設置,RF 預測模型利用經驗公式確定子樹數目為103,SVM 預測模型采用自適應算法搜索最佳超參數c,g,預測結果如圖4 所示。

圖2 客流量數據VMD 分解結果Fig.2 VMD decomposition results of passenger flow sequence

圖3 預測殘差Fig.3 Predicting residual

圖4 神經網絡模型對比Fig.4 Comparison of neural network models
平均絕對百分誤差(MAPE)體現了真實值與預測值的相對偏差,可直接衡量預測結果的好壞,常被用于評價預測模型的優劣,但不能直觀反映真實值與預測值的差值。 均方根誤差(RMSE)可直接體現真實值與預測值的絕對差值,且特大或特小誤差對指標影響明顯,可有效彌補MAPE 的不足,相關系數(R)可用于表征真實值與預測值變化趨勢的相似程度。 分別采取以上指標對各預測模型性能進行評價,結果如表1 所示。

表1 經典預測模型性能對比Tab.1 Performance comparison of classical prediction models
結合圖4 和表1 可以看出,在軌道交通客流量數據樣本足夠大的情況下,所有預測模型均有極高的預測精度。傳統的時間序列預測模型RF,SVM 與基于深度學習的LSTM 預測誤差相差不大。 但LSTM 神經網絡克服傳統預測模型每次加入新數據,需要重新訓練的缺陷,收斂速度也有較大提高,體現神經網絡良好的綜合性能。
當采用VMD 優化LSTM 后,預測誤差顯著降低,VMD-LSTM 模型的預測精度相對三種對比模型總體有了較大提高。 對比傳統時間序列預測模型RF,SVM,MAPE 分別減小了8.58%,6.64%,RMSE分別減小了271.05,246.99; 相比LSTM 神經網絡,MAPE 減小了8.38%,RMSE 減小了256.99,R 值也有一定的提高。 這是因為VMD 將含噪聲的客流量數據分解成模態分量與余量信號,將含噪聲的高頻信號單獨分離出來,從而弱化樣本噪聲對總體預測精度的干擾,有效提高神經網絡的預測精度;同時使非平穩客流量數據轉換為多個平穩時間序列,LSTM 神經網絡對這些平穩信號進行預測,進一步提高模型的魯棒性。
1) 采用VMD 將含噪聲的軌道交通客流量數據分解成具有原始數據局部特征的不同頻率信號,降低噪聲對模型的干擾,提出VMD-LSTM 神經網絡預測模型。
2) 采用明尼蘇達州軌道交通數據驗證VMDLSTM 預測模型性能,結果表明VMD 改進LSTM 能顯著提高神經網絡的預測精度與魯棒性,預測誤差相對傳統預測模型更小。