朱廣宇 孫歆霓 楊榮正 劉康琳 魏 運 吳 波
①(北京交通大學北京市城市交通信息智能感知與服務工程技術研究中心 北京 100044)
②(北京市地鐵運營有限公司 北京 100014)
③(太原中鐵軌道交通建設運營有限公司 太原 030006)
軌道交通進站客流量是衡量站點運營狀況的一項重要指標。通過處理、分析龐大的客流數據,挖掘數據背后的出行規律,對車站短時進站客流量進行分析、預測,能為管理部門制定合理的運營方案、進行乘客出行路徑誘導等提供數據支撐,也有助于充分發揮軌道交通運能、保障乘客安全高效出行。
根據預測過程中使用到的模型數量,城市軌道交通短時客流預測方法可分為單一模型預測法和組合模型預測法兩種。單一模型根據其方法和原理,又可細分為基于統計理論的預測模型、基于機器學習的預測模型和基于深度學習的預測模型3種。早期的客流預測,以差分整合移動平均自回歸模型(AutoRegressive Integrated Moving Average mode, ARIMA)[1]等時間序列模型、K近鄰模型[2]、卡爾曼濾波模型[3]等基于統計理論的模型為主。而隨著高速發展的計算機技術與交通領域的深入融合,支持向量機[4]、隨機森林[5]、極端梯度提升[6]等基于機器學習的模型憑借其在捕獲數據間潛在的非線性動態特性以及處理大量、復雜數據過程中的突出表現,在客流預測領域取得了出色的成果。基于人工神經網絡的深度學習是機器學習中發展最龐大的一個分支,其中,除了最為常見的循環神經網絡(Recurrent Neural Network, RNN)及其變體長短期記憶網絡(Long Short-Term Memory, LSTM)[7],生成對抗網絡[8]、深度卷積記憶網絡[9]等深度學習模型也被逐漸應用于客流預測領域。然而,以上單一模型的研究側重于模型的結構優化和提高算法效率,忽略了數據的噪聲干擾,且始終存在模型參數、閾值無法確定的問題。
由此,學者將不同模型進行組合以彌補單一模型的局限性。廣義組合預測模型可分為誤差修正類、模型優化類、分解重組類3種[10],分別從誤差校正、參數優化、數據降噪的角度來提高預測精度。其中,模型優化類組合模型應用最為廣泛,通常為使用啟發式算法解決人為設定超參數導致模型性能局限的問題。殷禮勝等人[11]使用遺傳粒子群算法對小波時間網絡的參數進行優化,提升了模型訓練的收斂速度;Zhang等人[12]使用一種具有混沌特性的改進的遺傳算法優化支持向量機模型的參數,提高了短時交通流預測的準確性。除了傳統的啟發式算法,近年來,也出現了一批專為機器學習任務設計的超參數調優框架,如AutoML-NNI, Hyperopt, Optuna, Ray, SMAC, Talos等。其中,Optuna相比于其他框架具有穩定性好、拓展性強、高效便捷的優點,可用于實現多種貝葉斯優化,在模型優化研究中也取得了出色的表現。分解重組類組合模型引入了信號分析領域的相關方法,以輸入數據為切入點,通過分解降噪來增強數據的平穩性并提高模型預測精度。寇唯[13]使用固有時間尺度分解算法分解進站客流序列,并針對波動較大的分量使用滑動平均法進行二次處理,增強了數據的可預測性;Zhang等人[14]將3維卷積神經網絡與集合經驗模態分解(Ensemble Empirical Mode Decomposition, EEMD)算法相結合,提出一種名為Deep Ensemble的混合預測模型,可應用于交通狀態監測和緩解擁堵;Wang等人[15]提出了一種使用自適應噪聲的完全總體經驗模態分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise, CEEMDAN)算法和基于注意力機制的卷積長短期記憶網絡的組合模型,以提取客流數據的時空特征。其中,CEEMDAN算法在經驗模態分解(Empirical Mode Decomposition, EMD)和EEMD算法的基礎上發展而來,更適用于處理復雜的、非平穩的客流序列。
組合模型擁有更為穩定且良好的預測性能,但如何將3個及以上的模型進行合理的組合,依然是目前研究的重點。鑒于此,本文提出一種新的深度學習組合預測模型,使用雙向長短期記憶網絡(Bidirectional Long Short-Term Memory, BiLSTM)作為底層模型,以學習前后兩個方向的客流量關系,結合分解重組類和模型優化類組合模型的方法原理,使用CEEMDAN算法進行數據降噪處理,再使用Optuna進行超參數尋優,使組合模型中的各個模型算法優勢互補,取得更高的預測精度。
CEEMDAN算法通過在分解的各個階段添加自適應高斯白噪聲,將原始信號分解為多個本征模態分量(Intrinsic Mode Function, IMF),進一步削弱了EMD算法存在的模態混疊的問題,使得分解的過程更加完整,且重構誤差幾乎為零。該算法的流程如下:
(1)向原始信號yt加入初始振幅為ε0的高斯白噪聲ε0ωi(t) ,(i=1, 2,···, I),其中ωi(t)為服從標準正態分布的白噪聲序列,得到新的信號yi(t)=y(t)+ε0ωi(t),對新信號進行EMD分解,得到第1階段的i個模態分量 IMFi1,對其進行總體平均即可得到CEEMDAN分解的第1個本征模態分量 IMF1。
(2)計算除去第1個模態分量后的殘差
(3)定義Ek表示由EMD分解得到的第k個模態分量,向殘差r1(t)中添加噪聲分量ε1E1(ωi(t)),再進行分解得到2階模態分量為
(4)重復步驟(2)、步驟(3),對于k=1, 2, ···,n,可以得到去除第k個分量后的殘差以及第k+1個模態分量
(5)當殘差rk(t)無法繼續分解時,分解終止,得到最終的殘差信號為
使用CEEMDAN分解后會產生較多個IMF分量,如果直接作為模型輸入進行預測,將產生龐大的計算量,且不利于后續優化算法的疊加,因此需要對IMF分量進行合并重構。在此過程中,由于各IMF分量的規律性和復雜程度差異較大,需要對IMF分量的復雜程度、與原始數據之間的相似度進行評估,并合理地結合兩者的結果[16]。本文分別使用樣本熵和層次聚類進行分量復雜性和相似度評估,并在此基礎上進行分量合并與重構。
2.2.1 樣本熵
樣本熵(Sample Entropy)作為近似熵的改進版本,降低了近似熵的計算誤差,抗噪能力更強,更適用于時間序列分析,被廣泛應用于度量時序數據的復雜性。樣本熵越大,時序數據的復雜程度越高,噪聲干擾越強;反之則表明數據的成分較為單一,復雜度低,噪聲少。
對于由N個數據組成的時間序列,其樣本熵的計算方法為
其中,維數m通常取值為1或2,相似度r通常取原始序列標準差的0.1~0.25倍,Am(r)為兩個序列在相似度r下匹配m+1個點的概率,Bm(r)為兩個序列匹配m個點的概率。
2.2.2 層次聚類
聚類分析方法可用于衡量樣本之間的相似性,將相似性相近的樣本歸為一類。層次聚類是較為常見的一種聚類算法,通過計算不同類別樣本之間的相似度來創建一棵有層次的聚類樹,樣本間的相似度越高,距離越小。聚類樹的創建方法分為凝聚(自下而上合并)和分裂(自上而下分裂)兩種。本文采用凝聚方式,對分解得到的IMF分量進行聚類。
LSTM由RNN發展而來,保持了RNN的記憶功能,并通過有選擇的記憶和遺忘,有效地解決了RNN存在的梯度消失及長程依賴問題。BiLSTM由前向LSTM和后向LSTM疊加而成,具有前后兩個方向的傳輸層,且都與輸出層相連,能夠有效利用LSTM網絡無法捕獲的后向信息,使每一節點都能獲得過去和未來兩個方向的數據信息,學習兩個方向之間的相互作用關系,使預測結果更加準確,其結構如圖1所示。

圖1 BiLSTM結構圖
BiLSTM網絡在t時刻的輸出由同一時刻前向層和后向層的輸出進行拼接得到,其計算公式為
Optuna[17]是由日本人工智能公司Perferred Network提出的一款自動超參數優化框架,包含3個核心概念,分別是目標(objective)函數、單次試驗(trial)和研究(study)。其中objective通常對應模型的損失(loss)或準確度(accuracy),trial表示目標函數的單次調用,而study對象包含了一系列的trials,用于管理優化過程。Optuna具有高效的采樣機制和剪枝算法、便捷的可視化、高度兼容的通用架構等特征[18]。優化過程中,Optuna通過不斷試錯進行剪枝,并依據歷史試驗結果來確定下一輪調優的參數組合,直到達到最大試驗次數,最終輸出最優解及最優目標函數值[19]。本文選用Optuna框架中的樹形結構Parzen優化器(Tree-structured Parzen Estimator, TPE)進行超參數優化,該算法基于貝葉斯優化原理,通過構建目標函數的概率模型對超參數進行評估,并根據評估結果選擇下一輪試驗的超參數,有效縮短調參時間。
針對特定車站的進站客流序列,本文提出了一個CEEMDAN-TPE-BiLSTM組合模型進行短時客流預測,建模及試驗的基本流程如圖2所示,主要步驟可歸納如下:

圖2 建模及實驗流程圖
(1)CEEMDAN分解。使用CEEMDAN算法對原始進站客流序列進行分解,得到n個IMF分量,通過計算樣本熵和層次聚類對分量進行評估與重構,得到新的k個IMF分量(k<n),用作后續組合模型的輸入,建立CEEMDAN-BiLSTM模型;
(2)組合模型搭建。使用Optuna中的TPE算法對各IMF分量在BiLSTM模型中的超參數進行優化,使用優化后的超參數搭建CEEMDAN-TPEBiLSTM組合模型,將k個IMF分量的預測結果累加求和得到組合模型的最終預測結果;
(3)實驗結果對比。使用BiLSTM模型、CEEMDANBiLSTM模型、TPE-BiLSTM模型、CEEMDANTPE-BiLSTM模型分別進行預測,選取評價指標對4個模型的預測效果進行對比分析,驗證CEEMDANTPE-BiLSTM組合模型的有效性。
本文所使用的數據集來源于杭州地鐵2019年1月2日至1月26日的AFC刷卡數據,選取龍翔橋站作為目標站點進行實例分析,該站靠近杭州西湖風景名勝區,為典型的景區型站點。為方便計算,規定運營時段為每日的5:30-23:30,以15 min為時間粒度進行時段劃分和進站客流量統計,將單日的運營時段劃分為72個時間片段,累計得到1 800個時間片段的進站客流量。
進站客流量通常以“周”為單位呈現出一定的周期性和規律性。鑒于此,將原始數據集劃分為兩組數據集分別進行預測。工作日數據集共18 d,取前13 d作為訓練集,后5 d作為測試集;非工作日數據集共7 d,取前5 d作為訓練集,后2 d為測試集。
4.2.1 初始分解結果
使用CEEMDAN算法對龍翔橋站的工作日和非工作日的進站客流序列分別進行分解。設置添加白噪聲的幅度均為原始數據標準差的0.2倍,添加白噪聲組數均為 500組,最大分解次數均為5 000次,分解得到的多個IMF分量按頻率由高到低排列如圖3所示。其中,最后一個分量為趨勢量,體現了進站客流序列的總體變化趨勢。

圖3 進站客流序列CEEMDAN分解結果
4.2.2 分量分類與重構
為了提高網絡預測速率且保持數據的完整性,本文通過計算各分量的樣本熵以及對分量進行層次聚類,分別用以衡量IMF分量自身的復雜性及彼此之間的相似性,在此基礎上將初始IMF分量進行分類合并與重構。設定嵌入維數為2,相似度為原始數據標準差的0.2倍,計算各分量的樣本熵,結果如表1所示。
可以看出,工作日和非工作日的IMF1~IMF3的樣本熵值均較大,分量復雜度較高,這3個分量各自為一類,再將工作日剩余的IMF4~IMF11,非工作日剩余的IMF4~IMF9分別進行層次聚類,計算各分量兩兩之間的平均距離,得到聚類結果的樹狀圖如圖4所示。

圖4 IMF分量聚類結果
根據工作日的分量聚類結果,將距離較近,較早聚為一類的IMF4, IMF5劃為一類,IMF7~IMF9劃為一類,剩余的IMF6, IMF10, IMF11劃為一類,將這6類IMF分量進行合并重組并重新編號,得到新的IMF1~IMF6圖像如圖5(a)所示;類似地,根據非工作日的分量聚類結果,將IMF4, IMF5劃為一類,IMF7, IMF8劃為一類,剩余的IMF6, IMF9劃為一類,合并重構后新的IMF1~IMF6圖像如圖5(b)所示。可以看出,重構后各分量保持了與原始數據相似的規律性,且波動性較原始數據更弱。

圖5 IMF分量重構結果
使用以TensorFlow為后端的Keras平臺,搭建BiLSTM網絡作為底層基準模型,添加Dropout層,設置隨機失活概率為0.2。其余參數設置為選用Tanh函數為激活函數,Adam優化算法,均方損失函數,單隱藏層神經元個數為32,迭代次數為50,批大小設為32,學習率設為0.005,時間步長為8,即使用前兩個小時的歷史數據對下一時刻的數據進行預測。在此基礎上,使用4.2節重構得到的IMF1~IMF6作為BiLSTM網絡的輸入,構建CEEMDAN-BiLSTM模型。
分別在BiLSTM模型和CEEMDAN-BiLSTM模型的基礎上,使用TPE算法對二者的超參數進行優化,其中,后者需要對輸入模型的6個IMF分量的模型參數分別進行優化。待優化的超參數均設為隱藏層神經元個數(units)、批大小(batch size)、迭代次數(epochs)、學習率(lr),其余參數保持不變。規定待優化參數的搜索空間范圍(最小值和最大值)及步長設置如表2所示。

表2 待優化超參數搜索空間范圍
設置試驗次數為50次,以均方根誤差為目標函數向最小方向迭代尋優,得到工作日、非工作日對應的兩個模型優化后的超參數如表3所示。

表3 優化后各模型的超參數
使用優化后的參數對模型進行訓練,得到TPEBiLSTM模型、CEEMDAN-TPE-BiLSTM組合模型的預測結果,繪制4個模型的預測結果對比圖如圖6所示。可見無論是工作日還是非工作日,4個模型中,BiLSTM模型僅能夠描繪出客流變化的大體趨勢,TPE-BiLSTM模型與之相比有所進步,但在波動較大的時段上預測效果不佳;而CEEMDAN-BiLSTM模型在把握客流變化走向的同時也能夠展現出高峰特征,CEEMDAN-TPE-BiLSTM組合模型的預測曲線則最貼近真實值,在峰值細節刻畫上表現最佳。

圖6 模型預測效果對比
為驗證組合模型的有效性,采用均方根誤差(Root Mean Squared Error, RMSE)、平均絕對誤差(Mean Absolute Error, MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE)、R2決定系數對4個模型的預測效果進行評價,4項指標的計算公式如式(11)-式(14),計算結果如表4所示。其中,n為樣本個數,yi,和分別表示真實值、預測值以及樣本均值。

表4 模型預測性能評價指標
使用經過CEEMDAN算法分解后的IMF分量作為模型的輸入,將所得到的預測結果與BiLSTM模型的各項評價指標進行比對,可以發現RMSE,MAE, MAPE 3項誤差指標顯著降低,擬合優度R2明顯提升,可見對輸入數據進行分解降噪預處理,能夠降低模型的預測誤差;再對比BiLSTM模型和TPE-BiLSTM模型,CEEMDAN-BiLSTM模型和CEEMDAN-TPE-BiLSTM模型的各項評價指標,說明超參數優化使模型性能有所提升。
4個模型的預測結果中,CEEMDAN-TPEBiLSTM組合模型同時從數據降噪和參數優化的角度提升了模型性能,在工作日和非工作日兩種情景下的預測結果中均取得了最高的預測精度,3項誤差指標均為最低,擬合優度指標均為最高,驗證了本文提出的CEEMDAN-TPE-BiLSTM組合模型的有效性。
進一步地,為研究模型在高峰時段的預測精度,對龍翔橋站每日的客流分布情況進行高峰狀態判定。對于全日客流量較大,高峰特征不明顯的龍翔橋站,傳統的高平峰劃分方式顯然并不適用。為此,本文借鑒文獻[20]中關于客流高峰持續時間的定義,以單位時間客流量的上80%分位點作為客流高峰狀態的臨界值。具體的判定標準為,對站點單日的進站客流量進行統計并從低到高排序,則后20%進站量對應的時段為高峰時段,在進站客流分布圖上做“y=臨界值”的虛線用以區分,全部25 d的高峰狀態判斷結果如圖7所示。考慮到客流存在短暫波動的情況,本文規定只有在30 min內,即連續兩個時間片段內進站客流量均達到臨界值時,才判定該時段為高峰時段。圖中橫縱軸分別表示時間片段和進站客流量。

圖7 高峰時段劃分圖像
計算模型在客流高峰狀態下的4項評價指標如表5所示。其中,多個模型的R2決定系數為負值,說明模型在高峰時段的預測誤差大于取該時段樣本均值得到的預測誤差,且RMSE, MAE明顯高于整體的對應值,其中非工作日模型的RMSE, MAE又遠大于工作日模型的對應值,說明模型在高峰時段的預測結果中,尤其是非工作日情景下,出現了較多異常值,高峰時段下的客流規律性更弱,可預測性更低。

表5 高峰狀態下模型預測性能評價指標
然而,在高峰時段的預測結果中,CEEMDAN-TPE-BiLSTM組合模型依然取得了最佳的預測結果,其中R2更是實現了由負到正的突破。因此可以看出,CEEMDAN算法弱化了客流高峰狀態下的噪聲干擾,有利于模型捕獲客流的高峰特征,參數優化則進一步提高了模型性能,這也再次驗證了本文組合模型的有效性。
本文根據城市軌道交通AFC數據,運用神經網絡、模態分解等方法,從參數優化和數據降噪兩方面入手,構建了一種深度學習組合預測模型。實驗結果表明,在工作日和非工作日兩種情景下,組合模型的RMSE, MAE, MAPE均為最小,R2決定系數均為最大,工作日(非工作日)的RMSE, MAE,MAPE值較底層BiLSTM模型分別降低了79.737(66.426), 55.505(42.241), 9.023%(6.538%),R2由0.914(0.956)提高到0.985(0.987)。可見本文提出的CEEMDAN-TPE-BiLSTM組合預測模型在短時客流預測中,可以取得較好的預測效果。但針對客流波動劇烈的高峰時段,如何更好地捕獲高峰客流特征,依然是后續研究的重點。此外,本文在進行超參數尋優的過程中,僅對神經網絡模型的神經元個數、學習率等4個超參數進行了尋優,針對每個IMF分量只進行了50輪尋優試驗。因此,分析各超參數的重要程度、選取其余多個超參數進行多輪尋優將是下一步的研究內容。