基于小波分解和長短時記憶網絡的地鐵進站量短時預測

2019-09-02 11:56:10高夢琦昌錫銘王歡

山東科學 2019年4期

關鍵詞：模型

高夢琦，昌錫銘，王歡

(北京交通大學交通運輸學院，北京 100044)

地鐵以其可靠性和安全性成為人們出行的首要選擇，客流量是地鐵項目設計與建設、運營與管理的基礎[1]。由于居民的出行會受到天氣、突發事件等影響，具有一定的隨機性，中長期預測已經難以反映地鐵客流的實時變化趨勢。因此，需要對地鐵客流量進行短時預測，使管理部門把握客流的動態變化規律，加強對市場的應變能力，適時調整客運服務計劃，加強對客流的動態管理。

由于短時客流量具有非線性與波動性，對其的預測依舊是一個有難度的問題。國內外學者都對短時客流預測做了大量研究，現有的基于數據的短時預測方法主要分為參數和非參數兩大類。參數方法中，未來交通量和歷史數據的函數關系是已知的，未知參數可以從訓練集中估計。Li等[2]對交通流量的時間序列數據的趨勢與波動進行分解，之后用套索回歸進行預測。Ding等[3]提出了ARIMA-GARCH模型，考慮地鐵進站量的波動特征對其進行預測。Ma等[4]提出了一種時空閾值矢量誤差校正模型(TS-TVEC)，考慮了路段流量與其上下游的時空關系。Ma等[5]提出了時間序列模型與卡爾曼濾波的組合模型。但是，這些參數方法不能反映數據的隨機性和復雜的非線性特性。非參數方法主要有神經網絡的方法，對模型不會做出很強的假設。Zhang等[6]將遺傳算法與深度信念網絡結合，對高速公路的車流量進行了預測。Zhao等[7]對公交乘客數據進行小波分解并通過BP神經網絡對分解序列進行預測，重構得到預測結果。Ouyang等[8]用粒子群算法優化后的BP神經網絡對小波分解后的子序列分別進行預測，將子序列相加得到最終預測結果。Li等[9]用多尺度徑向基函數網絡，對北京有突發事件的幾個地鐵站的出站量進行了多步預測研究。這些方法考慮了時間序列的非線性特性，但沒有考慮交通數據在時間上的規律，而交通數據在時間上有一定的周期性。Kang等[10]用循環神經網絡中的長短時記憶網絡(LSTM)對高速公路的5 min交通流量進行了預測，考慮了時間序列數據在時間上的規律，但單一的運用LSTM沒有處理短時客流數據的波動性。

地鐵的進站量數據在時間尺度較小時隨機性與波動性更強，同時具有一定的周期性。本文提出了小波分解與長短時記憶網絡的組合模型(Wavelet-LSTM)，全面考慮了短時進站量數據的波動性、非線性特性和時間相關性，彌補了以往文獻只考慮單一特性的不足。用小波變換處理小時間尺度數據的波動性，LSTM在普通神經網絡能處理非線性數據特性的基礎上還可以學習數據的時序信息。通過與其他方法比較可知，此方法可以得到較為精確的預測結果，能夠使管理部門及時獲得動態客流信息，以便適時調整運營管理計劃，改善地鐵系統的運營管理水平。

1 預測模型

地鐵的短時進站量數據具有一定的非線性特性，因所取時間段較短，數據較多，每個數據之間都存在一定差異性，并且短時的客流量數據受時間等隨機因素的干擾較大，工作日早晚高峰客流量大且集中，瞬時客流量巨大，因此地鐵短時進站量數據有一定波動性。而小波分析能分離趨勢信息和波動信息，具有解決非穩定時間序列的能力，其分解后的低頻近似信號可以反映時間序列的趨勢，減少數據的波動性，因此常被用來解決時間序列問題。LSTM屬于神經網絡的一種，可以捕捉數據復雜的非線性特性并能考慮時間上的規律。本文的基于小波分解和LSTM的短時預測方法(Wavelet-LSTM)，對數據的性質考慮較為全面。因為小波分析主要用來提取趨勢信息、過濾波動信息，分解層數不需要太多，于是先通過小波分解對小時間尺度上的客流量的時間序列數據進行三層分解和單支重構得到分解后的四個子序列，以達到提取特征趨勢并分離噪聲的效果。對小波分解出來的每個子序列分別用能記憶時間特征信息的LSTM進行預測，最后對預測得到的子序列進行相加，得到預測的進站量。預測模型的結構見圖1。

圖1 小波分解與長短時記憶網絡的預測模型Fig.1 The Wavelet-LSTM forecasting model

1.1 小波變換

城市地鐵客流量的時間序列數據可看作一個一維信號，對其做小波分解得到分解系數，再通過分解后的小波系數進行信號的單支重構，可以將具有早晚高峰趨勢的低頻信號與包含噪聲信息的高頻信號分開，從而能達到提取特征的目的。

本文中，可把客流量當作一維的信號進行小波分解與重構。客流量為離散時間序列，因此使用離散小波變換中的快速二進正交小波變換[11](Mallat算法)對其進行分解和單支重構。

分解過程可表示為：

Dm=HAm-1，

(1)

Am=GAm-1，

(2)

式中，H和G分別為正交鏡像濾波器組中具有低通特性的濾波器和具有高通特性的濾波器;m為分解次數，A0為原始時間序列。經過第一次分解后，可得到包含原始信號主要信息的低頻近似信號A1，以及包含誤差的高頻細節信號D1；下一次分解將近似信號A1分解為A2和D2,…,直至得到平滑的低頻信號。經過m次分解后可以得到m+1個序列(D1,D2,…,Dm和Am)，分解過程如圖2所示。

圖2 小波分解過程Fig.2 The wavelet decomposition process

采用Mallat算法進行小波分解時，每次分解后的時間序列的長度都會減少，較短的時間序列數據對接下來的預測是十分不利的，但可以用重構算法對分解后的每個分量進行單支重構，從而使每個分解序列的長度和原來相同。單支重構過程可表示為：

am-1=H*Am+G*Dm，

(3)

式中，H*和G*分別是H和G的對偶算子。通過單支重構可以增加序列的長度，對D1,D2,…,Dm和Am分別進行重構，得到序列d1,d2,…,dm和am,其長度和原始序列相同，并且和原始序列有如下關系：

A0=d1+d2+…+dm+am。

(4)

本文中采用db4小波對原始數據進行分解并重構，由于小波分析的目的在于提取數據的主要變化趨勢，過濾隨機性信息，不需要進行過多的層數分解從而增加計算量，因此對進站量數據進行3層的分解與重構，將時間序列分為4個子序列(d1,d2,d3和a3)，對這些子序列分別利用LSTM進行預測，再相加得到原始序列，能有效提高預測精度。

1.2 長短時記憶網絡

神經網絡適用于非線性預測，但傳統的神經網絡模型不具有對歷史信息的記憶功能。神經網絡中的循環神經網絡(RNN)可以將先前神經元的輸出信息應用到當前的任務上，RNN的結構示意圖如圖3所示。

圖3 RNN結構示意圖Fig.3 Schematic of the RNN structure

但普通的RNN存在梯度消失或爆炸的問題[12]。長短時記憶網絡(LSTM)屬于循環神經網絡的一種，可以學習長期依賴的信息。LSTM將隱藏層的RNN神經元替換為LSTM神經元，不但具有RNN的記憶功能，而且克服了模型的長期依賴問題，能選擇性地遺忘無效信息并更新記憶有效信息，可以在一定程度上解決梯度彌散的問題。經過小波分解與重構后的序列依舊為時間序列，可通過LSTM對各序列進行預測。LSTM神經元的結構如圖4所示。

圖4 LSTM神經元結構Fig.4 Structure of the LSTM neuron

輸入序列為x=(x1,x2,…,xT)，即為時間序列數據，經過LSTM計算后的隱藏層序列為h=(h1,h2,…,hT)，輸出序列為y=(y1,y2,…,yT)，通過下式迭代：

ht=H(Wxhxt+Whhht-1+bh),

(5)

yt=Whyht+by，

(6)

其中W是權重系數矩陣(如Wxh是輸入層到隱藏層的權重系數矩陣，Whh為隱藏層之間的權重系數矩陣)，b為偏置向量(如bh表示隱藏層的偏置向量)，為隱藏層的轉換函數，由以下一系列函數實現：

it=σ(Wxixt+Whiht-1+Wcict-1+bi)，

(7)

ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)，

(8)

ct=ftct-1+itg(Wxcxt+Whcht-1+bc)，

(9)

ot=σ(Wxoxt+Whoht-1+Wcoct+bo)，

(10)

ht=oth，

(11)

式中，i,f,c,o分別為輸入門、遺忘門、神經元狀態和輸出門的輸出值。這里σ(·)是標準邏輯函數：

(12)

g(·)和h(·)是中心對稱的邏輯函數。

模型的訓練過程即為權重的迭代更新過程，訓練結果需與真實值相對比。本文LSTM中各個權重的更新是通過ADAM優化算法最小化目標函數et來實現的：

(13)

式中，pt為t時刻的真實值，yt為t時刻的預測結果，et即為均方誤差。訓練多次直到et最小，即為最終的模型。

本文對小波變換后的每個子序列都分別輸入LSTM進行預測，之后對每個子序列輸出的預測結果進行相加，可得到最終的地鐵站進站量預測結果。

1.3 誤差分析

對于地鐵站進站量的預測結果，本文采用平均絕對百分誤差(δMAPE)、均方根誤差(δRMSE)和希爾不等系數(CTIC)來檢驗其精度。幾個誤差公式定義如下：

(14)

(15)

(16)

2 數據來源與模型結構

本文選取北京地鐵2號線的西直門地鐵站作為研究對象，對其進站客流量進行預測。西直門地鐵站作為重要的換乘站點，有3條換乘線路，客流量較大，其進站量的預測對于站點內部的規劃、緊急事件下的乘客疏散等都有著重要意義。由于工作日和節假日的客流量規律相差較大，且工作日的出行為必要出行，所以對于工作日的進站量預測更加重要。

本文選取2014年3月3日—14日連續10個工作日7:00—22:00的地鐵刷卡數據作為研究樣本，對其進行預處理。以5 min為時間步長，每天可劃分為180個時間段，分時段來預測短時進站量。經過處理后，3月3日的進站量變化趨勢如圖5所示，呈現出明顯的早晚高峰趨勢，并具有波動性，且在高峰時段波動性較強。

圖5 3月3日進站量Fig.5 Passenger flow on March 3

其他幾個工作日的進站量也與3月3日相似，連續10個工作日的進站量見圖6，趨勢比較穩定。進站量在時間上的特性，表示適合用LSTM處理這種時間序列數據，因為模型可以記憶時間上的信息。

圖6 連續10個工作日進站量Fig.6 Passenger flow on ten consecutive working days

對該10 d的時間序列數據進行3層的小波分解并單支重構，得到4個有效的子序列，且每個子序列的長度都和原始序列相同。3月3日的進站量數據的重構結果見圖7，4個序列的長度相同，其中a3為最終得到的平滑低頻信號，有前后兩個高峰，反映了進站量的趨勢；其他3個序列反映了其他因素的干擾，波動性較強，且波動最大的地方對應于a3兩個高峰的位置。

圖7 3月3日進站量小波分解與重構Fig.7 Wavelet decomposition and reconstruction of the passenger flows on March 3

本文選取的循環神經網絡模型共3層，含有一個輸入層、一個隱藏層和一個輸出層，隱藏層即為LSTM層，層中神經元個數為10個。因為分解后的子序列數值有正有負，所以輸出層激活函數選擇tanh函數。將子序列中預測時段之前的5個時段的數據作為輸入向量，經過模型的計算，輸出為預測時段的進站量重構數據，再對其進行相加，得到最后的預測結果。

把前7 d的數據作為訓練集，后3 d作為測試集。訓練過程中，對各個分解序列的訓練次數達到1000時，均方誤差波動較小，幾乎不會再減小，因此把其定為模型的訓練次數。對LSTM得出的所有分解序列相加，即可得到后3 d的進站量預測結果。

另外，本文將提出的模型與LSTM、經驗模態分解[13](EMD)與LSTM相結合(EMD-LSTM)這兩個模型的預測精度進行對比，比較模型的優劣。

3 預測結果

將西直門地鐵站10個連續工作日的進站量數據經過本文的小波分解與LSTM進行預測后，3天測試集的子序列預測結果見圖8。

圖8 子序列預測結果Fig.8 Prediction results ofsubsequence

將子序列的預測結果進行相加，即可得到進站量的預測結果。圖9為Wavelet-LSTM、LSTM、EMD-LSTM的預測結果與實際進站量的對比圖。

圖9 預測結果Fig.9 Prediction results

對3個模型的預測結果和實際進站量進行誤差估計，以評價每個模型與真實值的擬合程度。對比結果表明本文采用的模型有明顯優勢，模型的預測誤差如表1所示。

表1 不同模型的預測誤差

由表1可知，Wavelet-LSTM模型的預測結果的誤差與另外兩個相比最小，其平均絕對百分誤差、均方根誤差和希爾不等系數分別為5.48%、18.13和0.03，與另外兩個模型相比均有下降。這表示數據的波動性對預測結果影響較大，且小波變換更適合處理這一特性，通過小波分解與重構分解時間序列數據、提取時間序列的特征趨勢之后再進行預測可以提高預測精度，比經驗模態分解更加有效；LSTM的記憶特性在時間序列數據上的應用較適合，與小波變換結合后，預測效果更好。因為本文的主要關注點在于提高模型的預測精度，而沒有過多關注運行效率，所以運行時間約為15 min，效率有待提升。

4 結論

本文使用了小波分解和LSTM相結合的方法來進行交通流量的預測，同時考慮到了短時進站量數據的波動性和在時間上的相關性，有效提高了預測精度。以北京西直門地鐵站為例，先對每天的進站量數據進行小波分解與單支重構，再對其用LSTM模型進行預測，得到的序列進行相加，從而得到進站量的預測結果。實驗結果表明，因為小波分解對數據有提取趨勢和減少波動性的作用，使時間序列的趨勢更加明顯，LSTM 可以學習記憶時間上的信息，適用于在時間上具有相關性的數據，從而得到了較好的預測結果。該研究為運營管理部門更好地捕捉地鐵客流動態變化規律、制定短時運營策略、管理車站動態客流提供了數據基礎，還能為乘客及時提供動態客流信息，促進城市交通合理規劃。本文的不足之處在于算法效率有待提升，并且沒有考慮天氣、季節等因素對進站量的影響，未來可以結合其他因素進行研究并改進算法效率。