基于深度長短期記憶網絡的地鐵進站客流預測*

2019-10-16 00:40:14崔洪濤陳曉旭段紅勇

城市軌道交通研究 2019年9期

崔洪濤陳曉旭楊超,3 項煜段紅勇

(1.河南省高速公路聯網監控收費通信服務有限公司，450018，鄭州；2.同濟大學道路與交通工程教育部重點實驗室，201804，上海；3.同濟大學城市交通研究院，200092，上海;4.河南省交通一卡通有限責任公司，450018，鄭州//第一作者，高級工程師)

客流預測對于地鐵線路設計規劃、運營管理以及預警都有著重要意義。當前地鐵客流預測方法主要包括基于線性理論預測、基于非線性理論預測和基于組合模型預測的3種方法。線性預測模型主要包括時間序列法[1-3]和卡爾曼濾波模型[4]等。線性預測模型理論簡單，但是當預測時間變短(小于15 min，甚至更短)時，隨著客流量的非線性與不確定性增強，基于線性理論的預測模型預測性能就會變差。

地鐵客流具有非線性、隨機性、周期性的特點，短時客流波動性與隨機性尤其較大，因此短時客流預測應采用非線性模型進行分析。常用的基于非線性理論的預測模型主要有非參數回歸模型[5]、馬爾可夫鏈[6]、神經網絡[7]、支持向量機[8]等。基于非線性理論的預測方法更加符合地鐵客流的非線性特點，該方法只需根據歷史數據訓練，從數據本身尋找演變規律，因此該方法需要大量的數據做支持，相應的運算量也會增大。

單一的線性或非線性預測模型往往存在一定的不足與缺陷。多種模型結合預測方法利用兩種或者兩種以上的預測方法進行預測，既避免了每種方法的缺陷，同時又很好地繼承了各種方法的優點，預測精度也較單一預測模型有所提高。文獻[9]利用徑向基(RBF)神經網絡模型進行城市軌道交通線路流量的預測，構建了基于混合核函數的支持向量機模型進行進站客流量預測，最后融合兩種預測方法構建了基于灰色關聯度最大化的組合預測模型來預測重大節假日線路客流量。文獻[10]提出的城市軌道交通短時客流預測模型(EMD-BPN)，包含經驗模態分解和反向傳播神經網絡預測模型的組合。文獻[11]提出了基于聚類搜索的改進遺傳算法和小波神經網絡(IGA-WNN)客流預測模型。

近年來深度學習有了充分的發展，當前使用比較多的是深度神經網絡。文獻[12]設計了深度長短期記憶網絡(DLSTM)模型，并利用DLSTM模型對石油產量進行預測。本文首先對多源數據(地鐵IC卡數據、氣候數據和節假日數據)進行特征構造，然后利用DLSTM模型進行地鐵客流預測。本次研究選取深圳市2014年1—3月的地鐵刷卡數據進行研究。選取前兩個月的數據為訓練集，后一個月的數據為測試集。采用不同的DLSTM來預測地鐵客流，并與差分自回歸移動平均(ARIMA)模型、BP神經網絡(BPNN)模型、循環神經網絡(RNN)模型和支持向量機(SVR)模型進行比較。試驗結果表明，DLSTM模型在準確性方面優于其他模型。

1 數據預處理

本次研究使用的數據來自深圳地鐵，包括2014年1—3月的地鐵IC卡數據、節假日數據和氣象數據。截至2014年底，深圳地鐵網由5條線路和118個站點組成，運營里程為178 km，年度客流量為8.6億人次。地鐵IC卡數據格式如表1所示。

表1 2014年深圳市地鐵IC卡數據格式

首先對地鐵數據中的異常數據進行處理。異常數據包括完全相同的記錄、刷卡時間字段有缺失的記錄。完成數據清理后，選取深圳北站地鐵站刷卡時間在6:00—23:00的地鐵IC卡數據記錄。此次研究對象為深圳北站地鐵站，因為深圳北站是重要的交通樞紐，客流量較大。前兩個月的數據用于訓練模型，后一個月的數據用于測試驗證。深圳北站地鐵站一周的進出站客流量如圖1所示。

圖1 深圳北站地鐵站一周進出站客流量

從圖1中可以看出：進出站客流量都呈現出了一定的周期性，并且進站客流量和出站客流量存在明顯的潮汐現象；早高峰的進站客流量遠遠高于出站客流量，晚高峰的進站客流量則遠遠低于出站客流量；工作日的客流量存在明顯的早晚高峰，周末的客流量變化相對平緩，不同的工作日之間又有一定的差異。

乘客選擇地鐵出行與天氣狀況以及是否是節假日有密切關系。文獻[13]對站點進站客流量與天氣情況進行了相關性分析，結果顯示相關性顯著。而客流量還與當天是否是節假日也有很強的相關性。因此氣候數據集與節假日數據集也被用于構造輸入特征。氣候數據集如表2所示，節假日數據集如表3所示。

表2 深圳市氣候數據格式

表3 節假日數據格式

在本次研究中，對地鐵IC卡數據、節假日數據和氣象數據進行融合。選取客流量所在星期、小時、5 min間隔編號、是否節假日、平均氣溫、最高氣溫、最低氣溫、降雨量、大氣壓、風速、云量、預測時刻的前6個時間間隔的客流量(例如預測9:00—9:05的客流量，用8:30—8:35、8:35—8:40、8:40—8:45、8:45—8:50、8:50—8:55、8:55—9:00的客流量來構造特征)。因此，特征變量可以構造訓練數據集。

2 DLSTM模型構建

2.1 LSTM模型

LSTM模型最初由文獻[14]作者提出，LSTM模型的主要目標是解決RNN梯度消失且很難處理長序列數據的問題。LSTM模型由輸入層、循環隱藏層和輸出層組成。與傳統的神經網絡不同，LSTM模型隱藏層的基本單元是記憶模塊。記憶模塊包含細胞狀態單元(CEC)和3個稱為門的特殊運算單元。CEC在整個鏈中直接向下運行而沒有任何激活功能，因此當運用反向傳播算法訓練LSTM模型時梯度不會消失。記憶模塊包含輸入門、遺忘門和輸出門3個門結構，它們可以控制記憶模塊內的信息流。LSTM模型記憶模塊的原理如圖2所示。遺忘門確定單元狀態拋出哪些信息，輸入門決定哪些新信息存儲在單元狀態中，輸出門決定單元狀態的哪些信息作為輸出。

圖2 LSTM記憶模塊原理圖

模型輸入為：X=(X1,X2,…,XT)，隱藏層狀態可以通過以下循環訓練得到：

ft=σ(XtUf+St-1Wf+bf)

(1)

it=σ(XtUi+St-1Wi+bi)

(2)

Ct=Ct-1?ft⊕it?tanh(XtUc+St-1Wc+bc)

(3)

ot=σ(XtUo+St-1Wo+bo)

(4)

St=ot?tanh(Ct)

(5)

式中：

Wf、Wi、Wo、Wc——分別為遺忘門、輸入門、輸出門和CEC的輸入權重矩陣；

Uf、Ui、Uo、Uc——分別為遺忘門、輸入門、輸出門和CEC的循環權重矩陣；

bf、bi、bo、bc——分別為忘記門、輸入門、輸出門和CEC的偏差向量；

Xt——第一層LSTM模型記憶模塊的輸入；

ft、it、ot、Ct、St———分別為t時刻忘記門、輸入門、輸出門、CEC和單元的輸出；

St-1——t-1時刻單元的輸出;

Ct-1——t-1時刻CEC的輸出；

⊕和?——分別代表向量求和與向量點積運算；

σ(·)——標準sigmoid函數；

tanh(·)——雙曲正切激活函數。

2.2 DLSTM模型

在DLSTM模型中，將多個LSTM模型塊進行連接，如圖3所示。DLSTM模型可以結合每個LSTM模型層的優點。在分層體系結構中，堆疊多個LSTM模型可以在較低層構建特征。這些特征可以將輸入數據中的變化因素，利用非線性轉化在較高層映射輸出。文獻[15]認為在大型或復雜數據情況下，深層次的架構將比淺層架構更能反映出數據的內在聯系。

圖3 DLSTM 模型結構

St-1,1為上一個狀態的第一層的輸出，St為現在狀態的第一層輸出且是下一個LSTM模型記憶模塊的輸入。對于第二個LSTM模型記憶模塊，由上一個狀態的St-1,2和現在狀態上一層的輸出St,1就可以計算得到該記憶模塊的輸出St,2。后面各層的計算原理都是相同。

2.3 評價指標

為了全面地評價模型的預測效果，本文選取平均絕對誤差(EMA)、均方根誤差(ERMS)、平均絕對百分比誤差(EMAP)作為模型評價指標。這3個指標可以反映預測值與實際值之間的誤差大小，其定義分別為：

(6)

(7)

(8)

式中:

h(i)——預測值；

f(i)——真實值。

3 試驗結果

利用DLSTM模型分別對深圳北站地鐵站的進站客流量和出站客流量進行預測。并且與其它模型預測結果進行比較，比較模型分別為差分自回歸移動平均模型(ARIMA)、BP神經網絡(BPNN)、循環神經網絡(RNN)、支持向量機(SVR)。

設計了3種不同層數的DLSTM模型，分別對進站客流量進行預測。不同結構的DLSTM模型參數以及預測評價指標結果如表4所示，不同DLSTM模型結構的客流量預測結果如圖4所示。

表4 不同DLSTM模型的進站客流量預測評價指標

由表4可知，隨著DLSTM模型的深度增加，預測精度變高。DLSTM3模型的精度為：EMA=32.33,ERMS=45.74,EMAP=13.90%。

圖4 不同DLSTM模型的進站客流量預測結果

從圖4中可以看出，DLSTM模型具有較好的預測效果，并且DLSTM3模型的預測值曲線和真實值曲線差異最小。

不同預測模型的進站客流量預測評價指標如表5所示，不同預測模型的進站客流預測結果如圖5所示。

表5 不同預測模型的進站客流量預測評價指標

由表5可知，DLSTM3模型的預測精度最高。在所有的比較模型中，RNN模型預測效果最好，而SVR模型的預測效果最差。DLSTM3模型與SVR模型相比較，EMA降低了30.14，ERMS降低了25.62，ERMS降低了20.88%。DLSTM3模型與RNN模型相比較，EMA降低了10.05，ERMS降低了12.84，ERMS降低了2.29%。

圖5 不同預測模型的進站客流量預測結果

由圖5可見，DLSTM3模型的預測值曲線和真實值曲線差異性最小，而SVR模型的預測值曲線和真實值曲線差異最大。

4 結論

本文提出利用深度長短期記憶網絡(DLSTM)方法預測地鐵進站客流量。首先，對地鐵刷卡數據、氣候數據和節假日數據進行預處理并完成特征構造。對深圳北站地鐵站進站客流量進行試驗驗證，設計了不同的DLSTM模型，對各模型的預測結果進行對比分析。結果表明，DLSTM模型預測準確度隨著DLSTM模型深度的增加而提高。然后，將DLSTM模型預測結果與其它4種模型(ARIMA、BPNN、RNN、SVR)的預測結果進行比較，結果表明，DLSTM 的預測精度更高。充分驗證了深度長短期記憶網絡方法在地鐵客流預測中的適用性和準確性。在下一步的研究中，將考慮DLSTM模型與其他模型結合起來建立組合模型。