杜文博 石婉君 廖盛時 朱熙
(1. 北京航空航天大學 電子信息工程學院, 北京 100083; 2. 北京航空航天大學 前沿科學技術創新研究院, 北京 100083)
相比于城市道路交通,機場快軌以準點率高、速度快、運能大、舒適性好等優勢,成為銜接機場與市區的重要交通方式。 然而,目前中國各大機場的快軌系統時常出現繁忙時段運力不足、空閑時段運力浪費的“客流-運力”不匹配現象,成為進一步提升民航旅客出行效率和機場運轉效能的瓶頸之一。 因此,有必要依據機場客流動態變化情況對快軌運力進行高效調配。 為達到該目的,首要一步便是設計機場快軌客流的準確預測模型。
機場快軌客流受眾多非線性因素影響,如進離港航班旅客量、天氣、時段、是否為工作日等,這些因素對快軌客流的影響機理及相互之間的影響方式和大小各不相同;同時,這些影響在時間維度上也有著復雜的先后關系,難以定性和定量描述,如從機場到市區方向快軌的客流形成過程中,惡劣天氣會使到港航班靠橋時間延后,加上到港旅客從下機到抵達機場快軌站需要一定時間,造成了機場快軌客流變化在時序上相對于天氣與到港航班旅客數量等因素變化的復雜耦合性。 可見,機場快軌客流的形成是一個復雜多變的過程,準確預測機場快軌客流極具挑戰。
目前專門針對機場快軌客流預測的研究較少,而對于地鐵、鐵路客流預測問題,國內外已有不少研究,方法大體可分為2 類:①基于數學建模的方法;②基于機器學習的方法。 第1 類方法認為客流在歷史上的統計規律也適用于未來,基于對歷史客流數據的挖掘分析構建描述客流變化規律的統計學模型,從而實現對未來客流的預測。具體來說,Li[1]使用交通四階段預測模型,即基于交通產生量、吸引量、交通分布和交通方式劃分因素建立數學模型,對哈爾濱地鐵客流數據進行了預測分析;Ding 等[2]在自回歸移動平均(autoregressive integrated moving average,ARIMA)模型中增加自回歸條件異方差模塊,從地鐵歷史客流數據中捕捉軌道客流在一天中不同時段的平均值和方差;Zhang 和Liang[3]綜合考慮了客流數據的日相似性,計算2 周中同周次的客流量比值得到歸一化客流數據,再基于該數據建立改進后的卡爾曼濾波預測模型,實現了對北京地鐵站的客流預測。 總體上,基于數學建模的方法通常計算復雜度低、易于實現,但就本文所研究的機場快軌在未來較短一段時間內客流的預測問題來說,該類方法難以準確建模與短時客流密切相關的氣象、航班載客數等高動態因素對客流的影響,因此對機場快軌短時客流預測的精度較低。
第2 類方法是基于機器學習的軌道客流預測方法,通過使用歷史軌道客流樣本訓練機器學習模型,從樣本中挖掘客流受多種因素影響而動態變化的知識,從而實現對未來客流量的預測。 具體來說,Roos 等[4]從所研究站點客流與其自身歷史客流及臨近站點客流具有因果關系這一事實出發,采用貝葉斯網絡對客流進行預測,且提出了一種缺失數據擬合策略,在客流數據不完整時采用最大期望算法學習網絡結構和參數,提升了該方法在數據缺失條件下的魯棒性;惠陽等[5]通過反向傳播神經網絡(back propagation neural network,BPNN)構建節假日、是否為工作日、時段、天氣等多種因素與地鐵客流間的映射,實現了對西安地鐵各站客流的準確預測;Sun 等[6]針對地鐵客流數據變化兼備規律性及隨機性,將客流變化曲線視作信號,提出了先使用小波分析對客流變化曲線的高頻和低頻成分進行拆解,再使用多個支持向量機對各成分分別學習預測,最后綜合預測結果,避免了客流曲線不同頻段成分在預測過程中的相互影響。 上述軌道客流預測方法所采用的機器學習模型較為經典,較基于數學建模的方法對多維因素影響客流的非線性機理挖掘得更深,但在捕捉高動態因素與快軌客流間的復雜時序關聯上仍較為欠缺,導致預測性能并未達到最佳。 為此,一些學者使用時序深度學習網絡來解決該問題。 Yang 等[7]使用長短時記憶(long short-term memory,LSTM)網絡對地鐵客流進行預測,且考慮到每天相同時段的客流變化趨勢較為類似,因此,借助時間注意力機制重點關注所預測時段在歷史數據上的客流變化情況,提升了預測準確性;Ma 等[8]將客流數據分布轉化為靜態圖像,采用卷積神經網絡(convolutional neural network,CNN)提取其中的空間特征,進而用Bi-LSTM 網絡對客流時間序列分別從前向和后向學習時間特征,實現了地鐵客流數據空間特征和周期性的有效提取;Liu 等[9]使用3 個LSTM 網絡分別提取地鐵客流的時、日、周特性,結合天氣、是否為工作日、降水、地鐵運營時刻、站點間的交通時長等影響客流的因素對地鐵換乘站及常規站點客流進行了準確預測。
綜上所述,基于時序深度學習的軌道客流預測方法因對深層次時空特征挖掘的能力強已成為軌道客流預測的主流方法。 但已有相關工作大多針對市區內軌道交通,而本文所研究的機場快軌客流形成機理較之更為復雜。 機場快軌客流由乘機、下機、接機、送機等多類人員組成,受氣象、航班延誤、旅客通關等高動態因素影響較大,同時這些因素變化與機場快軌客流形成之間存在顯著但難以量化的時序關聯,這些特點導致傳統時序深度學習網絡難以高效學習機場快軌客流的變化規律。
為此,本文提出了一種基于“時間-特征”協同注意力機制的機場快軌客流預測方法。 該方法在LSTM 時序預測模型的基礎上嵌入了“時間-特征”注意力機制,用于精細化捕捉各維特征在不同時序上對機場快軌客流的影響規律。 將所提方法的性能與支持向量機(support vector machine,SVM)、BPNN、ARIMA、標準LSTM 等現有軌道客流預測代表性方法進行了對比,驗證了本文方法的優越性。
如圖1 所示,LSTM 網絡[10]由循環訓練的LSTM 單元構成,展開后呈現鏈狀,鏈中每個LSTM 單元對應著一個時間片。 LSTM 單元內部具體結構如圖2 所示。

圖1 LSTM 網絡Fig.1 LSTM network

圖2 LSTM 單元結構Fig.2 LSTM unit structure
LSTM 單元包含輸入門、遺忘門、輸出門和記憶細胞。 輸入門用來確定當前輸入有多少新的信息可以加入到記憶細胞中;遺忘門用來確定當前細胞需要遺忘的信息;輸入門和遺忘門共同更新記憶細胞在每個時間片的狀態;輸出門用來控制記憶細胞要輸出的信息。 LSTM 單元涉及的計算公式如下:

式中:ft、it、ot∈Rm分別為遺忘門、輸入門、輸出門的計算結果;c⌒t、ct、ht∈Rm分別為新生成的細胞狀態、當前細胞狀態、隱藏狀態;Whf,Whi,Who,Whc∈Rm×m和Wxf,Wxi,Wxo,Wxc∈Rm×n為 遺 忘 門、輸 入門、輸出門和單元狀態分別涉及的2 個權重矩陣;bf,bi,bo,bc∈Rm分別為遺忘門、輸入門、輸出門和單元狀態的偏置向量;xt為t時刻的輸入時間序列值;σ(·)為Sigmoid 激活函數;tanh(·)為雙曲正切函數激活函數;⊙為哈達瑪積。
Therefore, we analyzed miRNA expressions of both LSTs and protruded tumors as a specific feature of the stepwise progression from adjacent non-neoplastic mucosa to adenoma and submucosal invasive carcinoma using matched samples to compare accurate miRNA expression in each phase.
影響機場快軌客流的各個因素對快軌客流預測的貢獻程度、作用方式存在差異,為獲得準確的預測效果,需要對不同特征受關注程度,以及同一特征在不同時間片上的受關注程度進行學習和優化。 為此,本文提出了一種“時間-特征”協同注意力機制,使得預測模型能夠對不同時間片上不同特征的關注焦點進行動態調配。
近年來,注意力機制被廣泛應用于基于深度學習的各種分類、預測、聚類等任務中[11-12],促使模型在學習樣本過程中重點關注相對重要的特征或歷史時序(對于時序樣本),以獲得更好的樣本泛化能力。 自注意力機制在捕獲全局長時序依賴關系上較傳統注意力機制優勢明顯,然而自注意力機制對不同時間片使用的是同一組權重矩陣,不同特征之間權重不同,因此自注意力機制只能得到不同特征之間的相對注意力大小,無法得到一組時間序列中同一特征在不同時間片的注意力分布。 因此,本文通過對每一個時間片設置獨立的自注意力模塊,構建“時間-特征”協同注意力機制,實現為不同時間片上的多維特征進行獨立的權重分配。
本文所提出的基于“時間-特征”協同注意力(time and feature cooperative attention, TFATT)的快軌客流預測模型如圖3 所示。 首先,對客流及相關影響因素的原始數據進行清洗,包括對數據缺失部分進行推測補全,以及對異常數據進行剔除;然后,為了消除不同客流影響因素(或稱輸入特征) 間的量綱差異,對數據進行0-1 歸一化處理[13]。

圖3 機場快軌客流預測模型Fig.3 Passenger flow prediction model of airport express rail
歸一化后的輸入特征時序數據X= (x1,x2,…,xi,…,xT)∈Rn×T,其中n為輸入特征的數量,T為時間序列長度,隱藏層輸出H= (h1,h2,…,hT)∈Rm×T,其中m為LSTM 單元數量;再將H經過全連接層得到新的時間序列A=WF·H=(a1,a2,…,ai,…,aT)∈Rn×T,其中WF∈Rn×m為全連接矩陣。
為構建“時間-特征”協同注意力機制,本文方法針對每一個時間片設置了獨立的特征注意力模塊,即對于第i個時間片分別計算查詢(Query)矩陣Qi、關鍵字(Key)矩陣Ki、值(Value)矩陣Vi,1≤i≤T。

式中:e為K的維度大小。
對于每一個計算結果Attentioni(Q,K,V) ∈RT×n, 取其中第i個向量,記為atti,atti∈Rn。 將所有注意力模塊計算出的向量組合得到新的時間序列:ATT =(att1,att2,…,atti,…,attT)∈Rn×T,再經過一個全連接層得到^yst=wF2·ATT·wF3(wF2∈R1×n,wF3∈RT×1為全連接向量),最后對^yst進行反歸一化處理,得到機場快軌客流預測值^y。
本文選取2019 年1 月5 日至7 日、5 月9 日至11 日、8 月4 日至15 日、9 月27 日至30 日、12 月14 日至17 日共26 天的北京首都國際機場快軌站的進出站刷卡數據、機場天氣數據(含晴、霧、雨3 類),以及航班起降計劃數據和實際起降數據。 目標預測時段為6:30—23:00,選取10 min作為一個時間片長度(共計100 個時間片/天×26 天=2 600個時間片),統計每個時間片對應的市區到機場方向客流、機場到市區方向客流、天氣、機場實際/計劃到離港航班載客數、時段信息(以1 h為單元,如19 ~20 時段)、工作日/非工作日信息。
本文將所提TFATT 模型與近年來最常見的軌道客流預測模型SVR[6]、BPNN[5]、ARIMA[2]和標準LSTM[7]模型進行對比,通過咨詢行業領域專家與調研文獻,得到影響機場快軌客流的主要因素包括快軌客流歷史數據、進離港航班旅客量、天氣、時段、是否工作日等。 為了明確機場到市區、市區到機場2 個方向上機場快軌客流的關鍵影響因素,本文基于2 600 條樣本,使用Pearson相關系數、SNR 信噪比對各個客流影響因素與2 個方向客流的關聯程度作初步檢驗,并挑選其中關聯度較大的特征作為模型輸入(ARIMA 模型除外,根據文獻[1]可知其輸入特征僅為客流)。具體為:對于機場到市區方向客流,特征包括機場到市區方向歷史客流、機場實際到港航班載客數(機場實際到港航班載客數與快軌客流間Pearson系數為- 0. 106)、實際與計劃離港航班載客數(實際離港航班載客數與快軌客流間Pearson 系數為0.302,計劃離港航班載客數與快軌客流間Pearson 系數為0.244)、天氣(晴、霧、雨天氣與快軌客流間信噪比為0.114)、時段(時段與快軌客流間信噪比為1.426)、是否工作日(是否工作日與快軌客流間信噪比為0.108);對于市區到機場方向客流,特征包括市區到機場方向歷史客流、機場計劃到港航班載客數(機場計劃到港航班載客數與快軌客流Pearson 系數為-0. 078)、機場實際與計劃離港航班載客數(機場實際離港航班數與快軌客流Pearson 系數為0.136,機場計劃離港航班數與快軌客流Pearson 系數為0.156)、天氣(晴、霧、雨天氣與快軌客流間信噪比為0.265)、時段(時段與快軌客流間信噪比為0.671)、是否工作日(是否工作日與快軌客流間信噪比為0.311)。 各模型采用目標預測時間片的前6 個時間片的特征向量,對目標預測時間片客流進行預測。
考慮到模型的參數對模型性能有很大的影響,目前還沒有成熟的模型參數選取理論方法,因此,本文進行了參數遍歷實驗來挑選參數。 參數設置如下:①SVM。 核函數選擇徑向基函數(radio basic function,RBF),核系數gamma 設為auto,誤差項的懲罰參數C設為10。 ②BPNN。 BPNN 隱含層數設為2,每層大小設為36。 ③ARIMA。 自回歸系數p設為4,滑動平均系數設為1,差分階數d設為0。 ④LSTM。 batch_size =128,timesteps =6,epochs =300,LSTM 單元數設為70,LSTM 隱藏層數設為2,損失函數設為MAE,激活函數設為Sigmoid,優化函數設為Adam。 ⑤TFATT。 batch_size =128,epochs =300,隱藏層數設為2,損失函數設為MAE,激活函數為Sigmoid,優化函數設為Adam。
本文實驗在Windows10 系統中完成,CPU 為i7-8550U@ 1. 8 GHz,內存8. 0 GB,IDE 為Pycharm2018.2,Python 版本為3.6,實驗框架為Tensorflow2.6.2。
將26 天的數據中某一天的數據作為測試集(含100 條樣本),剩下25 天作為訓練集(含2 500 條樣本),設置26 組實驗,每組實驗獨立開展10 次,共開展260 次實驗。
本文使用均方誤差(mean square error,MSE)和平均絕對誤差(mean absolute error, MAE)來定量評估2 種模型的性能[14]。 計算公式如下:

式中:yi為實際值;^y為預測值;m為樣本總數。
基于2.3 節所述實驗設計,表1 為260 次實驗的平均結果。
由表1 可知,BPNN 和SVR 預測效果不如ARIMA、LSTM 及本文所提TFATT 模型,這是由于其雖然能夠在一定程度上挖掘出多維特征對客流的非線性影響,但不能捕捉多維輸入特征在前后時序上的關聯;ARIMA 僅使用歷史客流數據作為輸入實現對未來客流的預測,但其只能挖掘內生變量的時序影響而未考量其他多因素的綜合影響,因此預測效果不如本文所提TFATT 模型;LSTM 可學習客流受到的多元特征時序影響,但面對機場快軌運行中復雜的多維因素與客流耦合機理,對于特征時序關聯的泛化準確度仍不足;本文所提TFATT 模型通過“時間-特征”協同注意力機制充分捕捉不同特征影響客流的時序滯后性,由表1 可知,本文所提模型在2 個方向上的客流預測效果均優于其他4個對比模型。
此外,由表1 還可看出,各模型對市區到機場方向客流的預測精度普遍低于機場到市區方向(后文將對該現象原因作進一步分析),但本文TFATT 模型相比于其他4 個模型在2 個出行方向上均有更好的預測效果,說明了“時間-特征”協同注意力機制對于提升模型預測性能的有效性。

表1 機場快軌客流預測性能Table 1 Forecasting performance of airport express rail passenger flow
為更直觀地查看各模型的預測效果,圖4 展示了將前25 天的樣本作為訓練集、最后1 天樣本作為測試集的預測曲線。

圖4 客流預測曲線Fig.4 Forecast results of passenger flow
由圖4 所示結果可知,5 種模型均能夠預測出機場快軌實際客流變化的總體趨勢,但仔細對比可發現,本文TFATT 模型較其他模型在對實際客流曲線的擬合度上更優。 機場快軌實際客流曲線均出現了在短時間內波動較大的現象,特別是在市區到機場方向,這是由一些偶然因素所致。例如,圖4(b)中市區到機場方向列車到達機場站時刻在各預測時間片上并非均勻分布,一旦有車到站則客流猛增,無車到站則客流稀少,造成實際客流曲線跳躍明顯。 由于偶然因素尚未被納入到本文實驗模型的輸入特征中,造成各模型的預測客流曲線均不能嚴密擬合于實際客流曲線,但實驗結果仍能說明在現有數據基礎上,本文方法相比于其他方法具有優越性。
1) 本文面向機場快軌運力配置不能適應客流動態變化導致運力不足或浪費的問題,提出了一種基于“時間-特征”協同注意力機制的機場快軌客流預測模型TFATT,通過對不同因素在不同時序下對于機場快軌客流影響的顯著性進行精細化建模,提升了機場快軌客流預測的精度,為機場運控部門開展機場快軌運力調控提供支撐。
2) 基于北京首都國際機場及其快軌實際運行數據開展快軌客流預測實驗,將本文所提客流預測模型TFATT 與常用的基于BPNN、SVR、ARIMA、LSTM 模型的客流預測方法進行了實驗對比,結果驗證了TFATT 模型的有效性。
目前僅考慮了機場路側的一種交通方式機場快軌進行客流預測,而實際上路側具有多種交通方式,彼此之間互有影響,后續可以開展機場快軌[15]、巴士[16]、出租車[17]等多種交通方式客流協同預測研究,以提升預測精度。