張建旭,賓 科,蔣雨洋
(1.重慶交通大學 交通運輸學院, 重慶 400074; 2.重慶交通大學 山地城市交通系統與安全重慶市重點實驗室, 重慶 400074)
軌道區間客流擁擠度反映了該區間內軌道服務質量,高密度區間將由于服務水平較低導致客流流失。軌道運行區間客流預測能為列車運行調度提供依據,提高軌道服務質量及運營效益。
現有軌道客流預測常用時間序列模型[1-4]、機器學習[5-6]以及神經網絡模型[7-16]。例如,楊靜等[17]利用變點模型處理進站客流數據,結合小波變換和ARMA模型預測單站點進站客流,但站點客流無法反映區間客流擁擠度。部分研究以區間客流為研究對象,由歷史區間客流作為輸入,利用神經網絡模型預測下一時段區間客流[18],模型輸入的區間客流需結合全線OD數據推算,導致預測時效性不足。劉巖等[19]利用多維標度法分析線網各斷面之間的相關性,將研究斷面分為若干相關小組并結合卡爾曼濾波方法建立軌道交通斷面客流短時預測模型,僅研究了斷面客流數據本身規律,未考慮軌道客流出行時空分布特征,預測精度不高。
隨著軌道網絡化程度不斷加深,乘客出行路徑更加多樣化,普通模型無法反映軌道客流數據與區間客流的復雜關系。本文中通過分析軌道客流時空分布特征以及軌道出行分布與阻抗間的關系,標定離散摩擦因子,借鑒重力模型并利用站點進出客流,構建出行引力因子,提取兩站點間客流出行關系,建立雙層LSTM模型,研究出行引力因子與全線區間客流之間的復雜關系。
站點空間位置與站點進出客流將直接影響各區間客流分布。網絡化程度越高,其客流出行路徑分布愈復雜。
抽象軌道網絡如圖1所示,i0-i3,j0-j3表示軌道非換乘站點,t0表示軌道換乘站點。軌道運營過程中,線路兩端站點i0、i3的進站客流出行方向為線路中部站點i1、i2等;線路中間段站點j1、j2的進站客流出行方向為線路兩端站點j0、j3等。通常站點之間的進、出關系的數量即客流出行OD,其數值大小和乘客數量及其出行目的、站點周圍的用地性質和站點之間的出行距離等因素相關。

圖1 抽象軌道網絡圖
以圖1為例,出行起訖點對與區間段客流影響關系如圖2所示。

圖2 出行起訖點對與區間
以區間A為分析對象,由i0至t0、i2等站點間的客流出行OD將會通過區間A,各出行起訖點對與區間段距離遠近將對區間客流產生不同的影響。這種影響程度可用w0、w1等數值表示,代表不同點對的客流吸引能力影響程度,將其命名為出行引力因子。
借鑒重力模型的構造特征,出行引力因子可用下式構造:
Tij(t)=Pi(t)×Aj(t)×Fij(t)
(1)
式中:Tij(t)表示t時段內站點i、j間出行引力因子大小;Pi(t)表示t時段內站點i進站客流;Aj(t)表示t時段內站點j出站客流;Fij(t)表示t時段內站點i、j間摩擦因子。
根據重慶市2019年12月2日至12月23日4個星期一的軌道客流出行OD數據統計客流分布特征,隨機篩選4個站點:翠云(人口聚集區)、大渡口(區級組團中心,但人口崗位密度較低)、江北機場T3航站樓、磁器口(市級文旅商發展中心),繪制其客流出行OD分布占比(即1 d內由該站點出發到達其他站點的出行量占比)與出行距離的關系圖,如圖3所示。

圖3 軌道出行OD分布與出行距離關系
4 d內的客流出行OD分布趨于一致,表明各站點OD占比分布在時空上存在規律。其中前兩者分布圖呈現出短距離出行量占比高的趨勢,如金童路、楊家坪等,存在部分站點如碧津、劉家壩等周邊用地性質與出發站近導致出行分布占比低。出行距離超過10 km后,其客流占比分布隨距離增加總體呈現遞減趨勢,少部分站點如觀音橋、臨江門等周邊用地性質與出發站間存在協調互補的關系,此時距離較遠仍存在較高的出行量占比。后兩者出行輻射范圍更廣,同時由于用地性質上的互補,使得其存在不隨出行距離增加而遞減的出行需求,出行分布將呈多峰分布。
摩擦因子通常分為離散摩擦因子與連續摩擦因子函數。上述軌道客流出行分布受到出行距離以及站點周邊用地性質的影響,使得連續的阻抗函數無法刻畫軌道出行規律,而離散摩擦因子表可以更加準確并動態把握復雜軌道網絡下各站點間的出行阻力。由文獻[20]中離散摩擦因子標定方法,不考慮同站進出,根據客流出行OD及進出站客流標定得到t0時段內站點i、j間離散摩擦因子Fij,t0為:
(2)
2.2 出行引力因子與區間客流分布關系分析
以上述客流出行OD數據為例,展示標定完成的站間出行引力因子與區間客流間的關系。隨機選取4個區間斷面(1號線陳家橋-微電園、2號線金家灣-建橋、3號線嘉州路-紅旗河溝、6號線向家崗-蔡家),各區間左右兩端隨機選取3個站點,通過兩兩組合的方式構成客流出行OD對。堆疊各OD對出行引力因子,繪制各區間1 d內客流分布與堆疊的出行引力因子之間的關系圖,如圖4所示。

圖4 出行引力因子與區間客流分布關系
1 d內出行引力因子分布與區間客流分布存在高度相關,表明疊加的出行引力因子作為模型輸入能有效反映區間客流分布趨勢。
原始AFC票卡數據可統計各站點各時段的進出站客流數據。此時假設軌道網絡共有m個站點,則t0時段內各站點進、出站客流可表示為:
Pi,t0=[p1,t0,p2,t0,…,pm,t0],i∈[1,m]
(3)
Aj,t0=[a1,t0,a2,t0,…,am,t0],j∈[1,m]
(4)
則可按照式(5)計算t0時段內站間出行引力因子Tij,t0:

(5)
式中:i,j∈[1,m]且i≠j。結合式(5)可以得到每個時段內的出行引力因子Tij,t,并將其扁平化得到一組一維向量,則k個時段構成如下一組具有時間序列特征的出行引力因子矩陣:
上述步驟所構造出的出行引力因子為(m2-m)×k維的矩陣,此時假設軌道網絡存在n個區間斷面,則為(m2-m)維輸入向n維輸出映射。普通模型無法刻畫此類復雜的映射關系,同時各時段所組成的出行引力因子為一組時序數據。長短期記憶人工神經網絡作為非線性模型可以構造更大型深度神經網絡,能處理高維時序數據,自動學習輸入與輸出間的復雜映射關系,從而把握客流時空分布,預測區間客流分布。
長短期記憶人工神經網絡通過輸入門、輸出門與遺忘門實現信息的有效控制及傳遞,能解決RNN無法處理長記憶信息依賴問題。其單個cell內部結構如圖5所示。

圖5 LSTM單個cell內部結構
遺忘門處理上層輸出與當前輸入,篩選上一時刻細胞單元狀態Ct-1的有效信息。建立如下模型實現長久記憶信息的傳遞。
ft=σ(Wfht-1+UfTij,t+bf)
(6)
輸入門篩選當前輸入的站點i,j間t時段內的出行引力因子Tij,t的有效信息,更新細胞狀態Ct。建立如下模型得到輸入信息的重要度值,并經過激活函數tanh處理得到當前輸入細胞狀態。
it=σ(Wiht-1+UiTij,t+bi)
(7)
at=tanh(Wiht-1+UiTij,t+bi)
(8)
遺忘門保留長記憶信息,輸入門能避免無效信息的輸入。建立如下模型,將上一時刻細胞狀態Ct-1與遺忘門輸出ft按照對應元素相乘的方式結合,同時將當前輸入的細胞狀態at與輸入信息重要度it對應相乘。最后,累加上述2個結果,更新當前細胞狀態。
Ct=Ct-1⊙ft+it⊙at
(9)
輸出門能夠控制細胞狀態Ct輸出,通過sigmoid激活函數決定輸出的細胞狀態信息,計算模型如下所示:
Ot=σ(Woht-1+UoTij,t+bo)
(10)
最終,由以下公式得到隱含層輸出,即對應的區間客流值ht:
ht=Ot⊙tanh(Ct)
(11)
上述模型中,Uf、Ui、Ua以及Uo分別表示遺忘門、輸入門、細胞狀態更新和輸出門的權值參數;Wf、Wi、Wa以及Wo分別對應各個門控單元隱藏層的權重參數;bf、bi、ba以及bo分別為遺忘門、輸入門、細胞狀態更新和輸出門的偏置項;⊙運算符表示矩陣對應元素相乘。
如圖6所示,按照時間滑動窗口構造時序數據作為模型輸入。針對單個時間窗口,cell個數與滑動窗口大小對應,多個cell之間按照上述步驟計算,每個cell前向計算當前時間步的輸出值,最后一個時間步的cell輸出與對應的訓練標簽計算誤差值。根據誤差反向傳播規則分別計算每個權重以及偏置的梯度,更新遺忘門、輸入門與輸出門參數直至訓練收斂。

圖6 LSTM處理時序數據
堆疊的LSTM能處理更加復雜的輸入輸出對應關系,但層數過多也會導致模型過擬合,泛化能力不強。綜合上述因素設計了如圖7所示的雙層LSTM模型,將第1層網絡的輸出序列作為輸入再次傳遞至LSTM第2層,能更加準確地把握輸入特征規律,提升預測性能。

圖7 雙層LSTM模型結構
原始的AFC票卡數據統計如表1所示。

表1 AFC票卡數據統計信息
本實例所分析的城市軌道交通數據為重慶市2019年12月共計31 d的15 min粒度軌道客流數據。包括進出站客流數據、站間OD數據以及推算的區間客流數據,其有效時段為6∶30—23∶30,每天共計68個時段。
結合摩擦因子標定方法,得到如式(2)的各時段離散摩擦因子,結合式(5)以及進出站客流數據得到多天內各時段出行引力因子作為模型輸入數據。將數據集劃分為訓練集、驗證集及測試集。其中訓練集及驗證集用于模型訓練和參數尋優,測試集不參與訓練過程,待模型訓練完成之后用于評估模型預測效果。去除特殊日期,數據集如表2所示。

表2 數據集
LSTM神經網絡模型的結構及參數設置將直接影響模型訓練與預測效果。神經元個數影響模型的擬合能力;Dropout的設置能避免模型過擬合;BatchSize表示一次輸入多少個批次進行訓練,應結合輸入數據維度進行設置;其中時間步的取值表示一次訓練輸入多少個15 min時段數據。軌道客流出行時間長短不一,時間步取值過小時,部分出行還未完成將導致客流分布特征把握不完整;反之取值過大將輸入部分時效性不足的客流信息,需結合重慶市平均出行時間進行考慮。最終設計了如表3所示的參數組合。

表3 參數方案尋優設計
選用MAE(人次/15 min)評估各場景下全線區間客流預測平均誤差,為保證軌道全線各區間段客流預測效果,需通過分析各區間段客流MAE的離差從而選擇最佳模型預測結構。
以出行引力因子作為輸入的模型(Pred1)在各場景下的全線區間客流預測平均誤差MAE(人次/15 min)如表4所示。

表4 參數測試結果
可見場景6效果最佳,模型收斂時loss如圖8所示。

圖8 訓練loss曲線
4.3.1不同輸入模型比對分析
現有研究直接輸入進出站客流預測區間客流,為比對不同輸入時模型預測效果,在上述場景6的參數組合下得到以進出站客流作為輸入的模型(Pred2),其全線區間客流預測平均誤差MAE為82.91(人次/15 min)。進一步分析單區間客流預測誤差,繪制各區間段客流預測誤差分布圖,如圖9、10所示。

圖9 不同輸入模型各區間客流預測誤差

圖10 不同輸入模型各區間客流預測誤差百分比
上述2個模型全線各區間客流預測誤差百分比分布如表5所示。

表5 不同輸入下模型預測結果誤差分布
由以上圖表可見,前者即Pred1在全線區間客流預測上平均誤差更低,同時各區間客流預測精度也更高。為分析模型在1 d中各時段內的預測效果,隨機選定一個區間段(四公里—南湖)并繪制上述模型預測值以及真實值所對應的各時段客流分布圖,如圖11所示。

圖11 不同輸入下各時段區間客流分布
可見,Pred2難以把握區間客流的上下波動,而Pred1在客流波動性方面表現更好。
4.3.2不同模型預測性能評估
進一步比對時序模型(ARIMA)在上述區間客流預測時的效果并繪制其各時段的客流分布圖,如圖12所示,通過參數尋優得到的最佳模型ARIMA(3,0,2)預測誤差MAE為40.91(人次/15 min),Pred1預測誤差為21.52(人次/15 min)。結合圖12可見ARIMA模型預測值較真實值波動較大,而Pred1能有效把握峰值的變化情況。

圖12 不同模型各時段區間客流分布
驗證分析可得,Pred1預測效果最佳,根據重慶市軌道交通現階段的列車類型及其單節車廂乘客有效利用面積,以出行引力因子為輸入的預測模型在區間客流預測中單區間平均預測誤差能控制在5%以內,能準確把握區間客流分布。
離散摩擦因子能夠刻畫各時段內軌道出行阻力,同時出行引力因子的提出能夠體現區間客流與進出站客流分布特征,以此作為雙層LSTM模型的輸入,對城市軌道全線區間客流預測有較好的效果,能為提升軌道運營服務質量提供依據。