楊迎卯
(溫州市鐵路與軌道交通投資集團有限公司運營分公司,浙江 溫州 325000)
客流預測對城市軌道交通系統短期、中長期的經營管理有著極大的幫助,是指導日常運輸組織、優化列車開行方案、優化車站設施布局、制定客流引導策略及提高經濟效益的重要前提。按照預測時間跨度,客流預測可分為長期、短期、短時客流預測。長期預測依據地域發展規劃及經濟趨勢進行,短期預測主要依據季節性特征,短時預測則根據早晚高峰、節假日、大客流活動、氣候驟變等客流時間進行,本文主要研究短時客流預測。
基于線性理論,客流預測問題分為基于線性的統計預測、基于非線性的模型預測及統計學-非線性模型組合預測三類?;诰€性近似的非線性預測模型,主要有時間序列法和卡爾曼濾波模型[1,2]。有研究表明,基于統計學數學方法已經能夠解決大部分客流預測問題,而隨著預測周期變短、預測干擾增強等非線性特征的增強,預測模型預測的穩定性也會變差。常見的非線性模型有馬爾科夫鏈、神經網絡模型等,這類方法具備多源數據特性,令預測模型更合理[3,4]。但人工客流疏導、班次修改、臨時關站等事件,會使模型的精度失控?;诮M合非線性模型并結合統計學數學方法分類的預測成為當前研究的主流方向。
基于機器學習方法,客流預測可分為基于統計學理論的模型驅動、基于神經網絡模型的數據驅動和基于多模型的組合方法。模型驅動的客流預測方法使用統計學模型,通過分析客流數據,構建數據特征,形成有經驗的數據模型,其代表方法有時間序列、非參數回歸、聚類分析、貝葉斯估計等。其中,季節時間序列模型(SARIMA)的貝葉斯估計方法表現極佳。數據驅動的客流預測主要基于神經網絡理論,神經網絡由大量神經元(神經細胞)互相進行權重連接,形成了多層網絡結構,使用有效歷史數據對模型中的神經元連接權重進行梯度下降訓練方法獲得最終模型參數。其中,循環神經網絡(RNN),結合模糊控制、多時間單元及長短時記憶網絡(LSTM)均適配,此類方法具備機器學習能力,同時避免了模型的過擬合。
近年來,機器學習方法在社會各領域都得到了充分的發展,神經網絡模型算法也成為客流預測的主流方向。針對時序性較強的預測問題,循環神經網絡模型具有優良的匹配性,在進一步開發的長短時記憶神經網絡模型方面表現更優秀。本文主要內容有:對多源數據的融合問題進行特征構造介紹,介紹采用聚類算法分析、處理歷史數據的方法,介紹長短時記憶網絡的預測模型及結合多源輸入的組合模型系統框架。
本文基于神經網絡模型的客流預測算法架構如圖1所示,其結合了多源數據特征予以歸納,聚類分析預處理,按分類結果建立多組長短時記憶網絡模型,并根據進站、出站、區域及站內客流的不同預測目標分別進行了特征構造。
車站客流數據受到氣候、節假日、大型活動、列車編組班次、地域商區等各種因素的影響,利用豐富的信息源可以提高預測精度。通過AFC票卡(ACC清分)或智能視頻分析、獲取客流量,根據時間顆粒度大小對客流數據進行轉儲,例如:
其一,客流量,時間戳,站名,出入口/區域編號。
其二,天氣晴/雨指標,節假日指標,大客流指標。
其三,班次編號,編組車節數,到站時間,上/下行標志。
短時客流預測按預測對象可分為進站、出站、站內、斷面以及OD客流預測。對于不同預測對象使用同一套算法訓練,同時并行訓練多組模型的權重、偏置等模型參數。
地鐵客流具有明顯的時空特性,不同站點在不同的時間,會表現出極大的差別,同時也具有一定的分布規律。在一周時間內,客流在工作日和雙休日具有非常顯著的差別;在同一天,內客流則具有明顯的“潮汐現象”,即早/晚高峰和進/出站客流的關聯性。針對客流預測顯著的時序特征,使用K-Means聚類對歷史數據進行分析,對客流預測的數據進行預處理,可以極大地提高模型的精度。
對一周內各天的數據進行相關性分析,計算一周內各天的歐氏距離,結果表明,雙休日和工作日之間的相關性較差,所以可以將日期劃分為周一、周二、周三、周四、周五和周六、周日這兩類。對每天細分時段的數據進行相關分析,計算一天內各時段的歐氏距離,可將一天內的數據分為早/晚高峰和平常時段。
按照聚類分析,可將LSTM模型分為多組,分別用于聚類分類結果所劃分的各個時間段,降低模型非線性階次并避免過擬合,提升模型的訓練效率和穩定性。
人工神經網絡模型,是一種模仿人腦神經系統對各類信息進行處理的行為特征,并形成可以分布式計算的信息處理模型。
依據神經元觸發放電的原理,人工神經網絡設置了激活函數,使得具備處理強非線性問題的能力,神經元結構如圖2所示,其網絡結構便是由多個神經元交叉連接構成的。選用合適的激活函數及網絡層數理論,可使其適用于所有模型。
循環神經網絡(RNN)是具有時序特性的神經網絡模型。RNN在隱藏層建立了一個互相連接的權重矩陣,隱藏層中的信息將在時序過程中持續傳遞,可以將多個時序下輸入迭代更新的層間權重記錄下來。因此,RNN在客流預測中具有天然優勢。RNN細胞結構如圖3所示,x(t-1),x(t),x(t+1)分別表示前一時刻、當前時刻、下一時刻的模型輸入,表示模型結構的循環特性。其中W為層間,U為輸入,V為輸出權重矩陣。
圖中對于隱藏層的計算方式如式(1):
式(1)中:s(t)表示當前輸出;s(t-1)表示前一時刻的輸出。
輸出層的計算方式如式(2):
RNN在實際應用中,存在不同的計算形式,圖4為較常見的兩種情況。其中,“多對一”指利用多個時刻的數據預測模型預測下一時刻的數據,而“多對多”則是指預測未來一段時間內的整體數據。
當輸入數量過大時,RNN模型訓練易導致算法的梯度爆炸。添加門控制并減少輸入數量,可以優化處理此類問題。長短時記憶網絡(LSTM)即具有門控RNN網絡,通過門控保留往期輸入的特征,從而降低模型的輸入長度,LSTM細胞結構如圖5所示。
LSTM的算法流程與RNN相同,只在隱藏層增加三個門控單元:遺忘門f(t)、輸入門i(t)、輸出門o(t)。門控的計算公式為下式(3)、(4)、(5):
式(3)~(5)中:Uf、Ui、Uo為輸入信息權重;Wf、Wi、Wo為歷史信息權重;bf、bi、bo為偏置;δ為激活函數sigmoid()函數。
候選記憶如式(6):
細胞產生的新記憶s(t)、細胞的輸出h(t)以及網絡的輸出Z(t),計算方法分別為下式(7)、(8)、(9):
本文介紹了城市軌道交通客流預測的理論方法,通過對多輸入源的數據進行融合處理,搭建LSTM模型的系統框架,實現多目標的短時客流預測。使用神經網絡將多源和時序的歷史數據結合建模,調整神經網絡超參數,對模型進行訓練并實現預測功能。首先,對多源輸入數據進行了特征構造,建立進站、出站及在站客流的關聯度;其次,根據聚類搭建多組神經網絡模型;最后,建立具有時序特征的神經網絡模型,構建、處理多客流的預測系統。