劉 釗,賈 萌,陳 丹,饒文明
(南京工程學院汽車與軌道交通學院,江蘇南京 211167)
城市公共交通系統對于軌道交通的依賴性呈增長趨勢,特別是一線大城市,城市軌道交通客運量占城市公共交通客運總量出行比率已超過50%。深入分析和挖掘城市軌道交通客流的變化規律,對于進一步提升其客流組織、運力配置和短時客流預測等工作的精準性具有至關重要的作用。
目前,國內外學者對于城市軌道交通客流變化規律的分析已取得眾多的研究成果,而對于客流變化的波動性關注還較少。從變化趨勢來看,城市軌道交通客流通常具有明顯的周期性特征,例如在工作日呈現“雙峰”特征,在周末呈現“單峰”特征,而在城市郊區可能會呈現“無峰”特征,城市軌道交通客運組織、運力配置和客流預測等方面的運營管理工作很大程度上依據上述客流變化趨勢規律展開。文獻[1]認為客流的波動性是客流在微觀層面上的重要特性,主要由平均水平變化和離散變化2種特征組成。相比較而言,針對客流波動性特征分析的研究較少,目前已有文獻大多是利用客流估計值與觀測值之間的偏差來反映客流的波動性,而客流的估計值很大程度上與客流擬合的模型有關,如基于神經網絡的客流預測[1-3]、基于深度學習的客流預測[4-5]、基于支持向量回歸的客流預測[6]和混合預測[7-8]等。值得注意的是,城市軌道交通客流的變化規律與城市道路交通流十分相似,而城市道路交通流變化呈現出異方差特性,文獻[9-10]采用隨機時間序列進行建模取得了較好的擬合結果,文獻[11]在分析交通流異方差特性時進一步提出了基于置信區間的判斷方法。在其他研究領域,如電力儲能[12]、風電功率[13]和故障診斷[14]等,四分位法也被廣泛應用于時間序列的區間分析。總體而言,受乘客出行、天氣情況或突發事件等因素的影響,城市軌道交通客流在遵循一定變化趨勢的同時,也必然會呈現出一定的波動性,然而目前有關城市軌道交通客流波動性尚未有專門的定義以及具體的量化標準。
為此,針對城市軌道交通客流變化的波動性特征,本文提出基于四分位法和基于時間序列分析的區間估計建模方法,通過估計客流可能的變化范圍,探索客流變化的波動性特征,并提出區間覆蓋率、區間絕對寬度和區間相對寬度3個評價指標,以量化反映客流波動性。
以蘇州地鐵相門站的客流數據為例分析客流變化波動性特征,具體的數據來源說明見“4 實例分析”章節。時間匯集度為15 min尺度下工作日和周末客流變化的分布情況如圖1所示,由圖可知,客流在工作日和周末分別呈現“雙峰”和“單峰”的變化趨勢,工作日客流圍繞變化趨勢特征所呈現出來的波動范圍比較均勻,而周末客流呈現出來的波動范圍更大、更分散,尤其是在16 : 00左右,周末客流的振動幅度在100~300人次 / 15 min,遠遠大于工作日客流的振動幅度。盡管城市軌道交通客流的變化具有明顯的趨勢特征,但圍繞這種趨勢特征客流還會呈現出不同幅度的波動。為此,定義城市軌道交通客流的波動性為:在遵循一定變化趨勢下呈現出來的振動幅度或范圍。

圖1 城市軌道交通客流變化特征
假設城市軌道交通客流數據表示為X= [X1,X2,X3,…,Xt],其中Xt表示t時刻的客流值,而Xt= [xt1,xt2,xt3,…,xtn],其中xtn表示第n天t時刻的客流值。采用四分位法對連續多天t時刻的客流值Xt進行統計分析,首先按照從小到大的順序對Xt進行排序,得到新的序列Yt= [y1,y2,y3,…,yn],則下四分位數和上四分位數在序列yt中的位置計算如下:
式(1)、式(2)中,q1和q3分別表示下四分位數和上四分位數在序列中的位置。那么,序列Yt的下四分位數Q1和上四分位數Q3分別為:
式(3)、式(4)中,qZ1和qX1分別表示q1的整數部分和小數部分;qZ3和qX3分別表示q3的整數部分和小數部分。在此基礎之上,可以計算四分位距IQR為:
依據四分位距IQR,可以計算序列Yt的區間估計范圍:
假設城市軌道交通客流的時間序列表示為X= [x1,x2,…,xt],其中xt表示t時刻的客流值。應用差分整合滑動平均自回歸模型(ARIMA)和廣義自回歸條件異方差模型(GARCH)進行建模,即ARIMA - GARCH,城市軌道交通客流時間序列xt可以表示為:
式(7)中,xt為t時刻的客流;B為延遲算子;εt為時間t時的干擾;ht為條件方差;et為均值為0、方差為1的白噪聲;αi=1,2,…,v為ε2t-i的非負系數;βi=1,2,…,u為ht-i的非負系數;φ(B)= 1 -φ1B-φ2B2- … -φpBp,為非季節自回歸多項式,其中p為階數;θ(B)= 1 -θ1B-θ2B2- … -θq Bq為非季節滑動平均多項式,其中q為階數;(1 -B)d為差分,d為差分次數。因此,ARIMA -GARCH模型又可以表示為ARIMA(p,d,q) -GARCH(v,u)。
結合式(7),客流波動區間的范圍可以表示為:
理想的城市軌道交通客流估計區間應該遵循2個原則:一是客流估計區間的覆蓋范圍應該盡可能的小,即在同一時刻客流最大估計值與最小估計值之間的差最小;二是客流的觀測值應該盡可能落在估計區間中。滿足上述2個條件的客流估計區間,可以認為包含了足夠的客流變化信息。為此,提出客流波動性量化指標,包括客流區間覆蓋率(CR)、客流區間絕對寬度(AMW)和客流區間相對寬度(RMW),具體如下式所示。
式(9)~式(11)中,xt為t時刻的客流觀測值;和分別為t時刻客流估計區間的上限值和下限值;N為客流觀測的時間長度或觀測的客流數據數量。值得注意的是,對于最佳客流估計區間的確定尚未有統一的標準。參考文獻[16],可以以95%的客流區間覆蓋率,作為最佳客流估計區間的確定標準,即最佳的客流估計區間應該覆蓋95%的客流觀測值。
本文選用的客流數據來自蘇州地鐵自動售檢票系統(AFC),選取了6個車站,依次為相門站、星海廣場站、廣濟南路站、樂橋站、石湖東路站和蘇州火車站。按照5 min的時間間隔對乘客進站記錄進行匯集,客流數據的采集時間為2015年6月29日至2015年8月30日,共9周合計63天,其中工作日45天,周末18天,每天的客流數據采集時間為7 : 00 — 22 : 00共15 h。
采用四分位法進行客流區間估計建模,關鍵是確定客流區間估計系數。以相門站為例,設置客流區間系數范圍為[0.1,2.5],以0.1的步長測試區間系數對客流區間覆蓋率的影響,分析結果如圖2所示。

圖2 基于四分位法的客流區間系數敏感性分析
由圖可知,隨著區間系數從0.1增加到2.5,客流區間覆蓋率從60%逐漸增加到接近100%,并且在這一過程中沒有明顯的拐點存在。當區間覆蓋率達到95%之后,其增加幅度越來越小。以95%的客流區間覆蓋率作為最佳客流估計區間的判斷標準,那么所選擇的6 個車站客流區間估計系數如表1所示,表中依次列出了每一個車站在工作日和周末最佳的客流區間系數,以及對應的客流區間覆蓋率。

表1 基于四分位法的客流區間估計系數
構建基于ARIMA-GARCH的客流區間估計模型,首先依據客流時間序列數據的自相關特性和偏自相關特性確定ARIMA的模型階數,然后檢驗ARIMA模型殘差是否具有顯著的自相關性(ARCH效應),如果存在ARCH效應則進一步建立GARCH模型,并標定GARCH模型的階數,最終結合客流的均值和條件方差構建客流區間。有關ARIMA-GARCH模型的確定、檢驗標準、流程可以參考文獻[16-17]。
按照工作日和周末的時間劃分,在隨機時間序列分析過程中,所選6個車站的客流時間序列均值建模部分,模型結構均為ARIMA(1,0,1),而在條件方差部分則不盡相同,具體的建模結果如表2所示,依次列出了每一個車站在工作日和周末的模型結構,可以表示為ARIMA(1,0,1)-GARCH(u,v),以95%的客流區間覆蓋率作為確定最佳客流估計區間的標準,GARCH模型的參數u、v以及對應的最佳客流區間覆蓋率如表2所示。

表2 基于ARIMA-GARCH的客流區間估計建模
統計每小時客流區間絕對寬度和客流區間相對寬度2個指標,比較基于四分位法和基于ARIMAGARCH得到的客流估計區間差異,具體結果如圖3所示。結合城市軌道交通客流的變化趨勢特征,可以看出在 10 : 00 — 20 : 00時間段,客流估計區間的絕對寬度會隨著客流量的增加而增大,而客流估計區間的相對寬度則會隨著客流量的增加而降低。值得注意的是,在客流量較小時,即早高峰之前和晚高峰之后,基于四分位法和基于ARIMA-GARCH得到的客流估計區間存在較大的差異。

圖3 基于四分位法與基于ARIMA-GARCH的客流估計區間比較
統計工作日和周末的客流估計區間評價指標,具體的分析結果如圖4所示。在圖4a中,10 : 00之前工作日的客流估計區間絕對寬度大于周末客流估計區間絕對寬度,而10 : 00之后,則是周末客流估計區間絕對寬度大于工作日客流估計區間絕對寬度。在圖4b中,工作日和周末的客流估計區間相對寬度呈現出一致的變化趨勢,呈現出先快速下降,然后保持穩定,逐漸上升的變化特征,并且在10 : 00之前周末客流估計區間相對寬度明顯高于工作日客流的相對寬度,而在10 : 00 — 18 : 00之間則是工作日客流的相對寬度略高于周末客流區間相對寬度,在18 : 00之后二者沒有明顯差異。這表明城市軌道交通客流波動性隨時間的變化而改變,整體上而言早高峰之前及晚高峰之后的客流變化波動性較大,而早晚高峰之間時段的客流波動性相對較小。

圖4 不同時段客流波動性比較
本研究針對城市軌道交通客流變化的隨機性和不確定性展開研究,為此定義了客流變化的波動性,構建了基于四分位法和基于ARIMA-GARCH的2種客流區間估計模型,并提出了客流區間覆蓋率、客流區間絕對寬度和客流區間相對寬度3個評價指標。依據來自于蘇州地鐵AFC系統的客流數據,對工作日和周末客流的波動性進行了比較分析,分析結果表明,整體而言工作日客流變化的波動性小于周末客流的波動性,并且從一天內客流變化情況來看,早高峰之前及晚高峰之后的客流變化波動性較大,而早晚高峰之間時段客流量較大時波動性反而較小。
客流的波動性特征反映了客流量在一定時間范圍內的變化情況,包括高峰期和低谷期的出現、工作日與非工作日的差異、季節性變化以及特殊事件等因素的影響。通過對客流波動性進行分析,可以建立客流的基準模式或預期范圍,識別出與正常波動性模式明顯不符的異常情況,從而有助于檢測客流異常值。當客流量偏離預期范圍較大或出現異常波動時,可能預示著影響客流的特殊情況,如突發事件、設備故障、突發大客流等,也可能是由于數據采集錯誤或其他異常情況導致的。需要注意的是,僅僅依靠波動性特征分析可能無法確定具體的異常原因,但它可以作為一種預警機制或初步篩選方法,幫助運營人員或分析師識別潛在的異常情況,并進一步進行調查和深入分析。