耿立艷,魯榮利,李新杰
基于波動聚集性的城際高鐵客流量預測
耿立艷1,魯榮利2,李新杰2
(1. 石家莊鐵道大學 經(jīng)濟管理學院,河北 石家莊 050043;2. 河北曲港高速公路開發(fā)有限公司,河北 保定 071000)
由于受到眾多因素的影響,城際高鐵客流量序列呈現(xiàn)出波動聚集性特征,常用的預測方法很難準確揭示這種波動聚集性特征,一定程度上限制了城際高鐵客流量預測精度的提高。為解決該問題,將自回歸差分移動平均(ARIMA)模型與廣義自回歸條件異方差(GARCH)模型相結(jié)合,提出城際高鐵客流量的ARIMA-GARCH預測模型。先構(gòu)建城際高鐵客流量序列的ARIMA模型,再利用GARCH模型刻畫ARIMA模型殘差的波動聚集性。利用某車站的城際高鐵客流量數(shù)據(jù)檢驗ARIMA-GARCH模型的有效性。研究結(jié)果表明:ARIMA-GARCH模型刻畫出了城際高鐵客流量的波動聚集性特征,其短期、中期、長期預測精度均高于ARIMA模型。隨著預測步數(shù)的增加,ARIMA-GARCH模型的預測精度逐漸下降。
鐵路運輸;城際高鐵;客流量;預測;ARIMA-GARCH模型

城際高鐵客流量的大小對城際高鐵的建設、評價和運營等方面影響重大,在城際高鐵設計及建成后的運營使用階段,都需要進行城際高鐵客流量預測的研究。城際高鐵客運系統(tǒng)由于受到多種復雜因素的共同作用,其客流量數(shù)據(jù)序列呈現(xiàn)出異方差(波動聚集性)特征。目前用于鐵路客流量預測方法主要有四階段法[1]、時間序列預測法[2?3]、回歸分析法[4]、灰色預測法[5]、神經(jīng)網(wǎng)絡[6?7]、支持向量機[8]、最小二乘支持向量機[9]和組合預測法[10]等。四階段法對客流量調(diào)查數(shù)據(jù)的要求比較高;時間序列預測法和回歸分析法屬于線性預測法,它們以簡單的線性關系進行預測,不能很好地克服隨機因素對城際高鐵客流量的影響;灰色預測法為指數(shù)函數(shù)方法,用于預測具有波動聚集性的城際高鐵客流量時,效果欠佳;神經(jīng)網(wǎng)絡的非線性擬合能力較強,但易陷入局部最優(yōu)解,其結(jié)構(gòu)過分依賴經(jīng)驗;支持向量機和最小二乘支持向量機更適合于小樣本數(shù)據(jù)的分析及預測,預測大樣本數(shù)據(jù)時存在訓練速度慢、計算復雜度高等不足。組合預測法能克服單一預測模型的局限性,但其權(quán)重難于確定。另外,以上這些預測方法均無法準確刻畫城際高鐵客流量的波動聚集性特征,限制了城際高鐵客流量預測精度的提高。自回歸差分移動平均(ARIMA)模型是一類隨機模型[11],用于分析時間序列數(shù)據(jù),具有簡單易操作的優(yōu)點,但它以數(shù)據(jù)序列的同方差假設建立模型,難以揭示城際高鐵客流量的波動聚集性特征。廣義自回歸條件異方差(GARCH)模型[12]能夠很好的模擬和預測數(shù)據(jù)序列中的波動聚集性特征,挖掘出數(shù)據(jù)中包含的信息。本文從城際高鐵客流量的波動聚集性特征出發(fā),將ARIMA模型與GARCH模型相結(jié)合預測城際高鐵客流量,以提高城際高鐵客流量的預測精度,為城際高鐵的適應性評價提供基礎理論支持。
由于受到地區(qū)經(jīng)濟發(fā)展水平、政治文化、地理環(huán)境等眾多因素的影響,城際高鐵客流量變化具有隨機性和不確定性,致使客流量序列表現(xiàn)出明顯的非平穩(wěn)性和異方差(波動聚集性)特征。現(xiàn)有的智能預測方法,如神經(jīng)網(wǎng)絡、支持向量機和最小二乘支持向量機等雖能實現(xiàn)城際高鐵客流量的預測,但這類方法應用中存在建模過程復雜、模型結(jié)構(gòu)不透明等問題,而且它們無法捕捉到客流量序列的異方差特征,限制了預測精度的提高。因此,如何提高針對客流量序列非平穩(wěn)性和異方差特征的預測能力是城際高鐵客流量預測的關鍵。ARIMA模型結(jié)構(gòu)簡單、能夠通過差分處理實現(xiàn)對非平穩(wěn)時間序列的建模且預測精度較高,但ARIMA模型以同方差假設建模,難以描述城際高鐵客流量序列的異方差特征。GARCH模型是一種針對具有異方差特性時間序列的建模方法,能兼顧城際高鐵客流量序列波動的長期均衡與階段性的短期變化,可同時考慮前一時刻客流量的預測方差和觀測波動信息,并通過常數(shù)項對長期均值進行加權(quán)平均,很好地捕捉到客流量序列的波動聚集性特征。ARIMA-GARCH模型結(jié)合ARIMA模型和GARCH模型的優(yōu)勢預測城際高鐵客流量,按平穩(wěn)序列建模方法構(gòu)建城際高鐵客流量序列的ARIMA模型,同時基于殘差項構(gòu)建GARCH模型,刻畫出殘差項序列的波動聚集性變化特征,有效避免原始數(shù)據(jù)序列中有效信息的損失,進而實現(xiàn)城際高鐵客流量的準確預測。
假設城際高鐵客流量時間序列{y},=1,2,…,為一平穩(wěn)時間序列,自回歸移動平均(ARMA)模型估計{y}的基本思想是時刻的城際高鐵客流量y是階滯后的城際高鐵客流量與階滯后的殘差項之和,表達式為:


式中:為常數(shù)項;(1,2,…,)為自回歸系數(shù);(1,2,…,)為移動平均系數(shù);u為時刻的殘差項;和分別為自回歸項和移動平均項的階數(shù)。通過引入滯后算子,式(1)轉(zhuǎn)化為:

大多數(shù)的城際高鐵客流量序列為非平穩(wěn)時間序列,通常的做法是先對{y}進行差分處理,將其轉(zhuǎn)換為平穩(wěn)時間序列,因而,ARIMA(,)模型表達式為[13]:

應用ARIMA(,)模型進行預測的過程包括模型結(jié)構(gòu)識別、模型系數(shù)估計、模型殘差檢驗、模型預測[14]。ARIMA(,)模型應用的前提條件是時間序列具有平穩(wěn)性,因而建模前需檢驗時間序列的平穩(wěn)性。和可由赤池信息準則(AIC)和施瓦茲準則(SC)確定;模型結(jié)構(gòu)確定之后,可采用最大似然法估計模型系數(shù);模型殘差檢驗的目的是檢驗獲得的殘差項是否為高斯白噪聲序列,若為高斯白噪聲序列,可直接利用構(gòu)建好的模型預測。
一般情況下,ARIMA(,)模型的殘差項u為高斯白噪聲序列。若u呈現(xiàn)明顯的條件異方差特征,可以進一步利用GARCH模型來描述。GARCH模型是ARCH模型的拓展形式,可用于調(diào)整時間序列波動中的序列相關性[15]。GARCH模型的一般形式為GARCH(,),表示u的當前條件方差為階滯后的殘差項和階滯后的條件方差之和。



GARCH(,)模型的ARCH項與GARCH項階數(shù)和可由AIC和SC確定。
以某高鐵站日城際高鐵客流量為例進行計算。選取2017?01?01~2017?12?31的城際高鐵客流量序列作為數(shù)據(jù)樣本,并分成2部分:前290個樣本用于模型構(gòu)建和系數(shù)估計,后75個樣本用于檢驗模型的預測精度。表1為城際高鐵客流量序列描述性統(tǒng)計量。

表1 城際高鐵客流量序列描述性統(tǒng)計量
注:J-B代表Jarque-Bera正態(tài)性檢驗;LB(12)表示對城際高鐵客流量序列作滯后12階的Ljung-Box序列相關性檢驗;*,**和***分別代表統(tǒng)計量在1%,5%和10%水平下顯著。
由表1可知,在選定樣本范圍內(nèi),城際高鐵客流量在523~4 911人之間變動,均值、中位數(shù)和標準誤差分別為2 018人,1 794人和737.771 1,由此可見,城際高鐵客流量序列的均值和中位數(shù)相對較大、而標準誤差則相對較小,表明該序列的數(shù)據(jù)趨于集中、偏離均值的程度較小,反映出城際高鐵客流量序列具有變化幅度較小的波動性特征;城際高鐵客流量序列的偏度大于0、峰度大于正態(tài)分布的峰度值,說明該序列是右偏的,且凸起的程度高于標準正態(tài)分布,同時J-B統(tǒng)計量顯示,城際高鐵客流量序列在1%,5%和10%水平下都顯著拒絕了正態(tài)性的原假設。綜上,城際高鐵客流量序列呈現(xiàn)出“尖峰厚尾”且向右偏的非正態(tài)分布。
LB檢驗是一種用于檢驗時間序列是否存在滯后相關性的統(tǒng)計檢驗方法,還可用于檢驗殘差平方序列的異方差。作為一種定量檢驗方法,LB檢驗能獲得直觀的檢驗效果,有利于實際建模。基本原理是基于一系列滯后階數(shù),判斷時間序列總體的相關性。對于某一滯后階數(shù),若LB統(tǒng)計量大于給定的顯著性水平臨界值,則表明時間序列在該滯后階數(shù)下存在線性自相關性。
城際高鐵客流量序列的LB(12)統(tǒng)計量在1%,5%和10%水平下均拒絕了原假設,說明該序列存在顯著的自相關性。
選用ADF法檢驗城際高鐵客流量序列的平穩(wěn)性,結(jié)果如表2所示。由表2可知,ADF統(tǒng)計量在1%,5%和10%顯著性水平下均接受原假設,說明城際高鐵客流量序列為一非平穩(wěn)性時間序列。

表2 城際高鐵客流量序列ADF檢驗結(jié)果
再對一階差分后的城際高鐵客流量序列進行ADF檢驗,結(jié)果見表3。由表3可知,ADF統(tǒng)計量在1%,5%和10%顯著性水平下均拒絕原假設,說明一階差分城際高鐵客流量序列變?yōu)槠椒€(wěn)時間 序列。
構(gòu)建基于城際高鐵客流量序列的ARIMA(,1,)模型。和的選取對于ARIMA模型的性能有重要影響,常用的方法是通過直接觀察數(shù)列的自相關圖、偏自相關圖確定,但這種方法具有一定的主觀性。AIC準則利用模型擬合精度與參數(shù)個數(shù)的加權(quán)函數(shù)選擇最優(yōu)擬合模型,為模型的選擇提供了有效規(guī)則。SC準則是根據(jù)Bayes理論提出的判別準則,克服了AIC準則在樣本容量很大時出現(xiàn)的所選模型不收斂于真實模型的問題[16]。AIC準則和SC準則有效彌補了用自相關圖、偏自相關圖確定階數(shù)的主觀性,能在有限階數(shù)范圍內(nèi)找到相對最優(yōu)擬合模型。因此,這里同時采用AIC和SC確定和的值,以相互印證,AIC值或SC值最小值對應的階數(shù)為最優(yōu)滯后階數(shù)。計算發(fā)現(xiàn),當==3,AIC值和SC值均為最小,因而構(gòu)建ARIMA(3,1,3)模型。

表3 一階差分城際高鐵客流量序列ADF檢驗結(jié)果
利用最大似然法估計ARIMA(3,1,3)模型,并獲得殘差序列。表4為ARIMA(3,1,3)模型估計結(jié)果。由表4可知,ARIMA(3,1,3)模型所有系數(shù)的值均小于0.01,表明所有系數(shù)均在1%顯著性水平下通過檢驗,因而所建立的ARIMA(3,1,3)模型是有 效的。

表4 ARIMA(3,1,3)模型估計結(jié)果
圖1為ARIMA(3,1,3)模型殘差序列曲線圖。由圖1可直觀看出,殘差序列為一平穩(wěn)時間序列,表現(xiàn)出波動聚集性特征。

圖1 ARIMA(3,1,3)模型殘差序列曲線圖
采用結(jié)合LB檢驗與拉格朗日乘數(shù)(LM)檢驗的方法進一步檢驗其平穩(wěn)性及波動聚集性,以確定判斷的可靠性。LM檢驗是用于檢驗殘差序列中是否存在ARCH效應的拉格朗日乘數(shù)檢驗法,能夠克服通過直接觀察殘差平方序列相關圖確定ARCH效應的主觀性。其基本思想是構(gòu)造殘差平方序列與解釋變量之間的輔助函數(shù),獲得回歸平方和,從而判斷ARCH效應存在的顯著性。若LM值大于給定的顯著性水平臨界值,則殘差序列中存在ARCH效應。檢驗結(jié)果見表5。

表5 殘差序列LB和LM檢驗結(jié)果
注:LB(12)和LB2(12)分別表示對殘差序列和殘差平方序列作滯后12階的Ljung-Box序列相關性檢驗;LM(12)代表對殘差平方序列作滯后12階的Lagrange Multiplier檢驗,即ARCH檢驗。
由表5可知,殘差序列的LB(12)統(tǒng)計量顯著接受了原假設,說明殘差序列不存在自相關性;從LB2(12)統(tǒng)計量可以看出,殘差平方序列在1%顯著性水平下拒絕了非自相關性假設,表明殘差平方序列具有線性自相關性特征;而殘差序列的LM(12)統(tǒng)計量也在1%顯著性水平下拒絕了原假設,說明殘差序列存在顯著的ARCH效應。因此,ARIMA (3,1,3)模型獲得的殘差序列雖為不相關序列,但其平方呈現(xiàn)出顯著的相關性,存在明顯的波動聚集性特征,基于殘差序列構(gòu)建GARCH模型是合理的。
利用AIC和SC確定GARCH(,)模型的ARCH項階數(shù)和GARCH項階數(shù)的值。結(jié)果顯示,當==1時,AIC值和SC值均為最小,因而構(gòu)建ARIMA(3,1,3)-GARCH(1,1)模型。通過最大似然法對ARIMA(3,1,3)-GARCH(1,1)模型進行估計,結(jié)果如表6所示。由表6可知,ARIMA(3,1,3)-GARCH(1,1)模型中,除均值方程的系數(shù)和3外,其他系數(shù)的值均小于0.01,而和3的值分別小于0.1和0.05,說明該模型的所有系數(shù)在10%水平下顯著。

表6 ARIMA(3,1,3)-GARCH(1,1)模型估計結(jié)果

將ARIMA(3,1,3)-GARCH(1,1)模型和ARIMA (3,1,3)模型用于向前多步預測城際高鐵客流量,預測步數(shù)設為1至7步,將2模型的預測結(jié)果進行比較。選用3個指標評價2模型的預測精度,分別為均方根誤差(RMSE)、希爾不等式系數(shù)(TIC)和擬合優(yōu)度2。RMSE值和TIC值越小,模型的預測精度越高;2值越大,模型對實際值的擬合越好,即模型的預測準確性越高。
表7為ARIMA(3,1,3)-GARCH(1,1)模型和ARIMA(3,1,3)模型預測精度比較。由表7可知,首先,向前1至7步預測中,ARIMA(3,1,3)-GARCH(1,1)模型的RMSE值和TIC值均明顯小于ARIMA(3,1,3)模型的對應值,說明不論是短期預測、中期預測,還是長期預測,ARIMA(3,1,3)-GARCH(1,1)模型均獲得了較ARIMA(3,1,3)模型更高的城際高鐵客流量預測精度。其次,ARIMA(3,1,3)-GARCH(1,1)模型向前1步預測的RMSE值和TIC值最小,分別為168.453 1和0.048 2;在向前2,3步預測中,ARIMA (3,1,3)-GARCH(1,1)模型的RMSE值和TIC值有所增加;向前4步預測的RMSE值和TIC值稍小于向前2,3步預測的RMSE值和TIC值,但仍大于向前1步預測的RMSE值和TIC值;向前5,6和7步預測的RMSE值和TIC值又逐漸增加。這說明,隨著預測步數(shù)的增加,ARIMA(3,1,3)- GARCH(1,1)模型的預測精度逐漸降低。最后,ARIMA(3,1,3)- GARCH(1,1)模型的擬合優(yōu)度2值在向前1至7步預測中處于0.625 3~0.657 1之間,均大于ARIMA (3,1,3)模型的2值,說明相較于ARIMA(3,1,3)模型,ARIMA(3,1,3)-GARCH(1,1)模型的向前1至7步預測值對城際高鐵客流量實際值具有更好的解釋作用。另外,ARIMA(3,1,3)-GARCH(1,1)模型向前1步預測值的2值最大,隨著預測步數(shù)的增加,其2值出現(xiàn)波動性下降的趨勢,說明ARIMA (3,1,3)-GARCH(1,1)模型的預測精度整體上具有波動性下降趨勢,這與RMSE和TIC的檢驗結(jié)果一致。

表7 2模型預測精度比較

圖2 2模型向前1步預測值比較
圖2為ARIMA(3,1,3)-GARCH(1,1)模型和ARIMA(3,1,3)模型向前1步預測值比較。由圖2可知,在選定樣本區(qū)間內(nèi),2模型均預測出了城際高鐵客流量的波動性特征,與ARIMA(3,1,3)模型相比,ARIMA(3,1,3)-GARCH(1,1)模型預測出的波動峰值和谷值更接近于實際城際高鐵客流量,而ARIMA(3,1,3)模型預測出的波動峰值和谷值偏差相對較大。
1) 城際高鐵客流量序列呈現(xiàn)出較高的自相關特性和變化幅度較小的波動性特征,同時其具有“尖峰厚尾”的右偏非正態(tài)分布。
2) ARIMA(3,1,3)-GARCH(1,1)模型捕捉到了城際高鐵客流量的波動聚集性特征,同時也提高了城際高鐵客流量的預測精度。隨著預測步數(shù)的增加,其預測精度呈現(xiàn)整體下降趨勢。
3) ARIMA(3,1,3)-GARCH(1,1)模型在向前1步預測中更好地預測出了城際高鐵客流量的波動峰值與谷值。
[1] 宋嘉雯, 瞿何舟. 基于客流性質(zhì)的鐵路客流預測方法[J]. 鐵道運輸與經(jīng)濟, 2011, 33(3): 87?90. SONG Jiawen, QU Hezhou. Forecast method of railway passenger flow based on the passenger flow character[J]. Railway Transport and Economy, 2011, 33(3): 87?90.
[2] 劉佳. 我國鐵路旅客發(fā)送量預測模型研究[J]. 鐵道運輸與經(jīng)濟, 2010, 32(8): 86?89. LIU Jia. Study on forecast model of China’s railway passenger volume[J]. Railway Transport and Economy, 2010, 32(8): 86?89.
[3] B?rjesson Marial. Forecasting demand for high speed rail[J]. Transportation Research (Part A): Policy and Practice, 2014(70): 81?92
[4] LUO Yongji, LIU Jun, SUN Xun, et al. Regression model for daily passenger volume of high-speed railway line under capacity constraint[J]. Journal of Central South University, 2015, 22(9): 3666?3676.
[5] 孫晚華, 劉剛. 鐵路城際客流預測模型的研究[J]. 北京交通大學學報, 2005, 29(3): 84?87. SUN Wanhua, LIU Gang. Research on the model of forecasting passenger flow of the intercity train[J]. Journal of Beijing Jiaotong University, 2005, 29(3): 84? 87.
[6] XIE Meiquan, LI Xiaomiao, ZHOU Wenliang, et al. Forecasting the short-term passenger flow on high-speed railway with neural networks[J]. Computational Intelligence and Neuroscience, 2014(3): 1?8.
[7] LI Yang, WANG Xudong, SUN Shuo, et al. Forecasting short-term subway passenger flow under special events scenarios using multiscale radial basis function networks[J]. Transportation Research (Part C), 2017(77): 306?328.
[8] SUN Yuxing, LENG Biao, GUAN Wei. A novel wavelet-SVM short-time passenger flow prediction in Beijing subway system[J]. Neuringcomputing, 2015(166): 109?121.
[9] 周家中, 張殿業(yè). 基于空間加權(quán)的LS-SVM城市軌道交通車站客流量預測[J]. 鐵道學報, 2014, 36(1): 1?7. ZHOU Jiazhong, ZHANG Dianye. Direct ridership forecast model of urban rail transit stations based on spatial weighted LSSVM[J]. Journal of the China Railway Society, 2014, 36(1): 1?7.
[10] JIANG Xiushan, ZHANG Lei, CHEN Xiqun. Short-term forecasting of high-speed rail demand: A hybrid approach combining ensemble empirical mode decomposition and gray support vector machine with real-world applications in China[J]. Transportation Research (Part C), 2014(44): 110?127.
[11] Box G E P, Jenkins G M. Time series analysis: Forecasting and control[M]. Holden Day, San Francisco, CA, 1976.
[12] Bollerslev T. Generalized autoregressive conditional heteroskedasticity[J]. Journal of Econometrics, 1986, 31(3): 307?327.
[13] CUI Qinghua, XIA Jingxin. Time-vary confidence interval forecasting of travel time for urban arterials using ARIMA-GRCH model[J]. Journal of Southeast University (English Edition), 2014, 30(3): 358?362.
[14] LIU Heping, SHI Jing. Applying ARMA-GARCH approaches to forecasting short-term electricity prices[J]. Energy Economics, 2013(37): 152?166.
[15] Efimova Olga, Serletis Apostolos. Energy markets volatility modeling using GARCH[J]. Energy Economics, 2014(43): 264?273.
[16] 賈桂文, 張景川, 陳德旺, 等. 基于BIC準則模型選擇的光纖光柵波長溫度擬合研究[J]. 傳感技術學報, 2014, 27(2): 217?219. JIA Guiwen, ZHANG Jingchuan, CHEN Dewang, et al. Research of fiber grating wavelength-temperature fitting based on BIC criterion for model selection[J]. Chinese Journal of Sensors and Actuators, 2014, 27(2): 217?219.
Predicting intercity high-speed railway passenger flow based on volatility clustering
GENG Liyan1, LU Rongli2, LI Xinjie2
(1. School of Economics and Management, Shijiazhuang Tiedao University, Shijiazhuang 050043, China; 2. Hebei Qugang Expressway Development Co., Ltd, Baoding 071000, China)
Intercity high-speed railway passenger flow sequence is characterized by volatility clustering due to the influence of many factors. It is difficult for commonly used prediction methods to reveal the volatility clustering accurately, which limit the improvement of the precision to predict intercity high-speed railway passenger flow. To solve this problem, autoregressive integrated moving average (ARIMA) model and generalized autoregressive conditional heteroscedasticity (GARCH) model (ARIMA-GARCH) were proposed in this paper to predict intercity high-speed railway passenger flow. First, ARIMA model was constructed by using intercity high-speed railway passenger flow sequence. Then, GARCH model was used to describe the volatility clustering in the residual from the ARIMA model. The effectiveness of the proposed model was tested based on the intercity high-speed railway passenger flow data from a station. Results show that the ARIMA-GARCH model captures the volatility clustering in the intercity high-speed railway passenger flow. The precision from the ARIMA-GARCH model is higher than the ARIMA model in short-, medium- and long-term prediction. With the increase of prediction steps, the prediction accuracy of the ARIMA-GARCH model decreases gradually.
railway transportation; intercity high-speed railway; passenger flow; predicting; ARIMA-GARCH model
U412.366
A
1672 ? 7029(2019)08? 1890 ? 07
10.19713/j.cnki.43?1423/u.2019.08.004
2018?11?09
國家自然科學基金青年基金資助項目(61503261);河北省交通運輸廳科技計劃資助項目(QG2018-4);河北省高等學校青年拔尖人才計劃資助項目(BJ2014097)
耿立艷(1979?),女,天津人,教授,博士,從事鐵路運輸管理方面的研究;E?mail:gengliyan_28117@163.com
(編輯 蔣學東)