孫尹碩 潘思敏 耿立艷 于建立



摘要:城際高鐵客流量序列呈現出不平穩和波動性特征,常規預測方法很難對其進行精準預測。為提高城際高鐵客流預測精度,先通過小波分析對高鐵客流量數據進行平穩化處理,再構建自回歸差分移動平均(ARIMA)模型進行預測。應用該方法預測某城際高鐵站日客流量,結果表明,本文提出的方法獲得了更高的高鐵客流量預測精度。
關鍵詞:高鐵客流量;小波分析;ARIMA模型;預測
由于城際高鐵客運系統受到多種復雜因素的共同作用,其客流量數據序列呈現出不平穩與波動性特征。小波分析能夠將具有波動性的城際高鐵客流量數據進行分解重構的處理,既能精準的進行時頻雙分析,又能使城際高鐵客流量序列變得平穩。自回歸差分移動平均(ARIMA)模型[2]是一類用于分析時間序列數據隨機模型,簡單易操作,但對于不平穩波動性數據的差分損失了大量信息,使得數據的預測與真實值有較大偏差。本文將小波變換與ARIMA模型相結合(文中以下簡稱W-ARIMA模型)預測高鐵客流量,充分發揮兩者的優勢,提升高鐵客流量預測精度。
1. W- ARIMA模型
1.1小波分析
基于正交多分辨分析的小波變換將信號通過共軛濾波器進行分解和還原,通過Ingrid Daubechies正交小波構造方法構造具有緊支撐和較好正則性的Daubechies小波。在小波變換物理意義的分析中,小波變換將數據以圖形方式表達,使信息更加緊湊。小波變換將原始像分解,得到“模糊像”和“細節像”。
1.2ARIMA模型
ARIMA模型是對數據進行差分后建立ARMA模型。由于建立ARMA模型的前提條件是時間序列的均值和方差沒有發生系統變化,ARMA模型要求數據具有平穩性的特性。差分是對求導的近似,數據在差分后具有很好的平穩性。
ARIMA模型的差分能使數據更好地適用模型,但不能過多進行差分, 因為通常信息的加工會造成信息的損失,差分掉的數據沒有參加模型擬合。
1.3W- ARIMA模型構建
對于變化較平滑的數據而言,被差分掉的信息之間的差異較小,適于建立ARIMA模型。而城際高鐵客流量數據具有明顯的不平穩性和波動性特征,不適合用ARIMA模型直接預測。W-ARIMA模型首先通過小波分析中的Mallat算法進行對城際高鐵客流量數據進行分解處理,再對分解得到的小波系數建立ARIMA預測模型。
在mallat算法中,小波的低頻分量相當于小波通過低通濾波器,是信號向低頻基的投影,即得到的部分是小波變化緩慢的部分——“模糊像”。如,在haar小波中“模糊像”是以相鄰兩點的平均值來代替原來的兩點的數值,由于“模糊像”留下的數據是相鄰兩點的平均值,所以它依然能近似地反映圖像的整體狀態[1]。“模糊像”降低數據的離散程度,“模糊像”的離散系數或在歸一化消除量綱后的方差值均小于原數據的離散系數或在歸一化消除量綱后的方差值。處理后得到的低頻時間序列數據會變得平緩,進行差分時差分掉的數據所攜帶的信息減少,信號方差的系統變化減弱,此時則適合于應用ARIMA模型進行預測。
而高頻部分的系數可看作是小波窗范圍內數據的加權求和(權重和為零),是數據的差異平均,小波的高頻分量相當于小波通過高通濾波器,得到的部分是小波變化迅速的部分——“細節像”。此變換與數據的差分處理效果相同,可通過數據的平穩性檢驗,同時由于正交小波變換的矩陣是酉矩陣,在進行信號重構時產生的誤差微乎其微。
若低頻“模糊”處理效果不明顯時可繼續進行下一級小波分解,當高頻系數的擬合不好時,還可以對高頻系數進行同樣的小波分解,循環使用小波數據平穩化法。
2.實證研究
2.1數據描述
以某城際高鐵站日客流量數據為例進行實證研究,時間區段為2017年2月27日至2017年12月30日,共306個樣本。圖1為高鐵站日客流量的自相關和偏自相關圖,從圖1可看出,自相關圖在約200階后出現拖尾現象,而偏自相關圖沒有任何拖尾或截尾現象,表明原城際高鐵站日客流量具有不平穩性,不適合直接建立ARMA模型。
2.2小波分解
用小波濾波器系數構造小波矩陣,時間序列向量與小波矩陣相乘得到時間序列數據的小波分解結果——低頻系數和高頻系數。圖2、圖3分別為高、低頻系數的自相關和偏自相關圖。從圖2和圖3可看出,自相關圖出現拖尾現象,而偏自相關圖出現截尾的現象,所以,高低頻系數差分后的數據適合建立ARMA模型。
2.3預測過程
在306個樣本中,從第1天至第50天,每次取當日及以后的256個數據,前256個樣本用于模型構建和系數估計,后1個樣本用于檢驗模型的預測精度。利用小波濾波器系數構造256階和258階方陣,對前256個樣本數據進行一級小波分解和ARIMA模型預測,將數據的分解值和預測值進行小波重構可得到的2個預測數據,取第一個作預測結果。
2.4結果分析
同時利用ARIMA模型直接對城際高鐵客流量進行預測,比較W-ARIMA模型和ARIMA模型的預測結果。選用均方根誤差(RMSE)、平均絕對誤差(MAE)、平均百分比誤差(MPE)、西爾統計量(Theil)四項評價指標比較W-ARIMA模型和ARIMA模型的預測性能。
表1為W-ARIMA模型和ARIMA模型的預測結果,在所選取的樣本期內,W-ARIMA模型的預測性能明顯優于ARIMA模型,主要體現W-ARIMA模型的RMSE、MAE、MPE和Theil值均小于ARIMA模型的對應值。由此可見,經小波變換后,ARIMA模型能更有效利用數據信息,進而提高高鐵客流量的預測精度。
圖4為W-ARIMA模型和ARIMA模型的預測值曲線圖。由圖6可看出,W-ARIMA模型較好地預測出城際高鐵客流量每日流量,客運量預測值均比較接近于實際值,而ARIMA模型的客流量預測值與每日實際值偏差較大。
3.結論
本文提出一種結合小波分析與ARIMA模型的高鐵客流量預測模型。實證研究結果表明,該模型與ARIMA模型相比,能更好的利用非平穩數據信息,預測能力較強。
參考文獻
[1]張旭俊.用小波矩陣分析Mallat算法的物理幾何含義[J],江西電力,2010 ,34(1):18-22.
[2] BOX G E P, JENKINS G M. Time series analysis: forecasting and control[M]. San Francisco:Holden Day, CA,1976.
[3]耿立艷.基于波動聚集性的城際高鐵客流量預測[J].鐵道科學與工程學報, 2019,16(8) :1891-1892.
[4]楊叔子.時間序列分析的工程應用(上冊)[M].2版.武漢:華中科技大學出版社,2007:236-237.
[5]珀西瓦爾.時間序列的小波方法[M].北京:機械工業出版社,2004.
基金項目:2019年度大學生創新創業訓練計劃項目“基于特性分析的城際高鐵客流智能預測方法研究”(項目編號:201910107007);國家自然科學基金青年項目(項目編號:61503261);2019年度河北省人才培養工程項目(項目編號:A201901048);2019年中國物流學會、中國物流與采購聯合會面上研究課題(項目編號:2019CSLKT3-020)。
通訊作者:耿立艷(1979-),女,天津人,教授,博士。