倪 杰,于 莉,靳笑楠
(上海工程技術大學 城市軌道交通學院,上海201620)
近年來,隨著城市軌道交通行業(yè)的高速發(fā)展,由于新線開通運營后期,站點周邊公交配套設施逐漸完備,乘客對于新線已經(jīng)較為熟悉,且原有的客流出行習慣也會由于新線所提供的便利性而得到改變。此時站點的進出站客流波動趨于穩(wěn)定,因此可以利用歷史數(shù)據(jù)進行客流預測。
目前,眾多學者針對不同場景提出不同的預測方法。郭文雅等[1]比對武漢軌道交通3號線開通前后,線網(wǎng)及各線路客流變化情況,定量分析了新線開通對線網(wǎng)及各線路客流的影響,提出了提高線網(wǎng)客流的幾項建議和措施。楊德明等[2]對深圳地鐵新開通線路進行觀察,結合網(wǎng)絡后臺客流數(shù)據(jù)分析,找出網(wǎng)絡中存在較大問題的車站,掌握新線開通客流變化規(guī)律。朱霞等[3]從上海軌道交通運營線路的客流變化入手,探討網(wǎng)絡化進程對客流變化的影響,分析網(wǎng)絡化進程中客流變化的原因。鄭清杰[4]在分析歷史新線接入后客流變化情況,基于土地利用性質(zhì)對城市軌道交通車站進行K聚類,基于聚類結果及新線車站的評估,進行新線車站進出站量的預測。
考慮到不同重要度等級下的站點客流特性有較大差異[5],時間序列模型的優(yōu)勢在于能夠較好的挖掘出數(shù)值變化背后的規(guī)律性。因此,本文采用時間序列模型進行站點進出站客流的預測,并利用小波去噪法,針對客流信號中不規(guī)則波動的噪點進行去除,提高預測精度。
時間序列模型能夠?qū)σ粋€時間序列進行時頻兩方面的分析。時域分析認為當前信號組成的時間序列是由過去的狀態(tài)以及相關的外部因素(噪聲、干擾等)組成的,即將來的數(shù)據(jù)能夠由之前的時序數(shù)據(jù)預測而出;頻域分析則認為時間序列可以通過不同周期振幅下的正弦波相加而得,即將正弦波通過平移拉伸產(chǎn)生一系列不同周期及振幅的波系來對一個信號進行表示[6]。
本文研究內(nèi)容為城市軌道交通客流數(shù)據(jù),該序列受多種因素的影響,呈現(xiàn)出時序的趨勢及特征。因此在對客流信號進行分析時主要還是關注于時間域,以達到預測的目的。而頻率域的分析,則集中于對客流信號的去噪,以及不同頻率成分的分析。由于本文所采用的數(shù)據(jù)為地鐵日進出站客流量,且數(shù)據(jù)時間跨度較大,故而季節(jié)性與趨勢性并存,因此采用A R I M A(p,d,q)(P,D,Q)S進行預測模型的建立。ARIMA方法的模型運用主要包括:模型平穩(wěn)性分析、模型階數(shù)判定以及模型估計。利用季節(jié)時間序列模型即可預測出各等級下的站點新線開通后期的進出站客流。
為了驗證方法的可行性,在站點客流預測前,優(yōu)先針對線網(wǎng)全日總客流進行預測嘗試。圖1即為利用2006年1月~11月的全日客流數(shù)據(jù),預測2016年12月的預測值與實際值之間的對比圖。

圖1 全日總客流時間序列預測值與實際值對比圖Fig.1 Comparison of predicted and actual values of total daily passenger flow
由此可見,總體預測精度較高,能夠較好地保留客流變化的趨勢,證明了預測方法的可用性。
時間序列模型即為利用站點歷史客流數(shù)據(jù)的變化對新線開通后期的站點客流量進行預測。由于不同線路所在線網(wǎng)中位置走向的差異,則在進行實際預測時,需要對不同類別線路的站點分別進行建模,以提高預測精度。本文選取上海地鐵9號線楊高中路站作為實例,進行換乘站點進站客流預測模型的建立與演示。
預測采用2015年1月1日~2018年6月24日的上海地鐵9號線楊高中路站的全日進站客流數(shù)據(jù),利用Matlab繪制該站進站客流的總體趨勢如圖2所示。
從圖中清晰可見客流變化趨勢,春節(jié)期間,客流量降至全年的低谷,各大節(jié)假日,客流量也會有較大的降低。此外還有少量數(shù)據(jù)存在著較大幅度的波動,若將這些異常波動點納入時間序列模型中,則會降低預測的精度及模型的擬合效果,因此需要利用小波分析方法進行去噪。

圖2 楊高中路站進站客流總體趨勢圖Fig.2 The overall trend of passenger flow in Middle Yanggao Road Station
(1)借助Matlab對客流數(shù)據(jù)進行db9小波基下的3層分解,編程求取閾值(約為3745.3)。將分解后的低頻信號進行軟閾值去噪,對去噪后的信號進行重構,可得新的客流趨勢如圖3所示。

圖3 三層分解后的客流高低頻信號Fig.3 High and low frequency signals of Three-layer decomposition of passenger flow
由此可見,經(jīng)過小波去噪后的客流信號,相對較為光滑且將客流波動變化的特征尖峰很好地進行了保留。去噪后的進站客流總體趨勢如圖4所示。(2)利用去噪后的客流數(shù)據(jù)進行時間序列模型的構建,首先繪制自相關圖和偏自相關圖,如圖5所示。

圖4 去噪后的進站客流總體趨勢圖Fig.4 Overall trend of inbound passenger flow after denoising
顯而易見,兩圖皆未呈現(xiàn)拖尾或是截尾趨勢,因此序列非平穩(wěn)。觀察偏自相關圖中,數(shù)據(jù)在前三階顯著突出,但隨著階數(shù)的增長,數(shù)據(jù)在零水平線上下波動未顯著趨于零。因此可知,序列趨勢性與季節(jié)性并存。
(3)為了消除數(shù)據(jù)的趨勢性和季節(jié)性,擬采用一階差分和一階季節(jié)差分對數(shù)據(jù)進行差分。經(jīng)增加階數(shù)進行差分以及對數(shù)變換等嘗試,效果并不明顯。因此,為了不過分丟失原始數(shù)據(jù)的特性,最終選擇一階差分。差分結果如圖6所示。
經(jīng)差分后數(shù)據(jù)的自相關圖、偏自相關圖,如圖7所示。數(shù)據(jù)的趨勢性得到了一定的消除,但仍有少許季節(jié)性波動。

圖5 去噪后客流數(shù)據(jù)的自相關圖和偏自相關圖Fig.5 Autocorrelation and partial autocorrelation of passenger flow data after denoising

圖6 客流信號的一階差分圖Fig.6 First order difference in the passenger flow

圖7 差分后數(shù)據(jù)的自相關圖和偏自相關圖Fig.7 Autocorrelation plot and partial autocorrelation plot of differential data
考慮到數(shù)據(jù)既存在著趨勢性又存在季節(jié)性,在構建季節(jié)時間序列模型時,根據(jù)圖7的拖尾及截尾情況,嘗試建立A RIMA(5,1,3)(1,0,1)S模型,利用SPSS進行模型參數(shù)的擬合,實際擬合結果見表1。
由模型擬合結果可知,平穩(wěn)的R方和R方都達到0.858,Ljung-Box Q(18)(楊博克斯統(tǒng)計量)的顯著性為0.713,說明序列已經(jīng)達到平穩(wěn),消除了自相關性,而且正態(tài)化貝葉斯統(tǒng)計值也達到13.924,可見模型總體擬合效果良好,可用性較高。
利用所建模型對一周內(nèi)的進站客流進行預測(2018年6月25~7月1日數(shù)據(jù)),預測出的客流量見表2,客流預測值的擬合效果如圖8所示。
預測進站客流值與實際客流量作對比結果見表3。求得平均誤差約為3.708%,可見預測效果較好,能夠達到一定的運用程度。

表1 模型擬合效果評價表Tab.1 Model fitting effect evaluation

表2 模型預測結果Tab.2 Model prediction result

圖8 客流預測值擬合圖Fig.8 Passenger flow prediction value fitting map

表3 預測結果比較Tab.3 Comparison of prediction results
本文以2015年~2018年上海地鐵客流數(shù)據(jù)為基礎,以軌道交通市區(qū)段新線開通后的進出站客流量為預測對象,預測城市軌道交通新線開通后期的客運量。在進行時序建模時需要對區(qū)段的站點分別進行建模,對楊高中路站站進行了基于小波去噪的時間序列模型預測的實例分析,預測平均誤差較小(約為3.708%),證明該方法具有一定的實用性和工程應用性,可以應用于新開線路后期的客流預測研究及工程應用。