劉維源,戈悅淳,李 磊,殷 艷
(1. 蘇州市軌道交通集團有限公司,江蘇蘇州 215004;2. 蘇州規劃設計研究院股份有限公司,江蘇蘇州 215004)
近年來,隨著我國城市軌道交通的快速發展,城市軌道交通在節假日期間承擔的客流運輸比重逐漸提高,為城市軌道交通運營帶來了巨大的壓力。節假日客流預測受大型活動、惡劣天氣等因素影響,使得現有的客流預測方法難以獲得較高的預測精度。因此,本文對節假日客流進行專門研究,建立相應的預測模型,對城市交通管理和運營部門制定節假日特定的交通管制措施、編制車輛開行方案,具有重要的理論和實際意義。
四階段法是傳統的交通客流預測方法,一些學者采用該方法并在此基礎上進行改進,從而對軌道交通客流進行預測。例如,林本江等采用四階段法,對濟南市的各個軌道交通線網方案進行客流預測[1];陳大偉等對傳統四階段模型進行了改進,增加了機動車車流分配模型[2];裴劍平等在傳統四階段法的基礎上,增加了“時段劃分”和“反饋”兩部分內容[3]。由于城市軌道交通的自動售檢票系統(automatic fare collection system,AFC)可以實時記錄乘客進出站刷卡信息,因此以 AFC數據為基礎進行客流分析的研究也成為主流。周瑋騰等采用自底向上的網絡建模技術,構建了城市軌道交通客流動態分布仿真模型,并通過實際AFC刷卡數據進行二元校驗[4];馬超群等基于綜合交通網絡,提出了方式劃分與分配組合模型,以西安地鐵3號線為例進行了應用[5]。
刷卡數據為學者提供了充足的時序客流,也進一步推動了軌道交通短時預測的相關研究。呂利民等從實時判斷和實時預測兩個維度,在分析近幾年典型的研究算法和思路的基礎上,對未來短期客流預測提出了合理化建議[6];四兵鋒等建立了基于客流時序特征的并行加權神經網絡模型[7];郭曠等基于周期性差分自動平滑回歸模型和支持向量機理論,構建了短時客流預測組合模型,并引入廣義自回歸條件異方差模型來構建短時客流不確定性預測模型[8];李偉等將 SARIMA 模型和SVM 模型相融合,建立一種短時客流量預測模型[9];袁堅等提出基于貝葉斯網絡的客流量預測方法,從而實現了對特定站點的客流量預測[10]。
軌道交通作為城市公共交通的骨干,當遇到節假日或大型活動時,往往需要承受較大的客流壓力,因此也有部分學者對此進行了進一步預測:王興川等構建基于小波分解與重構的GM-ARIMA客流預測模型,并根據廣州地鐵在 2011—2014年廣交會期間的歷史AFC客流數據,對所提出的方法進行驗證[11]。光志瑞采用模糊C均值聚類法和一元線性回歸模型,構建了適用于線網結構發生改變的車站進、出站量預測模型,并結合北京市軌道交通的歷史客流數據,對2015年清明節前一日車站的進出站客流量進行了預測,但該模型需要確定站點周邊土地利用性質,并對歷史數據進行人工篩選[12]。
綜合以上研究可以發現,城市軌道交通短時客流預測有著較為成熟的方法體系,通常包括線性與非線性模型以及神經網絡模型,但針對節假日期間軌道交通客流預測的研究相對較少,導致已有的短期預測模型適用性較差。此外,已有的節假日客流預測方法需要基于歷史數據、站點性質等多種因素的考慮,忽略城市軌道交通對節假日客流常規性快速預測的需求以及軌道客流的動態增長。因此,筆者在考慮歷史節假日客流變化特征的基礎上,構建以現階段客流為基礎的節假日客流預測模型,在ARIMA模型對短時客流量均值進行擬合的基礎上,進一步建立GARCH模型對短時客流量的方差進行擬合,構造ARIMA-GARCH預測模型,以實現對節假日期間城市軌道交通客流的預測,并通過案例進行驗證。
節假日期間的出行大多具有類似的時間分布特性,如在節日的第一天回鄉探親或出門旅游,在節日的最后一天返程,因此首先對節假日期間的客流時間分布特性進行分析。以中秋節為例,選用以15 min為一個時間窗進行集計的數據,比較2018年中秋節假期(2018年9月22日—2018年9月24日)和2019年中秋節假期(2019年9月13日—2019年9月15日)的客流的時間分布特性,以客流量較大的木瀆站、樂橋站、臨頓路站、鐘南街站、石路站和察院場站為例,比較2018年和2019年上述站點15 min客流量的變化趨勢,如圖1所示。可以看出,雖2019年客流量明顯高于2018年客流量,但各站點在兩年間同一節假日的客流變化趨勢具有明顯的相似性,因此考慮可利用往年節假日的客流變化趨勢和當年節假日的客流總量來對當年節假日的客流量進行預測。

圖1 2018年與2019年中秋節假期部分站點15 min客流量比較Figure 1 Comparison of passenger flow of some stations on the first day of the Mid-Autumn Festival in 2018 and 2019
考慮到同一節假日在不同年份所在星期的不同,同時為了消除總體客流量變化帶來的節假日單日的客流量變化,計算2018年中秋節的客流量與2018年中秋節前一周(2018年9月15日—2018年9月21日)的平均客流量的比值,得到該站點在中秋節的客流變化趨勢,并以 2019年中秋節前一周的平均客流量為基準,利用該變化系數,獲得2019年中秋節的基準客流量。同樣以上述6個站點為例,對實際值與基準值進行比較,結果如圖2所示。

圖2 2019年中秋節部分站點客流量變化系數法15 min預測客流量與實際客流量對比Figure 2 Forecast and actual passenger flow of some stations during Mid-Autumn Festival in 2019
各站在一天中的預測誤差如表1所示。所有站點全天客流量的平均百分比誤差為35.26%,多數站點的誤差可維持20%~40%,但其中部分站點的誤差也較大,各站點的誤差如圖 3所示??梢钥闯觯糠诸A測站點的百分比誤差較大,如流虹路(63.90%)和蘇州灣北(102.39%),但兩站點的客流量均較小,分別為377人次/d和169人次/d。而客流量較高的站點誤差均較小,達到了可接受的預測精度。

圖3 2019年中秋節全站點客流量變化系數法預測誤差與實際客流量的關系Figure 3 Relationship between percentage error of the entire station and passenger flow during Mid-Autumn Festival in 2019

表1 2019年中秋節部分站點變化系數法全天客流量的預測誤差Table 1 Forecast trend error of an entire day of passenger flow in some stations during the Mid-Autumn Festival in 2019
不同節假日期間各站點的客流均具有不同的特點,且同類節假日每年只會出現一次。若采用各類回歸模型,雖能夠考慮天氣等多種因素,但同時也需要較大量的訓練數據對模型進行訓練,因此選用較為直接簡單的時間序列模型對短時客流進行預測。
筆者在時間序列模型的基礎上,以前面得到的基準客流量以及現階段客流為基礎,對每一時段實際客流量和基準客流量的誤差進行預測,用來代替直接對每一時段客流量預測的方式。換言之,并非用時間序列模型直接預測短時客流量,而是對上述的預測誤差進行預測,在通過客流變化系數得到的基準客流量基礎上,結合時間序列模型,使預測精準度得到進一步提高。
ARIMA 模型(差分整合移動平均自回歸模型)是一種線性時間序列模型,常用來對時間序列進行短期預測。該模型假設每一時段的方差為常數,即僅對均值進行預測。而節假日期間的客流常波動較大,其波動率多不為常數,具有時變性,即統計意義上的異方差性。為了對客流量的均值和方差信息進行完整預測,構造ARIMA-GARCH模型。此模型不僅要擬合均值,而且要對方差進行擬合,即在ARIMA模型對短時客流量均值進行擬合的基礎上,進一步建立GARCH對短時客流量的方差進行擬合,以便反映在該時段的預測精度。構造的ARIMA(p,d,q)-GARCH(m,s)模型表達式如下:

由于各個站點的客流性質不同,經過 ADF(augmented dickey fuller)單位根檢驗發現,在0.01的顯著性水平下,變化系數法得到的各站點客流誤差經過一階差分后,均拒絕了數據序列存在單位根的原假設,認為一階差分可滿足平穩性要求。以樂橋站為例,一階差分后的客流誤差時序如圖4所示。結合自相關與偏自相關圖,考慮到模型的簡潔性和統一性,設置自相關階數和滯后階數為 1,即建立 ARIMA(1,1,1)模型。

圖4 樂橋站一階差分客流誤差序列Figure 4 The first difference between residentials of Leqiao Station
對ARIMA得到的15 min客流預測值和實際客流的殘差,采用Engle的拉格朗日乘子法對其ARCH效應進行檢驗,各站點的p檢驗值結果如圖5所示。在總共93個地鐵站點中,75個地鐵站點能夠在0.1的顯著性水平下,拒絕殘差無異方差性的原假設,即認為該 75個地鐵站點具有顯著的 ARCH效應,可對其建立GARCH模型,預測得到每15 min客流量及其可靠性和一定置信區間的客流量范圍。

圖5 ACRH效應檢驗P值結果Figure 5 The p test values of ARCH effect
GARCH模型的定階較為困難,多數研究認為可直接選用 GARCH(1,1)模型。因此,筆者對 ARCH效應顯著的站點建立ARIMA(1,1,1)-GARCH(1,1)模型,對節假日短時客流量進行預測,對ARCH效應不顯著的站點僅建立ARIMA(1,1,1)均值模型。
根據上面ARCH效應檢驗的結果,6個客流量較大的案例站點中,僅木瀆站的ARCH效應不顯著,其余站點均可認為具有顯著的ARCH效應。6個站點的殘差時序如圖6所示。

圖6 部分站點殘差時序Figure 6 Squared residential of predicted volume
結合已獲得的2019年9月13日—9月15日中秋節基準客流,對每一個站點構建ARIMA或ARIMAGARCH模型,并假設其中εt符合高斯分布,將前兩天合計138個時間序列作為訓練集,第三天69個時間序列作為測試集,通過建立模型對蘇州軌道網絡全站點進行預測。以客流量較大的樂橋站為例,該站點具有顯著的ARCH效應,因此建立的ARIMA-GARCH模型如下:

式中:Xt為當前預測值,在此模型中即為基于變化系數法得到的客流誤差的一階差分;at為殘差;為條件異方差。以部分站點為例,15 min客流量的結果如圖7所示。

圖7 2019年中秋節結合基準客流量的時間序列模型15 min預測與實際客流量的對比Figure 7 Short-term passenger flow forecast and actual passenger flow of some stations during Mid-Autumn Festival in 2019
各站在一天中的預測誤差如表2所示。對比表1的客流量變化系數法的預測誤差可發現,6個站點的預測精度得到了明顯提高。所有站點的平均百分比誤差為18.64%,大多數站點的短時客流量預測誤差可保持在15%~25%范圍內,各站點的變化系數法客流量預測誤差與結合基準客流量的 ARIMA-GARCH模型客流量預測誤差的對比如圖8所示??梢园l現,結合基準客流量的 ARIMA-GARCH模型能夠在客流變化系數法的基礎上,對預測精度做進一步提升,且精度提升明顯。部分變化系數法預測誤差較大的站點的預測精度也提升顯著,如測試集的流虹路由63.90%提升至37.13%,蘇州灣北由102.39%提升至65.43%,說明筆者提出的節假日短時客流量預測模型達到了可接受的精度。

圖8 2019年中秋節變化系數法與結合基準客流量的時間序列模型的全天預測誤差對比Figure 8 Forecast error in the entire day of passenger flow and short-term passenger flow during Mid- Autumn Festival in 2019

表2 2019年中秋節結合基準客流量的時間序列模型全天客流量的預測誤差Table 2 Prediction errors of time series model combined with reference passenger flow during Mid-Autumn Festival in 2019
筆者以城市軌道交通節假日客流預測為對象,構建了 ARIMA-GARCH預測模型;以歷史客流量為基礎,通過計算歷史客流量變化系數,獲得當前節假日預測基準客流量;進一步采用ARIMA-GARCH模型,對每一時段實際客流量和基準客流量的誤差進行預測,用來代替直接對每一時段客流量預測的方式,實現了以當前客流為基礎對未來一定時期內的節假日客流進行預測。采用蘇州軌道交通2018年中秋節及前后的客流量數據與2019年中秋節前一周的客流量數據,對2019年中秋節進行短時客流量預測。結果表明,變化系數法得到的基準客流量全站點平均預測誤差為35.26%,結合基準客流量通過 ARIMA-GARCH模型能夠將測試集的預測精度提升至18.64%,充分驗證了筆者提出的短時客流量預測方法能夠充分結合歷史客流量和現狀客流量,通過 ARIMA-GARCH模型,對變化系數法得到的基準客流量預測精度做進一步提升,且精度提升明顯。該方法可以避免對軌道站點大范圍定性調查以及對歷史客流的識別分析,降低城市軌道交通節假日客流預測的工作量,具有一定的實踐意義和應用價值。