郭婷婷,宇世航
基于修正動態組合模型對公共交通客運量的預測
郭婷婷,宇世航
(齊齊哈爾大學 理學院,黑龍江 齊齊哈爾 161006)
針對公共交通客運量的預測問題,結合ARIMA、灰色預測以及BP神經網絡的優勢,采用臨近期的誤差平方和來計算動態權重,將突發事件定義為影響因子,建立了修正動態加權組合模型.選取北京市1978—2021年公共交通客運量進行實證分析.實證分析結果表明,修正動態加權組合模型的預測效果比單一模型和固定權重組合模型更好.
公共交通客運量;修正動態組合模型;ARIMA模型;灰色預測模型;BP神經網絡模型;突發事件
城市公共交通客運量是城市公共交通規劃的重要依據,也是確定行車計劃,經濟合理地使用車輛,改善提高公共交通質量所不可缺少的數據.城市公共交通是指在城市人民政府確定的區域內的公共汽(電)車(含有軌電車)、城市軌道交通系統和有關設施.城市公共交通是城市基礎設施的重要組成部分,對城市政治經濟、文化教育和科學技術等方面的發展影響極大,也是城市建設的一個非常重要的方面.發展城市交通不僅是緩解城市交通擁堵的有效措施,也是改善城市居住環境,促進城市可持續發展的必然要求.
新冠肺炎疫情對于我國各行各業都產生了不小的影響,其中公共交通運輸業也受到了很大的沖擊.公共交通運輸業屬于國民基礎產業,在社會再生產過程中起到先導性和戰略性作用.對于交通運輸業來說,建立有效應對突發狀況的體系,降低突發事件對交通運輸的影響,保障公共交通運輸的正常運行至關重要.因此,在預測客運量的過程中應考慮突發事件帶來的影響,單純依靠時間序列的預測會導致結果偏離實際情況.
目前,對于公共交通客運量的預測研究國內外學者已經進行了大量的工作,但多數集中于單一模型的研究.文獻[1]使用網絡克里金法估計乘客量,用網絡距離來反映地鐵站只通過地鐵隧道連接的事實.徐文遠[2]等對公共交通客運量的影響因素進行分析,建立ARMA時間序列模型對公交客流量進行擬合和預測.丁聰[3]等基于梯度提升和隨機森林的混合模型對日均客流量進行預測,發現此模型相較于常規ARIMA模型和隨機森林模型具有更好的適應性.王瑩[4]等總結北京地鐵進站客流量的波動規律,選用季節時間序列模型對北京地鐵進站客流量進行時間序列建模.盧小蘭[5]等使用Holt-Winters模型和SARIMA模型分別預測鐵路的月度客運量,并構建組合預測模型.張健[6]等采用一種時空模型平均方法,有效地降低了由于航空客運量的結構性變化和預測模型不確定性等導致的預測風險,進而做出精準而穩定的客運量預測.近年來,組合模型被廣泛地應用于各種預測問題中[7],組合模型能夠結合單一模型的優點,避免其局限性.關于突發事件方面,汪志紅[8]基于新冠肺炎疫情對日常生活的影響構建了ARIMAX干預模型,模型顯示我國鐵路客運正在緩慢持續回暖.




為檢驗模型的準確性,使用關聯度檢驗法、后驗差比值和小誤差概率檢驗灰色預測模型的效果.
神經網絡方法是一種具有高度靈活性的非線性擬合方法,理論上可以擬合任何函數,并且達到非常高的擬合精度[10].BP神經網絡是一種按誤差反向傳播(簡稱誤差反傳)訓練的多層前饋網絡,它的基本思想是梯度下降法,利用梯度搜索技術,以期使網絡的實際輸出值和期望輸出值的誤差均方差為最?。?/p>
BP神經網絡是在輸入層與輸出層之間增加若干層神經元(見圖1),它們與外界沒有直接關系,但它的狀態可以改變,從而影響輸入層與輸出層之間的關系.其過程主要分為2個階段,第1階段是信號的前向傳播,從輸入層經過隱含層,最后到達輸出層;第2階段是誤差的反向傳播,從輸出層到隱含層,最后到輸入層,依次調節隱含層到輸出層的權重和偏置,輸入層到隱含層的權重和偏置.神經網絡的擬合過程就是不斷地優化連接相應層神經元之間的參數.

圖1 BP神經網絡結構
為了加快訓練速度,避免陷入局部最小值和改善其他能力,學習算法可采用帶動量的批處理梯度下降法[11].



1.4.2 影響因子新冠肺炎疫情作為突發公共衛生事件,從多個渠道給經濟運行帶來負面影響.公共交通客運量能夠直觀地反映出此次突發事件對于人民生活的影響.
采取線性回歸將新冠疫情對公共交通客運量的影響描述出來,之后對正常情況下的公共交通客運量進行預測,根據不同月份公共交通客運量的占比,計算出月度公共交通客運量的預測值,通過對比,可以得出新冠疫情對公共交通客運量的影響值,影響值可以用于修正預測模型,更準確地預測突發事件影響下的公共交通客運量.具體計算公式為



文中使用的1978—2021年北京市公共交通客運量數據來源于北京市統計年鑒,新冠肺炎病例數據來源于銳思數據庫 (www.resset.com).

對數據進行預測,利用Forecast中的ARIMA函數進行預測分析,結果見圖2,其中1~39期分別為1978—2016年,向后1~3期分別為2017—2019年,其公共交通客運量預測值均為734 953萬人,預測誤差平方和在0.002 6~0.009 6之間,模型預測情況良好.

圖2 ARIMA模型公共交通客運量預測擬合
2014—2018年公共交通客運量的預測值和真實值擬合程度良好(見圖3),公共交通客運量的預測值分別為815 849,741 482,728 763.1,716 262.3,703 975.9萬人.

圖3 GM(1,1)灰色模型公共交通客運量預測擬合

訓練數據為1999—2016年的歸一化數據,預測數據為2017—2019年的歸一化數據,根據輸入節點的不同調整輸入數據,輸出數據為1999—2019年的數據.采用的BP神經網絡學習算法為LM(Leneberg-Marquardt)算法,設定網絡的最大訓練次數為1 000,學習速率為0.01,訓練目標誤差為0.01.
一般情況下,隱含層節點數大于輸入層節點數,網絡結構的穩定性比較好,但當隱含層節點數為輸入層節點數的4倍以上時,網絡會出現過擬合和穩定性變差的情況.當輸入層節點數為3,隱含層節點數為4時,平均相對誤差最小,為0.004 2,BP神經網絡的穩定性較好,可以獲得較好的結果.
使用訓練好的BP神經網絡模型對2017—2019年的公共交通客運量進行預測,結果分別為713 020,709 960,712 160萬人.驗證樣本的平均誤差率為0.00 428,與單個誤差率均小于目標誤差0.01.
3種模型的預測結果表明,直至2019年,預測的精度都是良好的,但自2020年開始,預測值與真實值的誤差急劇增大(見圖5).這是由于在2020—2021年期間,因為新冠肺炎疫情的影響,公共交通客運量大幅度降低,因此在接下來的預測過程中,應考慮這一突發事件給公共交通客運量帶來的影響,對模型進行修正.

圖4 BP神經網絡訓練集的預測值與實際值

圖5 3種單一模型2020—2021年公共交通客運量的預測值與真實值


表1 前3年的預測誤差平方和

表2 2017—2019年動態組合模型的權重
根據表2計算的動態權重系數,得出的動態組合預測模型為

使用組合模型預測2017—2019年的公共交通客運量,預測結果及相對誤差見表3.

表3 動態組合模型公共交通客運量預測結果及相對誤差
4種模型公共交通客運量的預測值與真實值對比見圖6.

圖6?。捶N模型的公共交通客運量預測值與真實值
組合模型的相對誤差小于其他3種單一模型的相對誤差,由圖6也可以看出,組合模型的擬合效果優于其他3種單一模型,集合了3種模型的優點,降低單一模型的局限性.因此選用組合模型預測2020—2021年沒有新冠疫情的情況下可以達到的公共交通客運量,并以此結果計算對比出新冠疫情對公共交通客運量的影響.

根據3種模型的預測結果,計算預測誤差平方和(見表4),確定動態組合模型的權重(見表5),利用動態組合預測模型公式,計算出2020—2021年的公共交通客運量預測值.

表4 3種模型的預測誤差平方和

表5 2020—2021年動態組合模型的權重
根據動態組合預測模型公式(6),可計算得出2020年和2021年的公共交通客運量預測值分別為717 778.496,722 946.764 6萬人,而實際上2020年和2021年北京市實際公共交通客運量只有411 967,557 708萬人,可見疫情對公共交通的影響巨大.
2.4.2 影響因子研究表明,北京市公共交通客運量受到了疫情的影響,假設其他的影響因素未發生改變,只考慮新冠疫情對公共交通客運量的影響.使用2020-01—2022-03每月新冠確診新增人數作為影響因素對公共交通客運量做線性回歸,結果見表6.

表6 月公共交通客運量線性回歸結果
注:**表示在1%顯著水平下非常顯著.
由表6可以看出,每月新冠確診新增人數對月公共交通客運量的線性回歸模型公式為

為了更詳細地反映出新冠疫情對于公共交通客運量的影響情況,以及對預測值進行修正,進一步探討2020—2021年的月度公共交通客運量預測值.由動態組合模型得出預測值,計算2020—2021年每個月公共交通客運量占當年公共交通客運量的占比的平均值,得出每個月的預測值,從而計算出新冠疫情對公共客運量的影響值,具體結果為

2021年每月的公共交通客運量預測值以及影響值見表7.

表7 2021年新冠疫情對月公共交通客運量影響
由表7可以看出,在新冠疫情的影響下,2021年的北京市公共交通客運量隨之產生衰減,1月時,本應因春運而上升的公共交通客運量,由于出現大量新增病例,而導致當期公共交通客運量較以往春運期間公共交通客運量出現很大程度的下跌;2~5月,由于新增人數非常少,公共交通客運量出現了上升趨勢;5~12月國家出臺應對疫情的相應政策,為響應國家號召,人們盡量減少出行,這也導致了公共交通客運量相對以往年份減少較為明顯.

[1] ZHANG D P,WANG X K.Transit ridership estimation with network Kriging:a case study of Second Avenue Subway,NYC[J].Journal of Transport Geography,2014(41):107-115.
[2] 徐文遠,鄧春瑤.公交客運量的時間序列預測模型[J].遼寧工程技術大學學報(自然科學版),2014,33(12):1715-1720.
[3] 丁聰,倪少權,呂紅霞.基于梯度提升的城市軌道交通客流量預測分析[J].城市軌道交通研究,2018,21(9):60-63.
[4] 王瑩,韓寶明,張琦,等.基于SARIMA模型的北京地鐵進站客流量預測[J].交通運輸系統工程與信息,2015,15(6):205-215.
[5] 盧小蘭,張可心.基于IOWGA算子的鐵路月度客運量的組合預測[J].數學的實踐與認識,2020,50(6):120-131.
[6] 張健,孫玉瑩,張新雨,等.基于時變模型平均方法的我國航空客運量預測[J].系統工程理論與實踐,2020,40(6):1509-1519.
[7] 孫彩云,劉翔宇.基于動態組合模型對河北省人均GDP的預測研究[J].數理統計與管理,2022(5):1-10.
[8] 汪志紅.突發事件對我國鐵路客運量的干預特征研究[J].鐵道運輸與經濟,2022,44(1):44-51.
[9] 楊婉瑩.新冠肺炎對交通運輸業影響的預測與分析[J].中國市場,2021(27):136-137.
[10] 王方.基于神經網絡的2020年奧運會獎牌成績預測[J].統計與決策,2019,35(5):89-91.
[11] 馮樹民,慈玉生.居民出行產生量BP神經網絡預測方法[J].哈爾濱工業大學學報,2010,42(10):1624-1627.
[12] 馮增喜,任慶昌.基于動態組合殘差修正的預測方法[J].系統工程理論與實踐,2017,37(7):1884-1891.
Forecast of public transport passenger volume based on modified dynamic combination model
GUO Tingting,YU Shihang
(School of Science,Qiqihar University,Qiqihar 161006,China)
Aiming at the forecasting problem of public transport passenger volume,combining the advantages of ARIMA,grey prediction and BP neural network,the dynamic weight is calculated by the sum of the squares of errors in the near period,the modified dynamic weighted combination model is established by defining emergency events as impact factors.The public transport passenger volume of Beijing from 1978 to 2021 is selected for empirical analysis.The empirical analysis results show that the modified dynamic weighted combination model has better prediction effect than the single model and the fixed weight combination model.
public transport passenger volume;modified dynamic combination model;ARIMA model;grey predictive model;Back-propagation neural network model;emergency event
1007-9831(2023)01-0031-07
TP18
A
10.3969/j.issn.1007-9831.2023.01.007
2022-09-09
黑龍江省自然科學基金項目(LH2019A027)
郭婷婷(1998-),女,黑龍江齊齊哈爾人,在讀碩士研究生,從事時間序列分析研究.E-mail:13895966506@163.com
宇世航(1971-),女,黑龍江齊齊哈爾人,教授,博士,從事整值時間序列和復雜數據統計推斷研究.E-mail:qqhrysh@163.com