文晶琳 鐘夢娟 吳文謙






摘要:為合理組織城市軌道交通系統客流,提升城市軌道交通使用效率,本文將基于組合模型,對城市軌道交通全線的客流預測進行分析。通過剖析城市軌道交通客流的影響因素后,基于相關性分析,研究客流與其影響因素的相關度;再基于時間序列及差分的方法,對原始客流數據平穩化處理;最后基于ARIMA模型進行客流預測并檢驗數據結果,以得出更符合未來實際發展的全線客流數據。
關鍵詞:城市軌道交通:全線客流預測:組合模型
憑借著安全系數高、運行速度快、不易受天氣影響等優點,軌道交通逐漸成為大部分出行者的選擇。但總體上依然很難滿足快速增長的客流需要,需要準確預測客流量信息,規劃列車運行方案,合理組織客流。
客流預測擁有較廣闊的前景,國內許多學者已經進行了多方面的分析研究,借助方法和建立模型以獲得成果。林璐通過相關回歸法,解析相關影響因素,再擬合ARIMAX模型進行預測,得出該模型預測效果更好,有實際應用價值的結論;聞克宇等人提出一種短期客流預測方法,通過改進遷移學習得到,再將某鐵路局客票數據作為研究案例預測,以更好地提升資源配置效率與客貨運服務水平。于顥晨基于四階段法,針對客流預測中風險指標,分析結果敏感性后,預測沈陽市軌道交通線路客流。
本文基于組合模型,針對城市軌道交通線路,進行月均客流量預測。首先,通過分析客流形成機理及影響因素。借助相關性分析,得出與客流變化有關的影響因素,將其作為研究變量。其次,基于差分和季節性差分的方法,對初始客流數據作平穩化處理,合理化時間序列圖。再次,基于ARIMA模型,比較各類模型的相關統計量及擬合值檢驗數據結果,再對模型進行修改。最后,基于構建的組合模型,以深圳地鐵7號線為例,進行客流預測研究。經過不斷優化,得到更合適該線的預測模型類型,以及更具針對性、更符合未來發展的客流預測數據。
1城市軌道交通客流分析
1.1客流形成機理
城市軌道交通客流,是指當人們乘坐軌道交通時,在一定的時間及空間范圍內有目的地移動,單位時間內人數及移動的總和。主要由基本客流、誘增客流和轉移客流三部分組成。基本客流是指在城市軌道交通初期建設時,要求擁有的客流數量,以達到城市軌道交通的建設必要性。誘增客流是指由于新建的城市軌道交通促進其他居民對此的出行行為而增加的客流。轉移客流是指由于城市軌道交通運營吸引其他交通方式中的部分客流量轉移到該線。
1.2客流影響因素分析
城市軌道交通客流受眾多因素影響,對其做出分析,為后續城市軌道交通的建設及相關客流預測做鋪墊參考。影客流因素主要包含以下幾點:
(1)沿線土地利用。沿線土地利用決定了未來城市發展的情況,能夠帶動沿線商業發展,促進沿線人流量的增長與市內就業率的增長。同樣,線路周邊土地的開發利用程度都決定了客流量的大小、出行時間及去向。比如,若車站周邊是大型商場、旅游景點等,那么在節假日時客流數額也將非常龐大。
(2)經濟水平。城市經濟水平,也就是政府的財政能力,都會直接影響著是否可以支付相關建設運營資金。一般來說,當城市的經濟發展水平較高、政府財政水平合理時,才能有足夠的資金投入。除此之外,還能根據實際情況、市民的承受能力制定出合理票價,提高居民的出行意愿,進一步擴大線路客流量。
(3)服務水平。服務水平的影響因素包括車輛票價、運營配置和乘車環境舒適度等。通過以往對城市軌道交通研究表明,票價變化、設施服務對客流量都會有很大的影響,當降低車輛票價,有可能會吸引到更多的客流量出現。另外,對發車間隔、運營時刻表等進行合理配置,提高服務水平,可以對客流量產生積極影響。
2組合模型的構建
2.1相關性分析
為研究兩個變量間的相關關系密切程度,我們最常使用的分析方法是Person,分析法。基于相關分析,可以研究各類影響因素與客流量之間的相關關系,從而確定后續時間序列模型的建立。
相關系數是衡量兩個變量之間線性相關強度的量,通常用字母r表示。最常用的是皮爾遜相關系數,其公式如下:
當0≤|r|<0.3時,兩個變量之間被認為不存在相關性;當0.3≤|r|<0.5時,變量間存在低相關;當0.5≤|r|<0.8時,變量間存在中度相關;當0.8≤|r|<1時,變量間存在高相關。
2.2時間序列平穩化檢驗及平穩化處理
在進行客流預測前,往往需要對歷史客流數據進行平穩化檢驗。時間序列存在非平穩性,需要通過差分處理,并再次進行平穩性檢驗,直至平穩為止,差分的階數為模型ARIMA(p,d,q)中d的數值,平穩化處理的方法如表1所示。
2.3模型識別
在spss統計分析軟件中,時間序列預測方法大致被分為有三種,在本文研究中,由于影響客流數據的因素較多,我們將直接利用SPSS軟件中的專家建模器(僅限ARIMA模型),以建立合適的時間序列預測模型,相對其他方法,此法較為簡便且模型適合度更高。如表2:
2.4模型定階及參數估計
ARIMA(p,d,q)模型通過分析得到的自相關圖(ACF)和偏相關圖(PACF),分別對平穩序列進行ACF和PACF圖分析,綜合差分階數,得到最佳參數p,q和d。將時間序列作自相關圖進行平穩檢驗后,分別觀察ACF圖與PACF圖的截尾性,二者不是拖尾就是截尾,否則判斷為非平穩序列。非平穩序列在差分后繼續進行平穩性檢驗,直至滿足平穩性條件,則d值確定,參數p、q及模型的確定方式如表3所示。
2.5模型檢驗
ARIMA模型的驗證主要是驗證其擬合效果,若時間序列的變化特征可以基本被模型所解釋,那么模型的噪聲序列則為白噪聲序列。具體的檢驗方法可利用Barlett法檢驗統計量Q。若求得的模型不能通過檢驗,那么應該重新擬合模型,直至模型能通過白噪聲檢驗為止。
3預測實例分析
3.1深圳地鐵7號線概況
深圳地鐵7號線以南山區西麗湖站作為起止點,到羅湖區太安站結束。每天的客運流量、車廂擁擠的程度都在不斷發生變化,將面臨日常運營、應急組織等艱巨挑戰。在這些情況下,提前做好客流預測研究分析顯得尤為重要。基于歷史客流數據建模將更加具有準確性和可靠性,本文將以該線2016年10月至2020年12月的每月全線的平均客流量作為原始數據,對其進行客流預測研究。
3.2雙變量相關性分析
通過研究其全線月均客流量與時間之間的相關關系密切程度,可以驗證實驗數據的準確性。再利用SPSS軟件進行相關性分析,得到表4的分析結果。從表中可以看出,兩個變量之間的相關系數為0.369,為正相關,且具有較強的相關性。同時兩者之間的顯著性水平為0.008,低于0.01,差異性非常顯著。由此可以得出,此歷史客流數據在預測未來年客流量趨勢上具有比較強的可靠性。
3.3原始客流量時間序列預處理
通過SPSS軟件對全線的月均客流量進行時間序列圖分析,從圖1可以看出,該原始序列有一個較明顯的季節特征,年度高點位于12月,為了序列圖更趨平穩化,采用了差分和季節性差分對數據進行時間序列平穩化處理,得到平穩化序列圖。
3.4案例模型構建與驗證
通過SPSS軟件,創建專家建模器預測模型(僅限ARIMA預測模型),如表4所示,所建立的ARIMA模型的因變量標簽為“全線”,模型名稱為“ARIMA”,模型的類型為ARIMA(0,1,0) (0,1,0)。
表4給出了模型的擬合統計量和Ljung-Box Q統計量。平穩的R方值為0. 923,與模型擬合圖中的平穩的R方一致,能夠解釋時間序列約92. 3%的變化規律。得出統計量值為10.864,顯著水平為0.900。可以說明ARIMA(0,1,0)(0,1,0)模型對全線客流量的擬合情況是非常不錯的。
完成模型建立后,對殘差序列進行自相關檢驗,SPSS軟件計算的殘差做殘差序列的ACF和PACF如圖2所示。由圖可知,殘差序列為白噪聲序列,ARIMA(0,1,0)(0,1,0)模型通過檢驗,可以確定ARIMA(0,1,0)(0,1,0)模型為預測深圳地鐵七號線未來年客流量較為適合的模型。
3.5未來兩年的全線客流量預測
通過ARIMA(0,1,0)(0,1,0)預測模型,對深圳地鐵7號線未來兩年(2021-2022年)的月均客流量進行預測,預測結果如圖3所示:
4結論及反思
運用所建立的組合模型對城市軌道交通線路進行客流量預測,分析其運營狀況。另外,還可以尋求出更多針對特點線路的預測方法及擬合模型,以得到更貼近事實發展的客流數據。除此之外,為車站客流控制和安全管理、軌道交通線路的規劃與發展提供了理論支持。現得出以下結論:
(1)一般而言,深圳地鐵7號線客流量在樣本期間波動幅度較大。另外,從指標來看,全線客流量均值較高,可見在樣本期間該線的運營狀況良好。
(2)深圳地鐵7號線客流量在樣本期間呈波動上升態勢,并且在樣本期間的波動不是很大,得出數據擬合較好的ARIMA(0,1,0)(0,1,0)模型,可更好地預測出其未來全線的客流數據。
(3)在城市軌道交通運營管理過程中,通過預測客流,有利于合理規劃列車運行方案日后運營能夠進行合理判斷和決策。但由于客流的分布特征廣,客流量影響因素多,目前采用的研究數據樣本較少,進行客流預測精準度有限,考慮更多相關變量、使用更大樣本數據將是下一步要探索研究的方向。
作者簡介:文晶琳(1999— ),女,漢族,廣東南海人,本科,研究方向:交通運輸規劃與管理。