任望 劉文斌


摘? 要:隨著大數據、云計算的不斷進步以及中國公共交通的逐步發展,大眾迫切需要智能公共交通。通過分析和研究大量的公共交通數據,在數據中挖掘重要信息可以幫助交通管理部門及時調整工作,并幫助乘客選擇正確的旅行時間和路線。在促進智慧城市的發展和建設中發揮著重要作用。當前在交通運輸部門對數據挖掘的研究主要集中在傳統技術的應用上,缺乏提高數據挖掘效率的研究。本文基于軌道交通客流的特征,提出了針對軌道交通站點的數據研究框架,并建立了預測基本數據的一般過程,創建軌道交通旅客運輸流量直接預測模型。
關鍵詞:大數據;軌道交通;客流預測;預測模型
中圖分類號:TP39? 文獻標識碼:A ? ?文章編號:1671-2064(2020)03-0000-00
在互聯網+城市軌道交通蓬勃發展的背景下,城市軌道交通進入了智能時代。得益于智能售票系統,自動軌道車輛控制系統和基于智能的視頻收集系統的進一步發展,軌道交通信息可以得到更準確,更全面的記錄。軌道交通數據已成為有效城市軌道交通運營狀況和特征的重要資源,是軌道交通管理部門決策的關鍵依據。尤其是對客運量的短期預測對軌道交通的合理發展和動態監測具有重要意義,這是協調管理軌道交通運輸能力的重要基準。對客流的準確預測可以有效減少并避免由于短時間內客流增加而導致的車站事故。本文根據城市軌道交通站點客流特征對車站的類型進行了分類。在此基礎上提出了針對軌道交通站點的數據研究框架,并建立了預測基本數據的一般過程,創建軌道交通旅客運輸流量直接預測模型,旨在有效應對軌道交通站點客運量變化并避免突發性安全事件[1]。
1軌道交通站點客流數據研究思路
這項研究包括兩部分數據需求:(1)統計數據:對軌道交通站點交通卡刷卡數據進行統計生成的數據,用于收集站點現有客流的統計信息,以獲取預測站點客運量模型中的基本數據。(2)收集性數據:針對土地利用,運輸路線、換乘著三個方面使用開放數據源獲取重要的數據屬性,以確保軌道站流量預測模型中的基本數據來源。將統計數據導入數據庫進行數據預處理,并根據時間序列的生成進行統計分析。根據選擇軌道站的客流的時間特性分析客流畫像。基于對客流特征指標的鑒別分析對站點類型進行逐級識別,將所獲得的站點客流指標引入訓練集中,以進行后續軌道站的客流數據回歸分析以及客流預測模型。為了收集和處理收集的數據,根據數據的維度特性和研究需求選擇關鍵指標,并使用數據爬取技術獲得關鍵指標,進行預處理。將用于回歸分析訓練的關鍵指標放置在回歸分析訓練集中,并將客流預測關鍵指標輸入回歸分析預測集中以收集和處理收集的數據。
2 基于大數據的軌道交通站點客流預測模型
傳統上,軌道交通站點客流預測通常從城市軌道交通線網出發,在客流初始預測中應采用“四步法”。但“四步法”需要大量的人力物力進行研究和基礎數據的收集,從初步調查到預測客運量的結果需要相當長的時間、經濟和時間成本較高。而且客運量預測主要用于軌道交通站點的初步評價和管理。對于部分開通的線路,無法預測新線開通后全網客運量的變化。本文以軌道交通站點(至少一年)為研究對象,從數據挖掘的角度出發,針對投資新建線路(車站)后的整個線路網的直接客流預測模型進行研究。
由于客流進出站位置和時間涉及不同部門之間的利益,因此可以準確、詳細地統計運輸中的客流數據。網絡信息平臺、數據爬取技術的發展提供了大量開放數據,此外,由于需要對客流進行及時、快速的預測,通過數據挖掘建立了中尺度的客流預測模型,成為交通運輸業客運量預測發展的新方向。
在軌道交通運輸方面,新線路的開通運營對整個站點客流的影響包括以下兩個方面:
(1)新開通的線路站增加客流量:新開通的線路站增加了客流,站點服務覆蓋范圍也會增加,總客流也就不可避免地增加了。由于軌道交通的出現,新車站附近的人將從原來的交通方式轉移到軌道交通。同時,新車站周圍的公共服務也將吸引線網上的其他乘客。
(2)來自原有車站的客流:新車站連接到現有的交通網絡,因此使用原有線路完成旅行的人將擁有更多不同的旅行線路選擇。由于新開放的車站周圍的公共服務具有吸引力,一些人可能會放棄原來的旅行目的地車站,而轉而使用新的車站來實現旅行的目的。例如,新車站開放后,車站建造了一個更大,更完善的商業購物中心,人們就會選擇新站點完成購物過程,導致原有車站客流轉移。此外,車站數量的增加會在多個車站的影響下導致客流腹地的增加,交通換乘條件對人們的出行選擇產生更大的影響。
在這種情況下,本文將軌道站點作為研究對象,從軌道交通客流圖和軌道交通站點的特征中收集數據,并重點解決在新增軌道交通線路的背景下預測整個軌道站客流的問題,包括:預測車站總客流;預測車站客流波動[2]。
3 基于大數據的軌道交通站點客流預測模型構建思路
從模型基本假設出發,考慮到本文的模型以回歸分析為基本分析方法,因此在構建模型前應對模型自變量與應變量進行相關性分析,對相關性過低的自變量進行調整或去除,以保障模型的有效性。在這一前提下,考慮從數量角度(站點客流總量)與形態特征角度(站點客流波動指標)兩方面進行站點客流的模型構建。
3.1客運總量預測模型
可以通過以下兩種方法來分析軌道站客運流量的變化:
(1)客運總量的變化趨勢:多項研究表明,考慮到軌道交通運輸的建設和城市的經濟發展,隨著時間的推移,軌道交通的總體客運量呈現一定的上升趨勢。對于這種隨著城市發展而進行的總量增長的預測,確定增長率是最常用的預測方法之一。本文涉及的增長率方法,構建了以時間和季節作為表征總體客流趨勢的自變量的線性回歸模型。同時,季節因素也對車站客流產生重大影響,部分軌道交通車站的季節變化明顯,為減少季節因素對車站客流預測的干擾,本文采用月度數據作為訓練數據集。即預測目標月份的客流數據,基于與每月數據相對應的訓練數據來校準模型參數。
(2)客流分布變化:即由于土地使用的改善,交通條件的變化以及通用線路網絡中車站拓撲條件的調整,車站客流量發生了一些變化,即客運流量在站點上的分布發生了變化。為了描述這種變化,本文構建了相應的線性回歸模型,以實現每個站點總客流量的預測。最后,為了全面考慮這兩種趨勢,本文使用模型的組合來完成最終模型的構建,以預測站點客流。
3.2車站客流波動特征預測模型
通常通過對現有客運量的統計分析來獲得站點客流波動的特征,如果使用線性回歸假設來構建模型,則該模型通常無效,并且預測效果不佳。因此,在這項工作中,非線性回歸被用作預測車站客流波動特征的主要方式,進而建立相應的模型。
本文中軌道站客流直接預測模型的構建可以分為三個部分:
(1)建立基本的回歸模型:在回歸假設的基礎上,建立現場總客流量的線性回歸模型和現場波動特征的非線性回歸模型;
(2)客流增長率模型構建:建立現場客流增長率模型;
(3)模型的最終構建:通過將基本回歸模型和客流增長率模型相結合,構建總客流模型和站點波動特征模型。
4基于大數據的軌道站客流預測模型的構建
4.1直接預測車站總客運量的模型
針對軌道交通中的客流,考慮到車站的多維變化,季節性差異,車站總客流主要取決于兩個方面:
(1) 場地周圍多維因素的變化。本文假定大多數多維因素服從線性相關,并且不存在多重共線性問題[3]。根據相關性分析,由于與限制相對應的每個自變量與因變量都具有線性相關性,因此考慮到未知因素對“總客流量”的其他影響,由于存在回歸系數實現第j個自變量和因變量之間的擬合,通過截距使該模型的配置與實際邏輯條件一致,可得用于確定站點總客流量的主要模型如下:
由于各城市居民出行特征的差異以及城市規劃和建設的差異,一些自變量會偏離線性相關或具有多重共線性,導致此類自變量的回歸系數為零。
(2)軌道站客流總趨勢的變化,城市人口的增長導致鐵路客運量的增加表明客運總趨勢可以用增長率法來表征,并使用年均GDP增長率作為增長因子,同時設置適當的校正參數以提高模型的準確性。因此,總旅客流量的預測模型如下:
4.2 客流總量預測效果評價
對于廣州地鐵5、13號線的61個車站,由于使用不同的tr值,將車站的總客運量預測值與實際值誤差考慮在內,邊際誤差值為20%時該模型的預測效果最佳,對車站的總客流預測更為合理;由于預測值與計算值之間存在顯著相關性(相關系數0.829),可以假設在基于計算值進行模型評估的條件下,大多數軌道站的總客流預測是比較理想的。
5結語
綜上所述,本文結合大數據背景下的數據分析和研究方法,對軌道車站客流進行了研究,基于車站總客流和車站客流波動性質兩個方面,在多元線性回歸分析的基礎上進行了直接預測建模。以廣州軌道交通為模型進行分析和預測的主要對象,基于該預測模型的適用性,采用多元線性回歸模型對車站客流波動的性質進行了預測,效果比較理想。
參考文獻
[1]謝英豪,江志彬,徐瑞華.城市軌道交通斷面客流數據可視化分析及優化[J].城市軌道交通研究,2017(1):78-83
[2]王嘯君.基于大數據分析的客流走廊判別方法研究[J].城市道橋與防洪,2018(1):134-136.
[3]李偉,周峰,朱煒.軌道交通網絡客流大數據可視化研究[J].中國鐵路,2015(2):106-110.
收稿日期:2020-01-11
作者簡介:任望(1985—),男,山西忻州人,本科,工程師,研究方向:軌道交通運輸行車組織。