劉芩瑜 康力 張凱



摘 要:數據正在深刻的改變我們的工作方式和思維模式,地鐵作為高質量數據的產生點,通過對地鐵客運數據加以分析,能夠挖掘不同時期、時段的客流特征。本文介紹了客運數據分析的一般方法,并簡要介紹了成都地鐵運營信息分析系統。
關鍵詞:地鐵客運組織;數據分析;數據可視化
中圖分類號:U293.13 文獻標識碼:A
1 概述
數據正在以前所未有的速度改變著這個世界以及我們的生活和工作方式。今天,我們只需要兩天時間即可創造出人類在2003年之前積累起來的全部數據。數據已經開始徹底改變公司、企業的運營模式,例如通過對刷卡數據的分析,結合進出站高峰小時系數及車站位置,可挖掘出不同日期、時段的客流特征,再運用機器學習、深度學習算法,可進一步實現更具可信度和準確性的客流預測,為線網客運組織、行車組織提供調整參考。
2 客運數據的分析方法
乘客出入車站借助列車完成距離遷移,上述過程均體現在刷卡上,因此AFC的刷卡交易數據是客運數據分析的主要來源。在分析之前首先需要將地鐵交通網絡通過數學手段復現,一般選用圖論的相關理論構造地鐵線網有向圖,車站是圖上的點,區間為圖上兩點間的連接線,線的權重為車站的站間距或時長。
2.1 地鐵網絡有向圖的建立
每個普通車站對應一個唯一的車站編號,換乘站拆分為多個單線普通站,車站與車站間根據實際可達關系通過鄰接關系表表示,兩站間線的長度通過區間運行時間表達,換乘站拆分出的兩個獨立車站也按上述方式相連。
2.2 綜合出行阻抗的計算
以旅行時間為基準的出行阻抗一般由路段阻抗和節點阻抗組成,路段阻抗等于列車在區間的運行時間,節點阻抗等于乘客在車站所花費的時間。不同的線路選擇有不同的阻抗值,乘客出行時總是力求選擇阻抗最小的方式出行。但由于阻抗值的大小無法直觀判斷,因此出行方式的選擇又具有隨機性,傳統的最短路徑分配法的缺點就是在于該方法忽略了實際出行過程中的這種隨機性。
2.3 有效可達路徑的篩選
一般一對OD之間存在多條可達的路徑,但是乘客只會沿著一部分的合理路徑出行,減少乘客自身的出行成本。有效可達路徑搜索是在城市軌道交通網絡中,為真實、有效的OD對尋找合理的出行路徑集,一般不超過5條,為下一步分配客流做準備。
2.4 路徑客流分配
2.4.1 基于時間阻抗的多路徑概率確定
(4)當近似等于即最小綜合阻抗值時,也近似等于即在綜合阻抗值在最小綜合阻抗值附近時,乘客受阻抗值的影響非常小,選擇的幾率相差不大。隨著路徑的阻抗值的增大,的遞減速率將迅速增加,乘客不予選擇的幾率越大,其客流分配的比例也越小。
(5)若始發站和終到站在同一線路,且第一條路徑正常、可用,則第一條路徑被選擇概率為1,其他均為0;若始發站和終到站在同一線路,但第一條線路中斷不可用,則計算正常、可行路徑被選擇概率。
通過以上分析明顯看出,有效路徑i的效益值是的函數,且成反比關系。根據的五個特性,可通過正態分布函數表示上述特性。當始發站和終到站不在一條線,計算正常可行路徑被選擇概率。正常可行路徑被選擇的概率計算方法:分別計算可達路徑中每一條徑路的廣義費用,得到各路徑的分配比例,再將OD量按此比例分配到各路徑上。
2.4.2 擁擠程度對路徑的客流分擔比例進行修正
在乘客實際的出行過程中,不同線路擁擠程度會有差異,這與線路所經過地區的站點客流量有關,與是否經過換乘站也有關。乘客在進行路徑選擇時,考慮兩條路徑擁擠程度一般會以乘坐的舒適程度作為衡量標準,當乘客的數量小于一列車的定員,不存在擁擠:當乘客流量大于列車的定員量時,且兩者的差值不斷增大時,乘客的不舒適感將不斷增強,故列車擁擠度用列車滿載率來表示,如下式所列:
其中表示第i條線路第j個區間斷面客流量;表示列車定員;
一般情況下,當擁擠程度在一定范圍內時,乘客選擇路徑時考慮擁擠程度的比例較小,只有擁擠程度達到一定的范圍,乘客才會考慮擁擠程度。因此,擁擠程度對乘客出行路徑的選擇的影響可以設置一個擁擠修正系數,對各有效路徑的客流分配比例進行修正。
全部有效路徑的客流分擔比例的總和也應該為。因此公式如下:
2.5 客流清分
通過對這些數據的挖掘和分析,結合機器學習、深度學習相關算法,可進一步實現各種不同場景下的客流預測。例如,通過分形插值算法與聚類分析,結合天氣、日期等信息可對當天短時客流進行預測;通過SARIMA模型,研究地鐵客流在時間序列的周期性特征,從而實現對短期客流的預測。
3 客運數據的可視化呈現及輔助決策
3.1 實時斷面擁擠度
NOIS系統頁面的頂部展示了當前線網的重要客流指標,中部是線網圖并通過漸變色展示線網所有斷面的擁擠度情況,通過這兩個頁面的主體板塊可快速掌握線網整體情況,具有縱覽全局的作用。運營管理人員可通過實時客流指標及斷面擁擠度變化趨勢,及時掌握各區段斷面擁擠情況,為行車調整及客運組織提供及時、有效、全面的信息化決策依據。
3.2 線網運力運量對比
通過對歷史客流進行回顧,結合列車運行圖提供的斷面運力,可在一個圖表內將斷面客流、運力、擁擠度等多個數據集中呈現,可直觀看出同一條線路不同區段的運力運量對比情況。該功能可應用于大站空車開行時機、運行圖轉峰期安排、車站常態化客流控制時間段等輔助決策,進一步提升地鐵運營組織水平。
參考文獻:
[1]張和杰,馬維華.基于時空特征的地鐵客流預測[J].計算機科學,2019,46(07):292-299.
[2]張素潔,謝小園.杭州地鐵客流特征分析與客流預測[J].價值工程,2019,38(19):65-67.
[3]盧佳,任剛,徐凌慧.基于南京地鐵AFC數據的大客流識別方法(英文)[J].Journal of Southeast University(English Edition),2019,35(02):236-241.