張禮平



摘 要:基于公交IC卡刷卡消費記錄數據,提出乘客上車站點估計模型,主要包括刷卡時間序列的聚類分析和類與站點的匹配模型。根據經緯度的坐標來計算相鄰站點間的距離,并在考慮交通信號燈和道路情況的前提下依次進行公交車輛某次出行的行車時間的計算,特別針對在站點(除終點站)無人上車的情況考慮類與站點的匹配,最后分析公交線路站點處的上車客流量特征和線路滿載率。
關鍵詞:公共交通;公交客流;公交智能卡;聚類算法
中圖分類號:U491.17 文獻標識碼:A
0 引言
智能公交系統內儲存的數據資料是國外學者的重點研究對象,Pelletier等綜合介紹了公交IC卡記錄數據在公共交通方面詳細使用情況[1];Ceder等人研究了基于公交IC據的換乘站點公交客流信息,對公交調度進行了優化[2];Jin Young Park等人將IC卡數據和GPS數據進行融合,針對不同時間段的乘客出行規律、運行速度進行研究分析[3];Dessouky等利用公交刷卡數據計算道路中路段的行駛時間,從而預測公交車輛的到站時間;Koutsopouls等采用數學規劃的方法來分析乘客的刷卡數據和公交集團的運營調度信息;Bagchi等利用公交IC卡中的信息,分析乘客出行行為中的乘客周轉率、乘客消費金額[4]。國內陳學武[5]等人使用統計分析的方法對公交刷卡數據展開研究,并分析乘客行為規律。李文鋒將公交刷卡數據與GPS數據進行匹配,對公交客流建立多維度數學分析模型,分析公交客流特征[6]。公交系統存儲的數據與傳統的調查方式收集的數據相比,公交系統存儲的數據更具有時效性、代表性、準確性更高、成本低。
1 估計乘客上車站點的模型
1.1 刷卡時間序列的聚類分析
由于乘客上車刷卡消費記錄中刷卡時間具有不可逆性,分析乘客上車刷卡時間差序列,以公交車在最短相鄰倆站點間的行車時間作為聚類分析的最小距離[7]。記某條線路的總站點數為m,站點序列為M={1,2,3,……,m},采用經緯度坐標[8]的方法計算公交車由站點i到站點i+1的距離d(i,i+1),則公交車由起點站到終點站的全程距離D:
(1-1)
假定在起點站有乘客刷卡上車開,終點站時無乘客刷卡上車。一輛公交車一次出行的全程行駛時間T:
(1-2)
其中:t1——該公交車于此趟出行時所記錄的最早一個公交乘客刷卡乘車的上車時間;
tn——最晚一個公交乘客刷卡乘車的上車時間;
α——交通信號燈的影響系數,0<α<1;
δ——由最后一位乘客刷卡上車時間來給出的調整系數,δ>0。
公交車在某次出行中行駛的平均速度V是全程距離D與全程行車時間T之比,則聚類的最小距離Tmin為公交線路上相鄰兩個站點間的最小距離dmin與平均速度V之比。
1.2 類與站點的匹配模型
以最小距離為聚類依據,將刷卡時間序列分為n類,需要考慮相鄰兩類間的行駛距離Δd(k-1,k)和相鄰站點間的固定距離的關系來匹配。設起點站與第一類匹配,終點站不進行匹配,進行第二類匹配時,可供匹配的站點序列為{2,3,4,……,m-1},其中有m-1-n個站點沒有乘客上車,記為ΔS1,因此第二類的上車站點只能是候選站點序列{2,2+1,2+2,……,2+ΔS1}中的一個站點。計算第一類與第二類之間的行駛距離Δd(1,2),再計算起點站到其他站點的固定距離d(n1,n1+i),Δd(1,2)與d(n1,n1+i)近似時,此時站點與第二類匹配,無乘客上車的站點數量為第二類上車站點與第一類上車站點間隔的站點數。依次估計各類的上車站點,無乘客上車的站點數量滿足如式1-3的規律:
(1-3)
第nk類所對應的上車站點mk的估計模型如式1-4:
(1-4)
其中:Δt(k-1,k)——最晚刷卡乘車的上車時間和緊鄰后一類中最早的上車時間之間的間隔。
2 結果分析
2.1 客流量分布特征
以金華市繁忙線路K330為實例,線路分為上行和下行兩個方向,其中上行共計21個站點,下行共計22個站點,發車間隔9~15分鐘。對K330一個月公交IC卡刷卡消費數據進行分析,其線路客流呈現周期性變化,七天一個周期。客流曲線會出現“波峰”和“波谷”,周一至周五平均客流量為6.249 3萬人,變化較為平緩;周六和周日的客流量變化較大,是客流曲線上的“波峰”。K330線路客流量時間上的分布不均衡性,客流量變化曲線有規律的波動,體現了市區的出行需求,表明市民在周末的出行比其他時間段明顯增多。
2.2 滿載率分析
線路晚高峰時間段客流量處于相對較高的水平,最大滿載率一般都發生于早高峰時段。金華市K330路的客流高峰期出現在早上七點到九點之間,K330路在高峰時段的運營已接近飽和,高峰滿載率已經到達70%以上。
3 結論
本文以公交IC卡刷卡數據作數據支撐,提出上車站點估計模型,用所提出的模型來完成客流量的統計,分析線路客流分布特征和滿載率分析,客流量在時間分布上具有不均衡性和呈現周期性波動,高峰時段和非高峰時間的客流量變化特別明顯。對其高峰時段采用有限措施來緩解交通問題,更加合理地安排公交調度。
參考文獻:
[1]Marie-Pier Pelletier,Martin Trepanier,Catherine Morency.Smart card data use in public transit: A literature review[J].Transportation Research Part C,2011(19):557-56.
[2]Ceder,A.and tal.“Timetable synchronization for buses.”Computer-aided scheduling of public transport,N.H.M.Wilson,ed,Springer,New York,1998.
[3]Jin Young Park,Dong-Jun Kim.Use of Smart Card Data to Define Public Transit Use in Seoul,South Korea[J].Transportation Research Record: Journal of the Transportation ResearchBoard.Vo1.2063,2008:3-9.
[4]M.Bagchi,P.R.White.The potential of public transport smart card data[J].Transport Policy,2005,12:464-474.
[5]李海波,陳學武.基于公交IC卡和AVL數據的換乘行為識別方法[J].交通運輸系統工程與信息,2013(06):73-79.
[6]李文鋒,林艷玲,程遠.基于公交IC卡與GPS數據的公交客流可視化分析[J].交通科技與經濟,2018,20(05):55-59+80.
[7]胡雷芳.五種常用系統聚類分析方法及其比較[J].經濟研究,2006,3(02):61-65.
[8]崔金紅,王旭.Google地圖算法研究及實現[J].計算機科學,2008,34(11):193-195.