嚴嵐



摘 要:公交客流OD矩陣是進行公交線網規劃與公交時刻表安排的重要依據。隨著物聯網技術的發展與公交IC卡的普及,現已獲得海量的公交車輛GPS數據與公交IC卡數據,這為創建新型的公交OD矩陣推斷方法提供了重要數據來源。在對城市級的公交系統進行數據分析時,由于數據量龐大而使得數據處理過程緩慢,為此,本文基于python數據處理分析庫與SQL Server關系型數據庫軟件提出一種基于出行者類別劃分的公交OD矩陣推斷方法。
關鍵詞:客流OD矩陣;GPS數據;公交IC卡數據
0 引言
公交的客流OD矩陣是指公交出行的乘客其出發點(origin)與目的地點(destination)構成的矩陣,它是制定公交運營時刻表與優化公交線網的重要參考依據。如今,交通大數據也取得快速發展,公交IC卡已在我國多數城市投入使用,但許多城市的IC卡信息僅停留在開發商手中,數據帶來的價值并未得到充分的挖掘。國內外交通與信息領域的專家學者對此數據的挖掘與處理提出了不同的技術方法。朱從坤等[1]對公交乘客下車行為進行研究分析,指出站點的用地性質對乘客的下車情況具有較大的影響;并引入吸引權系數,提出了由上下車人數推算單條公交線路OD量的結構化模型算法。竇慧麗等[2]通過公交出行行為特征調查分析,研究了公交乘客出行站數的概率分布。劉穎杰等[3]通過對公交IC卡信息的處理獲得公交站點上下乘客人數及對公交乘客出行特征的分析,結合站點吸引率,提出了單條公交線路站點間OD反推結構化算法。師富民[4]通過數據庫分類處理,將城市級的公交IC卡數據分解到公交線路上。鄧紅星[5]等提出基于乘客出行行為概率、站點附近土地利用性質、站點吸引權以及換乘能力對乘客的下車站點的推算方法。李軍等[6]采用基于出行鏈方法推導出公共汽車乘客的下車站點。周雪梅[7]以公交站點上下客人數為約束條件提出了綜合考慮了公交乘客上下車概率與公交站點產生吸引因素的反推模型。
本文首先基于聚類分析將公交IC卡數據與公交車輛GPS數據融合,從而識別乘客的上車站點。在根據卡類型字段將乘客分為不同的類別,對出行同伴群進行識別,并對不同類別的乘客采用不同的出行終點推斷方法,最終形成一套完整的基于公交IC卡數據的公交客流OD矩陣推斷方法。
1 基礎數據準備
1.1 公交IC卡數據
公交IC卡數據一般包含乘客的身份信息、卡號、消費時間、乘坐線路、車號等字段信息,在公交IC卡數據傳輸過程中,可能發生數據信息缺失,因此,在數據挖掘與處理分析之前應先對數據進行預處理,即數據清洗。數據清洗后的公交IC卡數據結構如表1所示。
1.2 公交車輛GPS數據
公交車輛GPS數據記錄了公交車輛的線路、車輛編號、時間及該時間對應的經度與緯度等字段信息,通過經緯度等字段信息處理后的數據結構如表2所示。
2 公交OD矩陣推斷模型與方法
2.1 上車站點識別方法研究
本文利用公交車輛GPS數據與公交IC刷卡數據,通過線路、車輛編號、消費時間與進站時間字段進行數據融合,從而識別乘客的上車站點。其具體實現過程為:首先應根據乘客的公交出行行為特征設定相應的時間閾值,計算乘客通過公交IC卡刷卡時間與車輛進站時間的差值,對與進行對比,若,則推斷該乘客為從該站點上車。
2.2 乘客公交出行終點推斷方法
在對乘客的公交出行終點推斷過程中,由于不同類別乘客具有不同的出行行為特征,因此先將出行者劃分為不同的類別,對于不同類別的出行者,采取不同的公交出行終點推斷方法。本文將公交出行終點推斷過程中的出行群體大致劃分為2類,分別為持普通卡的乘客與持優撫卡等特殊公交卡的乘客。
2.2.1 持卡類型為普通卡的乘客出行終點推斷方法
持卡類型為普通卡的乘客多為通勤出行者與年紀較輕的乘客,此類出行者出行過程中可能選取出租車、私家車等不同的交通方式進行換乘,其出行過程一般較為復雜,同時由于此類出行者的公交卡具有能夠不限次數替他人刷卡的特點,因此,需對出行同伴群進行單獨判別。對畢節市持卡類型為普通卡與畢節公交二維碼的乘客的出行終點進行判斷步驟如下:
出行同伴群識別:判斷前后兩次出行線路與車號是否相同,并計算前后兩次刷卡時間間隔,若前后相鄰兩次出行線路與車號均相同,且刷卡時間間隔小于60 s,則推斷后一次公交出行刷卡行為是為該次出行的出行同伴群刷卡。
基于出行鏈假設的出行終點推斷:排除為出行同伴群刷卡記錄的影響后,判斷乘客前后相鄰兩次刷卡的上車線路,若前后相鄰兩次刷卡線路相同,則基于出行鏈假設推斷其出行起訖點。
出行換乘識別:對于公交換乘行為的判別主要依托前后相鄰兩次出行的時間間隔與距離間隔,通過設定相應的時間閾值與距離閾值,對其進行比較。
判斷該次出行是否為當天的最后一次出行,若該次出行為當天最后一次出行,或該次出行不為當天最后一次出行且識別出下一次出行的出行站點不為該次出行的換乘站點,則根據概率分布模型對出行終點進行推導。
2.2.2 持卡類型為優撫卡、愛心卡與傷殘卡的乘客出行終點推斷方法
持此類卡的乘客多為年紀較大的乘客,此類出行者的出行過程中所采取的交通方式往往較為單一,且一天中最后一次出行的出行終點一般為其出行起點。并且,此類特殊公交卡受到政府對此類人群的特殊財政補貼,出行者不能用此類卡對其共同出行者進行代刷,因此,對于這部分票卡數據記錄可以不考慮出行同伴群帶來的影響。而直接進行出行終點推斷。其推斷方法與持普通卡乘客推斷方法一致。若該次出行推斷為該天最后一次出行且出行次數超過一次,則根據出行鏈閉合假設,推斷其出行終點為該天第一次出行上車刷卡所在站點。
3 結論
采用這套方法能夠快速高效的推斷出城市公交客流OD矩陣,僅靠乘客刷卡時間與位置等信息對乘客出行信息進行推導具有一定的局限性。因此,將來可對出行乘客的行為心理等進行深入挖掘,使推算結果更加準確。
參考文獻:
[1]朱從坤,丁建霆,陳瑜.公交線路OD反推的結構化模型研究[J].哈爾濱工業大學學報,2005(6):851-853.
[2]竇慧麗,劉好德,楊曉光.基于站點上下客人數的公交客流OD反推方法研究[J].交通與計算機,2007(2):79-82.
[3]劉穎杰,靳文舟,康凱.基于IC信息和概率理論的公交OD反推方法[J].公路與汽運,2010(3):31-33.
[4]師富民.基于IC卡數據的公交OD矩陣構造方法研究[D]. 吉林大學,2004.
[5]鄧紅星,趙志恒,王瑋琦.基于公交IC卡和GPS數據的公交OD量推算研究[J].重慶理工大學學報(自然科學版),2019,33(6):220-226.
[6]李軍,鄧紅平.基于公交IC卡數據的乘客出行分類研究[J].重慶交通大學學報(自然科學版),2016,35(6):109-114.
[7]周雪梅,楊熙宇,吳曉飛.基于IC卡信息的公交客流起止點反推方法[J].同濟大學學報(自然科學版),2017,40(7):1027-1030.