楊萬波,王 昊,葉曉飛,徐闖闖,姜冬雪
(1.深圳市城市交通規劃設計研究中心,廣東 深圳 518021;2.東南大學 城市智能交通江蘇省重點實驗室,江蘇 南京 210096;3.現代城市交通技術江蘇高校協同創新中心,江蘇 南京210096;4.寧波大學 海運學院,浙江 寧波315211)
?
基于GPS和IC卡數據的公交出行OD推算方法
楊萬波1,2,王 昊2,3,葉曉飛4,徐闖闖1,2,姜冬雪2,3
(1.深圳市城市交通規劃設計研究中心,廣東 深圳 518021;2.東南大學 城市智能交通江蘇省重點實驗室,江蘇 南京 210096;3.現代城市交通技術江蘇高校協同創新中心,江蘇 南京210096;4.寧波大學 海運學院,浙江 寧波315211)
主要基于GPS和公交IC卡數據研究推算交通小區公交出行OD的一種方法。將居民公交出行分為閉合型出行鏈和非連續型公交出行鏈,通過數據的挖掘融合技術,結合居民公交出行規律推算交通小區的公交OD矩陣,利用站點吸引強度對無明顯規律的紊亂出行數據進行修正,提出了基于GPS和公交IC卡數據推算公交出行交通小區OD的方法,并以佛山市中心城區為例驗證推算方法的可靠性。研究表明:所得公交出行OD矩陣精度較高。
交通工程;GPS數據;IC卡數據;交通小區OD;數據融合;聚類分析;吸引強度
眾所周知,通過傳統的人工調查法獲取公交出行OD需要耗費大量的人力、物力,實際操作也相對復雜,調查過程受多方面因素的影響,所得數據的精度很難保證。近年來,隨著GPS系統和公交IC卡的應用,為公交出行特性分析、公交出行OD的獲取提供了新的思路。
戴宵,等[1]首先提出基于IC卡進行客流特征分析的思想;徐建閩,等[2]提出了基于GPS和IC卡數據獲取單線公交OD的方法;吳祥國[3]提出獲取公交站點OD的基本方法,通過站點的聚類、累加獲取交通小區的公交OD;尹長勇,等[4]通過推算站點間運行時間,建立匹配約束規則完成站點的匹配。以上研究都是先獲取基于站點的公交OD,然后將站點歸類于小區獲得交通小區間的公交出行OD矩陣。高峰期經常出現站外上下客即站外刷卡的現象,因此需要確定合適的坐標差才能滿足系統數據融合的需求,對于公交站點繁多的大中城市來說,部分刷卡坐標將會匹配到非實際出行站點,如果持卡乘客實際出行站點同匹配到的非實際站點隸屬于同一個交通小區,那么基于交通小區的OD矩陣不受影響;如果實際出行站點與匹配到的非實際出行站點不在同一個交通小區內部,那么本次出行的交通小區OD矩陣會產生誤差。此種誤差的不可控性將影響基于站點OD的精度,進而影響基于交通小區的OD矩陣的準確性。現階段并未提出修正所得公交OD的方法。為了避免上述誤差,筆者跳過基于站點公交OD的確定過程,通過IC卡刷卡的實際坐標位置與交通小區的區域建立歸屬關系,通過MATLAB程序獲取基于交通小區的公交OD,同時提出基于站點吸引強度的公交OD修正方法,提高OD的精度。
數據來源于佛山市GPS和IC卡數據,在數據融合之前,需要對兩個系統的數據進行預處理,獲得所需數據格式。GPS系統包括終端ID、GPS系統時間、接收時間、經緯度、公交車瞬時速度等數據;IC卡系統包括卡號、卡類型、刷卡時間、線路號、車牌號等數據。通過對兩系統數據的預處理,可獲得基礎數據如表1。此外,還需獲得公交車牌號與GPS終端ID間的對應關系,對上述3組數據的融合所預期達到的數據形式如表2。至此,可確定任意一張IC卡的刷卡位置信息(即上車站點的經緯度)。

表1 GPS與IC卡基礎數據字段

表2 GPS與IC卡數據融合后數據
2.1 確定交通小區的邊界坐標
根據規劃區域用地性質、人口規模、行政區劃以及天然屏障將規劃區域劃分成若干個交通小區并依此編號為1,2,…,n,其中交通小區的邊界包括兩種類型:①邊界全部為直線的多邊形;②至少存在一個邊界為曲線的多邊形,如圖1。

圖1 交通小區邊界類型
對于第1類交通小區,只需找到對應的邊界頂點的坐標(即經緯度),即可確定交通小區的區域邊界。需要注意的是在數據記錄的過程中需要完成A-B-C-D-E-A的記錄過程,保證區域的封閉性。數據格式如表3。

表3 交通小區數據格式
注:LO代表經度值,LA代表緯度值
對于第2類交通小區,如圖1,A1D1邊為曲線,因此在確定交通小區區域過程中需要在邊A1D1上多取若干個點保證交通小區邊界的準確性。邊界A1D1上取的點越多區域越準確,記錄坐標仍要保證區域的封閉性,從起點開始,以起點結束,所得數據格式如表3。
2.2 確定刷卡坐標信息
公交IC卡只記錄刷卡時間、卡類型、余額以及車牌號等相關數據,而不能記錄刷卡的站點信息,公交車GPS數據恰好記錄公交車的位置信息。因此可通過車牌號和時間兩個關聯字段將IC卡數據和GPS數據進行融合,獲得公交IC卡刷卡的時間和位置信息,為公交OD的獲取提供基礎數據。
第1步,基于車牌號與GPS終端ID的一一對應關系,在IC卡數據中添加字段GPS終端ID,處理后數據格式如表4。

表4 車牌號與GPS終端ID融合數據
第2步,通過時間字段將表4數據與GPS數據進行融合匹配,獲得IC卡刷卡的坐標信息。實際應用過程中,由于GPS的系統時間與IC卡的系統時間存在誤差,因此需要對GPS數據進行校核。假設兩個系統的時間誤差為ΔT,GPS系統接收時間減去ΔT為新的接收時間。IC卡數據與GPS數據的融合過程需要進行兩次判斷,第1次判斷GPS終端ID是否相同,若相同則進行第2次判斷,即判斷刷卡時間和新的接收時間是否相同,若相同則記錄該條GPS數據的經緯度信息,獲得表2數據。
結合交通小區區域的坐標以及IC卡刷卡時的坐標位置,通過程序判斷乘客刷卡上車的交通小區,并記錄交通小區的編號(即為O點),將小區編號寫入表2形成表5。

表5 公交出行起始小區數據
公交IC卡采用單次上車刷卡的方式,每次刷卡的位置即為公交出行的起點,因此需要根據居民的出行規律確定公交出行下車的位置,完成OD對的獲取。根據居民的出行特征可將居民出行鏈分為閉合型公交出行鏈和非連續型公交出行鏈[5-6];閉合出行鏈第1次公交出行的起始站點即為該天最后1次公交出行的終點,非連續出行鏈的最后1次公交出行的終點不滿足上述規律,存在一定的隨機性,出行終點較難確定[7-8]。
第1步,閉合出行鏈公交OD的獲取。
分別對表5數據按照IC卡號字段和刷卡時間字段進行排序,1天中任一張IC卡的刷卡次數n(n≥1),每一次刷卡記錄都為1次出行的起點,第n+1次出行的位置即為第n次出行的終點[9],根據這個規律可形成OD對nA-(n+1)A(nA表示第n次刷卡的小區編號),完成公交出行的初次OD配對,初次配對如表6。

表6 公交出行初次OD配對
第2步,確定IC卡最后1次刷卡的出行終點(D點),完成基于交通小區的公交出行矩陣的推算。
具體方法如下:選取星期一至星期五共5天工作日公交出行的IC卡數據和GPS數據進行分析,可發現公交IC出行數據分為兩類:工作通勤出行數據和無明顯出行規律的紊亂數據。工作通勤出行數據指的是持卡人工作日出現兩次及兩次以上在相近的時間和空間內出行的記錄,刷卡出行的時間和空間具有相似性。無明顯出行規律數據定義為連續3個以上的工作日刷卡的時間和空間分布均呈現較強的離散性。工作通勤出行為閉合的出行鏈,滿足兩站點模型[10-11],即第n次出行的終點為第(n+1)的起點,第(n+1)次出行的終點為第1次出行的起點;公交IC卡無明顯出行規律的紊亂數據可依據GPS數據記錄的公交車方向字段以及IC卡數據記錄的公交線路字段判斷最后1次公交出行的終點,判斷方法為對比最后1次和倒數第2次公交出行的線路和方向,若刷卡的線路相同且GPS數據顯示的公交車的行駛方向相反,則說明最后1次公交出行終點為倒數第2次出行的起點;其他數據為無法判斷出行終點數據,記錄數據的線路和上車站點,最終通過站點吸引強度模型對所得OD矩陣進行修正。

(1)
(2)
(3)
式中:pkj(Xi)表示第j天第k次刷卡的坐標;Δm表示第(j+1)天與第j天第k次刷卡坐標差的絕對值,m=1,2,…,k;Δavg為Δm的平均值;p表示概率;tkj(Xi)表示第j天第k次刷卡的時間; Δtm表示第(j+1)天與第j天第k次刷卡時間之差的絕對值,m=1,2,…,k;Δtavg為Δtm的平均值。

第2次聚類的原則為:
(4)
式中:l(n)表示第n次出行所乘坐公交車的線路號;d(n)表示第n次出行的方向。
對于C21數據,任意一張公交IC卡的最后兩次刷卡的位置互為起訖點。
經過上述兩次聚類之后,可完成GPS數據與公交IC卡數據推算公交出行OD的過程。
第3步,對所得公交OD進行擴樣,所得矩陣稱為初始OD矩陣。居民是否持有IC卡是隨機的,因此樣本可根據持卡乘客的比例進行擴樣。公交運營總收入STOTAL,公交刷卡收費總額為SIC,公交刷卡優惠為α。可推算出持卡出行乘客占總出行量的比例。
(5)
2.3 公交OD矩陣修正方法
筆者提出基于公交站點吸引強度對所得公交OD進行修正,主要針對聚類后紊亂數據中的非可用數據。研究表明公交站點吸引強度與發生強度基本平衡,因此可用站點的發生強度等價替換站點的吸引強度。根據IC卡刷卡上車的站點,可統計得任一條線路各個站點的上車人數,由此計算站點的吸引強度為:
(6)
式中:Si表示線路第i站上車人數。
乘客下車的概率Pij與公交平均公交出行的站數和站點的吸引強度Pi有關,居民公交出行的乘站數主要集中在一定的范圍內,統計經驗表明,在固定的行駛方向上,公交乘站數近似符合泊松分布[6]:
(7)
式中:Zij表示乘客第i站上車第j站下車的概率;λ表示公交出行的平均乘站數,當i站以后的站點數目<λ時,λ=(n-λ),n為單線公交站點總數。
由此可以構造出站點i上車站點j下車的概率為:
(8)
至此,可得任意i站上車j站下車的乘客總數:
Mij=Si×Pij
(9)
上述修正方法對非可用紊亂數據處理后可得到1個Mij(m×m)公交OD矩陣,m表示公交站點總數,將此公交OD修正矩陣轉化為小區級公交OD矩陣補充到初始OD矩陣即完成公交出行矩陣的修正過程。
筆者以佛山市中心城區為例,中心城區小區劃分共77個,合并大區8個,根據上述推算方法利用MATLAB得出表7數據,表8為抽樣居民出行調查所得數據,表9數據顯示每一個OD對算法結果與實地調查結果間的誤差;對比兩表數據可知49組OD對間平均誤差為2.35%,方差為1.82×10-4,誤差波動幅度很小,具有較好的數據參考價值。

表7 算法所得OD

表8 居民出行調查OD

表9 OD誤差分析
基于GPS數據和公交IC卡數據,通過數據融合以及數據聚類算法,獲得基于交通小區的工作通勤OD,并通過公交站點吸引強度對公交OD矩陣進行修正,保障了數據的精度,彌補了現有公交IC數據記錄的不足。以佛山市公交IC卡和GPS數據為例對推算方法進行驗證,所得公交OD矩陣平均誤差為2.35%,誤差波動性較小,數據可滿足城市交通管理與規劃的精度要求,具有較好的實用價值,可為城市公共交通的管理、規劃以及線網的優化提供數據參考。
[1] 戴宵,陳學武.單條公交線路的IC卡數據分析處理方法[J].城市交通,2005,3(4):73-76. Dai Xiao,Chen Xuewu.The method of intelligent gard data analysis for one public transportation route[J].Urban Transport of China,2005,3(4):73-76.
[2] 徐建閔,熊文華,游峰.基于GPS和IC卡的單線公交OD生成方法[J].微計算機信息,2008,24(22):221-222. Xu Jianmin,Xiong Wenhua,You Feng.The method of singal-line public transportation OD base on GPS and intelligent card[J].Microcomputer Information,2008,24(22):221-222.
[3] 吳祥國.基于公交IC卡和GPS數據的居民公交出行OD舉證推導與應用[D].濟南:山東大學,2008. Wu Xiangguo.Urban Public Transportation Trip OD Matrix Inference and Application based on Bus IC Card Data and GPS Data[D].Jinan:Shandong University,2008.
[4] 尹長勇,陳艷艷,陳紹輝.基于聚類分析方法的公交站點客流匹配方法研究[J].交通信息與安全,2010,28(3):21-24. Yin Changyong,Chen Yanyan,Chen Shaohui.Bus station passenger matching method based on cluster analysis method[J].Journal of Transport Information and Safety,2010,28(3):21-24.
[5] 周銳.基于IC卡數據的公交站點客流推算方法[D].北京:北京交通大學,2012. Zhou Rui.Passenger Flow Calculation for Bus Stations Based on IC Card Data [D].Beijing:Beijing Jiaotong University,2012.
[6] 竇慧麗,劉好德,楊曉光.基于站點上下客人數的公交客流OD反推方法研究[J].交通與計算機,2007,25(2):79-82. Dou Huili,Liu Haode,Yang Xiaoguang.OD matrix estimation method of public transportation flow based on passenger boarding and alighting [J].Computer and Communications,2007,25(2):79-82.
[7] 戴維.基于IC卡數據和公交車GPS信息的公交OD矩陣推算[D] .武漢:華中科技大學,2009. Dai Wei.Transit OD Matrix Reckoning Based on IC Card Data and Bus GPS Information[D].Wuhan:Huazhong University of Science & Technology,2009.
[8] 師富民.基于IC卡數據的公交OD矩陣構造方法研究[D].長春:吉林大學,2004. Shi Fumin.The Research of the Method of Generating the Public Transport Travel OD Matrix Based on the Data of IC card[D].Changchun:Jilin University,2004.
[9] 舒國輝.基于數據挖掘的公交客流規律研究[D].北京:北京交通大學,2009. Shu Guohui.The Research on the Rules of Public Transport Passenger Flow Based on Data Mining[D].Beijing:Beijing Jiaotong University,2009.
[10] 吳子嘯,任西鋒,胡靜宇.基于GPS數據和IC卡數據的綜合交通建模新思路[J].城市交通,2011(1):47-51. Wu Zixiao.Ren Xifeng,Hu Jingyu.Comprehensive transportation modeling with information from GPS and IC card on public transit vehicles [J].Urban Transport of China,2011(1):47-51.
[11] 周濤,翟長旭,高志剛.基于公交IC卡數據的OD推算技術研究[J].城市交通,2007(3):48-52. Zhou Tao,Zhai Changxu,Gao Zhigang.Approaching bus OD matrices based on data reduced from bus IC cards [J].Urban Transport of China,2007(3):48-52.
[12] 于勇,鄧天民,肖裕民.一種新的公交乘客上車站點確定方法[J].重慶交通大學學報:自然科學版,2009,28 (1):121-125. Yu Yong,Deng Tianmin,Xiao Yumin.A novel method of confirming the boarding station of bus holders[J].Journal of Chongqing Jiaotong University:Natural Science,2009,28(1):121-125.
OD Matrix Inference for Urban Public Transportation Trip Based on GPS and IC Card Data
Yang Wanbo1,2,Wang Hao2,3, Ye Xiaofei4, Xu Chuangchuang1,2, Jiang Dongxue2,3
(1.Shenzhen Urban Transport Planning Center,Shenzhen 518021,Guangdong, China; 2. Jiangsu Key Laboratory of Urban ITS, Southeast University, Nanjing 211189, Jiangsu, China; 3. Jiangsu Province Collaborative Innovation Center of Modern Urban Traffic Technologies, Nanjing 200096,Jiangsu, China;4. Faculty of Maritime and Transportation, Ningbo University, Ningbo 315211, Zhejiang, China)
A method for estimation public transportation traffic zone OD was developed based on GPS data and IC card data. Public transportation will be divided into a closed-trip chain and a non-continuous trip chain. On this basis, the estimation of public transportation traffic OD can be calculated by integrating data mining technology and community residential transit trip rules. The appeal strength of bus stop was used to revise the disorder trip data. A method was proposed to calculate public transportation traffic zone OD based on GPS data and IC card data,and the data of Foshan center city was cited as an example to verify the reliability of this calculation method. On the whole, this method has realized the estimation of high precision trip OD matrix and it can be applied to urban transportation planning and management.
traffic engineering; GPS data; IC card data; traffic zone OD; data mining technology; cluster analysis; appeal strength
10.3969/j.issn.1674-0696.2015.03.24
2013-12-21;
2014-03-02
國家863計劃項目(2012AA112304)
楊萬波(1989—),男,安徽泗縣人,碩士,主要從事交通流理論、公交規劃方面的研究。E-mail:wanboymin@163.com。
U491.1
A
1674-0696(2015)03-117-05