楊 燕,胥 川
出租車和網約車載客空間特征分析
楊 燕1,胥 川2,3
(1.四川省公路規劃勘察設計研究院有限公司,綜合交通規劃分院,成都 610041;2. 西南交通大學,交通運輸與物流學院,成都 611756;3. 綜合交通大數據應用技術國家工程實驗室,成都 611756)
本研究的目的在于通過挖掘出租車和滴滴的上下客數據, 描述出租車和網約車載客行程的統計特征和空間特征并比較兩者的異同。首先通過對出租車和滴滴的GPS數據進行處理獲取了上下客數據, 然后以OD對為單元分析了出租車和網約車行程的距離、時間和平均速度; 接著分別以出租車、滴滴的上下客點為對象, 通過熱力圖、全局Moran’s檢驗和局部Moran’s檢驗分析了兩種方式的熱點和空間特征。結果表明: 網約車的平均行程距離和平均行程時間都更長, 而出租車的平均速度更快; 滴滴和出租車的大部分熱點位置比較類似, 但滴滴的服務范圍比出租車更廣; 兩類車輛的上下客點都分別存在空間相關性, 但在城市外圍有滴滴活躍而出租車不活躍的交通分析小區存在。
出租車;網約車;載客行程;GPS數據;熱點圖;空間相關性
網約車服務是用戶通過手機應用遠程叫車的新型服務模式,和傳統巡游出租車不同,網約車公司通過接入互聯網的智能手機搜集供需雙方的位置信息,并通過優化匹配算法來尋找最優配對關系,以減少打車用戶的等待時間、縮短服務車輛的空駛時間和尋客距離。開展網約車業務的公司也被稱為交通網絡公司,比如國內的滴滴、神州專車,以及國外的Uber、Lyft等公司。全球多個大城市在經歷了網約車的迅速發展階段后,原屬于出租車占主導的個人出行市場大量被網約車占有[1],比如美國的大城市舊金山[2;3]、紐約[3-5],中國的大城市上海[6]、深圳[7]、成都[8]。
很顯然,交通網絡公司和傳統的出租車公司處于激烈的競爭狀態。網約車的反對者認為網約車的成功是因為它違反了限制出租車的管理法律,包括總量管控、規定價格和安全標準(如出租車公司必須購買商業運輸保險)[2]。但網約車的支持者將其視為提供高質量出行服務(可提供車輛預計到達時間)[9]的低社會負擔(利用已有私家車)的創新;他們認為,基于私家車的廣泛普及和通信技術進步的網約車服務釋放了巨大的交通供給,同時覆蓋了低收入低密度的地區,增加了社會公平性。這樣的爭論還在繼續,且一直困擾著政策制定者。
當上述爭論仍在繼續時,出租車的份額在一些中國的大城市并未持續下降,而是開始趨于穩定[7]。研究兩種車輛相互作用后達到平衡狀態時的行程空間特征,可以理解兩種形式車輛的空間運行范圍和偏好,為政策制定者提供參考依據。
成都是一座超大城市,2017年的人口數為1600萬,2017年7月的機動車擁有量為432萬輛。根據深圳的經驗[7],有理由相信截止2016年11月,網約車對成都出租車市場的沖擊已經過去,網約車和出租車的平衡已經形成。
2012年,滴滴出行在北京成立。2016年第一季度的數據顯示,滴滴有中國最高的網約車市場占有率(88.4%的用戶比例)[10],第二名是Uber China(7.8%)。2016年8月,滴滴合并了Uber China,此后成為了中國網約車市場占支配地位的企業。2016年全年,滴滴平臺注冊用戶達到了4億,同時日均行程量峰值超過2000萬[8]。近期,滴滴出行公開了2016年11月成都部分區域的全樣本OD(origin and destination)數據,這為分析、比較出租車和網約車的行程特征提供了機會。與此同時,我們也收集了成都市的出租車GPS數據(抽樣車輛占比:47.36%)。
本研究通過挖掘出租車和網約車的OD數據來分析兩者載客的空間特征。首先通過對兩者行程參數的統計來對比其行程差異,然后通過熱力圖來分析出租車、網約車的OD點分布規律,最后通過Global Moran’s和Local Moran’s檢驗分析兩者OD點的全局和局部空間相關性。
滴滴公開的數據為快車和私家車數據,不包括順風車和滴滴專車,且公開區域為圖 1四邊形所示。即任意行程軌跡中,如果至少有1個GPS點在這個四邊形內,這個行程記錄則包含在公開數據集中。數據包括訂單編號、OD點的經緯坐標、行程開始和結束的時間。
為了比較傳統出租車和網約車,我們也收集了成都市的出租車數據。2016年,成都市共有11 374輛出租車,其中獲取了5 387輛(47.36%)出租車2016年11月的GPS數據。出租車GPS數據集中包含了車輛識別號、時間、日期、經緯度、載客標記(0-空車,1-載客)等。根據載客標記,每個行程的OD點可以根據如下步驟來確定:首先按照車牌和時間(升序)來排序,然后對于同一輛車,識別出載客標記有變化的相鄰GPS點。如果載客標記從0變為1,則識別為上客點,如果載客標記從1變為0,則識別為下客點。同時再剔除掉不完全的行程數據,于是,對于一次載客行程,最終獲取了上客點、下客點、出行時間、出行距離。
處理數據的過程中也發現了異常的OD數據,如異常的OD距離、出行時間和平均速度。這些異常可能是由GPS故障造成的。例如,由于故障,GPS設備在行程結束時不將載客標記從1變為0,那么提取的OD距離和出行時間將會非常大。同時,日常生活經驗告訴我們,在目的地非常近的情況下,乘客通常不會使用出租車或網約車,而是采用步行。同時,在研究區域內,大部分道路的限速都低于60 km/h。因此,本研究通過設定出行距離、出行時間、平均速度的范圍來過濾異常的OD數據。但判定正常數據和異常數據的準確范圍很難確定,本研究范圍的最終選取參考了指標的分布。最后,異常的行程界定為OD距離不在0.8~25 km之間,或行程時間不在2~90 min,或平均速度不在1~80 km/h之間的OD數據。出租車和網約車中的異常數據(小于3%)都被剔除。
本研究的目的是分析、比較出租車和網約車載客行程的空間差異,為了避免偏差,出租車和網約車的抽樣方式和抽樣比例都應保持一致。首先,出租車數據也采用了和滴滴數據相同的抽樣方式,即OD點中至少有一個點位于研究區域內。然后,出租車的抽樣率為47.36%,滴滴在網約車市場的占有率為84.1%[10]。因此要抽取網約車市場中47.36%的樣本,則需要抽取滴滴56.31%(47.36%/84.1%)的樣本。為了避免時間上的影響,我們在每個小時的數據中等比例抽取56.31%的滴滴數據。同時為了避免交通限行政策(2013年7月,成都開始實行車牌尾號限行政策,每天兩個尾號被限行,普通限行時間為7:30~20:00,重污染限行的時間為6:00~22:00)造成的樣本差異,剔除了周末和假期的數據。最終兩個數據集分別包含了1 732 613次的出租車行程和2 926 549次的滴滴行程。
同時,成都相關地理信息數據也用于本研究,包括路網數據(shape file)和交通分析小區數據(Traffic Analysis Zone,簡稱TAZ)。TAZ數據僅采用了全部或部分在研究區域內的交通分析小區,如圖1所示。

圖1 研究范圍和交通分析小區
滴滴的行程中,平均出行距離為5.887 km,平均出行時間為20.90 min,OD平均速度為17.26 km/h。對于出租車,平均出行距離為4.389 km,平均出行時間為15.64 min,OD平均速度為18.40 km/h。
從結果中可以看出,滴滴行程的平均出行距離和平均出行時間都更長,這可能是由于滴滴的補貼政策導致價格比出租車低,進而遠距離出行者更多的選擇價格更低的滴滴造成的。而在OD平均速度上,出租車更高,這可能是由于出租車駕駛員的豐富經驗使得其在路徑選擇上更優,且駕駛速度更快。圖2為出租車和滴滴的行程特征統計直方圖。

圖2 出租車和滴滴的行程特征統計直方圖
熱力圖、全局Moran’s和局部Moran’s檢驗[11-13]都被用于分析出租車和滴滴行程的空間相關性[14]。熱力圖采用了核密度函數來描繪出滴滴和出租車的OD點空間分布。


傳統的單變量Moran檢驗也可以擴展到雙變量,即度量1個變量在某個位置和另一個變量在鄰近區域的空間滯后[15]。雙變量的Moran’s[16]可以按照如下公式計算:

全局Moran’s值如果為正且接近1,則意味著聚集效應,即相近的觀測值比起隨機分布更加趨向于集中,相反的,如果全局Moran’s值接近-1.0,則意味著相近的觀測值比起隨機分布更加趨向于離散[17]。Moran’s[18]的值為正說明了觀測值的分布是空間聚類的[19],同時,值如果小于0.05則說明了Moran’s值在95%置信區間內顯著[20]。
從熱力圖(見圖3)結果可以看出,滴滴和出租車的大部分熱點都比較類似,比如中央商務區(春熙路-鹽市口商圈)、火車北站、寬窄巷子,以及電子科技大學沙河校區周邊,這從某種程度上說明了兩者的競爭關系。但如果仔細比較熱點圖的細節,仍然能觀測到兩者的差異。例如,出租車在市中心的上客點比滴滴更密集;滴滴的服務范圍比出租車更廣,特別是城外區域。兩者的空間特征進一步采用Moran’s檢驗進行了分析。

圖3 出租車和滴滴上、下客點的熱點圖
本研究使用軟件GeoDa[18]進行了單變量全局Moran’s檢驗來分別度量出租車上客、下客和滴滴上客、下客之間的空間相關性。同時,雙變量全局Moran’s檢驗也用于兩組變量:① 滴滴的上客點和出租車的上客點,② 滴滴的下客點和出租車的下客點。交通分析小區是此方法的分析單元,8個最鄰近的方法為權重計算方法。9999隨機組合(Permutations)被用于計算偽值。表2匯總了全局Moran’s檢驗的結果。結果表明滴滴的上客、下客,出租車的上客、下客都分別存在空間相關性。所有的偽值均小于0.05,確認了Moran’s值在95%顯著水平下顯著。結果同時表明了滴滴的上客和出租車上客的空間滯后有很強的空間相關性。同樣的相關性也存在于滴滴的下客和出租車下客的空間滯后,見表1。
表1 全局Moran’s檢驗結果

Tab.1 Global moran’s I test results
注意:E[I]是的期望值,SD[I]是的標準差。
Local Indicators of Spatial Association(LISA)檢驗被用于尋找局部特征,以及確定熱點和冷點。LISA分區圖是用于解釋高-高聚類、低-低聚類、高-低聚類、低-高聚類的圖形工具。高-高區域是那些自己具有高值且臨近區域也具有高值的區域,低-低區域是那些自己具有低值且臨近區域也具有低值的區域。同樣的,低-高區域是自己具有低值且臨近區域具有高值的區域,高-低區域是自己具有高值且臨近區域具有低值的區域。高-高區域和低-低區域是那些高值或低值區域的-致聚類,而高-低區域和低-高區域通常是空間的非一致區域。關于Moran’s檢驗的更多細節可以參考Xie等人發表的文章[19]。
在研究區域內,出租車的上下客有三個高-高聚類,分別是春熙路-鹽市口商圈(中下側區域),寬窄巷子(底部西側區域)和電子科技大學沙河校區周邊(東部區域)。春熙路是一條有大量商業聚集的步行街,附近有體量巨大的鹽市口商圈,人流量巨大。寬窄巷子是成都市的著名景區,也是成都三大歷史保護區之一,吸引大量游客前往。在電子科技大學附近有不少的商場聚集。滴滴的上客和下客熱點主要集中在春熙路-鹽市口商圈和東北部的大型居住區。在靠近火車站的地方和東邊區域滴滴有高-低聚類,說明滴滴呈現非均勻分布的特征,如圖4所示。

圖4 單變量局部Moran’s I分區圖
LISA的規則也可以用于雙變量的局部空間相關性。圖5表現了滴滴和出租車在中央商務區、寬展巷子、電子科技大學沙河附近都很密集。低-高區域出現在高高區域的旁邊,說明滴滴在這些區域沒有出租車的使用頻率高。這可能是由于出租車更多的出現在這些區域導致的。但是,在北部的城郊(高-低區域),滴滴的使用頻率更高。

圖5 雙變量局部Moran’s I分區圖
本文通過挖掘出租車和滴滴的OD點數據,利用統計方法、熱力圖、全局和局部Moran’s檢驗分析了出租車和網約車的載客空間特征。分析結果表明:網約車的平均行程距離和平均行程時間都更長,而出租車的OD平均速度更快;滴滴和出租車的大部分熱點都比較類似,主要差異在于出租車在市中心的活躍程度比滴滴更高;而滴滴的服務范圍比出租車更廣,特別是覆蓋了出租車沒有覆蓋的城市外圍區域;全局的Moran’s檢驗說明出租車的上客點、下客點,滴滴的上客點、下客點都分別存在空間相關性,同時,出租車的上客點和滴滴的上客點、出租車的下客點和滴滴的下客點也存在空間相關性;LISA檢查識別了成都市的三個熱點,包括春熙路-鹽市口商圈、寬窄巷子和電子科技大學沙河校區周邊,同時也發現在城市外圍,有滴滴活躍而出租車不活躍的TAZ存在。
本研究通過實際數據說明了出租車和網約車行程的分布異同,可以幫助政策制定者認清出租車和網約車的服務范圍、服務特征差異,也可以用于制定出租車和網約車的運價管理規范,為采取分區域的出租車和網約車管理政策提供決策依據。然而由于數據的限制,目前無法獲取行程打車費用的數據、施工區的數據等,導致一些現象(比如滴滴的行程更遠)無法解釋,所以建議下一步獲取更全的出租車和滴滴數據,以及相關的交通數據,用以支撐更精細化的研究。
[1] NGO V D. Transportation network companies and the ridesourcing industry: a review of impacts and emerging regulatory frameworks for Uber[D]. Vancouver: University of British Columbia, 2015.
[2] RAYLE L, DAI D, CHAN N, et al. Just a better taxi? A survey-based comparison of taxis, transit, and ridesourcing services in San Francisco[J]. Transport Policy, 2016, 45: 168-178.
[3] JIANG S, CHEN L, MISLOVE A, et al. On ridesharing competition and accessibility: evidence from uber, Lyft, and Taxi[C]. Proceedings of the 2018 World Wide Web Conference on World Wide Web, 2018: 863-872.
[4] CORREA D, XIE K, OZBAY K. Exploring the taxi and uber demand in New York City: An Empirical Analysis and Spatial Modeling[R]. 2017.
[5] BAO J, LIU P, BLYTHE P, et al. Exploring contributing factors to the usage of ridesourcing and regular taxi services with high-resolution GPS data set[R]. 2018.
[6] QIAN Ye J C, Chen Xiaohong, Zhen Hua. How taxi operation change in the development of E-Hailing APPs: a case study in Shanghai, China[C]. CICTP 2017, 2017.
[7] NIE Y. How can the taxi industry survive the tide of ridesourcing? Evidence from Shenzhen, China[J]. Transportation Research Part C: Emerging Technologies, 2017, 79: 242-256.
[8] RESEARCH D. Big data report on smart trips in Chengdu[R]. Beijing: DiDi Research, CBN Data, 2016.
[9] JIN S T, KONG H, WU R, et al. Ridesourcing, the sharing economy, and the future of cities[J]. Cities, 2018, 76: 96-104.
[10] Net Xinhua. http: //www. xinhuanet. com/tech/2016-03/ 30/c_128846667. htm.
[11] MORAN P a P. Notes on Continuous Stochastic Phenomena[J]. Biometrika, 1950, 37 (1/2): 17-23.
[12] MORAN P A. The interpretation of statistical maps[J]. Journal of the Royal Statistical Society, Series B (Methodological), 1948, 10 (2): 243-251.
[13] LUC A. Local indicators of spatial association—LISA[J]. Geographical Analysis, 1995, 27 (2): 93-115.
[14] MICHAEL T. The saddlepoint approximation of moran's i's and local moran's ii's reference distributions and their numerical evaluation[J]. Geographical Analysis, 2002, 34 (3): 187-206.
[15] ANSELIN L, SYABRI I, SMIRNOV O. Visualizing multivariate spatial correlation with dynamically linked windows[J]. Urbana, 2002, 51: 61801.
[16] GEODa, Global Spatial Autocorrelation (2), Bivariate, Differential and EB Rate Moran Scatter Plot[EB/OL]. https: //geodacenter. github. io/workbook/5b_global_ adv/lab5b. html#bivariate-spatial-correlation-a- word-of- caution.
[17] Spatial Autocorrelation (Morans I) (Spatial Statistics) [EB/OL]. http: //resources. esri. com/help/9. 3/ arcgisengine/java/gp_toolref/spatial_statistics_tools/spatial_autocorrelation_morans_i_spatial_statistics_. htm.
[18] ANSELIN L, SYABRI I, KHO Y. GEODa: an introduction to spatial data analysis[J]. Geographical analysis, 2006, 38 (1): 5-22.
[19] XIE K, OZBAY K, YANG H. Spatial analysis of highway incident durations in the context of Hurricane Sandy[J]. Accident Analysis & Prevention, 2015, 74: 77-86.
[20] GOODCHILD M F. Spatial autocorrelation[M]. Norwich: Geo Abstracts Univ. of East Anglia, 1986.
Analysis the Spatial Characteristic of Taxi and Ridesourcing Service Trips
YANG Yan1,XU Chuan2, 3
(1. Sichuan Highway Planning, Survey, Design and Research Institute Ltd, Department of comprehensive transportation planning, Chengdu 610041, China; 2. School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 611756, China; 3. National Engineering Laboratory of Integrated Transportation Big Data Application Technology, Chengdu 611756, China)
The aim of this paper is to describe and compare the statistic feature and spatial characteristic of regular taxi and ridesourcing service by mining the pickup and drop-off data of both types of services. Firstly, we got the pickup and drop-off data from taxi and Didi GPS data, then the origin and destination for each trip were extracted and the trip distance, travel time, average speed were acquired. Then, for taxi pickup, taxi drop-off, Didi pickup, Didi drop-off, globe Moran’sand local Moran’stests were conducted to uncover their hotspots and spatial characteristics. The results show that ridesourcing vehicles have longer trip distance and travel time, but the average speed of taxi is faster; although taxi and ridesourcing share some hot spots, ridesourcing vehicles are more active at the outer areas of the city where taxis are less available; autocorrelations exist in all types of OD points respectively; meanwhile we found traffic analysis zones which ridesourcing vehicles are more active exist in the outer range of the city.
taxi; ridesourcing; trip; gps data; heatmap; spatial autocorrelation
U491.1
A
10.3969/j.issn.1672-4747.2020.01.009
1672-4747(2020)01-0068-09
2019-01-14
綜合交通大數據應用技術國家工程實驗室開放基金項目(CTBDAT201912)
楊燕(1986—),女,工程師,研究方向:交通規劃,E-mail:570668797@qq.com
胥川(1987—),男,西南交通大學交通運輸與物流學院講師,博士,研究方向:交通安全、數據科學,E-mqil:xuchuan @swjtu.edu.cn
楊燕,胥川. 出租車和網約車載客空間特征分析[J]. 交通運輸工程與信息學報,2020,18(1):68-76.
(責任編輯:劉娉婷)