劉 涵,劉 聰
(蘭州交通大學 交通運輸學院,甘肅 蘭州 730070)
隨著我國城市規模的擴大和機動化進程的加快,城市內部交通需求大幅提高。出租車作為城市公共交通的重要組成部分,在人們日常出行中發揮著重要的作用。由于城市客源時空分布不均衡、出租車間不良競爭等因素,出租車尋客存在一定的難度,導致出租車運營效率低下。目前,我國大多數城市出租車都已配備有 GPS 軌跡記錄裝置,以出租車車載GPS數據為基礎,開展了很多研究。
王鄭委[1]通過Hadoop平臺,可視化并分析了北京市一年的載客熱點區域。程靜[2]等人分析了出租車出行需求的時間分布信息,研究了基于GPS軌跡數據的出行需求在時間方面與空間方面的分布特征;陳玲燕[3]通過計算成都市居民日出行量等多個出行需求指標,研究了不同星期屬性的居民出行高峰時段分布;鄭林江[4]等提出了一種基于網格密度的Gscan聚類算法,并以實例分析了出行熱點區域時空分布及出行分布規律;曹梁[5]基于上海市連續32d記錄無誤的出租車數據,探索了乘客出行規律、城市活躍度、碳排放的計算以及結合GPS數據的碳減排措施;程智源[6]對成都地區出租車軌跡的熱點路徑和區域進行了分析;王明[7]在對傳統基于密度的DBSCAN算法研究的基礎上,考慮了出租車在道路上行駛時的距離因素;陳亞玲[8]結合波爾圖市出租車數據,對該市現存公交路線進行分析和改進,使公交線路更方便乘客出行;王建軍[9]研究了基于出租車軌跡挖掘的尋客路線推薦方法;唐雋玉[10]基于出租車GPS數據,分別研究了出租車供需不平衡時空分布及其影響因素;劉麗[11]為了提高出租車尋客效益,提出了基于尋客效益指標模型的時空分析方法,對高效益客源的時空分布特征進行研究;Yazici M[12]等人利用logic回歸模型對出租車在機場的下客與搜索乘客的決策進行分析;Moreira-Matias L[13]等人提出預測短期出租車空間分布的方法,可以短時間內獲取城市的的出租車與乘客的空間分布特性。
本文以蘭州市出租車上下客事件作為研究對象,基于2021年4月全市出租車車載GPS數據,采用數理統計和核密度分析的方法,從不同角度刻畫出租車的出行特征,探究出租車上下客時空變化規律,為出租車的智能化管理,出租車司機的巡游策略以及運營商提供參考依據。
研究采用蘭州市2021年4月5日至2021年4月11日的出租車GPS軌跡數據作為研究對象,數據文件采用csv格式存儲,每日文件大小約4G,每30 s傳一次數據,以表的形式進行存儲。
受到數據采集設備故障、信號不良或者惡劣天氣的影響,出租車的GPS數據采集會存在異常數據。為了保證數據分析和后續處理的有效性和準確性,有必要對收集到的出租車GPS軌跡數據進行數據預處理。
進行數據質量控制后,采用比較成熟的幾何分析法,將出租車GPS數據進行地圖匹配。依據出租車數據中的STATUS(載客狀態)屬性值對于出租車的OD進行提取,當STATUS的值由0變成1時,表示乘客上車,當STATUS的值由1變成0時,表示乘客下車。同一個出租車的狀態變化為一次乘客乘坐出租車出行的乘客OD。
將全天的時間段分為24個間隔,以每個訂單的開始時間作為基準時間,每個小時進行一次統計,結果如圖1所示。橫坐標“1”對應的是“0∶00~1∶00”內的需求量,依次類推。可以看出:工作日的出租車出行需求時間變化趨勢幾乎一致,且每個時間段的訂單量大小接近,非工作日的變化趨勢和工作日有一些區別,在工作日。0∶00~5∶00的客源量持續減少,在6∶00達到最低值。出租車的出行需求出現了三次高峰,由于早上居民上班上學的需求,居民出行量比較大,出行需求量在6∶00后急劇增加,7∶00~9∶00達到了第一個高峰,即出行早高峰,這部分出行量占到全天出行量的20.23%。在10∶00~14∶00之間出租車需求量較為穩定,在17∶00~19∶00之間,由于下班、放學等原因,需求達到另一個高峰,即出行需求晚高峰。非工作日呈現不同的特征,凌晨訂單量比工作日的訂單多,居民在非工作日夜間出行的活動較多,此時公交地鐵等公共的交通設施已經停運,出租車需求較大。非工作日因為沒有了必須出門的剛性需求,總體出租車需求量較工作日減少,出行高峰也變得相對平穩。

圖1 一周內各時段上下客量分布
將出租車訂單量簡化為工作日和非工作日,以便更加清晰的進行分析工作日和非工作日蘭州市居民出租車出行需求的區別。使用周二到周五各時段的平均值作為工作日各時段的出租車訂單量,如圖2所示。

圖2 工作日與休息日各時段上下客量分布
出租車訂單時長時間分布在0~140 min之間,大部分訂單載客時間10~20 min之間。展現每個時間段的出租車載客時長,繪制工作日和非工作日的分時段載客時長,如圖3所示。

圖3 出租車載客時長分時段統計
由圖4可以看出,平均載客時長在工作日和非工作日呈現不同的特征。工作日不同時段的平均載客時長的變化幅度較大,高峰分布比較明顯,在7∶00~8∶00達到第一個高峰,中間較為平穩,在17∶00~18∶00達到了另一個高峰。非工作日平均載客時長的高峰和非工作日不同,在早上六點之后開始下降,7∶00到8∶00的平均載客時長呈現低谷,八點后隨著時間增加逐漸增加,晚上七點后呈現下降的趨勢。為了更清晰的描述載客時長分布,對于單次載客時長的比例做統計分析,如圖4所示。

圖4 出租車載客時間分布
由圖4可得,從時間分布來看,5~10 min的出行占26%左右,在出行時間中占據最大比例,30 min以內訂單累計占據90%,隨著載客時長的增加,載客量逐漸減少,載客時長大于60 min的訂單僅占1.49%,符合出租車為居民提供個性化的服務—適合短距離出行。
由圖5可以看出,無論是工作日和非工作日,候客時長特征幾乎一致,在1∶00~2∶00候客時長達到高峰,最高平均候客時長達到67 min左右,這個時間居民幾乎都在休息,出行需求較低,出租車供大于求,在三點后平均候客時長逐漸下降,八點達到了低谷,平均候客時長6~10 min左右,8∶00到晚上24∶00趨于平穩。繪制不同候客時長的比例,深入分析出租車的運營特征,如圖6所示。

圖5 出租車平均候客時長分布

圖6 出租車候客時間分布
蘭州市出租車有50.7%能夠在10~20 min內尋找到乘客,但僅有28.25%的司機能夠在10 min內找到乘客,有16.04%在20 min以上才能尋找到乘客。由以上數據可知,蘭州市出租車的尋客時間較長,出租車司機在尋客方面耗費成本較多,有待進一步的通過策略降低候客時長,提高司機收益。
居民出行需求和城市的區域結構以及功能緊密相關。通常情況下,在一定的時間段內,一定區域內的居民出行目的有著相似性。采用核密度分析方法研究空間分布特征。對于空間區域中的任一點S,其核密度估計值是其鄰域內所有點的核函數對點S的貢獻之和,核密度計算公式如式(1)所示。
(1)

本文選取了蘭州市2021年4月6日和2021年4月11日的出租車軌跡全天數據作為研究對象,分別對工作日和非工作日出租車需求空間分布進行分析。
可知,工作日和非工作日的出租車出行需求在分布上大致相似,但其出行需求量存在著較大差異。
選取出行高峰時間段7∶00~9∶00、12∶00~14∶00及17∶00~19∶00,對不同高峰時間段出行需求進行對比分析,根據上車次數分為9個量級。可以得出,在工作日早高峰、午高峰晚高峰這三個時間段中,出行需求有所差距。出行需求分布規律如下:在早高峰出租車需求量最大,西固區主要集中在陳官營地鐵站和西固村附近,安寧區集中在海關地鐵站和安寧區體育館附近,七里河區和城關區需求熱點集中在西站什字地鐵站和西關站附近,甘肅省公共資源交易局附近的出租車需求也較大。這段時間因為居民上班或者上學的剛性需求,出行量大,出租車需求高。午高峰和晚高峰的出行需求與早高峰的熱點較為類似,但更為分散。
非工作日在早高峰、午高峰、晚高峰著三個時間段中,出行需求和工作日出行高峰較為相似,出行范圍更大,但各個熱點的出租車出行需求量有所減少。西固區的乘客上車點主要集中在陳官營和西固村,安寧區主要集中在安寧科教城,七里河區的乘客上客點是以蘭州西站什字為中心向外延伸,西站什字和蘭州西站是不同高峰都具有的熱點區域,城關區的上客點較多且比較分散,主要集中在蘭州站、五里埔、西關附近。
對不同高峰時間段的2 h出行需求進行對比分析,根據上車次數分為9個量級。
可以看出,工作日以西站什字為中心的熱點區域早高峰出租車目的地最高,這個區域早高峰的出租車需求也較高,出租車司機可以考慮在此范圍內尋找乘客;午高峰安寧區的出租車目的地較其它兩個高峰顯著減少,晚高峰的出租車出行目的地在城關區分散在各個區域行政區劃中,城關區的商業經濟比較發達,出租車出行交通量也較多。
非工作日在安寧區乘客下客點主要分布在居民區、高校和商業街為主的區域,尤其是費家營和金牛街商業廣場的乘客下客點較多,符合居民利用周末娛樂休息的特性;七里河區以西站什字附近的下客點較多;城關區以西關十字、解放門立交橋以及雁灘聚焦了較多出租車下客點;城關區的下客點在數量上較其它三個區多。工作日較工作日增加了一些娛樂區域,如仁壽山、金城公園等。
OD分布主要可以反映人們在不同區域之間的遷移狀態,在一定程度上說明人們出行的情況,本節前兩章主要將出租車的需求地和目的地分別進行研究。在本節,將出租車出行的O和D進行結合,分析蘭州市的各個行政區的客流之間的遷移情況。
蘭州市出租車需求點和目的地主要集中在安寧區、西固區、七里河區和城關區,只有少部分集中在其它區域,根據統計得到主要四個區的出租車需求點占據總數據的99.38%,對于OD矩陣構建僅考慮這些區域的客流遷移量,使用一天的數據構建出行分布,如表1所示。

表1 居民出租車出行OD矩陣表單位:人次
可見,在城關區內出行的居民明顯比其它區域的人數要多。其中,各個區到達西固區的出租車較少,各個區到達城關區的出租車最多,數量最多的是從城關區到達城關區。總體來看,出租車出行的目的地更加傾向于其原本所在的城區內。
本文基于蘭州市的出租車GPS軌跡數據以城市出租車上下客事件為研究對象,使用數理統計和核密度分析的方法對上下客事件進行時間和空間特征分析,得出出租車上下客事件在不同時間段以及工作日和非工作日的不同規律。出租車的上客量在一天中存在著明顯的早晚高峰,工作日和休息日也存在著較大差異。從時間分布來看,5~10 min的出行占26%左右,90%的訂單在30 min以內完成,符合出租車為居民提供個性化的服務-適合短距離出行。蘭州市出租車有28.25%的司機能夠在10 min內找到乘客,司機尋客時間較長。與工作日不同的是,非工作日的早高峰出行需求量最低,午高峰需求量最高。工作日與休息日主要出行目的地位于城市商業中心西站什字以及西關附近、大型醫院、商務中心以及重要交通樞紐處。各個地鐵站附近也有大量的出租車乘坐需求,其它上下客熱點集中在高校附近,在非工作日居民的出行目的地增加了旅游景區,如仁壽山公園、金城公園等。分析蘭州市各個行政區之間的遷移,發現出租車出行的目的地傾向于其原本所在的城區內。研究結論可為蘭州市城市交通管理與優化出租車運營管理策略提供科學依據,也可為蘭州市出租車司機巡游提供一定的參考。
本文研究的是出租車出行的時空分布特征,城市公共交通中還有地鐵、公交車等方式,后續研究可加如更多的數據,更深層次的全面挖掘城市居民出行特征,指導公眾出行,緩解城市交通壓力。