馬新露 程明遠
(重慶交通大學交通運輸學院,重慶 400074)
居民的出行活動特征與城市空間發展密切相關,探尋居民出行的時空特征、內在的機制,對城市管理與規劃具有重要意義[1]。高鐵樞紐商圈是城市新興的地域屬性,隨著GPS定位技術的不斷發展,居民出行數據的獲取越來越迅速、客觀,各行業各領域積累了大量的出行軌跡數據,這些軌跡數據中蘊含著人類行為的時空分布模式[2]。出租車作為城市居民出行中最方便快捷的公共交通工具,在其運營過程中產生了海量的軌跡數據[3]。現階段對出租車軌跡數據的挖掘主要集中在居民出行特征分析、人群移動規律發展以及社會活動模式挖掘三個方面,其中,居民出行特征分析是人群移動規律發現和社會活動模式挖掘的基礎[4]。出租車出行隨機性強,不受線路約束,乘客涵蓋各個年齡段、各個階層的群體。對于沒有軌道交通的城市空間,出租車換乘概率相對較小,上下車點是居民真實的出發地與目的地。因此,大規模的出租車GPS上下車點(origin-destination,OD)是研究居民活動情況的理想數據源。本文主要利用出租車訂單OD數據,對出租車出行活動的時空特征進行分析,研究出租車在高鐵樞紐商圈區域內的時間和空間的運營特征,并結合高鐵班次數據以及天氣數據,進一步解釋出租車需求量與各個影響因素之間的關系。
研究區域為重慶市沙坪壩站以及三峽廣場構成的高鐵樞紐商圈。數據來源為2020年6~8月重慶市出租車運營的訂單數據,每輛出租車一次完整的載客行為對應一條數據,當乘客下車時將單筆訂單的數據記錄上傳至終端。
出租車訂單數據包含了出租車完成一筆訂單后,設備終端上傳的數據,包含了9個有效字段,每個月的數據大小為2 G左右,共包含全城每個月1 300多萬條數據,主要包含字段:車輛車牌號、乘客上車經緯度、乘客下車經緯度、乘客上下車時間、訂單行駛里程、訂單最終價格。
原始出租車GPS數據中由于GPS設備老化、GPS信號被屏蔽等因素,導致設備不能返回GPS數據或返回的GPS數據有誤。根據數據真實情況,對訂單數據的處理主要由以下步驟組成:(1)刪除經緯度異常,GPS記錄不在區域內數據;(2)根據完整字段的格式將不完整部分補充字段結構不完整數據;(3)刪除一條數據中部分字段為0值或空值的數據;(4)只留下一條有用數據,刪除其余重復數據。
選取2020年6~8月期間出租車訂單數據作為研究數據,其中包括工作日58 d、周末22 d以及節假日3 d。
將三個場景的數據分別求取每小時時間段的平均值,不同場景需求量如圖1所示。

圖1 不同場景需求量
由圖1可知,三場景在不同時間段的需求量皆不同,尤其是節假日需求量更特殊,原因可能是節假日期間居民對于高鐵樞紐站以及商圈的需求在時間上更分散,沒有規律性。綜上所述,三個場景出租車在每個時段的需求量均不同,因此,不同場景對于出租車每小時的需求量均存在差異。
出租車需求量的周期性主要表現在當日出租車小時需求量與前n周(n=1,2,3,...,n)的需求量之間的關系,選取6月18日(周四)為研究日,對應的前一周相同星期屬性(6月11日)和前兩周相同星期屬性(6月4日)的數據為對應,如圖2所示。

圖2 相同星期屬性
出租車的需求量與前一周及前兩周同星期屬性的需求量有較強的關聯性,部分時段相差較大,但變化趨勢相似,因此,前n周的相同屬性的需求量與當日需求量之間的聯系也較強烈。
每天需求量如圖3所示。

圖3 每天需求量
周一~周五的需求量整體變化曲線較為相似,在8:00~10:00時間段內產生區別,但整體走勢類似。周六和周日的出行需求不同,在大部分時間出行需求與周中相似的情況下,同樣在8:00~10:00時間段內需求量相比周中形成了一個波峰的形勢,此現象體現了周末兩天居民購物或高鐵出行,早上階段對出租車的需求均明顯大于周中的現象。
出租車的需求量不僅與時間序列相關,與當時區域所存在的出租車量也有關系,因此,可以使用出入特征表達此性質。出入差(Xgap)是用來表達某一時段研究區域內出租車到達(Xin)與出發(Xout)情況的量值:

式中:Xout——區域內每小時出租車的出發量;Xin——研究區域內每小時出租車的到達量。Xgap越高,表明當前時段內該地區越傾向于出租出行的目的地,越低則更傾向于出發地,接近0表示地區出租車的流入流出情況接近平衡。
路段車速是體現路段擁堵程度的重要指標[5],根據交通工程相關理論,分別按照85%位、50%位、30%位、15%位車速對道路擁堵狀況進行確定[6]。越擁堵的路段出租車的客運量越低,車速可以直觀體現租車的運營狀態。由訂單數據行駛里程字段與出租車上下客時間得到的速度為行程車速,與出租車GPS數據包含的瞬時速度有所區別。區域小時平均行程速度可以宏觀展示整個區域的交通狀態,交通狀態對居民選擇出租車出行具有重要的作用。
通過對研究區域、速度對應擁堵狀況的確定,取2020年6~8月區域內行駛里程小于4 km的速度,即85%位、50%位、30%位、15%位的車速為37、26.0、22.0、18.0 km/h,通過對每小時平均行程速度的區間劃分進行分級。
出租車出行需求代表了乘客對以出租車為代表的小型公共交通的需求,結合上文所述,得到最終與研究區域內出租車需求量相關的時空特征分別為:(1)時間段;(2)前1 h需求量;(3)前2 h需求量;(4)前1 h出入差;(5)前1 h區域交通狀態;(6)場景屬性。
通過數據標準化組成影響因素指標,本文使用XgBoost重要度分析算法對指標的重要程度進行排序,如圖4所示。

圖4 指標重要度排序
居民選擇出租車出行是為了減少工作及生活出行的煩瑣程度,但交通狀況的擁堵對居民選擇出租車出行具有決定性影響,擁堵狀態下幾乎不會選擇乘坐出租車出行,因此,交通狀態是決定出租車需求量的主要因素。其次,區域內出租車的出入量對于出租車需求的影響,區域內出租車出入量可直觀反映區域內出租車的時段保有量,出入量可體現當前區域的出租車狀態,如出租車大量駛入、出租車大量駛出或出入平衡狀態,對出租車需求的影響較大。時間序列對出租車需求量同樣屬于較重要的影響因素,因此,前兩個時間段的需求量在重要度分析中占據重要的地位。出租車需求量隨機性較強,不同于高速公路車輛出行等現象,因此,時段、星期屬性為排列最后兩位的重要因素。
本文主要針對高鐵樞紐商圈進行了時間及空間的特征分析,并使用XgBoost對時空特征指標進行了重要度排序,分析了對高鐵樞紐商圈出租車需求影響因素較靠前的指標,為高鐵樞紐商圈的建設、出租車對高鐵樞紐商圈的選型提供了理論依據。