葉 倩,張 華,陳小鴻
(1.同濟大學 道路與交通工程教育部重點實驗室,上海 201804;2.同濟大學國家磁浮交通工程技術研究中心,上海 201804)
隨著移動互聯網在城市出行服務中的應用發展,乘客通過叫車平臺告知出行起終點和時刻信息后,由司機響應訂單請求的服務模式被廣泛使用。相比傳統的街道巡游運營模式,新的網絡預約出租車服務被認為有望改善打車的便捷程度和服務質量。然而,一段時期以來,關于司機誘導加價、乘客高峰時期或短距離出行等服務需求難以獲得及時響應的現象仍廣泛存在,傳統模式下的打車難、繞路拒載等問題并沒有得到解決[1]。
有觀點認為[2],在獲得乘客出行信息條件下,出租車運營仍然存在挑客現象,實質上是由于司機或平臺利用信息優勢,傾向性地愿意響應或歧視某類乘客出行需求。理論上,司機提供服務的動機是追求利益最大化,即獲得更高收入。在運營實踐中,出租車服務計費結構與距離直接關聯,司機更加愿意響應長距離出行需求;同時,獲得同等收入所需要的時耗也是司機服務決策的重要因素,以更快速度將乘客送達目的地能夠提高司機在單位時間內的收入。因此,司機選擇優先服務那些道路交通狀況較佳的載客位置或出發時刻的服務需求非常有可能。
出租車服務歧視(taxi discrimination)問題[3]可以追溯到20世紀末,關注焦點集中于種族和性別歧視、價格歧視、目的地或地區歧視等。近來一些研究從司機群體細分的角度探究了其服務供給行為的特殊性,得到出租車司機行為模式和收入水平呈現顯著相關的結論。例如,Liu等[4]表明高收入司機更加關注訂單時耗,在載客和空駛狀態下均比一般收入司機行駛速度快,以期最高效地利用運營時間;Naji等[5]發現該群體傾向于挑選經濟活動更活躍的時間和地點進行巡游和停靠;Zhang等[6]驗證了高收入司機在尋客時存在拒載行為,且他們的上下客位置多樣性偏低,以保證高效的運營服務。
目前大多數針對司機行為傾向性的研究都僅考慮司機主觀經驗帶來的服務優勢,本文以網絡預約的出租車服務模式為對象,分析信息機制條件的變化對司機服務供給行為的復雜和動態的影響。基于司機不同信息獲知程度下的運營數據,驗證出租車司機的服務供給行為是否存在時間-空間分布的差異性,再通過訂單距離解析司機行為,分析其在出發時刻、載客地點的選擇傾向性。研究可為面向服務公平的移動出行市場的信息管制設計及市場評估提供參考。
本研究涉及三類數據。第一類是由出租車公司提供的上海市2015年1周的出租車運營數據,主要是由司機巡游載客完成,含占比約30%的網絡預約訂單。數據采集間隔10~20 s,包括車輛編號、司機編號、軌跡點的經緯度坐標、載客狀態、瞬時速度和時刻等信息。第二類是網約車平臺提供的上海市2016年1周的出租車訂單數據和對應軌跡數據,全部是由司機借助叫車平臺完成。軌跡每間隔6 s采集,訂單數據包括訂單編號、車輛編號、司機編號、訂單起訖點經緯度坐標、訂單開始和結束時刻等信息,軌跡數據包括訂單編號、時刻、經緯度坐標、瞬時速度等信息。為便于分析,按照傳統巡游和網絡預約運營模式下司機獲知乘客出行信息的差異,將兩類數據分別稱為“30%司機獲知信息-巡游平臺混合”訂單和“100%司機獲知信息-僅平臺機制”訂單。第三類是上海路網和513個分析小區的地理信息,其中,以上海市內環線、外環線作為中心區、中心城和市域的邊界[7]。
研究的空間范圍是上海市域大陸部分(不包括崇明區)。數據清洗遵循以下6個步驟[7]:①刪除信息不完整或錯誤的數據;②刪除較少軌跡點、出行時間過短的訂單;③刪除相鄰軌跡點間隔過大(間隔長于60 s)的訂單;④刪除行程距離或行程時間過短的訂單(行程時間短于2 min或行駛距離小于200 m);⑤刪除起訖點相同的訂單;⑥刪除繞行較大的訂單(行程距離3 km以下且非直線系數大于2.5或者行程距離超過3 km且非直線系數大于2)。由于數據的軌跡點采集間隔較短,計算訂單行程距離是對軌跡序列中前后兩個軌跡點的平面坐標求歐式距離并累加得到,如下式:

式中:Dnx為數據集x中第n個訂單的行程距離,每個訂單軌跡序列包含M個軌跡點 ;(Xnx,i,Ynx,i)和(Xnx,i+1,Ynx,i+1)分別為相鄰兩個軌跡點i和i+1的平面坐標。
文章分析遵循以下假設:相鄰年份的城市空間結構和居民出行特征(例如,出租車市場)未發生顯著變化;且出租車服務均是由具備相似駕車技能、城市街道熟悉程度的司機群體完成。因此,認為“30%司機獲知信息-巡游平臺混合”和“100%司機獲知信息-僅平臺機制”兩類訂單所體現的差異主要是由于信息機制非司機服務供給行為帶來的影響所致。
首先,對兩類訂單數據進行描述性統計分析,選取打車供需矛盾更突出、出行需求更剛性的工作日,分析出租車服務供給基本特征,包括響應時刻、行程距離、行程速度和區域分布等;使用K-S非參數檢驗(Kolmogorov-Smirnov test)測試不同信息獲知程度下出租車訂單距離的分布差異,基于累計概率分布曲線將訂單劃分為長距離組和短距離組。
其次,借助ArcGIS軟件的空間統計(spatial statistics)和空間分析(spatial analyst)工具描述出租車訂單在空間的分布特征。前者是基于矢量數據進行推斷統計的,本文使用方向分布(標準差橢圓)工具分析訂單空間分布的方向性和服務范圍,使用空間自相關工具驗證訂單距離的空間模式是否具有統計學顯著性意義的聚集、離散或隨機模式。后者用于分析和研究柵格數據,本文使用核密度分析對細分距離的訂單進行像元量值計算并擬合為光滑錐狀表面,結合柵格計算器和重分類模塊對核密度柵格圖層進行地圖代數運算,得到不同信息獲知程度下服務密度增減的空間面積和幅度數值。
信息差異下的工作日出租車訂單響應時刻分布如圖1所示。傳統巡游模式為主時,訂單在早上8:00時之后分布較均衡。而在平臺機制下,單位小時司機完成的訂單具有明顯的單峰,7:00~10:00時段完成的訂單比例明顯多于全日其他時段,在7:00~8:00達到全日峰值;13:00~16:00時段的訂單波動較大且比例較低。由此可知,在完全獲知乘客出行信息的情況下,司機在出行早高峰時段響應了更多需求,而在凌晨時段接單降低。

圖1 訂單量時變曲線Fig.1 Percentage of taxi orders satisfied per hour on weekdays
圖2是按小時計算的平均行程距離和增幅曲線。整體而言,部分信息獲知和完全信息情形下的訂單距離在全天呈單峰和雙峰趨勢,前者在4:00~6:00達到峰值,后者峰值出現在4:00~6:00和20:00~22:00。
司機由巡游-平臺混合機制向僅平臺機制轉變時,所完成訂單的平均距離從8.0km增長到10.2km,均高于同年份上海市巡游出租車的平均乘距(7.28km和7.55km)[8]。按小時增幅來看,全日各時段數值均大于0,表明司機在完全獲取信息情形下各時段內服務訂單的行程距離均比巡游模式為主的訂單距離長。其中,白天8:00~16:00時段(除11:00~12:00)和晚上18:00~22:00時段增幅最大(最大增幅3~4km);全日訂單距離峰值4:00~6:00和16:00~18:00距離增幅最小。

圖2 行程距離和增幅曲線Fig.2 Average distance and growth rate on weekdays
進一步對訂單距離進行分組統計,見圖3。整體上呈現中部低兩端高的趨勢,其中,巡游模式為主時,超過80%的訂單距離在12km以下,大于15km占12.8%;而司機在平臺機制下完成的訂單主要集中在9km內和15km以上(占比達到80%)。平臺機制過渡后,3~6km的訂單比例下降明顯,距離大于12km的訂單比例明顯增加。

圖3 行程距離分組占比Fig.3 Taxi order percentage grouped by distance
行程速度是每筆訂單的行程距離和時長的比值。圖4是按小時統計的訂單平均行程速度隨時刻的波動曲線。信息差異下,全日出租車速度呈現基本同步的波動趨勢,最快訂單速度出現在凌晨4:00~6:00,達到35~45 km·h-1;早、晚高峰(7:00~9:00和16:00~18:00)的訂單平均速度最低,其中晚高峰僅為20.0~22.2 km·h-1。對比發現,除去自由流交通條件的凌晨,其余各時段由網約車平臺生成的訂單的行程速度均明顯高于巡游模式為主的速度值,增幅達到4~7 km·h-1;且早、晚高峰的訂單速度明顯得到提高,其中,早高峰達到25.9~29.7 km·h-1。

圖4 平均行程速度時變曲線Fig.4 Average speed on weekdays
由城市交通網絡數據可知,連續兩年的道路交通運行狀況和工作日擁堵區域差異不大[8]。因此,推斷出租車平均行程速度明顯提高的原因,一方面,叫車軟件內置的路徑規劃導航降低了司機尋路、繞路的可能性,然而由于出租車司機長期從事全職運營服務,具備較強的巡游駕駛經驗,不太可能在相鄰兩年間造成如此明顯差異;另一方面,是司機運營服務的行為所致,例如,平臺司機在響應乘客需求時有意避開常發生擁堵或實時擁堵嚴重的路段,從而在交通狀況較好的區域運營,提高訂單效率。這一推斷將在下文中結合訂單空間分布深入分析。這個推斷可以解釋多數公眾反映的叫車平臺內“巡游車難叫”的現象[9]——叫車高峰期,由于網約車信息不對稱,除非出行需求本身非常“優質”(即出行距離長或者起訖點位置的交通狀況良好),否則通過平臺呼叫出租車往往難以得到響應。
運用核密度和方向分布分析,得到信息差異下的訂單熱力圖和標準差橢圓圖,見圖5。核密度分析參數設置為:輸出像元大小500(將研究區域劃分為500m×500m的網格[10]);搜索半徑設置為3 km(取自上海路網圖層長邊和寬邊中較小值的1/30);采取自然間斷點分類,密度分為5個等級(見表1)。方向分布中輸出橢圓大小為1倍標準差。

表1 訂單生成區域熱力圖密度分級Tab.1 Density grade of heatmap of pick-up locations

圖5 訂單生成區域熱力圖和方向分布Fig.5 Kernel density heatmap and direction of pick-up locations
當司機從部分獲知乘客出行信息向完全獲知信息轉變時,出租車服務訂單的空間分布形態由集聚中心城變為散布于市域范圍,高密度等級的面積比例明顯降低(例如,等級1~3的面積由4.54%降至2.41%),而在城市外圍區域和新城新區的出租車服務區域明顯增多。以密度最強的等級1為例,巡游-平臺混合機制下,司機主要服務于虹橋樞紐、陸家嘴商務區、五角場等人口密集的交通樞紐或商務片區;而在叫車平臺中的出租車服務,分布在陸家嘴、人民廣場和南京西路等幾個高密度區域。通常而言,盡管中心區出行需求更多,但城市外圍區域的出行需求往往距離更長,交通狀況更佳,因此對司機也具有較強吸引力。與此同時,方向分布的結果是,1倍標準差橢圓面積由256.0 km2增加到922.5 km2,扁率由0.26降低至0.08。由此可知,在平臺機制下,出租車司機的服務供給在空間上呈范圍增大但方向性降低的特點。
此外,基于城市分區可以進一步比較信息差異下出租車服務供給在區域內和區域間的分布。圖6是基于起訖點的上海中心區、中心城和市域的訂單分布,其中,跨區域訂單平均分配給兩個區域。出租車服務主要發生在城市區域內部,跨區域訂單服務比例約占10%。全部轉為平臺機制后,城市中心區、中心城內部的出租車服務需求響應比例大幅下降,而市域內部服務比例增幅顯著,達到26%。

圖6 區域內和區域間的訂單分布Fig.6 Taxi order percentage grouped by spatial areas
因此可以認為,信息差異下的出租車服務供給在出發時間、行程距離、行程車速、空間范圍和密度指標上均有明顯差異,證實了提前獲知乘客出行信息對出租車司機的服務供給行為的影響。為進一步探究服務訂單差異所反映的司機行為規律和潛在的服務歧視問題,下節將聚焦直接影響司機收入的距離,開展行程距離、出發時刻、載客位置的分析,以發掘平臺機制下司機響應需求時的選擇傾向性。
訂單距離直接關系到司機收入。圖7繪制了司機在不同信息獲知程度下,完成訂單的行程距離頻率分布和累積頻率分布。為分析兩類訂單的距離分布是否具有相似性,進一步利用K-S檢驗。結果顯示P值是9.26×10-243,無限接近0,說明司機在兩類機制下的服務訂單具有顯著的距離分布差異性。

圖7 行程距離頻率直方圖和累積頻率分布曲線Fig.7 Frequency distribution and cumulative frequencies of taxi order distance
為了便于討論,將訂單按距離劃分為不同組別,分組閾值分別取兩條曲線的50%、75%、95%分位值并取二者均值,以此分為短距離組(<6.5km)、中距離組(6.5~12km)和長距離組(12~25km)。結合3.2節中對訂單距離結構分析,可知中距離訂單比例基本保持不變,因此下文僅關注明顯減少和明顯增加的短距離組和長距離組的訂單。部分獲知信息時司機所完成的長、短距離訂單占總體的15.2%和57.6%,完全獲知信息下司機所完成的長、短距離訂單占比是25.1%和43.4%。
按照出發時刻將全天分為上午(6:00~12:00)、下午(12:00~18:00)和晚間(18:00~24:00)3個時段,統計司機在獲取信息差異下的長距離訂單的運營特征,見表2。隨著司機由巡游模式向借助平臺機制響應服務轉變時,長距離訂單的各項運營指標均有所變化。例如,行程距離略有提高,從16.7km增加到16.9km;行駛速度從29.3~37.1 km·h-1大幅提高到32.5~38.9 km·h-1。
為進一步探究長距離訂單特征變化的原因,以20min為時間間隔分別統計其出發時刻(圖8)和行程時間分布(圖9)。出發時刻方面,司機在上午和晚間完成的長距離訂單比例明顯提高,尤其8:00~10:00和 21:00~23:00,單位間隔訂單量占全日2.5%以上;而長距離訂單完成比例的最低值出現在15:00~17:00時。訂單時長方面,上午和下午時段長距離訂單分布曲線近似一致。巡游模式為主時,長距離訂單的行程時間集中于25~50min(占比約75%);當完全處于平臺機制下,約77%的訂單時長為20~45min,略有降低。而在晚間時段,長距離訂單的耗時由25~40min(占比74.8%)提高至2016年的30~50min(占比 80.2%),與3.2節中20:00~22:00訂單行程距離增幅最大的結果一致。

表2 長距離訂單運營特征指標Tab.2 Operation index of long-distance taxi orders

圖8 長距離訂單出發時刻曲線Fig.8 Percentage of departure time of long-distance taxi orders

圖9 長距離訂單行程時間分布曲線Fig.9 Empirical distribution of duration of longdistance taxi orders
總體來說,司機在完全獲知乘客出行信息條件下,響應長距離出行需求時具有出發時刻選擇傾向性,即在8:00~10:00和21:00~23:00(可稱之為出租車服務供給的早、晚高峰時段)完成了更多訂單。盡管各時段的訂單行程距離顯著增加,但司機駕駛速度更快,因而縮短了訂單的平均耗時。可以推斷,訂單距離增加和完成速度更快使得司機在平臺機制下收入更高。
為判斷出租車訂單的生成位置和行程距離在空間是否具備統計學意義的集聚現象,本文采用ArcGIS空間自相關工具。所基于的零假設是,不同行程距離的出租車訂單在研究區域是隨機分布的。參數設置如下:空間關系的概念化選擇反向距離(INVERSE-DISTANCE),距離法選取Manhattan距離,距離閾值設置為500m。輸出結果包括表征空間自相關強弱的Moran I指數、表征標準差倍數的Z得分和P值等。
模型結果是,兩類信息獲知程度下的訂單距離Moran I指數分別為0.11和0.07,說明訂單的行程距離與其生成位置有關;Z得分為165.5和10.3,說明不同距離的訂單在空間呈集聚型分布;P值均為0,證明結果可信。由此可知,無論司機是部分還是完全獲知乘客出行信息,其所完成訂單的行程距離均與空間具有較強的相關性,并且部分獲知信息情形下的空間集聚現象更顯著。
為探究信息差異下不同距離分組的司機服務供給行為的空間相關性,下文針對兩個問題繼續分析:①長、短距離訂單分布的位置是否有差異,服務供給是增加還是減少;②結合出發時刻探究,在司機傾向完成更多長距離訂單的出租車服務供給的早、晚高峰(8:00~10:00和21:00~23:00),是否存在載客地點的轉移,即傾向于選擇“收益更佳”的區域。
4.3.1 長短距離訂單的空間分布
圖10是以上海市分析小區為空間單元統計出租車服務的距離均值,以起點落在小區內為計算規則。司機在部分信息獲知時,訂單距離在研究區域整體上呈圈層化分布,即從城市中心向外依次是中距離、長距離、短距離,行程距離超過25km的訂單分布于臨港新城、浦東機場等小區。相比之下,司機完全獲知乘客出行信息時,服務的長距離訂單的小區間隔散布于整個市域范圍,距離超過25km的小區數量由9個減少為3個。
由此可知,平臺機制下城市出租服務的最大變化是,城市中心區短距離小區集聚的現象基本消失(如楊浦區附近),以長距離訂單為主的小區比例增長至近1/3,該發現與3.2節和3.4節的分析相符合。

圖10 基于分析小區的出租車服務行程距離Fig.10 Taxi order distance within analysis zones
4.3.2 服務高峰時段的訂單密度轉移
運用與3.4節相同規則的核密度方法,以距離分組和出發時刻(僅關注出租車服務供給早晚高峰)作為分析維度,得到出租車服務載客位置熱力圖和描述信息獲知程度轉變后影響的密度變化圖。信息機制變化后,基于出發時刻和距離分組的出租車服務供給的密度分布呈現以下規律:
(1)由圖11可知,出租車服務供給早高峰時段,長距離訂單的載客地點存在空間轉移,高密度載客區域的分布由集聚中心區變為中心城帶狀分布,服務響應密度低的區域從中心城延伸到近郊區。此外,36%的柵格載客密度增加,增幅較大的柵格在空間呈散點和塊狀,主要分布在近郊區和浦東內外環之間;柵格密度降低的區域較為集中,分布在內環內、外環內普陀區、長寧區-虹橋樞紐。
(2)由圖12可知,出租車服務供給晚高峰時段,長距離訂單的載客地點分布變化不大。載客位置密度降低的柵格數量約占75.3%,明顯多于密度增加的柵格。密度提高的柵格在空間呈帶狀分布,主要集中在內環內及徐匯、長寧和浦東新區;虹橋樞紐至內環附近的載客密度降低明顯。值得注意的是,在部分獲知信息時,可觀察到虹橋樞紐是司機提供出行服務的高密度區域;然而,在完全獲知出行信息后,載客密度明顯降低。
(3)由圖13可知,出租車服務供給早高峰時段,短距離訂單的載客位置密度分布發生明顯變化,高載客密度的區域基本消失,中低載客密度的區域呈散點分布于整個市域范圍。載客密度增加和減少的柵格各占一半;除張江附近,中心城內的載客密度均略有降低,城市近、遠郊出現多個載客密度明顯增加的點狀區域。
綜合上述分析可知,出租車司機在不同程度獲知乘客出行信息時,其服務供給行為在出發時刻和載客位置分布均具有明顯差異。具體而言,傳統巡游模式為主時,司機響應出行需求的空間分布與出發時刻、行程距離無明顯關聯;但當全部轉變為借助平臺提供服務后,出租車司機在服務供給早晚高峰對長、短距離出行需求的響應呈現出空間差異化。供給早高峰時段,城市中心區的長、短距離出行需求響應均有所降低,在城市外圍區域和遠郊區則明顯提高;供給晚高峰時段,變化規律剛好相反,司機對中心區的長距離出行需求響應增強。
本文從司機服務供給行為視角切入,量化分析了出租車運營模式前后變化。揭示了信息機制對服務響應的時-空影響,以及移動出行市場供-需匹配的動態博弈過程。研究結果表明:
(1)信息機制差異下,相鄰年份的出租車訂單在響應時刻、行程距離、空間密度和城市區域分布上均可觀測到明顯轉移。因此,本研究證實了網絡預約模式的信息優勢對出租車司機服務供給行為的影響。
(2)信息優勢下,司機對長距離訂單的響應比例增多,且呈現出發時刻和載客位置的選擇傾向性。一方面,出租車服務供給的早、晚高峰時段是8:00~10:00時和21:00~23:00時,這期間司機集中完成了更多的長距離訂單;并且他們的駕駛速度更快,實際上縮短了訂單的平均耗時,使得司機在平臺機制下收入更高。另一方面,司機在服務供給早高峰時段降低了對城市中心區的出行需求響應,而增強了對城市外圍區域和遠郊區的響應;而在服務供給晚高峰時段,對中心區的長距離出行需求響應增強。
研究回答了出行平臺的機制設計是否需要監管規制這一政策議題,為未來制定移動出行市場更加精細化的信息管制措施和市場公平性評估提供了量化支持。