耿雪琳, 許倫輝
(華南理工大學 土木與交通學院,廣東 廣州 510641)
截至2019年,我國網約車用戶規模達4×108人次,行業的市場規模達3 044.1億元,同比增長3.42%[1]。網約車憑借便捷的預約服務和靈活的上門服務正在成為一種快速發展的交通方式,因此研究網約車客流的出行規律對于促進城市交通的規劃和管理具有重要意義。目前,針對網約車的研究主要集中在出行活動[2]、交通網絡[3]及交通出行預測[4]等方面,針對城市建成環境對于網約車客流影響的相關研究較少,而交通出行規律的本質與土地利用等建成環境因素密切相關。
已有相關研究表明,出行客流或者出行方式選擇與周邊建成環境有關。文獻[5]采用分段回歸方法研究土地利用和交通特性對家庭交通出行的影響;文獻[6]研究周邊環境的就業密度、通勤距離及商業活動中心等對地鐵站點日客流產生的影響,并進行相關性分析;文獻[7]通過調查影響出租車需求的主要土地利用因素,發現地鐵可達性與出租車流量之間存在正相關關系。
對建成環境影響因素分析的常見模型有普通最小二乘(ordinary least squares,OLS)模型[8]、空間誤差和空間滯后模型[9]等,這些模型的估計參數不會隨著空間變化,而環境變量的影響會隨著城市形態和時間變化而變化。有研究者通過構建地理加權回歸(geographically weighted regression,GWR)模型來解釋空間異質性[10],但在刻畫地鐵、網約車這些具有時間特性的出行數據時,GWR模型結果無法呈現其時間上的不均勻性[11]。因此,需要建立能夠捕捉時間變化和空間異質性的模型,來量化城市建成環境對網約車客流的影響程度。
本文基于網約車訂單數據和采集的更加精細化表征城市建成環境的數據,構建時空地理加權回歸(geographically and temporally weighted regression,GTWR)模型,來刻畫城市建成環境在時間和空間上對網約車客流的影響,以及建成環境影響因素的時空異質性,并分析網約車客流的時空出行規律,為網約車的運營管理提供理論參考。
研究區選取成都市內一個約65 km2范圍,包含了網約車分布較集中的區域;研究區涉及的行政區有錦江區、青羊區、金牛區和成華區,包含的繁華商業區有天府廣場、春熙街道、寬窄巷子等,還包括成都北站及多條主要公交地鐵線路。
根據2018年12月起實施的《城市居住區規劃設計標準》[12],居民10 min生活圈的距離界定為500 m能滿足基本生活需求,因此將研究區域劃分為289個網格,網格大小為500 m×500 m,每個網格作為網約車出行分析單元,劃分后的研究區域分布如圖1所示(基于自然資源部四川測繪地理信息局標準地圖服務網站審圖號為川S[2021]00056號的標準地圖繪制,底圖邊界無修改)。

圖1 研究區網格劃分
1.2.1 網約車訂單數據描述
網約車訂單數據來自蓋亞數據開放計劃發布的滴滴快車平臺成都訂單司機軌跡數據,包括訂單起止點坐標和起止時間數據。根據收集的某月22個工作日網約車訂單數據,得到工作日平均網約車訂單數據,以此代表日常出行數據。通過對訂單數據的整理和篩選,確定研究區域內網約車的出行客流量,上車客流量在1 d內的時間分布如圖2所示。

圖2 上車客流量在1 d內的時間分布
圖2中,7:00—20:00內每h客流量超過1.0×104人次,屬于客流量比較密集的時間段,因此將該時間段內的網約車客流數據作為研究樣本。
1.2.2 建成環境變量描述
建成環境是指不同于自然環境的各種建筑和城市空間,特別是那些可以通過政策和人類行為改變的建筑和城市空間。本文采用由Cervero提出的“5Ds”要素[13]表征建成環境。建成環境變量描述及指標確定見表1所列。

表1 建成環境變量描述
本文基于網絡爬蟲平臺,運用Python語言編程,從高德開發平臺爬取到興趣點(point of interest,POI)數據,每條記錄包括POI名稱、POI類型及POI的坐標經緯度信息。POI數據是一種能夠表征現實地理實體的地理空間數據,定位精度高,數據量豐富,能夠反映微觀真實的具有精確位置數據的建成環境數據[14]。因此,采用POI數據能夠較準確地表征建成環境的實際情況。
本文共爬取14種POI數據類型,包括購物服務POI、餐飲服務POI、公司企業POI、體育休閑服務POI、住宅區POI、公共設施服務POI、金融保險服務POI、科教文化服務POI、生活服務POI、體育休閑服務POI、醫療保健服務POI、政府機構機關POI、社區及住宿服務POI、交通設施服務POI。交通設施服務POI主要包括公交站點和城市軌道交通站點的位置信息,因此其數量可以用來表征建成環境變量中的到公交設施距離,其余POI數據的數量可以用來表征建成環境變量中的密度。道路網數據來自開放街道地圖(OpenStreetMap,OSM),由此可獲得道路網密度。
Herfindahl-Hirschman指數(Herfindahl-Hirschman Index,HHI)被廣泛用于衡量經濟學中的行業集中度,還可用來反映多樣性[15]。因此,本文采用HHI代表土地利用混合度,即代表該土地的利用性質多樣性。HHI的計算公式為:
(1)
其中:IHHl為網格l的HHI;Xl為網格l中的總POI數量;Xlj為網格l中第j類POI的數量。HHI值越大,說明該區域土地利用混合度越小,若該區域沒有POI數據,則HHI值為1。
空間自相關性檢驗有助于了解空間上某一要素的觀測值與相鄰空間觀測值之間的相似程度。莫蘭指數(Moran’sI)通常用來檢驗變量之間的空間自相關性,本文以莫蘭指數I來衡量研究單元之間客流量分布的空間自相關性[16],其計算公式為:
(2)

當I>0時,說明研究對象之間具有空間自相關性,可以進行時空異質性分析。
本文采用OLS模型、GWR模型和GTWR模型進行實例驗證和擬合效果差異比較。
1) OLS模型。該模型是典型的線性回歸模型,經常用于回歸分析,解釋自變量與因變量之間的某種依存關系,其計算公式為:
(3)
其中:Yi為第i個樣本點的因變量值;Xik(k=1,2,…,r)為第i個樣本點處第k個自變量值;β0為OLS模型的截距;βk為第k個自變量的回歸系數;εi為隨機誤差,服從N(0,δ2),δ為方差。
從OLS模型獲得的回歸參數只能反映研究區域整體的平均水平,無法表現研究區域內周邊建成環境的空間距離及時間變化對于網約車出行的影響。
2) GWR模型。該模型是對傳統線性回歸模型的補充擴展,在回歸參數中加入了表征地理位置的距離權重系數,在局部范圍內對研究區域進行逐一的參數估計,空間位置的不斷變化也會使得模型參數的估計值在不斷回歸中變化,能夠展現結果的空間結構分異,其計算公式為:
(4)
其中:ui、vi分別為第i個樣本點的經、緯度坐標;β0(ui,vi)為第i個樣本點的常數項;βk(ui,vi)為第i個樣本點第k個自變量的回歸系數。
3) GTWR模型。為了能夠同時測量數據在時間和空間上的變化,考慮到網約車客流在不同的研究區域內可能呈現時間上的規律性,GTWR模型將時間數據維度也嵌入回歸參數中,是GWR模型在時間上的擴展,因此GTWR模型能夠發揮時間維度上的優勢。GTWR模型的結構計算公式[17]為:
(5)
其中:(ui,vi,ti)為第i個樣本點的空間和時間維度坐標;β0(ui,vi,ti)為第i個樣本點的常數項;βk(ui,vi,ti)為第i個樣本點第k個自變量的回歸系數。GTWR參數估計的計算公式為:
[XTW(ui,vi,ti)X]-1XTW(ui,vi,ti)Y,
W(ui,vi,ti)=diag[Wi1Wi2…Wis]
(6)
其中:W(ui,vi,ti)為時空權重矩陣,是一個s×s對角矩陣;Wij(1≤j≤s)為時空距離衰減函數。Wij計算公式為:
(7)
(8)
其中:h為時空帶寬,是非負參數,當GTWR模型的赤池信息準則(Akaike information criterion,AIC)最小時,h取到最優值[18];dST為空間時間距離;λ、μ分別為空間和時間距離的比例調整系數。本文使用ArcGIS10.6軟件對模型參數進行估計。
首先對城市建成環境的自變量進行多重共線性分析,再進行空間自相關性檢驗,盡量避免表征建成環境的變量相加夸大建成環境的影響,因此,對方差膨脹因子[19]大于5的變量采用逐步分析法排除,然后進行空間自相關性分析檢驗,最終得到7個能夠納入模型的城市建成環境變量,包括交通設施服務POI、餐飲服務POI、公司企業POI、住宅區POI、購物服務POI、體育休閑服務POI及土地利用混合度。本文采用上述6種POI屬性數據和HHI值作為自變量,每個研究單元區域的上車客流量作為因變量,進行時空異質性分析,其在各個分析單元內的數量分布特征如圖3所示。

圖3 客流量、POI屬性數據及HHI的分布特征
對建立的OLS模型、GWR模型和GTWR模型進行驗證分析,擬合度R2或修正后R2反映模型擬合的優度,校正AIC(AIC corrected,AICc)值綜合反映GTWR模型的復雜度,殘差平方和(residual sum of squares,RSS)反映模型預測精度。
R2越大,AICc值和RSS越小,說明模型檢驗的結果越顯著[20]。
OLS模型、GWR模型和GTWR模型的檢驗結果見表2所列。

表2 OLS模型、GWR模型和GTWR模型的檢驗結果
GTWR模型的擬合度R2比OLS模型提高將近0.22,比GWR模型提高0.13,GTWR模型的AICc值和RSS均比OLS模型、GWR模型小,這說明GTWR模型在時間、空間2個層面能更有效地解釋建成環境屬性對網約車客流的影響,擬合的效果更好。下面對GTWR模型擬合系數的時間和空間特性進行分析。
3.2.1 擬合系數的時間特性
采用自變量(6種POI屬性數據和HHI值)擬合系數的平均值進行分析,各個建成環境因素的平均擬合系數時間分布如圖4所示。由圖4可知,除土地利用混合度外,其余6種變量均能促進網約車的客流出行。其中隨著時間的變化,餐飲、娛樂的客流逐漸增多,餐飲服務POI、體育休閑服務POI的促進作用逐漸增強;住宅區POI的擬合系數在早高峰最大,而后逐漸減弱,原因是住宅區是早上通勤者的出發地;由于網約車的便捷性和靈活性,極大方便了購物消費,16:00—18:00完成購物服務后乘坐網約車的乘客比較多,購物服務POI在此時間段的擬合系數增幅較大;土地利用混合度的擬合系數均為負值,說明土地利用類型的豐富度提高會抑制網約車出行客流,這與文獻[21]的研究結果一致。

圖4 影響因素擬合系數平均值的時間分布
文獻[21]認為土地利用混合度高的區域有足夠的生活設施來滿足日常生活需求,從而降低了出租車出行需求。
3.2.2 擬合系數的空間特性
6種POI屬性數據和HHI值擬合系數平均值空間分布分別如圖5、圖6所示。

圖5 6種POI屬性數據擬合系數平均值的空間分布

圖6 HHI值擬合系數平均值的空間分布
交通設施服務POI的擬合系數由南向東北遞增,說明交通設施服務POI對于網約車客流的影響在郊區,尤其是在二環路以外的東部區域更加顯著,該區域公交站點和地鐵站點相對較少,網約車客流產生總是集中在公交、地鐵站點,說明網約車可能因其便捷性和靈活性,起到接駁換乘和補充公共交通出行的作用。
餐飲服務POI、購物服務POI的擬合系數由東北向西南遞增,原因是西南地區有著名的歷史街區和商業街,有許多的小吃店和購物商場,會吸引大量的網約車客流。
東北地區POI類型比較簡單,土地利用類型相對單一,主要包括住宅用地、工業用地和未開發用地,網約車出行主要圍繞住宅區和公司企業,因此在東北地區住宅區和公司企業的POI擬合系數比較高,與網約車客流相關性較強。
土地利用混合度對于網約車出行始終起抑制作用,但總體上抑制程度比較弱。西南部商業區用地類型復雜,多樣性程度高,HHI值較小,但有更多的購物、餐飲、休閑娛樂等服務,其促進作用大于土地利用混合度的抑制作用,因此相較于其他地區更具備吸引力,獲得了更多的網約車客流。
1) 本文以網約車訂單數據、城市建成環境數據為基礎,構建GTWR模型,探究城市建成環境在時間、空間上對網約車客流的影響;相比于OLS模型和GWR模型,GTWR模型的擬合效果更顯著,其擬合度與前兩者相比分別提高22%、13%;采用GTWR模型可定量分析城市建成環境因素的時空異質性影響,有助于網約車運營公司考慮建成環境因素影響,改進動態行駛匹配算法,優化運營策略,從而提高網約車司機的接單效率。
2) 土地利用混合度的變化對網約車客流出行始終表現出抑制作用,混合度越高,抑制作用越強,但整體抑制出行能力較弱。在土地利用類型豐富的區域,購物服務POI和餐飲服務POI的促進作用更強,從而有更多的網約車客流。因此,在分析城市規劃和交通管理問題時,可以對土地利用結構與性質進行更多的研究。
3) 本文研究結果表明,網約車在一定程度上填補了公共交通出行的不足,可以利用網約車的便捷性和可達性實現與其他公共交通工具有效的銜接,滿足更加方便多元化的出行需求。
關于如何判斷網約車的潛在出行需求,并考慮更多因素分析網約車在時間、空間上的供需平衡關系,需要進一步研究。