萬 婕,王慶國,郭富成
(武漢科技大學 汽車與交通工程學院,湖北 武漢 430065)
隨著城市空間規模的擴張和職住空間分離的加劇,長距離通勤、交通擁堵等城市問題日益嚴峻。由于公共交通具有集約高效、普惠公平等優點,優先發展公共交通成為緩解交通擁堵、轉變城市交通發展方式的必然要求和戰略選擇。相應地,對公共交通的研究成為熱點。
傳統研究主要從站點布局、公交可達性、公交效益評價、乘客滿意度等方面對公交服務供給進行量化分析,較少涉及公交服務需求的量化及公交服務供需的匹配。公交供給以滿足公交需求為目標,只有供需匹配,才不至造成公交供給的不足或浪費。而公交需求量化研究的缺位,使公交優化失去方向、變得盲目,弱化了公交供給量化研究的實際意義。
現實中,由于人的出行存在波動性,對公交服務的需求是動態變化的,同時,路網實時交通狀態的變化也導致候車時間和公交服務供給的動態波動;另一方面,在微觀的人口活動空間,出行需求位置與公交供給位置之間依靠步行空間銜接,這使得供需識別與匹配需要空間上精細粒度的需求分布挖掘與步行級別的路網構建。因此,公交服務供需量化與匹配應該是微觀動態的。
傳統研究受限于長時間序列活動數據的缺乏,對人們活動的動態感知不夠,空間覆蓋也不全面。因而,傳統的公交服務研究更多的是一種粗粒度和靜態的研究,忽略了公交供需的動態變化,掩蓋了局部供需的不匹配。隨著大數據時代的來臨和數據源的豐富,基于個體行為的大數據具有更精細的時空粒度,使得實時精細觀察大規模的群體活動行為、全面感知人們的活動空間動態,從微觀層面研究活動空間動態演化成為可能。為此,本文以武漢市主城區為研究對象,充分發揮大數據在微觀尺度上精確與海量的優勢,基于高德路徑規劃大數據獲取實時交通狀態下的公交出行信息,騰訊“宜出行”人口位置大數據挖掘不同時段精細粒度的需求分布,進行公交服務供需的動態挖掘與匹配,分析其差異與耦合;重點考慮早晚高峰時段的職住出行需求與城市公交供給,量化城市規模的公交服務供需,引入空間統計指標進行供需動態匹配及匹配程度定量計算,識別公交供需失衡區域。
由于武漢市的通勤需求與公交設施主要集中于《武漢市城市總體規劃(2010-2020 年)》規定的主城區范圍,因此,本文以武漢市主城區為研究范圍,進行公交服務供需水平挖掘與匹配分析??紤]交通出行者步行活動范圍小、習慣就近乘車等特點與數據源精度,在研究范圍內建立500m×500m 網格作為分析的基本單元,將主城區共劃分為3 683 個網格單元,如圖1 所示。

圖1 研究范圍與網格單元劃分
1.2.1 高德路徑規劃數據。本文基于高德地圖路徑規劃API 獲取研究區域內公交出行行程數據。高德地圖路徑規劃API 是一套為開發者提供的步行、公交、駕車查詢及行駛距離計算接口,可以規劃綜合各類交通方式與出行策略的通勤方案,并且返回通勤方案的數據。相較于其他路徑規劃與行程成本計算方法,高德地圖路徑規劃API 路網信息全面,精確至步行路網,保障規劃方案步行可達;模擬真實交通環境與乘車環境,結合精準的實時路況,還原真實交通狀態下的實際行程時間,同時考慮乘車、換乘期間的候車時間與步行時間;規劃方案自定義,提供多種出行方式與路徑規劃策略,自定義避讓區域或道路,指定出發時間。
通過對主城區交通狀況連續一周的觀察與記錄,確定早晚高峰時段范圍;利用Python 程序獲取2020 年6 月29 日至7 月1日連續三個工作日早高峰時段(08:30~09:30)與晚高峰時段(17:30~18:30),主城區3 683 個網格質心兩兩之間的13 564 489條公交出行路徑規劃信息作為公交服務供給挖掘的原始數據。高德路徑規劃示例如圖2 所示。

圖2 高德路徑規劃示例
1.2.2 騰訊“宜出行”位置大數據。本文采用騰訊“宜出行”位置大數據作為公交服務需求挖掘的數據來源。宜出行位置大數據基于騰訊全線互聯網產品的用戶數據,對各區域人口分布以熱力地圖的形式進行實時可視化展示。宜出行數據具有實時性強,能夠實時動態展示不同時段人群的真實位置與聚散規律;覆蓋群體全面,幾乎涵蓋所有智能手機用戶;采集網格密度為25m,數據粒度細、定位精度高;可以實時獲取后臺原始數據等優點。利用Python 程序獲取相應時段的實時人口位置數據,每條數據包含經度、緯度、人口熱力值和爬取時間四個字段,在ArcGIS 中顯示,如圖3 所示。

圖3 宜出行數據
2.1.1 公交服務供給量化分析方法。以不同時段、不同時間出行情景下的公交可達性表示公交服務供給水平,基于高德路徑規劃數據構建可達區,并以可達區域面積計算各網格單元的公交可達性。具體方法為:(1)構建OD 矩陣。將研究區域內的3 683 個網格單元分別作為起點與終點,獲取網格質心坐標作為起訖點坐標,構建OD 矩陣。(2)獲取行程數據。通過高德路徑規劃API 獲取起訖點間的行程數據,提取并記錄公交出行時間成本。(3)建立可達區?;谏弦徊将@取的最短行程時間,建立各網格單元t 時間約束下的可達區域范圍,即以網格單元i 為起點,所有在t 時間內乘公共交通能到達的網格單元構成網格單元i 在t 時間約束下的可達區,這里時間閾值t 取30、60、90min,分別模擬短、中、長時間出行情景。(4)計算公交可達性。統計各網格單元t 時間可達區的面積,作為該網格單元t 時間約束下的公交可達性。
2.1.2 公交服務需求量化分析方法?;隍v訊“宜出行”位置大數據獲取實時人口位置數據,利用時間識別窗口的方法推測職住出行需求發生的位置。根據人口活動習慣,取23:00 至次日6:00 為休息時段,各網格單元休息時段人口值表示居住人口分布,代表早高峰時段以該網格單元為起點的出行需求;取9:00~12:00 和14:00~17:00 為工作時段,各網格單元工作時段人口值表示就業人口分布,代表晚高峰時段以該網格單元為起點的出行需求。
2.2.1 公交服務供給量化結果分析。以30min、60min、90min 時間約束下的公交可達性評價主城區短、中、長時間出行情景下的公交服務供給水平,基于自然斷點法將網格供給水平分為好、較好、中等、較差、差五級,從公交服務供給的空間分布上看(如圖4 所示):主城區中央核心區域供給水平較好,主城區外圍供給水平差,軌道交通沿線網格公交供給水平明顯更好。早晚高峰時段公交供給水平差異不大,從均值與最值上看,晚高峰時段整體公交可達性相對較差。

圖4 早晚高峰時段不同出行時間情景公交服務供給水平
結合公交供給水平直方圖(如圖5 所示),進一步對比不同時間出行情景公交服務供給的分布特征與變化趨勢:短時間出行情景大部分網格公交供給等級為差或較差,早高峰時段38.01%、晚高峰時段37.82%的網格公交供給差,早晚高峰時段僅6.90%、7.28%的網格公交供給好或較好,21.69%、20.96%的網格公交供給在中等及以上,其分布與公交站點密度高的區域高度重合,可達性最好的網格高峰時段可達區可覆蓋主城區的5%~10%(不含水域);中時間出行情景核心區域網格公交供給等級基本為好,早晚高峰時段35.89%、36.03%的網格公交供給高于主城區平均水平,可達性最好的網格高峰時段可達區可覆蓋主城區的50%~60%(不含水域);長時間出行情景大部分網格公交供給水平在中等及以上,早晚高峰時段43.17%、42.38%的網格公交供給好或較好,僅5.67%、6.79%的網格公交供給差,主要為主城區邊緣或水域上的網格,可達性最好的網格高峰時段可達區可覆蓋主城區85%以上的區域(不含水域)。短時間出行情景只有距離公交站點近的網格可達性好,隨著時間約束增大,大部分網格公交供給提升,不再局限于公交站點附近,供給好的網格占比增加、供給差的網格占比下降,可達性在0 值附近的網格明顯減少。

圖5 早晚高峰時段不同出行時間情景公交服務供給直方圖
2.2.2 公交服務需求量化結果分析。從公交服務需求的空間分布上看(如圖6 所示):各時段公交需求主要集中于主城區中央、濱江核心區域,由主城區中央向外圍遞減,主城區外圍公交需求較低。結合出行需求直方圖可以發現(如圖7 所示):晚高峰時段公交服務需求高值突出、數值間差異大,公交服務需求相對集中,各網格單元需求分布差異明顯;早高峰時段公交服務需求相對均勻分散,各網格單元需求分布差異小。

圖6 早晚高峰時段公交服務需求分布

圖7 網格尺度早晚高峰出行需求直方圖
進一步分析主城區各區域的出行需求分布特征,將各網格單元按所在組團分類統計(如圖8 所示)。漢口地區的漢口中央活動區、塔子湖組團出行需求較高,其中,漢口中央活動區出行需求密度在早晚高峰時段均為主城區最高,塔子湖、后湖組團早高峰出行需求占整體比重上升,二七組團晚高峰出行需求較高、早高峰出行需求下降,外圍的黃浦組團出行需求較低。晚高峰時段以江漢路、循禮門為中心聚集了大量出行需求,另有王家墩片區、漢口火車站、萬松街道、漢正街等區域晚高峰時段分布有較高的出行需求,萬松街道早高峰出行需求降低,周邊街道早高峰時段出行需求增加。武昌地區的武昌中央活動區、珞瑜組團、楊園組團出行需求較高,楊園、青山、白沙組團早高峰出行需求占整體比重均不同程度上升,外圍的武鋼組團、東湖風景區出行需求較低。晚高峰時段出行需求大量集中于糧道街、中南路等街道及軌道交通2 號線與4 號線沿線串聯的多個大型商圈附近,這些區域早高峰時段出行需求明顯下降。漢陽地區的漢陽中央活動區出行需求較高,四新組團早高峰出行需求占整體比重上升,十升組團早高峰出行需求比重下降,外圍的沌口組團出行需求較低。晚高峰出行需求主要分布在王家灣片區,早高峰時段出行需求有向商圈外圍移動的趨勢。主城區組團早晚高峰出行需求分布密度如圖8 所示。

圖8 主城區組團早晚高峰出行需求分布密度
雙變量空間自相關性指標能很好地描述兩個變量在空間分布上的相關性,因此,對于公交服務的需求與供給水平,基于雙變量局部莫蘭指數(Bivariate LISA)揭示二者在局域空間的集聚與分異。其計算方法如下式所示:


按照網格公交服務供需與周邊網格平均水平匹配情況,可以將網格單元分為四類(高需求—高供給、高需求—低供給、低需求—高供給、低需求—低供給),從空間分布上看(如圖9 所示):高—高類網格集中在主城區中央核心位置,主要分布在漢口、武昌、漢陽三大中央活動區及珞瑜組團等人口活動密集、公交站點密集的區域,隨著時間閾值提高,高—高類網格的分布也向周邊次級人口活動組團擴散;低—低類網格主要分布在主城區外圍,二七、沌口、武鋼組團外圍及東湖風景區人口活動密度與公交供給水平均較低;低—高類網格主要分布在高—高類網格外圍,因位置靠近中央核心區域而有較好的公交設施條件,然而公交服務需求并不高,應加強對該區域公交設施的利用,引導人口、產業向該區域移動,分擔中央核心區密集的公交需求;高—低類網格主要分布在低—低類網格內側,是主城區外圍公交需求較高的區域,而主城區外圍公交設施條件普遍不好,無法滿足需求,應加強該區域公交設施建設,在公共交通線路向主城區外圍延伸的過程中,首先考慮這些公交需求高的區域。早晚高峰時段供需匹配的差異主要表現在中、短出行時間情景高—低類和低—高類網格的分布上,整體匹配情況相似,這是由于早晚高峰時段需求分布的差異體現在非核心、非外圍組團下的局部街道,出行需求由核心向外圍組團遞減的整體規律是相同的。

圖9 早晚高峰時段不同出行時間情景公交服務供需匹配模式分類
從數量占比上看(如表1 所示):低—低類網格較多,其次是主城區中央的高—高類網格,主要是由于主城區外圍公交供需水平均低的區域面積較大;低—高類網格和高—低類網格較少,即公交供需不匹配的區域占比較少,主城區公交供需匹配情況較好。

表1 四種類型網格數量及占比
進一步識別公交供需不匹配的區域(如圖10 所示),其中:低—高類網格為需要加強需求的區域,該區域有較便利的公共交通條件,公交供給水平高,可以加強生活設施建設、增加就業崗位,吸引人口、增加需求,為中央核心區域分流人口、分擔需求,作為次級生活或產業中心發展;高—低類網格為需要加強供給的區域,是現階段公共交通設施尚未覆蓋或供給不足的盲點區域,應加強配套公交設施建設、滿足出行需求,作為下一步城市交通建設的重點。

圖10 早晚高峰時段公交服務供需不匹配區域識別
本文以武漢市主城區為例,對微觀尺度上的公交服務供需進行動態量化及匹配??紤]供需分布的動態變化,發揮大數據精確與海量的優勢進行微觀尺度挖掘,基于高德地圖路徑規劃數據構建不同時間出行情景下考慮步行活動空間的可達區域范圍,利用騰訊“宜出行”位置大數據挖掘不同時段的人口分布與公交服務需求。引入空間自相關指標對公交服務供需匹配程度進行定量計算與分析評價,并進一步識別公交服務供需不平衡的區域。研究表明:不同時段、不同時間出行情景下從微觀尺度對公交服務供需匹配的評價與不匹配區域的識別,可以發現現有城市職住空間與公交布局下人的職住出行需求與真實獲得的可達機會之間的耦合與分異,識別供需匹配的盲區,為城市規劃與交通設施建設提供可靠的規劃依據與科學建議,從而優化城市布局、緩解交通壓力,進一步提升城市交通運行效率、推進公交公平。
該方法基于細粒度大數據量化公交供需,可以對不同出行情景下城市規模公交供需進行動態匹配與失匹區域識別,適用于不同城市。然而,仍存在一些不足:首先,由于數據獲取限制,本文采取的數據源有限,后續可結合IC 卡刷卡數據、手機信令數據等多源數據,進一步細化時空精度,豐富數據語義信息;其次,考慮職住出行時效性的需求特點,本文以時間成本最低為約束條件構建公交出行方案,后續可進一步細化出行目的,構建多重出行策略下的公交出行方案。另外,考慮人群差異、結合共享單車接駁等也是值得進一步深化研究的方向。