鄧紅星,白伊楊
(東北林業大學 交通學院, 哈爾濱 150004)
大力發展公共交通是解決“城市交通擁堵”問題最重要的途徑之一,常規公交目前仍然是我國多數城市公共交通系統的主體。在此背景下,如何提高公交的運行效率和服務水平,需要交通管理者對公交運行狀況和線路存在的問題有整體把握。為此,對常規公交實際軌跡狀況進行研究[1],分析公交運行可靠性、識別線路擁堵高發路段對于決策者評價公交運行效果,解決城市規劃中公交系統存在的問題具有重要參考價值。
識別公交運行狀態離不開公交軌跡數據,利用公交GPS數據進行交通研究已經成為新趨勢[2]。隨著智能交通的應用,配有全球定位系統(GPS)和無線通信模塊的公交車輛能記錄到高精度、易獲取、低成本的軌跡數據。在公交軌跡數據與線路匹配算法選擇方面,Lin等[3]基于公交GPS數據提出了3種車輛與線網匹配的算法,從穩定性、精確度和魯棒性等方面評價3種算法預測公交車到站信息的能力,并選擇出最佳的預測算法。Hsueh等[4]基于GPS數據提出了車輛與路網匹配的STD-Matching算法,計算出道路速度約束及車輛行駛路徑,為交通擁堵識別提供了建模和數據可視化條件。在公交運行指標的選取方面,對于公交行程時間可靠性分析及影響因素研究較多。王玲等[5]基于上海市所有公交線路運行GPS數據,分析影響公交線路行程時間可靠性的顯著因素和影響規律,并構建邏輯回歸模型定量分析影響因素與公交線路可靠性間的關聯。王殿海等[6]基于公交軌跡的地圖匹配算法提取公交區間行程時間,建立行程時間可靠性的計算模型,并根據實測數據定量分析交通條件、道路條件及采樣間隔等因素對公交行程時間可靠性指標的影響。Ehsan等[7]基于公交GPS數據分析公交運行時間在不同時段的分布特征,探究了影響時間變化的因素。在擁堵指標的研究方法選擇方面,包括基于擁堵里程比例、出行時間和綜合評價等方法。WANG等[8]基于GPS數據提出一種擁堵時空關聯性的交互式可視化分析方法,用擁堵蔓延圖可視化了交通擁堵。張俊濤等[9]總結車輛運行的4種通行狀態,提出了一種基于軌跡分段的擁堵檢測的可視化方法,能較好估計城市擁堵狀況。陳鼎等[10]基于軌跡數據采用ST-Matching算法對車輛軌跡和路網數據進行匹配融合,通過概率密度分段函數構建具有自適應調節的擁堵指數模型,并對交通運行狀態進行識別應用。鄔群勇等[11]基于車輛軌跡數據計算出城市道路擁堵指數.提出一種擁堵指數異常判別和基于區域連續性修正方法。
本文中借助Python數理分析庫處理公交軌跡數據完成了地圖匹配,刻畫公交實際運行狀況,進而統計出車輛單程耗時和早晚高峰及平峰時段的車輛到站時間間隔。計算公交單程準時度和單程準時穩定度運行指標值,對公交運行可靠性進行評估,并提出一種基于運行時間增加率的擁堵高發路段識別方法。可為公交運行效果評估工作提供借鑒,為提高公交運行效率、優化線路擁堵高發路段提供參考依據。本文中以哈爾濱84路公交軌跡數據為例,對該線路擁堵的時空特征進行分析。
公交GPS數據(即軌跡數據)記錄了車輛ID、GPS時間、經緯度、速度、上下行方向等關鍵信息,是分析公交運行狀態及識別線路擁堵高發路段的重要數據源。對于該數據集是否適合本研究主題,其采樣時間間隔、坐標轉換、異常數據篩選需格外關注。
步驟1采樣間隔。公交軌跡數據采樣間隔頻率越高,識別運行軌跡越精準。若采樣間隔足夠精細,公交車輛的加減速狀態可清晰描述;若采樣間隔較粗糙,公交車輛的到離站特征行為不能準確刻畫。因此研究公交運行狀態的軌跡數據采樣間隔不宜高于30 s。本數據集的采樣間隔密度概率分布如圖1所示,采樣間隔集中在5 s左右,屬于高頻采樣,連續性較好,極少出現缺失點,可用數據的占比率高,具有較高的精度與可信度,適用于公交運行狀態識別。
圖1 采樣間隔密度概率分布曲線
步驟2坐標轉化。將線路、站點GIS數據和公交GPS數據三者坐標系進行統一,由地理坐標系轉換到投影坐標系,便于實現數據可視化,保證后續地圖匹配的精確度及適配性。
步驟3地圖匹配。公交軌跡數據與線路的匹配是公交運行狀態識別的核心環節。公交車在行駛過程中受到設備設施、衛星信號等干擾因素影響,導致設備記錄的GPS數據和當時公交所處位置準確值存在一定誤差。為了減少軌跡數據的誤差,將公交車輛行駛軌跡與線路GIS信息進行匹配并加以修正,排除異常點。即將公交GPS點和站點匹配到公交線路上,確定出每個GPS點處于公交線路的具體位置,進而判斷出公交運行具體位置。現有的地圖匹配算法多應用在浮動車與路網匹配,類比浮動車和路網匹配思想,本文中的地圖匹配的具體思路如下:
1) 設原始點G=(g1,g2,…gi,…gn)。利用project函數以半徑r檢索每個gi點距離線路l最近位置點(即匹配點),得到每個匹配點與線路起點o的距離D=(d1,d2,…di,…dn),并把距離集合輸出。距離檢索的規則可表示:
(1)
3) 繪制原始點G=(g1,g2,…gi,…gn)和匹配點P=(p1,p2,…,pi,…pn)相差距離值diff=(df1,df2,…,dfi,…dfn)的距離核密度概率分布曲線,如圖2所示。原始點和匹配點距離差值主要集中在500 m以內,故建議設定距離閾值diff<500 m,將距離差超過500 m的視為異常距離,篩選掉遠距離的異常點,使數據更具有可靠性。
圖2 距離核密度概率分布曲線
基于地圖匹配結果,繪制每輛公交車運行軌跡,從運行圖上識別公交到離站信息,進而得出公交的運行指標值。如圖3所示,彩色線條代表84路所有公交車的運行軌跡,縱坐標表示地圖匹配后站點位置,用灰色線標注。在繪制運行圖時,存在某輛車GPS數據長時間缺失引起的軌跡線橫穿了多條線,導致無法識別其運行軌跡的異常情況,應予以排除。對于異常數據,處理思路是如果某輛車長時間未采集到數據,且時間間隔大于30 min,則下次出現時認為是一輛新車,設定時間閾值30 min,從而消除長時間無數據情況的影響。
通過公交運行圖提取公交車的到站和離站信息,識別原理如圖4(a)所示,橫坐標表示時間,縱坐標表示距離。先提取出某輛車的運行軌跡(紅色線條表示)和某一個站點位置(灰色線條表示),運行軌跡和站點的交集即為公交車輛的到、離站時間信息。由于站點存在車輛排隊或其他外界因素干擾,公交停車位置和站點位置會存在一定距離偏差,故在站點前后設置一個50 m或100 m的Buffer緩沖區面,如圖4(b)所示。將運行軌跡線與緩沖區第1個交點視作公交車輛的到站時間,最后一個交點視作離站時間。
圖3 公交車輛運行曲線
圖4 到離站時間識別原理示意圖
由于現實交通情況的復雜性,車輛在某些站點存在停車再啟動現象,此時車輛運行軌跡和緩沖區面有多個交點,短時間內在同一個站點出現車輛多次到離站的異常情況。針對此異常情況的處理思路如圖4(c)所示,通過設置時間閾值確定異常情況的到離站時間間隔,排除短時間多次到離站的情況。一般常規,公交車到站停靠時間在5 min內,故根據經驗值設時間閾值為5 min。若同一站點公交車輛在5 min內識別出多個到離站時間,則將車輛軌跡與緩沖面第一個交點橫坐標值視作該站點真正到站時間,最后一個交點視作離站時間。
根據公交運行圖數據,統計得到每輛公交車的單程耗時(即公交車從起點到終點的耗時時長)、到站時間間隔(同一方向兩輛車到達相同站點的時間間隔)。在統計到站時間間隔時需區分該到站記錄是屬于上行到站還是下行到站,標記此到站記錄是處于早高峰、晚高峰還是平峰時段。基于單程耗時和到站時間間隔數據,量化分析公交行程時間可靠性,通過計算公交單程準時度和單程準時穩定度2個指標評價公交線路行程時間可靠性,為提升公交服務可靠性提供參考依據。
單程準時度[12-13]表示公交車從O點到D點間的平均時間距離與設計的標準單程時間的相對誤差與1的差值。用來衡量公交車單程行駛過程的準時程度,描述一條公交線路一個方向上從出發點到終點行駛時間與設計的標準單程時間的偏差程度,且OWPI值越接近1,表明該方向的準時程度越高。
(2)
式中:OWPI為單程準時度;stdtow為設計的標準單程時間;distow為公交路徑從O到D的平均時間。
單程準時穩定度[12-13]用來描述線路在一個方向上的準時度的變化程度,SOWPI越小則表明準時的變化程度越小。
(3)
(4)
(5)
(6)
abs(Δtij)的本質是行程時間增加率。行程時間增加率指的是單位距離內車輛增加的行程時間。若多輛車通過同一個路段,其行程增加率非常高,說明此路段經常產生延誤,屬于擁堵高發路段。通過分析該指標識別線路上存在的延誤路段。行程時間增加率的計算原理如圖5所示,將圖5(a)公交運行曲線的橫、縱坐標交換位置,則新曲線表示距離-時間的關系,如圖5(b)所示。曲線斜率越平緩,說明路段的行程增加率越低,表示交通暢通;曲線斜率越陡峭,說明路段的行程增加率越高,表示交通擁堵。根據斜率的變化表征交通狀況,對圖5(b)的函數求導,導函數曲線如圖5(c)所示,即公交車輛行程時間增加率分布情況。根據行程時間增加率數值分布識別線路中存在的擁堵高發段。
圖5 行程時間增加率原理圖
選取30 m的間隔長度計算整條線路的擁堵指標值ω,定義為以30 m的固定距離對各個路段im的運行時間增加率絕對數值abs(Δtij)進行權重計算。該值可反映公交線路總體的擁堵情況。ω值越大,說明該線路存在的擁堵高發路段較多。
(7)
式中:m為線路分割個數;L為線路總長度。
采用哈爾濱市2022年3月17日84路公交GPS數據、線路和站點GIS數據進行案例分析。通過Python的數值分析庫Pandas及地理空間分析庫GeoPandas對數據進行統計分析,包括數據預處理、地圖匹配、公交運行狀態刻畫,公交運行指標分析,以及擁堵高發路段的可視化。
根據軌跡數據處理步驟對84路公交GPS數據進行預處理,預處理前后的字段、數據類型、數據行數結果如表1所示。其中,滿足模型計算要求的有效數據占比達到原數據的百分之84.5%。
表1 公交GPS數據預處理前后情況
線路信息:① 首末班時間:05∶30-20∶30;② 線路長度:27 439.279 848 781 93 m;③ 上行方向:仁里街-新三中公交首末站;下行方向:新三中公交首末站-仁里街 ;④ 方向類型:1=上行;0=下行;⑤ 站點數:49個。
地圖匹配前后結果如圖6所示,紅色點代表公交站點,黑色點代表GPS點,匹配后的軌跡點走勢和公交線路走勢方向一致。原始軌跡點如圖6(b)所示,根據圖2設定的距離閾值500 m,篩選掉diff值大于500 m的軌跡點,并進行線路匹配,結果如圖6(a)所示。
圖6 公交軌跡數據與線路匹配前后結果示意圖
84路當天共有40輛公交車輛運營,其中第一輛公交車1 d的運行軌跡見圖7(a),橫坐標代表時間,縱坐標表示站點名稱,可以清晰判斷出車輛任一時刻的所在位置。利用數據集ToDir列信息對所有公交的運行軌跡進行上、下行方向分類,如圖7(b)所示,黑色代表上行方向,藍色代表下行方向。
圖7 公交車的運行軌跡曲線
依據公交運行圖,統計出公交車輛的單程耗時、運行速度、站點的到站時間間隔。單程耗時為公交車從起點站到終點站耗時時長,到站時間間隔為同一方向的2輛車到達相同站點的時間間隔。先區分出每輛公交車的上、下行駛方向,將同一方向每輛車起點和終點的時間信息提取后合并,排序后統計出每趟的出行時間(即單程耗時)。按每h進行分組,標識出該趟運行時間段,繪制上、下行耗時分布的箱型圖如圖8(a)所示,橫坐標表示時間,縱坐標表示單程耗時,84路單程耗時多分布在75~100 min。運行速度箱型圖如圖8(b)所示,上、下行各時段運行速度分布在16~22 km/h,11—12點時間段下行方向速度較低,存在速度低于15 km/h的情況,說明該時段可能存在擁堵。根據哈爾濱綠色出行創建行動方案,早晚高峰期的公交車平均運行速度大于15 km/h,符合規定值。后續可進一步分析此情況產生的原因。
圖8 單程耗時和運行速度箱型圖
對到站時間間隔進行統計,先區分出到站方向,分別計算出在同一站點相鄰車輛的到站時間間隔,并標記該到站記錄屬于早高峰、晚高峰還是平峰時段。根據哈爾濱交通運行特征,早高峰段為6時30分至9時,晚高峰段為16時30分至19時,其余時段為平峰時段。
在運行軌跡和到、離站時間信息的基礎上,按照式(2)和(3)計算當天84路公交運行可靠性指標。總體單程準時度為88.33%,其中上行方向單程準時度為88.06%,下行方向單程準時度為93.85%。總體的單程準時穩定度為61.55%,其中上行單程準時穩定度為55.28%,下行單程準時穩定度為67.28%,上行和下行的行程時間可靠性不同,且上行方向比下行方向準時穩定度波動大。由于3月17日哈爾濱因疫情處于交通管控態,對公交運行的效率產生一定影響,且84路線路站點數目較多,超過30個站點,會降低公交時間可靠性,因此導致線路單程準時度較低。在公交線路規劃時應盡量避免單程站點數過多。后續將進一步分析影響公交可靠性的影響因素。
根據圖5提出的擁堵高發路段識別原理思路,84路的兩兩站點間的交通擁堵指標值變化情況如圖9所示,可以清晰觀測到上、下行站點間行程時間增加率的變化情況。由于站點存在停車特征,運行時間增加率激增。而站站間的運行時間增加率大,說明存在擁堵路段,反之說明道路暢通。
為了更直觀地掌握84路的擁堵常發路段,排除站點和交叉口停車導致的假擁堵現象,用熱力圖將行程時間增加率可視化。如圖10所示,綠色代表暢通,紅色代表擁堵。
圖9 運行時間增加率分布曲線
圖10 84路擁堵可視化熱力圖
圖10(a)表示84路上行方向(仁里街至新三中公交首末站)交通擁堵狀況,圖10(b)表示84路下行方向交通擁堵狀況。從熱力圖可知,84路部分路段存在擁堵路段,且、下行擁堵空間分布不均勻,下一步將分析造成擁堵路段的原因并提出改善方法。如對84路公交線路的擁堵區采取拓寬車道、設置公交專用道或提高公交運行高峰時段的車輛分流效率等緩解擁堵路段交通壓力的方法。后續將結合多天數據深入研究如何降低線路擁堵持續時間、改善公交運行狀態。本文中提出的基于運行時間增加率識別擁堵高發路段的方法可應用在頻繁出現擁堵的路段,分析城市規劃中的問題,輔助城市規劃決策[15]。
借助公交GPS數據分析城市公交運行狀態,分析公交線路可靠性評價指標,提出了基于行程時間增加率識別擁堵高發路段的方法,可作為優化常發性擁堵段的參考依據。針對哈爾濱市2022年3月17日工作日的公交軌跡數據展開試驗論證,分析了單條線路的運行狀態。下一步工作將結合周、月軌跡數據細化研究多條線路,容納時間周期性、空間區域性、政策干預性和突發性等特殊因素對公交運行軌跡進行研判,進一步分析影響公交可靠性的原因,改善和精細計算線路擁堵指標,拓展方法的應用場景范圍,保證城市交通平穩運行。