劉勇,鄧曙光
(1.南寧市建筑規劃設計集團,廣西 南寧 530002;2.南寧師范大學 地理科學與規劃學院,廣西 南寧 530001)
近年來,出行大數據分析為更高標準的城市公交線網優化提供了有效手段。2017年,胡永愷的研究表明,基于手機信令的大數據分析能夠建立軌道交通個人出行活動及群體出行特征分析,從而達到應用交通出行大數據對軌道交通乘客組織誘導的目的。2019年,賈曼月的研究顯示,手機信令定位數據結合傳統廣義出行費用的優勢出行距離,可用于中小城市公交線網規劃,節約規劃成本。本文結合既有研究之相關成果,以實際案例為基礎,著眼于公共交通出行特征把控,為城市片區公交線路優化提供決策支持。旨在以南寧市多元大數據為基礎建立居民出行特征及公交出行指標計算系統模型,并以南寧市仙葫西片區為例,探究該系統在城市公交線路優化決策中可起到的重要支持作用。
數據預處理、異常值檢測、識別出行鏈、指標計算及功能區OD五個模塊。模塊的層層遞進形成了居民出行特征精準把控的結果。
1.1.1 數據預處理模塊
該模塊的主要功能是基于數據去重,刪除無效數據及不可靠數據來獲取有效可靠的手機信令數據。該模塊的流程包括:(1)讀取原始數據基礎數據。(2)數據去重,將原始數據中用戶ID與時間記錄相同的數據刪除、合并去重。(3)篩選有效數據,根據數據上傳頻率,篩選數據上傳頻率在[10,90]分位的數據,作為有效數據的基礎。(4)刪除不可靠數據,查找所有單用戶記錄中斷超過60 min以上的用戶出行記錄,標記為不可靠數據進行刪除。
1.1.2 異常值檢測模塊
該模塊是系統的核心模塊,主要功能是針對手機信令數據通信誤差產生的乒乓效應及通信誤差產生的異常離散值進行檢測,并通過異常值修復算法,糾正異常值,獲取高精確度的手機信令數據。該模塊主要步驟為:
步驟1:將用戶數據根據時間分割成連續的數據組成的片段。
步驟2:先對所有數據做以下處理:若出現ABA,且兩個A間隔不超過60 s,將B設為A【category3】。
步驟3:對每個片段進行以下處理:
(1)將所有數據status設為unstable。(2)將連續3個坐標相同的數據定義為stable。(3)若片段中不存在stable的數據,則將片段中所有數據的坐標設為片段中出現次數最多的坐標【category2】。(4)若片段中存在stable的數據,做以下處理:將滿足以下條件的unstable數據設為之前最近的stable數據,若片段起始數據為unstable,則設為之后最近的stable數據【category1】:1)如果AB的網格間距小于等于3(3×250=0.75公里)。2)如果大于3且abs(網格間距)×250/time(s)>20 m/s;
對所有數據做以下處理,將屬于ABA模式的數據,如果[兩個A相隔小于10分鐘的數據]或[兩個A相隔大于等于10 min且小于20 min,并且abs{dis(A-B)≤3}],全部設為A【category3】。
1.1.3 識別出行鏈模塊
該模塊的主要功能為消除異常數據、合并疑似停留點、識別最終停留點、提取單用戶的完整出行鏈,主要步驟為:(1)標記停留時間大于20 min的點為疑似停留點。(2)合并疑似停留點,主要方法為遍歷所有疑似停留點,刪選間距小于5個單位并且出現時間間隔小于30 min的停留點合并為第個停留點。
1.1.4 指標計算模塊
該模塊主要用于計算居民出行特征指標,包括居民出行時間、距離、出行方式、空間等指標。具體流程包括:(1)判斷指標識別用戶職住地;(2)基于1個月數據計算全市用戶的平均出行關鍵指標;(3)以原始移動用戶數據為基礎,根據占比例進行擴樣,得到全市出行數據。
1.1.5 功能區OD識別模塊
根據以上處理,根據出行特征識別南寧市出行空間特征。模型可視化結果如圖1、圖2所示。

圖1 南寧市中心城區常住人口分布圖(每個網格250 m×250 m)

圖2 南寧市居民出行空間分布
出行指標計算模型包括四個模塊,將基于多元大數據得出片區公交出行指標。
1.2.1 功能區OD識別模塊
用于識別功能區OD數據,步驟為:(1)讀取線路文件中線路信息。(2)讀取站點文件中站點信息。(3)讀取軌跡文件中車輛軌跡信息。(4)讀取交易文件中刷卡掃碼信息。
1.2.2 數據處理模塊
該模塊的主要功能是針對上一步驟得出的線路數據、站點數據、軌跡數據、交易數據分別進行數據處理,刪除冗余數據,清除時間錯誤數據,屬性結構化。得到合理可信公共交通數據。
1.2.3 數據融合模塊
該模塊是系統的核心模塊。主要融合線路、站點、軌跡、交易數據,形成完整的單次交易的上下站點信息,步驟為:(1)分離車輛軌跡數據:根據線路編號、運行方向和車輛編號,得到各線路下不同方向各車輛的軌跡點序列,軌跡點按照時間排序。(2)融合線路和站點數據:根據線路編號和方向,生成各線路不同方向的站點序列,序列中的站點值包含站點經緯度坐標。(3)融合交易、軌跡和線路站點數據:以線路編號為key,分別提取此線路編號下的交易數據,根據交易數據時間和車輛編號檢索時間最鄰近的車輛軌跡點,以軌跡點為基準,查找距離軌跡點最近的站點,以此生成交易數據的上車站點信息。
1.2.4 指標計算模塊
該模塊主要用于計算下車站點、站點客流及線路客流等,具體步驟為:(1)計算下車站點:以交易卡號為key,按照日期生成當日的刷卡序列,對序列當中的記錄,如某次交易距離上次交易時間在[5,40]分鐘區間內,則以此次交易的上車站點為基準,查找上次交易線路方向上距離此基準站點最近的站點,作為上一次交易的下車站點,并根據車輛軌跡點記錄,得到上次交易的下車時間。(2)計算站點客流:以線路站點名稱為key,根據補充上下車站點的交易數據,統計各站點以日/小時為單位的上車人次及下車人次,得到各站點客流數據。(3)計算線路客流:以線路名稱為key,根據補充后的交易數據,統計各線路以日/小時/15分鐘為單位的上、下車人次,得到各線路客流數據。
上述基于手機信數據的居民出行特征及公交出行指標模型用于片區公交線網優化決策的支持中,從而精準把握片區職住分布、居民出行特征及片區公交運行現狀,更便捷清晰地優化公交線網。本研究以南寧市仙葫西片區為例,分析居民出行特征、職住特征、公交供需水平特征及公交線網優化建議。
仙葫西片區位于南寧市青秀區那安快速路、鳳嶺南路、仙葫大道、蓉茉大道合圍區域,用地規劃現狀主要以居住為主,已基本建成,有部分民房建筑。仙葫西片區公共交通接駁方式以常規公共交通為主,穿過仙葫西片區的公交線路共有12條,主要布設于仙葫大道上,無始發終到線路,如表1及圖3所示。距離仙葫西片區最近的軌道交通站點為南寧市軌道交通1號線埌東客運站,距離約2 km,位于軌道交通接駁范圍內。

表1 仙葫西片區現狀公交線路分布情況

圖3 南寧市仙葫西片區位置及現狀公交分布
將研究數據分為工作日及非工作日。在工作日,仙葫西片區公交客流總規模為167 393人次/天,其中到達客流為83 724人次/天;離開客流為83 669人次/天,高峰期分布于7:00~8:00、17:00~18:00。非工作日,仙葫西片區客流總規模為181 092人次/天,其中到達客流為90 967人次/天;離開客流為90 124人次/天,無顯著高峰。
到達、離開仙葫西片區的公交客流主要分布于周邊的鳳嶺片、龍崗片、仙葫片等區域。分具體位置來看,民族大道沿線在仙葫西片區到發客流分布上占比最多,達到36%,其次為鳳嶺區域,占比24%。整體來看,仙葫西片區出行空間分布以向西、向南出行為主,如圖4所示。

圖4 工作日仙葫西片區公交客流空間分布
根據仙葫西片區職住分布及現狀公交線網分布,目前片區公交線路主要分布在對外聯系的主要通道,各通道的線路服務可以滿足現狀公交出行需求,但片區內部支路線路覆蓋不足,未覆蓋部分住宅小區及民房。仙葫西片區現狀公交線路分布情況如表2所示。

表2 仙葫西片區現狀公交線路分布情況
2.4.1 需求響應的線網優化
研究發現,仙葫西片區工作日呈顯著的出行高峰,為典型的通勤出行需求集中點,且往來民族大道沿線的客流需求大,因此建議開行沿民族大道方向的早晚高峰線路,同時增加往五象新區總部基地方向的公交快線,以補充總部基地方向快速通勤需求,同時往民族大道方向線路宜設置為8~9 km內,并削減至朝陽中心的長距離線路,達到合理靈活運用公交運力的目的。
2.4.2 軌道接駁建議
仙葫西片區軌道交通接駁線路情況如表3所示。作為城市遠距離公共交通的骨架,軌道交通在公共交通中的地位不可或缺。雖然該片區未直接接入軌道交通,但位于軌道交通1號線的服務范圍,需考慮合理布設軌道交通接駁。建議增設一條接駁微循環線路,以增加埌東客運站的服務覆蓋,并作為缺少公交覆蓋地點的公交服務補充。

表3 仙葫西片區軌道交通接駁線路情況
2.4.3 公交走廊調配建議
仙葫西片區現狀公交線路主要分布在對外聯系的干路上,建議調配仙葫大道公交運力,設短距離接駁公交覆蓋通福路、軍堂路、宏達路等支路;線路服務到麗景花園、鳳嶺天空、路橋花園西側民房等小區,增加天池山區域服務線路。
本次的城市公交線路優化決策支持研究以相關研究為基礎,結合南寧市實際交通特征,建立用于分析城市居民出行特征及公交出行指標的大數據模型,具有范圍廣、精度高的特點,有效節省交通規劃成本。并以南寧市仙葫西片區為例,介紹模型在城市公交線網規劃中的具體應用,可為與南寧規模類似城市的公交線網規劃設計及研究提供參考。同時該模型仍有結合更多數據源以進一步提升精確度的空間,有待進行更多的相關研究。