






摘要 文章將多源數據分析技術融入步行需求預測,設置了步行權重,以南京主城區為研究對象,采集研究范圍內的興趣點(POI)數據、人口規模數據和路網數據,并采用重力模型,以步行權重作為出行發生的吸引量,通過TransCAD對數據、路網、小區三要素進行了步行需求的預測分析,構建了未來步行需求的分配模型。研究結果顯示,南京市主城區步行需求預測的空間分布不均衡,水平差異度大,相關道路設施配置設置不合理,該模型為主城區再規劃建設和設施配置的改善提供了科學量化的模型分析。
關鍵詞 多源數據;步行需求預測;重力模型;量化指標;設施配置
中圖分類號 U293 文獻標識碼 A 文章編號 2096-8949(2025)05-0031-04
0 引言
對于多源數據的融合模型研究已有不少探索和嘗試,王斯琨[1]通過多種途徑完成了多源數據的采集和融合,依據離散數學logit模型的基本原理,利用BIOGEME分析工具構建了縣域城鎮居民活動鏈類型的預測模型,以及居民出行時間—出行方式的聯合預測模型;彭宇紅[2]建立了PSO優化LSSVM的機器學習方法,預測居民的交通出行需求,并提出了公共交通優先發展及資源優化配置的對策和措施;彭輝等[3]構建了基于空間聯系強度的城際出行分布預測模型,提出了城市群多模式空間聯系概念,將空間聯系強度作為參數引入雙約束重力模型,從出行目的比例獲取、出行生成預測、出行分布量計算等三個方面,建立了城市群不同活動模式的出行分布量預測方法;孫曉黎等[4]從空間分析和地理加權回歸模型,探索了西安市城市軌道交通的客流需求預測;關醒權
等[5]結合函數法、福萊特法和馬爾可夫鏈法三種方法模型,采用四階段法對該城區公交客流進行了預測,并運用交通規劃軟件TransCAD得到了各交通小區間的公交發生量、吸引量以及公交出行期望線圖。
由既有研究可知,雖然在多源數據融合、步行需求、預測模型三個模塊方面已有大量的文獻參考的研究,但鮮見這三個模塊的綜合性研究、模型構建及應用。
1 研究范圍
2021年9月,南京市入選了全國首批“一刻鐘便民生活圈”國家級試點城市。所謂“一刻鐘便民生活圈”是指服務半徑在步行15 min左右的范圍內,以社區居民為服務對象,以滿足居民日常生活基本消費和品質消費等為目標,以多業態集聚形成的社區商圈。由此可知,南京市主城區的步行交通模式具有典型的借鑒和參考意義。
該文選取南京主城區作為研究對象,即明城墻、護城河(湖)圍合的范圍。從步行交通的角度出發,南京市主城區核心區域是新街口,城市功能高度集中、人口和建筑密度極大、活動強度分布集中度很高,居民的日常活動半徑主要集中在3~5 km以內。相比于城市副中心和郊區,其生活設施類型更加豐富多樣,其范圍內的潛在步行需求更大。這樣的空間結構、功能配置、活動特征,有利于步行需求交通模式的深化研究。
2 多源數據獲取與處理
2.1 數據來源
2.1.1 POI數據的獲取
南京市主城區POI數據以自編網絡爬蟲從高德地圖API的開放平臺獲取。根據高德地圖開放平臺的POI數據分類,結合我國居民步行出行特點,在《城市用地分類與規劃建設用地標準》(GB 50137—2011)的基礎上,將獲得的POI數據共分為14類,設定采集數據的類別如表1所示。
2.1.2 人口規模數據的獲取
南京市人口規模數據分為公司企業人員數據規模和商務住宅兩類,公司企業人員數據規模以自編網絡爬蟲從“天眼查”網站上獲取,在數據獲取的同時優化了Python代碼,添加了約束條件和指向性代碼,同時完成了數據獲取和數據清洗。同理,商務住宅區住戶數的規模數據以自編爬蟲從“安居客”“鏈家”等房屋中介網站上獲取。
2.1.3 路網數據的獲取
南京市主城區的路網數據來源于Open street map官網和《南京市慢行(步行與自行車)系統規劃》中的慢行路網,將完成坐標轉換的路網加載至ArcGIS軟件中擬合校正。為解決步行模型的精度問題,在現有路網的技術上結合高德地圖數據,對研究范圍內原始路網進行支路與街巷道路的完善、補充和刪改,使路網數據更加完整和準確,如圖1所示。
2.2 數據處理
2.2.1 數據清洗
為了提高數據質量,讓數據更好地適用于項目研究,將獲取的POI數據在Excel中進行初步分類、篩選和排序。例如,對獲取的POI數據進行“缺失值、異常值”的刪除;把“同名異義/異名同義”的數據進行合并;并刪除數據“冗余屬性”。
2.2.2 坐標變換
在進行交通小區步行權重統計分析的過程中,需要將POI數據與路網小區數據進行空間連接,首先需要對坐標進行轉換處理,以解決同一地理實體在不同坐標系下存在的坐標系偏移問題。該文對清洗后的POI的數據和完善后的路網數據進行坐標轉換,統一轉換成國際通用的WGS84坐標,并將完成坐標轉換后的POI數據和路網數據加載至ArcGIS中。
2.2.3 劃分交通小區
考慮研究的步行出行作為出行鏈一部分,依據步行生活圈的范圍界定,其出行距離主要集中在800 m范圍內。因此,交通小區的劃分以周邊道路邊界進行,最大范圍在800 m以內。在ArcGIS軟件中,基于路網、建筑分布、居民日常使用設施的地理位置,結合劃分原則進行交通小區面積的劃分,用于計算交通小區范圍內POI數據的步行權重。
基于劃分到交通小區、并結合坐標轉換的POI數據點,刪除研究范圍外的POI數據點,導出Excel表格,再次進行預處理,即數據清洗操作。
3 預測模型構建與應用
3.1 “四階段法”交通規劃模型
“四階段法”中涉及的交通出行分布模型,主要包括增長系數模型、重力模型、機會模型、熵模型等。該研究采用重力模型展開研究分析。
重力模型是根據未來區域各交通小區之間的廣義成本(小區間的時耗、距離、費用中的一種或幾種),計算區域出行的阻抗矩陣,然后基于阻抗矩陣計算各交通小區之間出行交換概率,再結合未來的出行生成預測結果求解未來出行分布的OD矩陣。重力模型本質是將交通小區之間的交換量看作出行成本的函數。涉及公式如下:
(1)
式中,Pi , Pj——小區i ," j的人口數量;Oi , Dj——小區i ," j的產生交通量與吸引交通量;α , β , γ——模型參數,αβ通常稱為潛能系數,一般取1,而γ為阻抗系數,一般取0.5~3.5;——阻抗函數,當出行阻抗(距離、時間、費用等)增加時函數值降低。
3.2 步行發生吸引權重分析
既有研究表明,不同用地間的步行需求強度首先與自身用地類型相關。根據人口構成分類,一般將城市人口分為常住人口、流動人口以及其他人口三類,其中常住人口是該項目的研究對象。由于模型計算過程中不涉及實際的步行發生吸引量,為反映步行出行需求的強度,現針對不同用地類型的POI數據點設置相應的步行出行權重,其中不同用地類型的POI數據步行出行權重,表征了針對不同出行類型的潛在步行出行需求。根據實際情況,針對常住上班、常住上學和常住彈性分別對14類POI數據類型進行合理的權重分配,并確保各發生權重與吸引權重的之和為1,從而得到三類步行出行的權重,因篇幅原因僅列出常住上班的權重,如表2所示。
3.3 居民步行出行生成率和出行總量
參考2021年南京市發布的《南京市城市交通狀況》的問卷調查,以抽樣調查273人的樣本數據作為南京主城區居民出行的結構比例,其中出行方式選擇步行交通的占比為26.4%。同時,參考《南京市城市綜合交通規劃》中的遠期居民生成率表(如表3所示),采用相應的工作0.6、就學0.2和私用0.32作為計算常住上班、常住上學和常住彈性的出行率。通過式(2)計算不同出行目所對應的步行出行生產率。
出行結構中步行比例×出行生成率=步行出行生成率 (2)
通過式(3)計算求得常住上班、常住上學、常住彈性的出行總量。其中,人口規模爬取數據按照每戶3人進行計算,大致估算出研究范圍內的居住人口規模為1 876 316人,然后求出不同出行目的所對應的總出行量次。
居住人口×出行生成率=出行總量 (3)
3.4 數據處理和預測模型構建
通過Python編寫代碼從高德地圖初步獲取主城區的14類POI數據,共計93 111個POI數據。補充支路和街巷,形成老城區研究范圍內的路網,通過ArcGIS平臺對研究路網進行小區劃分,共劃分658個交通小區。結合14類POI數據點和路網模型,將范圍外的POI數據刪除,進行數據清洗操作,最終得到56 762個POI數據點。
以常住上班權重表為例,為其余13類POI用地數據類型和企業公司數據賦予相應的權重。將路網、交通小區、POI權重信息數據一同加載至TransCAD軟件,利用重力模型對各交通小區內步行發生吸引的總權重進行權重的分配,最終得到路段常住上班步行需求的預測模型(如圖2所示),常住上學和常住彈性的預測模型構建同理。不界定出行形式,將常住彈性權重表賦值于重力模型中,即可得到小區步行的未來需求分布圖,如圖3所示。
3.5 結論與應用分析
3.5.1 模型結論
南京市主城區的居民出行步行生成率:由式(2)計算可得,常住上班的步行生成率為15.84%,常住上學的步行生成率為5.28%,常住彈性的步行生成率為8.448%。
南京市主城區的出行總量:由式(3)計算可得,常住上班的出行總量為1 125 790人/日,常住上學的出行總量為375 263人/日,常住彈性的出行總量為600 421人/日。
對重力權重模型推導出的主城區路段步行需求分配進行分析:
(1)南京市主城區按照道路層級的大小(即城市主干道、城市次干路、支路),步行出行需求預測的權重占比逐漸變小。
(2)以中央路、中山路為首的城市主干路,接近南京新街口的步行生活圈,POI數據反映的用地類型以公司企業、交通設施服務、購物消費為主,其吸引權重較大,圖表反映出的步行需求預測權重呈現紅色的數值較大,形成以商圈、企業為核心的步行集散中心圈。
(3)以長江路、珠江路為代表的城市次干路,其步行需求預測權重呈現黃色,有較為集散的居民步行行為出行特征,道路層級較高。周邊小區用地性質以公司、老住宅、商業購物為主體,但是因為路網步行設施配置較為齊全,步行交通基本能夠滿足供需平衡。
(4)以成賢街、四牌樓為核心的城市支路,其步行需求預測權重呈現紅色和黃色的混合狀態,周邊小區用地密集,道路層級較低,居民出行需求量大。以成賢街為典型代表,實施了“一刻鐘便民生活圈”的步行方案,該區塊的出行需求得到緩解。
3.5.2 模型分析應用
第一,從宏觀整體角度分析常住上班的路網需求分配圖:以新街口為核心發生的步行活動預測向主城區邊緣城區道路逐漸遞減,反映出主城區步行交通空間分配不均衡的特質,核心城區仍面臨著步行交通擁堵的現狀,這對于城市主城區再規劃建設和設施配置的改善提供了科學量化的數據佐證。
第二,從宏觀角度對主城區小區步行的未來需求流量圖進行分析:由于是彈性權重,所以步行出行特征更具普適性,反映的是遠景視角下城市核心區的步行需求規劃,依據南京市常住人口持續增長的現狀,未來主城區步行流量仍會出現不斷攀升的情況。所以,現狀條件下核心城區流量擁堵、改善步行交通設施配置、舊城區的路網再規劃這三個模塊都是迫切需要解決的問題,而該模型為這些問題提供了“向哪一個交通小區改善,向哪一條道路改善,如何去改善”的方向指引。
4 結論
該文基于多源數據對行人步行出行需求預測進行了研究,以高德地圖POI數據、“天眼查”的公司企業人員規模和“安居客”“鏈家”的住宅人員規模為基礎,結合路網數據進行統計分析。以步行權重作為出行發生的吸引量,通過TransCAD利用重力模型對數據、路網、小區三要素進行了步行需求的預測分析,為城市步行需求分析提供了一種簡便可行的定量化分析方法,并提供了一種可測量性、可預見性的預測建模思路,解決了以往步行網絡規劃以定性分析為主,難有數據支撐的問題。以南京主城區為案例進行了應用研究,得到的步行需求模型能夠很好地支撐步行網絡規劃方案的生成,并針對規劃方案提出了步行空間和步行環境改善的措施建議。
參考文獻
[1]王斯琨.基于多源數據融合的縣域城鎮居民出行需求分析研究[D].南京:東南大學, 2022.
[2]彭宇紅.基于PSO-LSSVM機器學習的居民出行需求預測方法及應用[D].北京:北京交通大學, 2020.
[3]彭輝,王威,徐培娟,等.基于空間聯系強度的城際出行分布預測模型[J].北京交通大學學報, 2022(4):43-51.
[4]孫曉黎,朱才華,馬超群.考慮步行影響范圍的城市軌道交通客流需求預測[J].鐵道運輸與經濟, 2023(4):133-140.
[5]關醒權,閆磊,吳魯香.基于TransCAD的公交客流預測應用研究[J].物流科技, 2021(9):76-80.