史立凱、韓竹斌、胡城峰,3
(1.江蘇電子信息職業學院,江蘇 淮安 223003;2.南京城驛城市與交通規劃設計有限公司,江蘇 南京 210000;3.淮安市元亙交通規劃設計有限公司,江蘇 淮安 223021)
城市交通需求預測不僅是城市交通規劃、交通政策制定的依據,也是城市交通重大建設項目建設過程的重要參考。近年來,隨著交通精細化管理的進一步發展,對交通需求預測的精確度要求也進一步提高,而較為準確的交通需求預測離不開精準、全面的交通現狀調查工作。
傳統的交通現狀調查手段主要是基于問卷的抽樣調查,包括居民出行調查、交通核查線調查、對外出入口調查、交通樞紐調查等[1]。一方面,傳統調查需投入較大的人力、財力,且一般以紙質問卷調查形式為主,效率相對較低,為了獲得同一天的出行數據,往往需要幾百人同時開展調查工作;另一方面,傳統調查方式的抽樣率較低,無法有效保證調查結果,以居民出行調查為例,一般城市的抽樣率不超過4%,大城市則更低,難以全面地反饋居民的出行數據。
隨著“互聯網+”、信息化技術的進一步發展,交通調查的信息化手段也逐步豐富,包括移動終端數據(手機信令數據、APP 應用數據等)、交通設施數據(ETC、IC 卡、電子警察等)及基于GPS 的動態數據等[2]。手機信令數據因具備用戶較多、基礎設施分布較廣、數據可挖掘性較強等特點,逐步成為重要的交通調查輔助手段。手機信令數據在交通需求分析領域從最初的分析城市居民職住分布情況,逐步發展到基于手機信令數據的出行數據分析、在交通專項需求分析中的應用及出行模型的應用等研究[3]。
手機信令數據的現狀研究集中在調查分析及交通出行分析方面,缺乏在城市交通需求預測方法方面的應用和研究。對此,基于手機信令數據的應用原理、交通需求預測方法對手機信令數據在城市交通需求預測中的應用進行研究,并基于南通手機信令數據的應用進行分析。
手機信令數據的處理包括多個步驟:對原始手機信令數據的采集、預處理(清洗、排序、修補),基于交通分區的數據匹配、出行需求OD 整理等。通過這一系列步驟可獲得居民出行的相關數據信息。
手機使用終端與發射基站或微站之間會產生交互的通信數據,這一數據從手機終端開啟后即產生,這一通信數據即為手機信令[4]。手機信令數據可記錄終端編號、出現時間,結合基站坐標串聯起來,即可描述手機終端使用者的行動軌跡,形成出行數據。
手機信令數據包含的字段較多,脫敏(去除用戶個人信息數據)后的手機信令數據一般包含7 個字段:移動端ID、發生時間、位置區域編號、基站網格編號、事件編號、國際用戶識別碼。通過數據的清洗、排序、修補等過程,按照出行需求分析的各個階段,將數據整理成數據表格,包括人口分布、崗位分布、人口動態分布、OD 分布等數據表格(見表1)。

表1 基于手機信令數據處理的出行數據表格
通過記錄同一手機使用終端在不同基站之間的時間差,結合基站坐標,可獲得居民出行數據,即基站密度越大,出行數據越精確,但隨著基站數量的增加,手機信令數據會出現一定的誤差。因此,需要從“乒乓效應”、數據漂移兩個方面分析手機信令數據清洗原理。
1.2.1 乒乓切換處理
“乒乓效應”的產生是由于相同的位置可能被多個基站信號所覆蓋,處于該區域的手機號會因為重疊覆蓋的各個基站信號強度、負荷問題發生切換,在信令數據的體現方面,會出現該用戶真實位置沒有發生變化的情況下,產生多條位置切換的信令數據的現象。
應對“乒乓效應”,一般采用較基于RSSI 的三角定位模型進行用戶位置定位,即已知三個點的坐標和其與目標用戶的距離,求解目標用戶的位置[5]。三個基站與目標用戶的距離可以根據RSSI 信號的強弱轉換來確定。
1.2.2 數據漂移清洗
數據漂移是指因特殊原因導致手機信令服務基站位置跳躍而出現數據信息脫離實際位置的情況。數據漂移清洗擬采用數據點速度的閾值清除方法開展。根據居民出行方式速度特性確定最大出行速度的閾值,并清除超過速度閾值的數據條。
2.1.1 城市概況
南通是長三角城市群核心地帶的主要城市之一,2021 年年末常住總人口約773 萬人,市區常住人口約380 萬(數據來源:南通市統計局網站http://tjj.nantong.gov.cn/)。近年來,城市綜合交通得到大力發展,“一軸一環六射”快速路系統、城市軌道1 號線、2號線開通在即。為了支撐南通未來的“八橫八縱”快速路系統建設、“4 普2 快”城市軌道系統建設,有必要量化分析南通市城市出行需求。
2.1.2 運營商選擇
手機運營商包括中國移動、中國電信和中國聯通。從市場占比上看,中國移動遙遙領先,但其沒有統一的全國數據中心,較難獲得對外出行的手機信令數據[6]。中國聯通與中國電信都具有全國數據中心,溝通成本低,數據格式統一。因此,此次調查以中國電信數據中心作為數據來源,以中國電信在南通的市場占有率作為擴樣系數。
2.1.3 基站分布
南通市全市分布基站網格約1.13 萬個(分布情況見圖1),密度約1.4 個/km2,其中市區范圍分布基站網格約5000 個,密度約1.7 個/km2。結合城市用地分布將南通市區劃分約1100 個交通小區(分布情況見圖2),坐標與基站統一為WGS84 坐標體系。

圖1 南通市域基站網格分布圖

圖2 南通市區交通小區劃分圖
2.2.1 現狀人口崗位分布
根據中國電信手機信令數據擴樣,結合南通市官方現狀人口崗位規模,得到全市范圍人口崗位分布情況。將手機信令數據集計到交通小區,可統計分區數據情況[7]。根據分析,南通常住人口大多就業選擇所在縣區,內部就業比例均高于85%。市區范圍內的跨區就業相對較高,如南通新城區、通州副城、空港片區跨區就業比例為10%~15%。
2.2.2 出行生成的應用
城市居民出行調查一般認為出行距離大于500m作為一次有效出行,而手機信令數據相對精度較高,數據融合過程中仍以大于500m 作為一次有效出行進行數據清洗,并與居民出行調查數據進行校核,作為出行生成率和出行吸引率回歸計算的依據[8]。
2.2.3 出行分布的應用
結合南通市城市發展趨勢,出行分布采用雙約束重力模型,模型的標定數據材料包括現狀出行OD,現狀分區的發生量、吸引量。為保證數據的一致性,均采用手機信令集計的數據,標定獲得的α、β、γ 參數及K-factor 矩陣,作為交通需求預測預置參數,得到預測年交通分布矩陣。南通市現狀全方式出行期望線見圖3,南通市2035 年預測出行期望線見圖4。

圖3 南通市現狀全方式出行期望線

圖4 南通市2035 年預測出行期望線
2.2.4 方式劃分的應用
方式劃分采用巢式競爭(NL)模型,各出行方式出行選擇肢通過競爭模型進行選擇,出行效用包括出行時間和費用等。
因出行距離清洗、速度拆分等過程存在較多數據噪點,因此通過居民出行調查中的分距離、分方式的方式比例,對通過手機信令數據獲得的出行方式矩陣進行修正。
手機信令數據在交通需求預測中的應用不僅包括對需求相關參數標定和需求的校核,還可以用于分析指定通道的交通需求,為新建、改擴建的大型交通通道提供需求依據;交通來源分析,為重點分析某些片區或建筑的出行特征等提供數據支持;用于分析特定斷面的出行需求,主要用于分析跨片區出行規模,作為特定交通分區出行校核是依據。
與傳統的交通調查方式相比,手機信令數據具有抽樣率更高、數據更準確的特點,可幫助相關部門更全面地掌握城市交通需求狀況。然而手機信令數據在交通需求方面的應用仍有兩個待解難題:一是匹配終端使用者的出行特征(個人特征、出行目的等),二是匹配更為準確的出行方式矩陣。
目前,城市交通需求模型仍主要采用基于交通小區的集計模型,隨著手機信令數據挖掘技術的進一步發展,在基于手機信令出行方式劃分交通區方法逐步可靠的基礎上,可適時開展城市交通需求預測非集計模型研究。