


摘要:手機信令數據能夠實時反映城市中用戶的移動模式和位置變化,通過分析這些數據,可以實現對城市交通狀況的實時監控,及時發現交通擁堵的潛在區域,為交通管理部門提供快速響應的能力。本文基于手機信令數據,構建了宏觀交通模型,通過提取用戶軌跡、劃分用戶區域并以之構建模型評估出行模式和預估交通流量,實現了基于手機信令大數據在宏觀交通模型中的應用。通過實驗測試,模型在預測高峰時段和非高峰時段的交通流量時表現良好,具有較高的準確性,能夠有效提高城市交通系統的運行效率。
關鍵詞:手機信令;大數據仿真;動態流量分配;交通模型;用戶軌跡
一、引言
信令位置數據作為一種新興的數據源,具有覆蓋范圍廣、實時性強、成本低等特點,已成為城市交通管理領域的研究熱點[1]。通過對手機信令數據的分析,可以實時監控城市交通狀況,預測交通流量,識別出行模式,為交通管理提供科學依據[2]。本文通過分析手機信令數據在宏觀交通模型中的處理方法,構建了基于手機信令數據的宏觀交通模型。通過提取用戶軌跡信息,計算用戶在地理空間中的分布情況,識別用戶的出行模式,以實現對交通流量的準確評估。本文通過研究信令位置數據在宏觀交通模型中的應用方法,以期為交通管理提供有用的決策支持,改善城市的交通狀況。
二、手機信令數據在宏觀交通模型中的處理方法
(一)數據采集
Y市作為重要的交通樞紐和商業中心,其公共交通系統逐漸完善,但同時也面臨著交通擁堵的問題。為改善Y市的交通狀況,提高居民出行效率,本次研究旨在移動網絡運營商企業內部進行數據探索,以保障數據的安全性、可靠性和有效性。通過實時收集Y市基站信息、用戶移動軌跡和信號強度變化等基礎信息,獲取數據內容包含用戶的唯一標識符IMSI、基站ID(LAC和CELLID)、時間戳、事件類型(連接、斷開、位置更新)等。通過收集信令位置數據,實時監控Y市交通流量、車速和道路狀況,從而為交通管理提供決策支持。
(二)數據匿名
為保護用戶隱私,需對手機信令數據進行匿名處理。通過從手機信令數據中提取個人手機號碼、IMSI等數據識別信息(PII)后,對所提取的PII進行匿名化處理,以防止用戶隱私泄露[3]。首先,將PII替換為隨機生成的數字,并使用選定的哈希函數對PII進行哈希運算,得到哈希值。隨后,將哈希值作為種子值,通過偽隨機數生成器(PRNG)生成隨機數,由此,將生成的隨機數替換為PII。當無法從匿名化數據中恢復原始PII時,則認為隱私保護達到了預期的效果。
(三)數據整合
數據匿名后,為實現數據整合,需將來自不同來源、不同格式的數據整合為統一的格式,便于后續分析。基于信令位置數據在宏觀交通模型中的處理路線如圖1所示。
在進行數據整合時,首先需要對匿名化后的數據進行解析,提取有用的信息時間戳、位置等信息,確保數據的準確性和完整性。隨后,選定Y市特定商業區域在特定時間段內的數據,并篩選出與宏觀交通模型分析相關的數據,將時間戳格式、坐標格式等不同數據轉換為統一的格式,確保數據格式的一致性。同時,將來自不同來源的數據進行融合,形成完整的數據集,以提供全面的宏觀交通模型分析。通過去除錯誤記錄、異常值、重復數據等,確保數據質量。最后,將整合后的數據存儲在分布式數據庫中,以便于后續的數據處理和分析。通過實施上述步驟,可以實現對匿名化后的手機信令數據的整合,為宏觀交通模型分析提供可靠的數據基礎。
三、基于手機信令數據的宏觀交通模型構建
(一)用戶軌跡提取
對于每個用戶,利用時間戳和經緯度信息,構建其在Y市特定區域內的移動軌跡。首先,通過設置時間窗口,可以確定一個連續軌跡。如果一個用戶在1小時內連續更新位置信息,則這些信息可以拼接成一個軌跡點。同時,根據需求,也可以合并相近時間內的軌跡點,減少數據量,從而對軌跡點的粒度進行適當調整。通過分析軌跡數據,可提取用戶的速度、停留點等移動模式。如果兩個軌跡點在時間差Δt內,且位置差Δ1小于某個閾值L,則可以將這兩個點合并為一個軌跡點。流量矩陣的元素Aij可以表示從區域i到區域j的流量,其計算公式見式(1):
(二)區域劃分
(三)出行模式識別
該函數提供了一個量化的指標,用于評估模型在出行模式識別任務中的性能。通過將模型的預測結果與實際結果進行比較,能夠提供一個具體的數值,表示預測的準確性。在出行模式識別問題中,使用交叉熵損失函數可以幫助模型實現預測出行模式與實際出行模式之間差異的最小化,從而提高模型預測結果的準確性。通過分析不同出行模式的分布和變化,可以更準確地預測未來的交通流量和需求,從而優化交通布局。
(四)交通流量預估
在進行交通流量預估時,需要提取時間、空間、交通等流量特征,并應用線性回歸模型以實現準確預估交通流量。線性回歸模型在處理線性關系時表現良好,能夠提供較為準確的預測結果。對于交通流量這種受到多種因素影響的復雜系統,線性回歸模型可以通過提取關鍵特征來捕捉交通流量與影響因素之間的線性關系,從而實現較為準確的預估。同時,線性回歸模型可以通過調整模型參數優化模型的性能,以適應不同的交通流量變化情況。這種靈活性使得模型可以根據實際情況進行調整,提高預測的準確性。假設交通流量Y與特征X之間存在線性關系,則可以表示為式(5):
四、測試分析
(一)測試準備
在收集Y市歷史交通數據后,將其分為特征和標簽兩部分。特征包含時間、日期、天氣條件、節假日、道路類型、車流量等,標簽則是每個時間段的交通流量是否為高峰時段,以此使用歷史數據對模型進行訓練。在填充或刪除缺失的交通流量數據后,將日期、時間等非數值型數據轉換為數值型數據,并對數據進行標準化處理,以消除不同量綱的影響。最后,使用混淆矩陣評估模型,預測高峰時段和非高峰時段的交通流量時的性能,計算準確度(Accuracy)、精確度(Precision)、召回率(Recall)和 F1 分數(F1 Score)等指標。
(二)測試結果
模型在測試集上的表現詳見表1。根據模型在測試集上的表現,計算性能指標詳見表2。
根據測試結果可知,模型在預測高峰時段和非高峰時段的交通流量時表現良好,準確度達到了84%。精確度和召回率分別為83.3%和66.7%,表明模型在預測交通流量狀態方面具有較高的準確性。F1分數為72.7%,證明了模型在精確度和召回率之間能夠取得良好的平衡。上述結果表明,模型具有一定的實用價值,可以為交通管理提供決策支持。
在非實驗環境中,模型的準確度為80%左右,仍能夠提供相對可靠的交通流量預測。精確度保持在80%左右,召回率為60%左右。F1分數保持在70%左右,表明模型在精確度和召回率之間能夠保持較好的平衡。
五、結束語
通過對手機信令數據進行分析和處理,可以獲取城市交通網絡的時空特征,為宏觀交通模型的建立提供了重要的數據支撐。通過構建基于手機信令數據的宏觀交通模型,可以更準確地模擬和預測城市交通流量的變化,為交通規劃和管理提供科學依據。然而,信令位置數據在宏觀交通模型中的應用仍面臨一些挑戰。因此,未來研究可以進一步優化數據處理方法,提高模型預測的實時性,以平衡數據利用和用戶應急的需求。
作者單位:吳祖康 中國移動通信集團江蘇有限公司
參考文獻
[1]牛強,陳樹林,伍磊.基于手機App使用大數據的居民線上生活空間結構初探——以武漢市都市發展區為例[J].地理研究,2024,43(04):966-984.
[2]田釗,張乾鐘,趙軒,等.基于手機信令數據的城市居民動態OD矩陣提取方法[J/OL].鄭州大學學報(工學版),1-9[2024-04-23].
[3]戴嬌,胡勝,劉宇軒,等.顧及多模態數據特征關聯的城市功能區識別方法——以武漢市為例[J].時空信息學報,2024,31(01):74-84.
[4]曾鵬,李玉斌.基于手機信令數據的城鎮網絡特征及影響因素分析——以天津市武清區為例[J].城市環境設計,2023,(04):266-271.
[5]張凱,湯俊青,段仲淵,等.手機信令大數據在宏觀交通模型中的應用研究[J].交通與運輸,2023,36(S1):226-231+241.