文 / 鄭愛琴
在大數據時代,尤其是手機普及率如此之高的時代,手機信令數據作為新興大數據的典型應用代表之一,為交通工程、交通規劃領域提供了很好的技術選擇。相較于傳統的數據采集方式,手機信令數據具有數據采集時間連續、花費較少、客觀性強、數據獲取簡便、軌跡連續等優點,并且可間接記錄用戶的出行軌跡,因此對于用戶的出行特征具有非常好的把握。
特別是在高速公路的工可研究階段,由于高速公路建設一般涉及范圍較大,可能影響多個城市甚至多個省份,需要對研究范圍內所有城市的職住分布、出行特征、通勤特征等進行分析,基礎數據的采集工作量極為龐大,因此,利用手機信令數據開展大尺度區域內的分析,特別是跨區域的出行特征,能夠很好的彌補傳統調查的缺點,具有得天獨厚的優勢。
在國家“一帶一路”“長江經濟帶”“長三角區域一體化”等戰略實施以及浙江省“四大建設”的背景下,杭州灣以及杭州大都市區發展起著至關重要的作用,在很大程度上影響到這些戰略規劃實施。
杭州灣區域、杭州大都市已經成為浙江乃至長三角地區產業發展的核心地帶,進一步促進經濟發展,增強其輻射浙西和贛東能力,推進區域協調發展仍然是重中之重。促進區域發展離不開交通網絡這一重要的基礎設施。
目前,滬昆大通道已經建成三條高速滬昆G60(杭金衢高速公路)、杭長高速G6021(杭新景高速公路)、杭瑞高速G56(杭徽高速公路)。杭金衢高速浙江段整體交通量較大,杭新景高速杭州至建德段交通量也較大,杭州城區段已經接近飽和,預計2025年杭新景高速富陽段平均交通量將達到8.5萬pcu/d以上。
分析整個經濟發展趨勢、交通需求以及區域路網結構,杭州往西的東西向公路交通通道的通行能力已顯緊張,因此,增加杭淳開高速作為新的高速公路通道,擴容滬昆通道,暢通浙贛省際通道以及強化杭州都市輻射能力非常必要并且已非常迫切。
杭淳開高速公路項目位于浙江省西部,途經杭州市富陽區、桐廬縣、淳安縣和衢州市開化縣,向西連接德昌高速進入江西省境內,是浙贛交通大走廊的重要組成部分,是杭新景高速的分流線,是浙江西南生態旅游的交通干道,是實現西部山區陸域縣縣通高速重要目標的重要紐帶。
項目起點為富陽銀湖街道G320國道過境線起點,終點為開化縣境內G3京臺高速公路(杭衢南高速公路)。
本文涉及的研究數據由浙江省移動大數據中心提供,包含2019年10月每天24小時浙江全省的手機信令數據,其中杭州市平均單日用戶數約1200萬人,總數據量為578億條,平均單日單用戶的信令條數為95條,數據在24小時內的記錄數分布較為穩定,在空間范圍內除部分街道由于節假日的原因,總體分布也較為均勻,數據質量較好,可以滿足后續的分析需求。

高速公路工可研究階段交通量預測的任務旨在根據高速公路影響范圍內各城市當前和歷史的經濟發展、交通供給及出行特征,來預測將來各特征年份的高速公路交通需求。
其中OD矩陣是進行交通分析、交通預測的基礎數據,傳統做法是根據調查獲得各交通小區典型日的交通量,構造OD矩陣。但其缺點是不能代表出行需求的內在結構,較難描述較大時空范圍內的變化特征。
隨著大數據采集環境和分析方法的成熟,我們可以利用手機信令數據來連續觀測研究范圍內的居民出行特征,并獲得一段時間內連續的OD矩陣,稱為時空OD矩陣。
如何利用現有方法對OD矩陣的時間維度進行壓縮是提取時空OD矩陣的重點,通常情況下我們采用簡單平均的方法來獲得時空OD矩陣,然而這可能忽略了過多的時間變化特征信息。
因此本文將采用奇異值分解的方法對連續觀測獲得的時空OD矩陣進行降維,來得到更能反映不同需求特征的時空OD矩陣,并作為交通模型“四步驟法”中交通量分配預測的基礎。
根據建模和交通分析的需要,主要考慮以城市行政邊界、高等級公路及城市主干道、山川、水體、鐵路等隔斷作為邊界,以城市功能區塊及組團為單位,將研究區域分成了51個內部交通小區,同時將外圍與研究區域聯系緊密的區域按照主要公路聯通方向和組團設置了8個虛擬外部交通小區,共59個交通小區。
利用手機信令數據統計2019年10月每天項目研究范圍內各區域間的OD矩陣,算法如圖2。

將一個矩陣劃分為多個線性不相關部分,然后進行加權組合,這種方法稱之為奇異值分解。該方法已經被應用于合成材料、語義分析等多個領域。
對2019年10月各交通小區的OD矩陣進行奇異值分解。在這里我們規定某日時空矩陣為Ds,共包含n個OD對,同時,把Ds轉化為n個行向量ds,共有m天,所以聯系強度可以表示成m*n的OD矩陣M,根據奇異值分解法,時空OD矩陣可以表示為:

式中:M是m×n矩陣,M的秩是r;U是m×r的矩陣,uh是U的第h列,U的轉置矩陣是UT。另一個矩陣,V是n×r矩陣,V矩陣的第h列表示為vh,V的轉置矩陣表示為VT。矩陣U和矩陣T均為正交矩陣,即他們滿足UTU=E,VTV =E, E表示的是單位矩陣。在正交矩陣中,它的每一個列向量都是單位向量,即uh和vh是單位向量。式子中的S表示的是對角矩陣,這個對角矩陣對角線上的第h個元素記為δh,δh即是奇異值。矩陣S有r行,該矩陣共有r個特征值,且δ1≥ δ2≥ … ≥ δr 。奇異值δh = λh,并且λ1≥ λ2≥ … ≥ λr,故λh是MT M矩陣第h個最大特征值。uh vhT 是秩為1 的m×n矩陣。由此,時空OD 矩陣可以分解為r個秩為1的矩陣,奇異值δh是M中uh vhT的權重。
(1)在高速公路建設項目過程中,相比于傳統的調查數據獲取方式,利用手機信令數據大規模、連續的觀測高速公路影響范圍內各區域間的OD,無論從時間還是空間的覆蓋范圍上都更加全面。
(2)利用奇異值分解方法得到的時空OD矩陣相比簡單求取多天平均值得到的OD矩陣更能反映當前高速路網的實際需求。
(3)本文提出的基于手機信令數據來識別時空OD矩陣的方法具備可行性和實用性,將來能夠應用在更多類似的高速公路建設項目中。
本文利用手機信令數據來分析2019年10月杭淳開高速公路建設范圍內各城市、區域間的OD聯系強度,隨后利用奇異值分解的方法得到該區域的時空OD矩陣,并應用于公路網交通模型和交通分配預測中。