王鑫 王英平 張彭 顧明臣 王卓偉 宋揚 費彧



[摘? ? 要] 高速公路聯網收費信息系統中包含了海量的公路交通信息[1],通過收費數據挖掘得到長時間斷面交通量的算法已經實現,但是針對短時間粒度的斷面交通量算法尚屬空白。而短時間粒度、分車型交通量是公路交通情況調查系統采集數據的主要指標。本研究構建了針對短時、分車型數據的挖掘分析方法,充分利用高速公路收費數據,采用車輛動態模擬的分配方式,計算全路網各路段短時間粒度的動態交通量。將收費數據推算結果與自動化交通情況調查站監測結果對比,高速公路網日交通量平均誤差為8.87%,小時交通量誤差為9.02%。本文提出的方法實現了高速公路網全域、高效的自動化交通量推算,對于推動公路交通基礎信息采集技術發展及提升多源大數據分析能力建設具有重要意義。
[關鍵詞] 交通量;收費數據;交通調查;車型;推算方法
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2019. 17. 070
[中圖分類號]? TP312? ? [文獻標識碼]? A? ? ? [文章編號]? 1673 - 0194(2019)17- 0180- 04
1? ? ? 引? ? 言
我國從1978年正式開展公路交通情況調查,并從2010年起開展大規模自動化調查站建設,站點涵蓋全國31個省(區、市),涉及高速公路、普通國道、普通省道等各等級道路。截至2018年底,全國共有交調站44 574個,其中自動化交調站7 631個[2],間隙式站點和比重調查站點36 943個。但是目前交調站采集覆蓋率還不能滿足行業、社會的應用需求[3]。經過多年來的持續投入,我國高速公路網已建成了較為完備的聯網收費系統[4],基本覆蓋高速網全境,可以自動獲取海量、實時的收費數據[5]。如何利用現有多源公路交通數據,提高高速公路交調數據采集覆蓋率,對公路交通基礎信息統計工作具有重大意義,也是亟待解決的技術問題。目前研究已經可以用收費數據進行OD分配來計算路段交通量,但是主要是使用平均OD、通過靜態分配方式計算路段平均交通量,數據的時效性不強,沒有完全挖掘出收費數據短時粒度的特點,不能很好地滿足短時間粒度的數據需求。文章針對現有研究中算法時效性的不足的問題,利用四川省高速公路收費數據,通過車輛動態模擬的分配方法,將收費數據轉換成短時高速公路路段交通量,并通過一定對應關系,將收費數據車型轉換為交調數據車型,得到路網中任意斷面的短時分車型交通量。研究表明,由高速公路收費數據轉換成的短時路段分車型交通量數據,能夠為高速公路交調數據采集提供補充、校核。文章第二節完成數據準備,第三節給出推算方法,第四節給出推算結果,最后給出結論。
2? ? ? 收費數據準備
本研究采用四川省全省聯網收費系統采集的收費數據作為研究建模對象,采用四川省高速公路交調數據作為校核對象。目前全省共529個實際收費站點,其中省界收費站點21個。為解決多義性路徑問題,在產生多義性路徑的路段上設置了共129個標識站,車輛進入高速公路后,其所經標識站均可在收費數據中記錄,從而保證了車輛路徑的唯一性。
在進行分析建模前,首先要對收費數據進行數據清洗。一方面刪除不符合常規的、或明顯錯誤的數據,另一方面,將與推算斷面交通量相關的信息進行讀取與分析,包括進出高速公路的收費站編號、出入時間,標識站、車型信息等,而忽略其他數十種無用屬性信息。用于數據處理的收費數據屬性信息如表1所示。
3? ? ? 推算方法
推算方法包括路網拓撲構建和交通量推算兩部分。
3.1? ?路網拓撲構建
路網拓撲構建是將收費數據與實際路網相結合、進行動態模擬分配、推算路段斷面交通量的基礎。路網拓撲建構需要考慮高速公路網路段間的拓撲關系,收費站和路網的關系,以及收費站之間的關系、標識站位置等。在進行路網拓撲構建時,還要考慮必要的路段屬性信息,如每條路段的長度距離,用于進行下一步建模。
路網采用近鄰表的方法進行構建。路網拓撲節點的建立采用虛實結合的方法。四川路網中的收費站、標識站作為路網中的實節點,而路段間相交的、但沒有布設收費站或標識站的節點作為虛節點。近鄰表實節點包括已建設529個收費站點,129個標識站,結合路段相交點的虛節點,共有830各路網拓撲節點。網絡拓撲節點編號的建立需要與收費數據中的節點編號相對應。在建立路網拓撲過程中,發現有些收費站中同一個收費站卻配有不同的編號,需用一張單獨表將這些編號不同而實體相同的節點一一對應,以便在處理收費數據中不產生歧義。
3.2? ?交通量推算
交通量推算分為三個主要步驟,分別為路段經過性判斷、車輛通過時間判斷和集成交通量。根據處理數據的時間,可以分為離線處理和在線處理兩種情況。其中,路段經過性判斷屬于離線處理,即在分析收費數據前就進行的步驟;車輛通過時間判斷、集成交通量兩個步驟屬于在線處理,即與處理收費數據同步進行的步驟。
路段經過性判斷的方法是最短路徑法。對于路網上任意兩個收費站節點(標識站看作特殊的收費站,可以將車輛的實際路徑描述為最短路徑的集合),用迪杰斯特拉(Dijkstra)算法計算兩個收費站的最短路徑,作為進出這兩個收費站點的車輛的行駛路徑。四川路網收費站529個,標識站129個,即共有658個網絡實節點。
對于任意路段D,在推斷交通量之前,還需要求經過路段D的經由路徑LAB中每輛車通過路段D的時間。本研究使用勻速平均法來確定每輛車所經過路徑中每一個路段的時間。勻速平均法是假設車輛進入高速路網后以勻速行駛,來計算該車輛通過各個路段的時間。因為車輛入站時間、出站時間、以及所經路線的行駛總距離為已知,所以可以容易計算出勻速行駛的速度等參數,再通過各個路段的長度和與入口之間的距離,推出車輛經過每個路段的時間。設AB是經過路段D的最短路徑集合SD中的任意一個進出站組合。車輛i從A站進入高速的時間為TiA,車輛從B站駛出高速的時間為TiB,車輛從站點A到路段D的路程為LNAD,車輛由進入站A到駛出站B的最短路徑的路程為LNAB,則根據勻速假設,可以求出車輛i通過路段D的時間為
TDAB(i)=TiA+(TiA-TiB)*LNAD/LNAB(1)
其中,LNAB為由A到B的最短路徑經過的所有路段集合SLAB中的路段距離之和。LNAB∑LNK(k∈SLAB);LNAD為由A到B的最短路徑經過路段D之前的所有路段集合SLAD中的路段距離之和,LNAD=∑LNK(k∈SLAD)。若以路段D 的中點的斷面交通量代表通過路段D的交通量,則在計算LNAD時需要多考慮路段D本身距離長度的一半。設路段的長度為LND,則LNAD=∑LNK+0.5×LND(k∈SLAD)。
計算任意路段D在任意時段T(T1,T2)內的交通量VD(T),本質就是計算經由路段D的最短路徑的集合SD中,對于每一組進出高速的AB組合,在時段T內經過路段D的車輛數量的累加。用Ni代表累計個數增量,Ni數值取1。∑Ni代表滿足條件的車輛i的累計總數。設時間段T的起始時間為T1,終止時間為T2,VDAB(T)為由A進入高速、由B駛出高速、且在時間段T內經過路段D的車輛數,則有
VDAB(T)=∑Ni(i∈w滿足T1 VDAB(T)代表進出組合高速站點組合AB在時間段T經過路段D的車輛數。對于單一路段D,可以根據SD中的每一組合AB中的所有車輛進出高速時間和距離,計算其經過D的時間,從而求得VDAB(T)。將集合SD中的所有組合的車輛數累加,從而得到路段D在時間段T中的交通量。 VD(T)∑VDAB(T)(AB∈SD)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3) 若考慮路段經過性判斷,可將上式寫為 以上是以路段為對象考慮的交通量推算方法。在四川路網中根據節點劃分了幾百個路段。在計算不同路段的交通量時,會涉及同一輛車在不同時間行駛到不同路段的情況。為了減少計算量,在計算不同路段時不重復計算每輛車的基本信息,本研究采用以每輛車為對象的動態模擬的方法標定其行駛軌跡,從而計算路網路段的交通量。通過收費數據進出收費站的時間,推算車輛在高速公路網中經過每一個路段中點的時間,進一步推斷該路段的交通量。車輛i從A站進入高速的時間為TiA,車輛i從B站駛出高速的時間為TiB,可以根據公式標出其經過各個路段中點的時間TDAB(i),其中D為車輛從A站到B站經過的每個路段。對駛入高速的每輛車都進行如從計算,則每一個路段D都標定了路網中的經過其路徑的車輛通過它的時間TDAB(i)。計算交通量時,將符合時間段T內的車輛個數累加,即為該路段在時間T內的交通量。用動態模擬的方法,可以同時計算路網中所有路段的交通量,而不會重復計算車輛行駛到每個路段的時間等基本信息,從而減少了計算量。 4? ? ? 推斷結果 采用上述算法對四川省高速公路2018年1-6月的收費數據進行分析,并與已建設的70個自動化交調站采集的數據進行校驗。圖1為可視化的四川工作日晚高峰流量空間分布圖,可以看出,成都周邊路網車流量較大,其他路段流量相對較小。 圖2為可視化的路網各路段車速分布。可以看出,四川省高速路網中,成都環線的路網較為擁堵,速度較為緩慢,而從成都環線分向各個放射線高速的車速較為通暢。對于行駛路徑依次經過放射線和成都環線的車輛,實際車速并非理想的勻速行駛,從而按照勻速平均法計算的路段交通量會有微小偏差。但根據數據分析,在計算交通流量時,勻速行駛假設基本可以滿足以小時為單位的短時間粒度交通量計算要求。 將由收費數據轉化的交通量和交調站點直接采集的斷面交通量在同一空間、時間范圍下進行比對。圖3為基于全網具備交調站點的路段的平均流量與相對應的收費數據轉化的平均流量的比較。從圖中可以看出,二者變化趨勢一致,高速公路網日交通量平均誤差為8.87%,小時交通量誤差為9.02%。對于單一路段,高速公路日交通量誤差為13.80%,小時交通量誤差為17.20%。分車型看,單個站點的中小客車小時交通量誤差在12%左右。車型校驗結果如圖4所示。 5? ? ? 結? ? 論 高速公路收費數據中蘊含了豐富的動態路網交通信息。本文研究了收費數據推算交通量的數據挖掘方法,首次采用動態模擬分配的方法得出了短時間粒度的全網各路段流量;且經過車型匹配算法,得出基于公路交調系統的分車型交通量數據。通過收費數據轉換計算短時的路段交通量數據,能夠掌握全路網各路段交通情況,可以作為公路交通情況調查數據的有益補充,可為后續相關研究與應用奠定基礎。 主要參考文獻 [1]付鑫,王建偉,袁長偉.基于高速公路收費數據庫的斷面交通量計算方法[J].交通運輸研究,2006(6):150-153. [2]交通運輸部規劃研究院.2017年國家干線公路交通情況分析報告[R].2017. [3]胡閏秀,李夢雪.基于高速公路收費數據的交通量調查[J].山東交通學院學報,2016,24(1):21-26. [4]孫忠輝.從聯網收費數據中提取管理信息方法探討[J].中國交通信息化,2009(8):70-72. [5]鐘足峰,劉偉銘.基于聯網收費數據預測交通流量的實現[J].中國管理信息化,2009,12(2):59-61.