






摘要:高速公路信息化建設日益完善,為了能夠更加詳盡地掌握高速公路的交通狀態,以濟青高速為研究對象,通過挖掘門架數據,設計了k均值聚類算法和基于密度的噪聲應用空間聚類算法相結合的兩階段聚類方法來識別駛入服務區車輛和異常行駛的車輛,再結合各車型流量占比加權的交通狀態指數,從時間和空間維度分析高速公路路段交通狀態。研究結果表明,兩階段聚類算法有著很好的識別效果,通過交通狀態指標發現在7:00—20:00時段高速公路存在3個交通狀態較擁堵的時段,精確地識別出高速公路中交通狀態較擁堵的路段,并且發現路段的大車混入率與交通擁堵程度呈現密切的正相關的趨勢,最后依據交通狀態指數將濟青高速路段交通狀態劃分為4個不同的等級,為交通管理部門提供了路段交通狀態評估的技術支持。
關鍵詞:門架數據;交通狀態;聚類算法;交通狀態指數;大車混入率
中圖分類號:U491文獻標志碼:A文章編號:1002-4026(2023)03-0100-08
Abstract∶To thoroughly investigate the traffic state of highways, Jiqing Highway was selected as the study case. By mining the gantry data, a two-stage clustering algorithm combining k-means and density-based special clustering of applications with noise (DBSCAN) algorithms were proposed. The method was used to identify vehicles entering the service area and driving abnormally. Subsequently, the filtered vehicle records were extracted to realize a traffic state index weighted by the vehicle type to analyze the traffic state of the highway in terms of spatiotemporal dimensions. Results indicate that the two-stage clustering algorithm performs very well in the identification. The traffic state index indicated three periods when the highway is defined as congested during 7:00—20:00. Furthermore, it accurately identifies the congested sections of the highway. Moreover, it shows out that the mixed rate of large vehicles and the degree of traffic congestion in a section have a close positive correlation. Finally, according to the evaluation index, the traffic state of the Jiqing Highway is divided into four levels, which provides technical support for the traffic authorities to evaluate and manage the highway sections.
Key words∶gantry data; traffic condition; clustering algorithm; traffic state index; mixed rate of large vehicles
截至2021年,我國高速公路里程數已經達到16.91 萬公里,但是隨著我國汽車保有量的增加,高速公路仍然會出現擁堵問題。為更好地評估高速公路運行狀態,門架系統應運而生。目前,全國已建成了2.66 萬套門架系統,記錄了海量的行車感知數據。隨著數據挖掘技術逐漸成熟,通過智能化手段從海量的門架數據中挖掘出復雜的交通流變化態勢是當前交通研究的熱點與難點。在建成交通強國、智慧高速等背景下,研究高速公路路段時空維度的交通運行狀態,對引導出行者出行、提高路段通行效率具有重要意義。
由于門架系統的建設周期較長,已有的高速公路交通管理研究對于大規模的門架數據仍少有涉及,劉群等[1]利用門架數據進行了交通流預測的研究;邢麗峰等[2]利用門架數據進行了高速公路各類車輛的交通量轉換的研究;曹波[3]在門架數據的基礎上提出區間擁堵指數,用于估計路段交通狀態。在道路運行狀態估計方面,現階段采用的數據大致分為固定式交通檢測技術采集的數據(感應線圈、微波檢測)[4-5],移動式交通檢測技術采集的數據(全球定位技術(global positioning system,GPS)[6]、手機信令采集技術[7]),以及收費站數據[8],無人機[9-10]、監控視頻[11]檢測技術采集的數據。而門架數據相較這幾類數據具有如下優勢:固定式交通檢測設備往往只在特定的路段布置,無法大規模地應用,而門架設備布置規模非常之廣;移動式交通檢測技術往往會受到周圍環境的影響導致精確度大大下降,而門架數據精確度較高,幾乎不存在數據大批量缺失的現象;利用收費站數據進行交通狀態估計時,由于數據中僅僅記錄車輛進入和離開高速路網的數據,所以數據處理過程相當復雜,而門架系統記錄車輛經過每一個路網路段的數據,可以更好地檢測車輛在每一個路段的行駛狀態,計算過程相對容易;無人機、監控視頻數據雖然精度高、靈活性強,但是成本高、不利于推廣應用,而門架數據獲取容易且維護成本也較低。綜上所述,門架數據具有應用范圍廣、精度高、計算方便、成本低的特點。由于高速公路兩兩門架之間設有服務區,在計算駛入服務區的車輛平均行程速度時會偏低,根據梁奇[12]統計,高速公路服務區客車、貨車駛入率均超20%,但現有研究方法對此問題通常不予考慮,造成結果可靠性下降。賴見輝等[13]采用機器學習的方法對車輛是否駛入服務區進行預測,而該方法存在一定的誤差,可解釋性差,并且還需進行問卷調查來獲取模型的訓練數據,增加了工作量。直接利用原始門架數據,根據每個車輛的平均行程速度特性挖掘出駛入服務區的車輛的方法準確度高,可解釋性強。
研究本研究通過兩階段的聚類方法準確地識別出路段中駛入服務區的車輛和行駛異常的車輛,再利用交通狀態指數在時間和空間維度對濟青高速的交通狀態進行評價分析,挖掘其時空規律。最后根據交通狀態指數將濟青高速各個路段劃分為4個擁堵等級。為高速公路管理部門準確了解高速公路運行狀態,制定擁堵管理措施提供借鑒,進而提升高速公路的通行能力。
1異常速度識別方法
1.1k均值聚類算法
k均值聚類(k-means)算法[14]作為一種經典的聚類算法,已經廣泛地應用于各個領域。本研究將k-means算法用于識別駛入服務區的車輛,以時間維度和各個車輛平均行程速度vi為聚類指標,利用是否駛入服務區的兩類車輛在平均行程速度上存在較大差異的特點解決了k-means算法難以確定初始聚類中心的問題,識別過程如下:
(1)指定聚類數目k和聚類中心(c1,c2,…,ci),由于本研究已經非常明確地將數據集劃分為兩個類別,并且未進入服務區車輛和進入服務區車輛在平均行程速度上存在明顯的差異,所以將聚類數目k指定為2,聚類中心(c1,c2)指定為([t_,v_],[t_,s])。其中t_為目標時段的中間時刻;v_為未駛入服務區車輛的平均行程速度的經驗值,本研究選取90 km/h;s為駛入服務區車輛的平均行程速度的經驗值,本研究選取20 km/h。
(4)重復(2)和(3)步驟,直到各個聚類中心ci不再發生變化,或者達到預設的迭代數。
1.2基于密度的噪聲應用空間聚類算法
基于密度的噪聲應用空間聚類算法(density-based special clustering of appliations with noise,DBSCAN)[15]可以在具有噪聲的數據集中發現任意形狀的簇。該算法最重要的兩個參數分別為鄰域密度閾值ρMinPts以及鄰域半徑REps。本研究利用該算法識別某一路段未進入服務區車輛的平均行程速度集合中的偏大或者偏小的離群數據,相對于傳統的閾值篩選的方法更加靈活,識別過程如下:
(1)定義某一路段未駛入服務區車輛的平均行程速度集合D,給定鄰域密度閾值ρMinPts和鄰域半徑REps,計算各個車輛平均行程速度vi的鄰域對象個數NEpsvi,若NEpsvi≥ρMinPts,則vi為核心對象。
(2)判斷各個核心對象是否在其他核心對象所構成的鄰域里面,若在其中則該兩個核心對象構成密度可達,密度可達的核心對象鄰域構成的集合為一個簇,不在任何簇中的車輛平均行程速度則為異常數據。
2交通狀態評估指數
交通狀態指數(ITS)[16]可以用量化數值來表示道路交通狀態,數值越大表示交通擁堵越嚴重,分為基本模型和加權模型。本研究使用各車型流量加權模型,計算公式如下:
式中,Tgij為路段i時間段j中g類車的ITS值,vgf為g類車的理想平均行程速度,vgij為路段i時間段j所有g類車的實際平均行程速度的平均值,Tij為路段i時間段j的ITS值。
交通狀態評估流程如圖1所示,首先利用兩階段聚類算法對車輛平均行程速度進行篩選,避免駛入服務區車輛對路段平均行程速度計算的干擾,提高計算的可靠性,最后計算各路段ITS來評估路段交通狀態。
3實例分析
3.1數據概況與預處理
本研究所使用的數據來自山東省濟青高速濟南章丘—青島機場北樞紐段共26個門架路段,路段全長309.633 km,2021年9月6日至12日共一周的門架數據4 063 295條,刪除重復值和缺失值后還剩余4 051 105條數據,字段信息如表1所示。
本研究以相鄰兩個門架組成的路段為研究路段,共25條,上游門架數據以trans_time和vehicle_plate字段為鍵,下游門架以last_gantry_time和vehicle_plate字段為鍵,進行數據拼接,拼接后的數據即為路段行車數據,包括車牌號、經過上下游路段時間、路段長度、車輛平均行程速度,其中某輛車經過該路段的平均行程速度vi=lΔt,l為路段長度,Δt為經過上下門架的時間差。濟南章丘—青島藍村的研究路段編號0~24,每個路段的交通量周變化情況如圖2所示,可以看出在這一周內高速公路周一交通量最大,周三交通量最小,并且路段越往青島方向交通量越小。
3.2異常速度篩選
本研究以1 h為時間間隔,對設有服務區的路段采用k-means聚類算法將駛入服務區的車輛識別出來后,再將未進入服務區的數據利用DBSCAN聚類算法進行二次篩選,識別出速度偏大和偏小的異常數據,其中k-means聚類算法初始聚類中心([12,90],[12,20])的最大迭代數設置為300,DBSCAN聚類算法的鄰域半徑REps設置為1 km/h,鄰域密度閾值ρMinPts設置為3,篩選結果如圖3所示。從圖4可以看出,經過篩選后的數據更趨近于正態分布。
3.3交通狀態評估
以行程速度為基礎的交通擁堵評價指標是用于評估交通狀態的常用手段,例如路段延誤、TTI(travel time index)等,但往往在理想行程速度的取值上選取道路的最高限速[17-18],而不同車型之間的理想行程速度是存在差異的,所以本研究選取交通量占比較高的3種車型,如表2所示。計算3種車型流量加權求和后的ITS指標來判斷某一路段的交通狀態,研究時段選取旅客出行活動較為頻繁的上午7:00到晚上20:00,從時間和空間兩個維度對濟青高速進行交通狀態的評估。在時間維度方面,計算濟青高速研究時段的日平均ITS指標變化情況,從圖5可以看出,在研究時段中存在3個ITS指標高峰時段,分別為9:00—10:00、14:00—15:00、19:00—20:00,其中19:00—20:00時段ITS指標最高。
從空間維度分析各個研究路段7天中8:00—20:00的平均ITS指標的日變化情況,從圖6可以看出濟青高速中交通狀態最擁堵路段為9,從濟南開始的0~6路段較為擁擠,較為流暢的路段為12~14路段以及18~22路段,其余路段交通擁堵狀態較為一般。大車(中大型貨車)在交通流中的混入率與交通擁擠程度有著重要的關系[19],如圖7所示。大車混入率與ITS呈現正相關趨勢,并且兩者的皮爾遜系數為0.68,可見兩者線性關系十分密切,其中路段9為臨淄東—青州西路段,臨淄區為山東省重要的工業園區,出入大車的數量會比較多,所以大車混入率較高,交通運行狀態也較為擁堵。可以對大車實行夜間時段通行費用折扣的措施,錯開小客車出行高峰時段,以此降低路段擁堵狀態。
根據以上情況將濟青高速線路的路段交通狀態劃分為4個等級,各個等級日平均ITS指標范圍如表3所示。
4結論
本研究提出了一種基于門架數據的兩階段聚類方法來識別高速公路駛入服務區的車輛和行駛速度異常的車輛,再利用各車型流量占比加權的交通狀態指數ITS,有效地識別路段異常的行程速度數據,評估了濟青高速25個路段的交通狀態,發現大車混入率與ITS呈現密切的正相關的關系,即大車混入率越高交通狀態越擁堵,并且將濟青高速路段交通狀態劃分為4個等級,本研究方法可以為交通管理部門發現高速公路瓶頸路段提供理論支持。但本研究所使用的的數據量較少,僅僅分析了交通狀態的日變化和周變化的情況,提取的交通參數數量以及精度方面也有待提高,在以后的研究中應加大研究的數據量,分析更長周期的交通狀態,利用更為先進的算法提取更多有意義的交通參數。
參考文獻:
[1]劉群, 楊濯丞, 蔡蕾. 基于ETC門架數據的高速公路短時交通流預測[J]. 公路交通科技, 2022, 39(4): 123-130. DOI: 10.3969/j.issn.1002-0268.2022.04.014.
[2]邢麗峰, 邱廷銓, 邢宇鵬. 基于ETC門架數據的高速公路交通量轉換探究[J]. 中國交通信息化, 2022(4): 94-96. DOI: 10.13439/j.cnki.itsc.2022.04.004.
[3]曹波. 基于門架數據的道路運行指數應用研究[J]. 中國交通信息化, 2022(1): 110-113. DOI: 10.13439/j.cnki.itsc.2022.01.011.
[4]王光輝. 高速公路交通運行狀態判別方法研究[D]. 長春: 吉林大學, 2015.
[5]NANTHAWICHIT C, NAKATSUJI T, SUZUKI H. Application of probe-vehicle data for real-time traffic-state estimation and short-term travel-time prediction on a freeway[J]. Transportation Research Record: Journal of the Transportation Research Board, 2003, 1855(1): 49-59. DOI: 10.3141/1855-06.
[6]趙千里. 基于車載GPS數據的城市交通狀態估計和出租車需求預測研究[D]. 上海: 上海交通大學, 2016.
[7]劉超彪. 基于手機信令數據的交通路況預測的研究與實現[D]. 武漢: 華中科技大學, 2019.
[8]YAO E J, WANG X W, YANG Y, et al. Traffic flow estimation based on toll ticket data considering multitype vehicle impact[J]. Journal of Transportation Engineering, Part A: Systems, 2021, 147(2): 04020158. DOI: 10.1061/jtepbs.0000488.
[9]KE R M, FENG S, CUI Z Y, et al. Advanced framework for microscopic and lane-level macroscopic traffic parameters estimation from UAV video[J]. Intelligent Transport Systems, 2020, 14(7): 724-734. DOI: 10.1049/iet-its.2019.0463.
[10]張新.基于無人機視頻的交通參數提取方法及應用[D]. 上海:同濟大學,2014.
[11]LI J L, XU Z G, FU L, et al. Domain adaptation from daytime to nighttime: a situation-sensitive vehicle detection and traffic flow parameter estimation framework[J]. Transportation Research Part C: Emerging Technologies, 2021, 124: 102946. DOI: 10.1016/j.trc.2020.102946.
[12]梁奇. 高速公路服務區滿意度與駛入選擇行為研究[D]. 重慶: 重慶交通大學, 2019.
[13]賴見輝, 齊悅, 王揚, 等. 基于收費數據的交通運行參數估計方法[J]. 中國公路學報, 2022, 35(3): 205-215. DOI: 10.19721/j.cnki.1001-7372.2022.03.017.
[14]楊俊闖, 趙超. k-means聚類算法研究綜述[J]. 計算機工程與應用, 2019, 55(23): 7-14. DOI: 10.3778/j.issn.1002-8331.1908-0347.
[15]周玉, 朱文豪, 房倩, 等. 基于聚類的離群點檢測方法研究綜述[J]. 計算機工程與應用, 2021, 57(12): 37-45. DOI: 10.3778/j.issn.1002-8331.2102-0167.
[16]吉靜, 顧承華, 翟希, 等. 基于交通狀態指數的城市道路交通擁堵評價體系研究[C]//中國智能交通協會第十一屆中國智能交通年會大會論文集. 重慶:中國智能交通協會,2016: 931-939.
[17]張南,黃正國,葉彭姚,等. 基于車牌數據的行程速度特性及交通狀態評估[J]. 綜合運輸,2019, 41(5):63-70.
[18]WANG Z J, ZANG C, YANG C L. Multi-indicator Road traffic state assessment based on path state[EB/OL].[2022-08-20]. http://dx.doi.org/10.12783/dtcse/icmsa2018/23259.
[19]胡建榮, 何磊. 基于尖點突變理論的高速公路交通流狀態判別方法[J]. 中國公路學報, 2017, 30(10): 137-144. DOI: 10.19721/j.cnki.1001-7372.2017.10.017.