張詩, 楊子邈, 黃杰, 徐進,3*
(1.重慶交通大學交通運輸學院, 重慶 400074; 2.重慶高速公路集團有限公司南方營運分公司, 重慶401300; 3.重慶交通大學山區復雜道路環境“人-車-路”協同與安全重慶市重點實驗室, 重慶 400074)
受到特殊地質地貌和自然環境等條件的限制,中國山區高速公路道路組合復雜,形成了較多的連續縱坡路段,在人-車-路-環境多因素的不協調作用下,連續下坡路段已成為道路交通安全的重災區[1]。近年來,高速公路大型轎車、輕型貨車和重型貨車發展迅猛,由于車輛的輪廓尺寸和載重量不同,各車型的運行特征受到道路幾何指標和慣性等因素影響存在顯著差異性,對山區高速公路通行效率和安全造成較大影響,因此亟需對車型進行合理分類,選擇不同軸重的車型作為典型車型,研究不同幾何線形路段各車型的車速特征和差異性,為提升連續下坡路段行車安全性提供理論依據。
行車速度是高速公路安全評價和效率的重要指標之一。Sil等[2]評估了平曲線幾何結構對車速分布的影響并且建立了基于平均車速和標準差的預測模型。Chen 等[3]通過仿真駕駛試驗分析山區高速公路貨車速度變化行為,構建基于遞歸神經網絡(recursive neural network,RNN)的速度預測模型。徐進等[4]分別采集了車輛斷面速度和行程速度,明確了山區高速公路典型車型的速度分布特征并建立了基于速度特征值的區間限速閾值模型。崔洪軍等[5]研究了不同車型在重載公路信號交叉口處跟馳行為的差異性,得出了加速階段和穩定階段的車流運行特性。
車輛在連續縱坡路段的行駛狀態一直是山區交通管理的重點。Hou等[6]基于大量全球定位系統(global positioning system,GPS)數據集分析比較了下坡路段理論運行速度和實際車速的異同。Jiang等[7]提出了大型車輛在長陡下坡路段安全和高效的速度控制系統。萬遠航等[8]構建人-車-路協同仿真系統,分析了重載貨車在不同坡度下掛擋運行車速的變化范圍,提出了長大下坡路段車輛運行速度安全仿真模型。張馳等[9]收集了西南地區某高速公路連續長大下坡路段斷面車速,建立了貨車運行速度預測模型。
車型分類是交通管理重要的部分。Chen等[10]使用高斯混合模型算法對視頻錄像中的大量車輛進行了定位、提取和分類。Javadi等[11]基于模糊C均值聚類算法,利用每輛車的尺寸和速度特征對相似外觀的不同類型的車輛進行了聚類分析。徐進等[12]通過分析一般路段和連續上坡路段不同車型的速度分布特征并對不同路段進行了車型聚類分析。陳濤等[13]分析了交通事故數據和區間車速的相關性并利用K-means聚類對不同車型進行了分類研究。侯樹展等[14]基于高速公路車輛運行速度與車輛軸距之間的關系,利用聚類分析技術提出了基于軸距的車型分類方法。
車輛速度研究目前傾向于通過GPS系統、路側測速儀、實車試驗等途徑來獲得瞬時車速,但采集數據困難數據量有限,電子不停車收費(electronic toll collection,ETC),系統可以在不新增交通檢測設備的情況下,通過挖掘大量數據來分析車輛行程速度的特征。現有車型分類研究都是基于車輛動力特性、車輛外廓尺寸和車輛軸距等方面得到的,還應結合不同車型在不同道路條件下的實際運行狀況進行分類分析。
為此,現獲取包茂高速水江至南彭段主線ETC數據,分析山區高速公路平緩路段和連續下坡路段不同車型的行程速度分布特征,并利用K-means聚類方法對車型進行分類,提出基于ETC系統中全車型實際運行速度的分類方法,結果可為山區高速公路路線設計車型的選擇、全車型精細化管理以及速度控制措施的評價提供數據支撐和借鑒。
選取G65包茂高速公路水江至南彭段(K3+500-K61+750),設計速度為100 km/h,包含6個互通立交、4條隧道和1個服務區,年平均日交通量為13 714 veh/h,貨車占比為32.1%。該路段組成結構復雜,存在大量小半徑曲線路段、陡坡和長下坡路段,是常見的典型山區高速公路。主線路段共設置有6處ETC門架,分別為“水江K3+500”“南川K25+100”“大觀K33+000”“石龍K46+150”“接龍K58+970”和“南彭K61+750”,如圖1所示。
將水江-南川區段和石龍-接龍區段作為研究對象,其中水江-南川區段為平緩路段,全長21.60 km,圓曲線半徑等于1 000 m的有8處,最小圓曲線半徑為1 000 m;最大縱坡坡度為3.5%,縱斷面只有短距離上下坡。石龍-接龍區段為連續下坡路段,全長12.82 km,小客車限速100 km/h,小客車除外其他車型限速80 km/h,區段內隧道限速80 km/h,圓曲線半徑小于1 000 m的有2處,最小圓曲線半徑為700 m,最大縱坡坡度為4.0%,坡度為4.0%的路段占路段總長的24%,坡度為3.0%的路段占路段總長的54.9%。

圖1 研究路段示意圖Fig.1 Schematic diagram of the research section
ETC系統(電子不停車收費系統)通過安裝在高速公路主線位置上、高速公路出入口處的ETC門架來獲取通行車輛信息。客車按車型輪廓尺寸和載客人數劃分為一~四型,貨車根據車輛軸數、車長和最大載重質量劃分為一~六型。研究主線路段ETC門架在2020年8月采集的車輛通過數據,原始數據為ETC電子交易數據記錄表,該表包括以下字段:門架編號表示計費當前門架標號(通行方向)、小時批次號、車牌號+顏色、交易時間表示通過當前門架對應的瞬時時間、計費車型、軸數、交易金額等,如表1所示。
選擇天氣晴朗、路面條件良好、車輛處于相對自由流狀態時的ETC數據作為研究對象,共提取出25 d的有效ETC數據,能夠反映不同車型在同一路段的實際運行狀態。ETC收費數據具有字段豐富、內容充實、數據量大等特點,但往往也會出現數據丟失、數據不一致、數據冗雜重復以及數據字段缺失等大量異常數據[15]。數據預處理則是對異常數據進行剔除和清理來獲得高價值性信息。剔除的數據主要是短時間內同1輛車在同1個門架連續通過2次及以上的數據即同架進出、同1輛車通過前1個門架的交易時間晚于后1個門架的交易時間的數據、車輛通過門架時交易失敗的數據以及一段連續時間內所有車輛速度異常的數據即擁堵情況數據和超速情況數據。
通過ETC門架運營樁號計算相鄰門架的距離,對比相鄰門架的ETC數據,確定同1輛車通過相鄰門架的時間差,車輛的行程速度即為門架距離與相鄰門架時間差的比值,計算式為
Tij=(ti-tj)×86 400
(1)
Vij=(Lij×1 000)/Tij×3.6
(2)
式中:Tij為通過門架i與門架j的時間差,s;ti為1輛車通過門架i的瞬時時間;tj為同1輛車通過門架j的瞬時時間;Vij為ETC門架i與j之間的行程速度,km/h;Lij為ETC門架i與j之間的距離,km。式中,一天24 h換算成以秒為單位即為86 400 s,將ETC原始數據時間格式乘以86 400轉換成以秒為單位的數值格式。
將水江—南川區段和石龍-接龍區段全車型行程速度進行匯總,為保證組數在20組左右,選擇3 km/h為區間大小進行頻數分布計算,樣本數據出現在各個小區間的頻率與區間大小的比值即為相對頻率,用Origin軟件中Gauss函數對頻率分布直方圖進行擬合,所有車型擬合的R2均大于0.9。部分典型車型(一型客車、三型客車、四型客車、一型貨車、三型貨車、六型貨車)行程速度頻率分布直方圖如圖2和圖3所示,從中可得到:

表1 ETC原始數據字段信息Table 1 ETC raw data field information

圖2 平緩路段部分車型行程速度頻率分布直方圖Fig.2 Histogram frequency distribution diagram of travel speed of some types of vehicles in the gentle section
(1)一型客車行程速度在水江—南川區段和石龍-接龍區段都近似正態分布,但在石龍-接龍區段更為集中,平緩路段一型客車由于汽車性能較好速度較高,連續下坡路段,一型客車受到其他重型車輛阻滯,在保證安全行駛條件下低速車輛較多。
(2)三型客車和四型客車速度在水江—南川區段表現為中間高度集中,兩側分布較少,在石龍-接龍區段呈現出中間較為集中,兩側分布較多,由于三型客車和四型客車為大型載客營運車輛,駕駛員由于個體差異性導致車輛速度存在較快和較慢這種離散性的影響。
(3)貨車在石龍—接龍區段高速車輛的比例逐漸降低,速度在50~60 km/h和40~50 km/h區間的低速車輛比例逐漸增加,表現為中間速度分布較少兩側速度分布較多。相較于平緩路段,貨車在連續下坡路段一般會低檔位行駛且需頻繁制動,行程速度整體表現為低速行駛,但高速公路任有大部分貨車速度低于60 km/h,誘發安全風險。
將水江—南川區段和石龍—接龍區段全車型行程速度頻率分布直方圖擬合曲線匯總,可看出在平緩路段和連續下坡路段不同車型之間的速度分布存在明顯差異。

圖3 連續下坡路段部分車型行程速度頻率分布直方圖Fig.3 Histogram frequency distribution diagram of travel speed of some types of vehicles in the continuous downhill section
如圖4所示,在平緩路段時,一型客車速度分布較分散,三型客車和四型客車速度分布高度集中,四類客車相對頻率峰值點對應的速度差值最大為8.1 km/h,說明大型客車與一型客車速度差異很大。除一型貨車以外其他五類貨車行程速度分布差異較小,一型貨車和六型貨車相對頻率峰值點對應的速度差值最大,為6.1 km/h。如圖5所示,在連續下坡路段時,四類客車速度分布較為分散,四類客車相對頻率峰值點對應的速度差值最大為6.4 km/h,說明大型客車與一型客車速度差異較小。六類貨車行程速度分布呈現出階梯型變化,一型貨車行程速度分布較分散,六型貨車與三型貨車行程速度分布接近,其他三類貨車分布相似,一型貨車和六型貨車相對頻率峰值點對應的速度差值最大,為7.7 km/h。
由此可得:平緩路段客車速度分布差異較大,貨車速度分布差異較小,而連續下坡路段客車速度分布差異減小,貨車速度分布差異增大,說明路段線形和車輛類型對車輛行程速度分布有較大影響,尤其是大型貨車。

圖4 平緩路段車輛行程速度相對頻率分布Fig.4 Probability distribution of vehicle travel speed in the gentle section

圖5 連續下坡路段車輛行程速度相對頻率分布Fig.5 Probability distribution of vehicle travel speed in the continuous downhill section
由頻數分布得出每個速度區間對應的累計頻率分布值,用Origin軟件中高斯函數對散點值擬合,所有車型擬合的R2均大于0.9,擬合是成功的。繪制水江-南川區段和石龍-接龍區段所有車型行程速度的累計頻率分布擬合曲線,如圖6和圖7所示,部分車型行程速度累計頻率曲線幾乎重合,說明部分車型速度分布有較大的相似性。
平緩路段三型客車和四型客車速度分布差異較小,二型~五型貨車速度分布十分相似;連續下坡路段二型客車和三型客車速度分布幾何重合,三型貨車和六型貨車速度分布差異較小。連續下坡路段一型客車由于其他慢行車輛阻滯故行程速度會受到較大影響;三型客車和四型客車屬于大型營運客車,駕駛員技術熟練、經驗豐富且路線確定熟識道路環境,受到線形的限制較小,傾向于將速度維持在1個穩定的幅值且不斷向期望車速靠近。由于連續下坡,貨車司機為了保證行車安全會采取頻繁制動,貨車速度不斷降低,尤其三型貨車和六型貨車明顯降低,載重貨車在連續下坡路段由于超載、滿載和空載條件下速度有所不同。

圖6 平緩路段車輛行程速度累計頻率分布Fig.6 Cumulative frequency distribution of vehicle travel speed in gentle road section

圖7 連續下坡路段車輛行程速度累計頻率分布Fig.7 Cumulative frequency distribution of vehicle travel speed in continuous downhill section
不同線形路段下,全車型行程速度的特征值如表2所示,數據可為路段不同車型限速值的確定提供數據支撐。平緩路段平均速度在66.36~82.19 km/h,標準差在6.53~12.90 km/h,連續下坡路段平均速度在59.17~74.53 km/h,標準差在8.1~11.61 km/h。同一線形路段下,客車和貨車行程速度百分位值變化近似為直線變化,說明部分車型的百分位速度差異較小。在連續下坡路段,客車的百分位速度值依次低于對應平緩路段的百分位速度值,而貨車百分位速度值有所交錯,三型貨車和六型貨車在連續下坡路段的85分位速度值V85低于在平緩路段的50分位速度值V50,說明三型貨車和六型貨車在連續下坡路段受到道路線形影響更為明顯。
各車型間的速度分布特征值呈現出差異性,部分車型的平均值和標準差表現出一定的聚集性。第85%分位速度V85指觀測路段一種車型的行程速度中,有85%車輛速度都低于或等于該值,常用作道路最高限速;第15%分位速度V15則是指15%車輛速度都低于或等于該值,多用為道路最低限速。交通流中各車之間的行駛速度與車流平均速度差值越大,車速分布越離散,事故發生概率越高[16]。用第85%分位速度V85與第15%分位速度V15差值可表示車速離散度,相較于平緩路段,連續下坡路段車速離散度增大,事故發生率增大。
通過分析行程速度分布特征,發現不同線形路段下ETC系統中各車型之間行程速度有一定差異性和聚集性。由此,采用基于歐式距離的K-means聚類方法對ETC系統中現有車型進行聚類分析,根據不同線形路段速度特征分布實現不同線形路段下車型的再分類。
K-means聚類是基于劃分算法聚類的,對大數據樣本有較高的效率,根據計算樣本與初始簇類中心的歐式距離來歸納各簇類下的所屬樣本,不斷迭代,以實現計算樣本與其歸屬的簇類中心的距離平方和最小為目標,表達式為

表2 全車型行程速度分布特征值Table 2 Characteristic value of whole vehicle travel speed distribution

(3)

(4)
式中:d()為計算樣本與簇類中心的歐式距離;(xi,yi)為簇類中心;(xj,yj)為計算樣本;Emin為簇內樣本距離平方和最小值;k為簇類個數;Ci為第i個簇類的中心點。
由3.1節分析,速度平均值能較穩定地表征不同車型的整體速度分布,速度標準差可以表示車輛速度偏離平均速度的程度,不同線形路段下各車型行程速度的平均值和標準差表現為一定的差異性和聚集性,將其作為聚類指標。
為保證最終聚類的實現,根據各車型交通量動態選擇各車型聚類點數量,確定各車型的分組步長。將每種車型的速度值進行等量分組來計算每組速度值的平均值和標準差作為1個聚類點,將所有車型分組之后得到的聚類點匯總如表3所示。
K-means聚類方法以簇內樣本距離平方和最小化為目標,用簇內方差作為聚類準則函數,方差越小,聚類效果越準確。首先用SPSS中系統聚類方法得到指標聚類譜系圖,根據譜系圖得到聚類數k值大致范圍:水江-南川區段為[2,5], 石龍—接龍區段為[2,4]。將不同的k值作為聚類數進行聚類,經過比較,水江-南川區段當簇內樣本距離平方和為8.593時為最小,此時k值取4;石龍-接龍區段當簇內樣本距離平方和為13.044時為最小,此時k值取3。確定平緩路段各車型聚類為四類、連續下坡路段各車型聚類為三類較為合理。
平緩路段各車型聚為4類,連續下坡路段各車型聚為3類,聚類結果如圖8和表4所示。
在平緩路段,一型客車與其他車型分布差異較大;三型客車和四型客車分布較為集中且更靠近貨車,由于這類大型營運車輛在道路線形較好的平緩路段,駕駛員技術熟練、經驗豐富且熟悉路線環境將速度保持為一個穩定的幅值;貨車整體表現為速度向降低發展,離散性不斷增大。
連續下坡路段車輛速度較平緩路段有所降低,多數駕駛員更傾向于控制速度以安全通行,由于路段為雙向四車道一型客車受到其他慢行車輛阻滯,速度呈現向低速發展,整體速度離散性降低。三型客車和四型客車分布靠近一型客車,大型營運客車由于駕駛員駕駛風格的差異,部分駕駛員仍傾向于向期望車速靠近[17],部分駕駛員則保持低速行駛,整體速度離散性增大。一型客車與大型客車混行嚴重,超車需求增加,換道頻繁,易引發追尾等交通事故。貨車整體表現為速度往增大方向發展,離散性不斷增大,三型貨車和六型貨車車輛速度低于60 km/h較多,誘發安全風險。二型客車包括營運性和非營運性,駕駛員駕駛風格不同,速度分布較分散車輛之間離散性較大。輕型貨車(一型貨車和二型貨車)速度分布與其他車型差異較大,是城市間和短途貨運使用較廣泛的車型,速度分布離散性偏大。

表3 全車型聚類分組結果Table 3 Whole vehicle clustering grouping results

圖8 車型聚類結果散點Fig.8 Types of vehicles clustering results scatter plot

表4 車型聚類結果Table 4 Types of vehicles clustering results
該分類結果可為連續下坡路段運行速度研究提供理論基礎,同時對山區高速公路不同線形路段所有車型的精細化管理、同類別車型限速值選擇提供一定理論依據和數據支撐。
通過收集包茂高速水江至南彭段主線ETC數據,分析了水江—南川區段(平緩路段)和石龍-接龍區段(連續下坡路段)ETC系統中全部車型的行程速度分布特征,利用K-means聚類方法對兩種線形路段下的全部車型進行了分類,結論如下。
(1)同種車型在不同線形路段上的行程速度分布有明顯差異,三型客車和四型客車在平緩路段傾向于維持一個穩定的速度幅值,而在連續下坡路段部分駕駛員仍向期望車速靠近,部分駕駛員則保持穩定車速;貨車在連續下坡路段整體為低速行駛,但有部分車輛速度低于60 km/h,造成安全隱患。因此在山區高速公路對于不同線形路段應該有不同的安全速度管理。
(2)不同車型在同種線形路段上的行程速度分布差異較大,客車在平緩路段速度分布較分散,在連續下坡路段則分布相對集中;貨車在平緩路段速度分布相對集中,而在連續下坡路段速度分布較分散,說明在山區高速公路上對車輛分車型進行速度管理是有必要的。
(3)較平緩路段,除三型客車和四型客車外其他車型在連續下坡路段的行程速度和標準差都有所降低,說明連續下坡路段速度離散性比平緩路段更大,增加了事故發生的概率,說明在山區高速公路對連續下坡路段進行不同車型進行速度管理和分類是有需要的。
(4)不同車型之間速度分布存在差異性,部分車型行程速度的平均值和標準差有較大的相似性和聚集性,選擇兩者作為聚類指標,用K-means聚類方法對山區高速公路平緩路段和連續下坡路段的ETC系統中全部車型進行車型分類。平緩路段的車型分為四類:一型客車;二型客車和一型貨車;三型客車和四型客車;二~六型貨車。連續下坡路段的車型分為三類:一型客車和三型客車和四型客車;二型客車和一型貨車;二~六型貨車。基于ETC系統中全車型的行程速度分布特征對車型進行分類分析得到的結果,可為山區高速公路設計車型的選擇和不同線形路段車輛精細化管理提供參考和借鑒。