劉志強,馬進
(江蘇大學汽車與交通工程學院,江蘇鎮江 212013)
近年來有許多通過采集駕駛數據并通過處理后用于駕駛風格的分析與識別。李經緯等[1]運用K-means 算法對駕駛員風格進行識別。吳振昕等[1]利用K 均值和D-S 證據理論決策融合分析搭建了駕駛人識別模型。彭金栓等[2]選取風險感知因子與臨界安全系數為參數構建行人風格識別模型。李立治等[3]基于神經網絡建立的駕駛識別模型。劉志強等[4]基于駕駛人數據建立起隨機森林模型對跟車行為和識別。然而,通過以上建立模型方法對數據的特征提取和分析來確定換道過程中的關鍵特征卻很少,且缺少相似模型的驗證和對比。
該文通過統計分析和時頻分析各駕駛員的換道因素,得到輸入參數并建立基于改進的PSO-SVM 的駕駛人風格辨識模型。為駕駛輔助系統的發展提供有力支持。
該文使用下代仿真(Next Generation Simulation,NGSIM)[5]數據集。NGSIM 的子集US-101 數據集是來自于美國101 號高速公路的車輛軌跡數據,路段車輛軌跡數據的采集間隔時間精度為0.1 s。路段由5條主路車道、1 條集散車道構成,為避免堵塞,選取US-101 路段08:05-08:35 時軌跡數據為宜。
1.2.1 數據清洗和處理
通過Kalman 濾波[6]對采集數據進行清洗處理,主要對車輛橫向位置、速度以及加速度等換道數據進行處理,以1391 號車輛為例,車輛濾波降頻后對比如圖1 所示。

圖1 1391號車輛濾波降頻后對比
1.2.2 數據提取
實驗所提取數據為車輛行駛過程中軌跡數據,具體包括:換道時間、速度、加速度、跟車時距、與前車相對距離等[7];上述提取參數能較為全面地反映駕駛人換道駕駛行為特性,換道特征參數如表1 所示。

表1 換道特征參數
該研究運用K-means 聚類[8]對每位駕駛人換道特征參數進行聚類,可將數據中所采集駕駛員分為激進型、一般型和謹慎型三種風格。激進型、一般型和謹慎型的比例約為2∶7∶5,結果如表2 和圖2 所示。

表2 K-means聚類結果

圖2 聚類結果
1)統計分析
對聚類參數進行統計分析,參數為換道時間、速度、加速度、跟車時距、與前車相對距離的均值,標準差,最大、最小值,其中對有明顯差異的參數進行方差檢驗,對無顯著差異的使用K-W 進行檢驗。統計分析的均值,標準差,最大、最小值的計算公式如下:
其中,i為單獨樣本;xi為換道各樣本參數,n為總樣本數。
K-W 檢驗公式如下:
其中,N是樣本量;Rj是秩和;nj是其測量值;J是樣本組數。
換道時間、速度、加速度、跟車時距、與前車相對距離的均值(95%置信區間內)如表3 所示。

表3 聚類后換道參數分析
從表3 中得到,駕駛人從謹慎型到激進型的平均換道頻次逐漸下降,其中,激進型駕駛員換道行為更趨于快速完成,且換道時間更短,而謹慎型駕駛人換道時的行為數據相反;再者,駕駛人的平均速度與平均加速度呈上升趨勢,可以說明激進型駕駛員的操穩因子和加速因子較大,謹慎型駕駛員反之。最后,駕駛人的平均車頭時距和平均初始與前車相對距離逐漸下降,說明激進型駕駛員更迫切地提前換道,安全性低,謹慎型駕駛員則反之。將統計結果進行K-W檢驗,發現v和x0的中位數差異顯著,各是0.023 和0.532,大于0.01,沒有明顯差異,其他指標都小于0.01,存在差異性,可以看出不同駕駛人的駕駛風格有明顯不同并且符合客觀事實,可用于下一步駕駛風格辨識模型的建立。
2)小波時頻分析
小波變換[9]可對信號的時頻進行精細化處理,如信號f(t),r0為被測小波起點,則其級數展開如下:
其中,r是尺度;t是時間;s是位移,cr0(s)是近似系數、dr(s)是細節系數。是尺度函數,是小波函數。
在三種類型的所有駕駛人中各隨機選取一名駕駛人的速度數據進行小波分析,分別為7 號(謹慎型)、32 號(一般型),50 號(激進型)。采用db4 小波基進行4 層離散小波變換,小波系數重構后,d1-d4分別表示每層的細節系數,a4 為第五層近似系數,重構后的速度小波系數如圖3 所示。

圖3 重構后的速度小波系數
從圖3 中可以看出,三名駕駛人的小波系數存在明顯的差異,體現在不同時段下的振幅具有不同的特點。7 號駕駛人的d1 層細節系數的振幅大小在-0.05~0.05 之間,換道過程速度變化較小,符合謹慎型習性;32 號駕駛人的d1 層細節系數在0~5 s 和35~40 s 過程中變化較大,其他時段相對穩定;50 號駕駛人的d1 層細節系數的振幅大小在-0.4~0.4 之間,換道過程變化較大,符合激進型習性。為深入分析小波系數,現將各駕駛人的小波各層系數繪制為直方圖以便分析,三名駕駛人的近似系數與細節系數的直方圖分布也有所差異,且p為頻數。7 號駕駛人呈現為三峰,32 號駕駛人為中偏雙峰,50 號駕駛人為右偏雙峰狀態。并且各駕駛人的細節系數直方圖分布也存在差異,如圖4-6 所示。

圖4 7號駕駛人頻域分布

圖5 32號駕駛人頻域分布

圖6 50號駕駛人頻域分布
利用SVM[10-11]方法在訓練集上尋找最優分類函數時,將最優函數轉化為尋找超平面之間的最大分類區間問題。且分類問題可以轉化為下列方程:
其中,ω為權重向量和b為偏移向量,訓練樣本為(xi,yi),ξi均表示松弛變量,n表示訓練樣本數量。參數C是可調參數,也稱為懲罰系數,最后得到:
利用粒子群算法尋找最優參數C和內核參數g,得到最優SVM 模型。
在PSO 算法中,該文提出以下策略對粒子的速度和新位置進行更新。
基于慣性權重非線性變化策略,可表達為:
其中,t是迭代數,T是總迭代數,K是權重因子。
基于粒子的最大速度非線性遞減的方法,可表達為:
其中,Vmax與Vmin是最大速度的最大最小值。
改進PSO-SVM 識別模型[12-13]關鍵在于優化兩個關鍵參數,訓練集與測試集取7∶3。構建PSO-SVM模型的具體步驟如圖7 所示。

圖7 算法流程
學習因子設置為c1=1.5和c2=1.7。設置粒子群優化算法的最大迭代次數為50 次。參數的最優適應度和迭代數如圖8 所示。

圖8 迭代曲線
與PSO-SVM 相比,改進后的收斂精度和收斂性能得到了提升。最終訓練得到最優參數C=81.644 8,核參數g=0.1。然后,利用測試集樣本獲得模型的預測精度。訓練集準確率達97.580 6%,測試集準確率達96.25%,說明該模型的準確率較高,如圖9 和圖10 所示。

圖9 訓練集準確率

圖10 測試集準確率
為進一步驗證模型識別預測的效果,引入精確率PPV、召回率TPR 兩個指標來描述該模型[14]。可以看出精確率可達94.5%,召回率可達92.83%,達到了較高的辨識預測效果,混淆矩陣如表4 所示。

表4 混淆矩陣
以不同的換道參數組合作為模型輸入來驗證改進PSO-SVM 模型的識別準確率,并且確定駕駛風格識別模型的最優主成分組合輸入,經過10 折交叉驗證后進行準確率評估。與此同時,將不同參數組合輸入到BP 神經網絡[15]、PSO-SVM、隨機森林[16]、KNN[17-18]中進行訓練,來對比驗證該模型的識別效果。結果如表5 所示。

表5 各參數輸入的模型識別準確率
從表5 中可見,單獨選擇(xthw,L0)組合或者(a,xthw,L0)組合作為模型輸入,識別準確率都不佳,而加入(t,v)或者(t,v,a)組合之后模型的識別準確率明顯提高。因此單一的(t)或者(t,v,a)組合并不能明顯反映駕駛人的換道特性。隨著(t,v)或者(t,v,a,xthw)組合的增加,模型識別準確率也隨之增加。總體上粒子群優化的支持向量機和所選機器學習算法,以(t,v,a,xthw,L0)組合作為輸入時,其模型效果和準確率最高。
基于NGSIM 數據集子集US-101 路段所采集的車輛軌跡數據[19-20],通過聚類后得到謹慎型、一般型、激進型三類駕駛人。通過統計分析和時頻分析可知,所提取的換道特征參數可在不同程度上表征駕駛員的換道特性,符合客觀事實要求。
將不同的換道參數作為特征參數作為輸入,建立基于PSO-SVM 的駕駛人風格辨識模型,精確度可達94.5%,召回率可達92.83%,并且和一些機器學習算法相比較,以(t,v,a,xthw,L0)組合作為特征參數輸入的模型具有更好的辨識精度,準確率可達到96.25%。然而該文在駕駛的換道指標的采集上仍有一定的不足之處,由于數據集的限制,未考慮周圍環境信息與駕駛人等特征指標。對于駕駛人辨識的敏感度還需要進行一步的分析。但是,可以說明在換道工況下借助改進PSO-SVM 模型可以識別駕駛員的風格差異,可以為駕駛人的換道風格識別以及駕駛人的非常態行為辨識的研究提供支持。