付斌 朱煦晗 涂寧寧
(嵐圖汽車科技有限公司,武漢 430000)
主題詞:智能汽車 換道決策 XGBoost 貝葉斯優化
換道決策是智能駕駛車輛換道過程中非常重要的一環,也是智能駕駛領域的重點研究方向。國內外很多學者針對智能駕駛汽車換道決策模型開展了深入研究。目前,可以將換道決策模型分為基于規則的模型和基于人工智能的模型。
基于規則的模型即人工建立一系列換道規則,從而作出換道決策,但其無法適應復雜的交通道路條件。人工智能算法具有強大的學習能力和分類能力,基于人工智能算法的換道模型成為主流研究方向。其中,神經網絡經過訓練后可以很好地模擬人類的決策過程,因此被廣泛應用。Hunt 等[1]首次將神經網絡模型引入車輛換道決策過程,并證明了其可行性。Dumbuya 等[2]建立了一個三次網絡的網絡數據聚合(Networks Data Aggregation,NDA)模型,通過車輛位置、速度及交通車的信息即可輸出換道主車的目標速度和方向。Meng 等[3]建立了分類回歸樹(Classification and Regression Tree,CART)模型對駕駛員的換道行為進行預測。Dou等[4]利用支持向量機(Support Vector Machine,SVM)和神經網絡建立了高速車輛換道決策模型。Schubert 等[5]將貝葉斯網絡(Bayesian Network,BN)用于換道決策模型中;Motamedidehkordi 等[6]建立了基于隨機森林(Random Forest,RF)的換道決策模型。目前,相比于基于規則的決策模型,基于人工智能的換道決策模型決策準確率大幅提升,但其模型單一,缺少參數尋優過程,決策準確率仍有提升空間。本文基于貝葉斯優化算法來優化XGBoost模型的超參數,以進一步提高模型的決策準確率。
美國交通運輸部門的NGSIM(Next Generation Simulation)計劃提供了5組數據集,其中I-80和US-101為高速數據集,本文選取這2 個數據集作為研究對象,提取換道數據。圖1所示為I-80數據的采集路段[7]。

圖1 I-80數據采集路段示意
NGSIM 中的數據在采集過程中并未采用高精度定位,所以數據中存在一定的錯誤和誤差,故本文采用Thiemann 提出的對稱指數移動平均濾波(symmetric Exponential Moving Average filter,sEMA)算法[8]對數據進行平滑處理。sEMA算法的公式為:

式中,xa(ti)、高高高高(ti),i∈[1,Na]分別為車輛a在ti時刻的測量值、擬合值;Na為車輛a軌跡數據點的數量;D=min{3,i-1,Na-1}為考慮數據邊界的平滑窗口寬度;Δ=T/dt為平滑寬度;dt=0.1 s為采樣頻率;T為平滑區域的采樣時間寬度,其取值隨濾波數據類別x的不同而不同,當x對應位置、速度、加速度數據時,T分別取0.5 s、1.0 s、4.0 s;。
本文針對I-80數據集中的第1882號車輛數據進行濾波處理,距離、速度、加速度如圖2所示。

圖2 1882號車行駛狀態信息濾波結果
本文研究智能駕駛汽車的換道行為,因此需從US-101 和I-80 數據集中提取有效的換道片段供訓練模型使用。Wang 等[9]研究發現,車輛的換道時間通常小于20 s,因此可認為一個完整的換道過程時間為20 s,以車輛所在車道發生變化的時刻為中心時刻,向前、向后各取10 s,作為換道軌跡片段。此外,并非所有換道過程數據均可使用,在US-101和I-80中有些換道點靠前或靠后,導致前10 s 或后10 s 并沒有完整的10 s 數據,故將滿足條件T0-10>Tstart且T0+10<Tend的換道軌跡視為有效換道軌跡,其中T0為車道編號變化的時刻,Tstart為換道起始時刻,Tend為換道終止時刻。圖3 展示了數據中有些車輛雖然發生了換道,但換道軌跡不完整的情況。

圖3 不完整的換道軌跡
此外,仍存在某些換道不成功的軌跡,本文采用KMeans聚類算法進行換道軌跡的聚類,進而從中分離出可用的換道軌跡。令第i段軌跡的橫向位移為一維列向量Xi=(xi(1),xi(2),…,xi(N)),其中xi(k)為第i段軌跡在第k個時間點的車輛橫向位移坐標,考慮到NGSIM 數據集的采樣周期是0.1 s,所以N=200。
聚類前對軌跡進行標準化處理,并計算其間的歐氏距離:

2個軌跡之間的歐式距離可以表征其相似度,歐式距離小于相應閾值,表明2個軌跡屬于同一類軌跡,KMeans計算聚類差異值的公式為:

式中,X為當前計算的某一條換道軌跡;μ為聚類的中心集;μk為第k類的聚類中心;n為聚類的軌跡數量。
通過K-Means的聚類,可以分離出換道成功的軌跡和換道失敗的軌跡,如圖4 所示,該聚類結果是I-80 數據中17:00~17:15之間換道的數據。

圖4 換道軌跡聚類結果
提取到可用換道軌跡后,還需提取換道的起始點,本文結合車輛換道時的橫向位移變化和橫向速度閾值來確定車輛換道的起始點。在判斷換道起點時,以NGSIM數據集中車輛車道信息變化的時刻點為基礎,向前回溯至車輛的橫向加速度極值點,再以此點作為第2基礎點向后追溯,直到車輛的橫向加速度大于0.2 m/s2,本文以此點作為換道起始點,如圖5所示。

圖5 換道起點判斷示意
車輛的換道行為受到多方因素的影響,不僅包括自車的速度、加速度等,還包括交通車的運動狀態等。車輛換道過程如圖6所示。

圖6 車輛自由換道行為示意
現有的換道決策算法中,對于換道決策變量的選取不同,本文結合其他文獻,選取共17 個換道決策變量,可以包含自車和交通車的行駛狀態:換道主車速度vs、換道主車加速度as、當前車道前車與主車的縱向距離df=yf-ys、主車與當前車道前車的速度差Δvf=vs-vf、主車與當前車道前車的加速度差Δaf=as-af、主車與當前車道前車的碰撞時間tf=(yf-ys)/(vs-vf)、當前車道后車與主車的縱向距離dr=yr-ys、主車與當前車道后車的速度差Δvr=vsvr、主車與當前車道后車的加速度差Δar=as-ar、目標車道前車與主車的縱向距離dtf=ytf-ys、主車與目標車道前車的速度差Δvtf=vs-vtf、主車與目標車道前車的加速度差Δatf=as-atf、主車與目標車道前車的碰撞時間ttf=(ytf-ys)/(vs-vtf)、目標車道后車與主車的縱向距離dtr=ytr-ys、主車與目標車道后車的速度差Δvtr=vs-vtr、主車與目標車道后車的加速度差Δatr=as-atr、主車與目標車道后車的碰撞時間ttr=(ytr-ys)/(vs-vtr)。其中,yf、vf、af分別為當前車道前車縱向坐標、速度、加速度,ys為主車縱向坐標,yr、vr、ar分別為當前車道后車縱向坐標、速度、加速度,ytf、vtf、atf分別為目標車道前車縱向坐標、速度、加速度,ytr、vtr、atr分別為目標車道后車縱向坐標、速度、加速度。
本文選取Chen[10]提出的重要性評價指標F-score對不同的決策變量進行重要性分析排序,其具體計算公式為:

F-score 越大,說明該特征作為決策變量的辨別能力越強,其對決策行為貢獻程度越大。通過計算Fscore得到這17個變量的重要性如圖7所示。

圖7 特征變量的F-score分數
貝葉斯優化算法可以縮短優化時間,適合解決非凸問題,其計算過程為:
1:fort=1,2,…do
2:最大化采集函數,得到下一個采樣點:xt=argmaxμ(x|D1:t-1)
3:求得采樣點處的函數值yt=f(xt)
4:更新樣本集合D1:t={D1:t-1,(xt,yt)},并更新函數f的后驗分布
5:end
在XGBoost決策模型中,有許多超參數可以自行設定,本文采用貝葉斯優化算法對XGBoost的部分超參數進行尋優,需尋優的超參數如表1所示。

表1 XGboost需要尋優的超參數
貝葉斯尋優算法的迭代次數設定為50次,XGBoost超參數優化過程如圖8 所示,隨著迭代次數的增多,接受者操作特性(Receiver Operating Characteristic,ROC)曲線的曲線下面積(Area Under Curve,AUC)逐漸升高且趨于穩定。

圖8 基于貝葉斯優化的XGBoost超參數優化過程
經過貝葉斯優化算法優化后,XGBoost 的超參數的最優值如表2所示。

表2 最優超參數
將超參數帶入XGBoost模型進行驗證,可以得到其交叉驗證的曲線如圖9所示。
在圖9 中,優化后測試集的AUC 顯著提升,且其與優化后的訓練集之差也明顯小于未經優化的訓練集和測試集之差。其結果表明,優化后,XGBoost 模型的過擬合現象降低,可以有效預測未知數據,泛化能力提升。

圖9 XGBoost交叉驗證曲線
本文選取經貝葉斯優化的XGBoost 決策模型進行測試,同時與未經優化的XGBoost 模型、支持向量機模型、隨機森林模型和決策樹模型進行比較分析。帶入相同的換道訓練樣本集,可以得到不同決策模型在測試集中的ROC 曲線,如圖10 所示,其中假正類率表示模型預測為正類但實際為負類的樣本占所有實際為負類的樣本的比例,真正類率表示模型預測為正類且實際也為正類的樣本占所有實際為正類的樣本的比例。ROC 曲線下包絡的面積即AUC,AUC 越高,其預測效果越好。本文設計的貝葉斯優化的XGBoost 決策模型的AUC值為0.925。

圖10 不同方法的預測ROC曲線
其不同換道決策模型的性能測試參數如表3所示。

表3 不同換道決策模型性能參數
對以上的換道決策模型進行比較,可以明顯看出,經過貝葉斯優化的XGBoost 換道決策模型在各項指標上均由于其他換道決策模型,提升約4%。
本文基于NGSIM數據集進行換道訓練測試數據的提取,選取XGBoost 決策模型設計換道決策算法,以貝葉斯優化算法來優化XGBoost決策模型的超參數,在模型的訓練過程中,充分考慮了換道的實際情況,選取了自車和其他交通車等多項運動參數作為決策變量,最終訓練出的模型在US-101 和I-80 數據集中決策精確率和準確率均在90%以上,本文設計的換道決策模型可為智能駕駛汽車自主換道設計提供參考。