冀杰 黃巖軍 李云伍 吳飛
(1.西南大學,重慶 400715;2.滑鐵盧大學,加拿大 安大略省 N2L3G1)
主題詞:智能車輛 自動駕駛 有限狀態(tài)機 危險勢能場 行為決策
駕駛行為決策是智能車輛研究領域的關鍵問題之一,也是自動駕駛系統(tǒng)智能化水平的重要體現。在實際道路交通環(huán)境中,智能車輛所面臨的駕駛環(huán)境和交通狀況存在多樣性、隨機性和不準確性等特征,而人們對車輛自動駕駛的安全性和實時性要求不斷提高,這對駕駛行為決策系統(tǒng)提出了巨大挑戰(zhàn)[1-2]。因此,設計能夠滿足復雜道路工況要求的自動駕駛行為決策系統(tǒng)對智能車輛研究具有重要的理論意義和應用價值。
自上世紀80年代以來,隨著環(huán)境感知及智能控制技術的不斷發(fā)展,移動機器人相關研究取得了飛躍式進展并涌現出了許多行為決策方法,包括神經網絡決策方法、馬爾科夫決策方法、貝葉斯網絡決策方法以及模糊決策方法等[3-5]。然而,上述決策方法大多對控制單元的計算能力要求較高且與駕駛員的實際駕駛行為決策方式存在較大的差異。因此,上述方法難以直接應用于智能車輛的駕駛行為決策系統(tǒng)中[6]。
近年來,有限狀態(tài)機(Finite State Machine,FSM)技術的興起和應用為智能車輛自動駕駛行為決策提供了新的思路[7]。例如,熊光明等人提出了一種智能車輛交叉口行為預測與控制方法,并建立了相應的有限狀態(tài)機模型,從而對交叉口其他車輛的行為進行了準確預測[8];熊璐等人基于分層決策思想和有限狀態(tài)機理論設計了差動轉向無人車的整車控制策略,從而有效地實現了無人車各運動模式間的切換[9];馮關明等人基于有限狀態(tài)機理論和模糊邏輯控制理論設計了具有主動安全性的汽車自適應巡航控制(Adaptive Cruise Control,ACC)系統(tǒng),使車輛在加速行駛、車輛跟蹤和制動減速等行駛工況下保持跟蹤性和適應性[10]。從上述文獻可以看出,有限狀態(tài)機理論可用于實現交叉路口行為預測、差別轉向以及自適應巡航等部分自動駕駛功能。但是,如果利用有限狀態(tài)機方法實現復雜道路工況下的自動駕駛行為決策,則需考慮車輛運動學以及動力學特性對駕駛行為決策的影響,同時,需基于實際道路交通狀況,對各狀態(tài)之間的切換依據進行定量分析。
因此,本研究將對智能車輛的典型自動駕駛行為進行分析和分解,并基于有限狀態(tài)機理論設計面向結構化道路環(huán)境的智能車輛自動駕駛行為決策系統(tǒng)。同時,構建能夠反映實際道路交通狀況的虛擬危險勢能場,并依據勢能場對自動駕駛行為決策依據進行定量分析。最終,通過MATLAB/CarSim聯合仿真及比例道路模型試驗對上述理論進行驗證。
對于智能車輛的自動駕駛行為決策而言,需要根據當前的道路環(huán)境感知信息以及自身運動狀態(tài),對車輛周圍的道路交通危險態(tài)勢進行準確判斷,同時,要依據自動駕駛任務目標以及安全行駛行為準則,在不同的駕駛行為模式之間作出及時準確的決策[11]。因此,對智能車輛的主要自動駕駛行為進行分析是進行決策的重要前提。
智能車輛自動駕駛運動過程如圖1所示,由圖1可以看出,當智能車輛在結構化道路環(huán)境下行駛時,根據車輛在行駛過程中的不同運動狀態(tài),可將自動駕駛過程分解為4種基本的駕駛行為模式。主要包括:
a.車道保持行為(A)。自動駕駛系統(tǒng)采取的一種缺省模式,指智能車輛始終沿所在車道行駛的行為。
b.車輛跟隨行為(B)。根據所在車道前方車輛的行駛狀態(tài)信息,通過控制油門或制動踏板,自適應調整智能車輛的行駛速度,使之以安全間距跟蹤前方車輛行駛。
c.車道變換行為(C)。當智能車輛所在車道不具備通行條件時,從所在車道切換到相鄰車道行駛的過程。根據目標車道的不同可以分為主車道切換至超車道和超車道切換至主車道兩種情況。
d.制動避撞行為(D)。當智能車輛前方出現緊急或者意外危險情況且不具備車道變換條件時,智能車輛要采取緊急制動行為,避免與前方障礙物或車輛發(fā)生碰撞。

圖1 智能車輛的自動駕駛行為
從以上分析可以看出,智能車輛的各駕駛行為模式之間是相互關聯的,通過其相互間的實時切換,可在結構化道路上實現主要的自動駕駛功能。根據智能車輛所在車道以及相鄰車道上的車輛運動狀態(tài)信息和障礙物信息,可以確定自動駕駛行為決策的基本觸發(fā)條件,如表1所示。

表1 基本觸發(fā)條件信息
對智能車輛在不同車道上的自動駕駛行為模式(A、B、C、D)進行細分,并與表1所示的自動駕駛行為決策觸發(fā)條件進行組合,得到如圖2所示的決策及模式切換示意圖。從圖2可以看出,當智能車輛在結構化道路上進行自動駕駛時,各種駕駛行為模式之間存在多種切換動作,每一種切換動作的執(zhí)行條件由不同的觸發(fā)信息組合而成。
自動駕駛行為決策過程是一種非連續(xù)的狀態(tài)表達形式,采用傳統(tǒng)數學模型難以有效解決此類問題,而有限狀態(tài)機是用來研究有限個狀態(tài)的計算及這些狀態(tài)之間的轉移和動作等行為的離散數學模型[12]。因此,構建自動駕駛系統(tǒng)的行為決策有限狀態(tài)機表達式為:式中,T為狀態(tài)機中所有自動駕駛行為模式的集合;E為各狀態(tài)所能接收的所有輸入的集合,即引起駕駛行為模式狀態(tài)轉換的觸發(fā)條件集合;δ為狀態(tài)轉移函數,δ:T×E→T;t0∈T為自動駕駛行為初始狀態(tài);F?T為自動駕駛行為終止狀態(tài)集合。


圖2 自動駕駛行為模式切換過程
對于智能車輛而言,基本駕駛行為模式(T)之間的切換主要由自動駕駛任務決定,它屬于外部事件(E)觸發(fā)的系統(tǒng)對象。自動駕駛系統(tǒng)的初始狀態(tài)t0=A(主)是在主車道上執(zhí)行定速車道保持模式(即缺省模式),而終止狀態(tài)F則表示脫離自動駕駛并轉為人工駕駛模式。根據不同車道上的實際道路工況,有限狀態(tài)集合T可細分為6種有限駕駛行為狀態(tài),即T={A(主),A(超),B,C(主),C(超),D},如圖2所示;駕駛行為模式之間的觸發(fā)事件主要取決于主車道和超車道上的車輛運動狀態(tài),即E={a1,a2,a3,b1,b2,c1,c2,d1,d2},如表1所示;狀態(tài)轉移函數表示智能車輛在接收到不同的狀態(tài)觸發(fā)信息時,從一個駕駛行為模式轉移到另一個駕駛行為模式的規(guī)則,可以看作狀態(tài)轉移規(guī)則集合。
根據自動駕駛系統(tǒng)的行為決策模式分析以及人工勢能場基本理論,利用MATLAB軟件的Stateflow設計開發(fā)工具箱,構建如圖3所示的有限狀態(tài)機仿真模型,從而對智能車輛自動駕駛行為模式的決策過程進行圖形化描述。
通過對有限狀態(tài)機模型的五元組進行定性分析可知,輸入集合及狀態(tài)轉移函數是實現自動駕駛行為決策的關鍵。因此,基于危險勢能場理論對有限狀態(tài)機的觸發(fā)條件和狀態(tài)轉移函數進行定量分析[13-14]。

圖3 自動駕駛行為決策有限狀態(tài)機模型
對智能車輛所在的道路環(huán)境進行參數化建模和區(qū)域劃分,如圖4所示。圖4中,分別以道路寬度和長度方向為X軸和Y軸建立道路坐標系,Lw和Lc分別為車輛危險勢能場的寬度和長度,(Xo,Yo)為其他車輛的幾何中心在道路坐標系下的位置,PF、PL分別為智能車輛位置和相鄰車道上對應位置的勢能場。設定智能車輛所在車道前方Lc/2范圍內的區(qū)域為制動避撞區(qū)域,保證車輛有足夠的空間和時間用于主動制動并避免發(fā)生碰撞;智能車輛所在車道前方Lc/2~Lc范圍內為車輛跟隨區(qū)域,用于實現自適應跟蹤功能;而智能車輛相鄰車道的前、后Lc范圍為車道變換區(qū)域,該區(qū)域的中心位置可用于判斷是否具備車道變換條件。當智能車輛位于超車道時,相應的區(qū)域劃分沿兩車道間的中心線左右互換。

圖4 危險勢能場區(qū)域劃分
根據上述道路區(qū)域劃分以及其他車輛的行駛工況信息,利用三角函數及指數函數構建三維虛擬危險勢能場,并基于該勢能場對狀態(tài)轉換觸發(fā)條件進行定量分析。該勢能場P(X,Y)主要由道路危險勢能Pr(X,Y)和車輛危險勢能Po(X,Y)共同構成:

當劃分的各區(qū)域內無其他車輛行駛時,構建的道路危險勢能場應保證車輛能夠在當前車道上行駛(即自動駕駛行為缺省模式)。
為實現該目標,設定道路兩側的危險勢能為1,主車道和超車道中心線的危險勢能均為0,兩車道中間的危險勢能為Pm,取值范圍為0<Pm<1,道路中心及兩側的勢能場保證了車輛在車道中心行駛時的危險勢能最小,進而實現車道保持的功能。
利用三角函數構建道路危險勢能場為:

式中,A(X)為道路危險勢能幅值隨道路寬度的變化參數:

式中,Xz和Xc分別為主車道和超車道中心線的橫向坐標。
將道路的結構參數Lw、Xz、Xc以及道路中心危險勢能Pm代入式(3),可得到道路上不同橫向位置的三維虛擬危險勢能值,如圖5所示。

圖5 道路危險勢能場(Pm=0.5)
以其他車輛的幾何中心坐標(Xo,Yo)為原點,利用人工勢場理論中的斥力場指數函數構建三維虛擬危險勢能場為:

式中,c1和c2分別為危險勢能在道路寬度和長度方向上的變化系數,兩個系數直接影響障礙物危險勢能場的三維結構。
c1應盡量不影響相鄰車道中心線上的道路危險勢能場,從而保證車輛在相鄰車道上能夠執(zhí)行車道保持功能:

c2是智能車輛主動制動避撞以及車輛跟隨駕駛行為決策的觸發(fā)條件依據,可根據智能車輛的最大制動減速度及車輛跟隨距離的需要確定:

式中,P1為車輛跟蹤勢能閾值;P3為車道變換勢能閾值。
c1和c2確定后帶入式(5)即可獲得如圖6所示的其他車輛三維虛擬危險勢能場。

圖6 其他車輛三維虛擬危險勢能場
根據式(5)和圖6可知,車輛幾何中心處的斥力場值最大,即P0(X0,Y0)=1。隨著與(Xo,Yo)間的距離不斷增加,危險勢能場的值也不斷變小。
將構建的道路和車輛危險勢能場進行疊加并以此確定車輛自動駕駛行為的狀態(tài)轉移規(guī)則。如圖4所示,選擇智能車輛位置的勢能場PF作為車輛跟隨及主動避撞行為的決策變量,相鄰車道上對應位置的勢能場PL作為車道變換行為的決策變量。
根據上述道路區(qū)域劃分以及決策閾值的確定,得到智能車輛不同自動駕駛行為模式的執(zhí)行依據如表2所示。表2中,P1、P2和P3分別為自動駕駛的車輛跟蹤、制動避撞及車道變換的勢能閾值;VL和V1分別為前方車輛速度及跟蹤速度閾值;TV和T1分別為車道變換過程持續(xù)的時間及時間閾值。

表2 行為決策執(zhí)行依據
基于實際道路的結構參數以及車輛的典型運動特性,利用MATLAB/CarSim軟件構建自動駕駛行為決策過程的聯合仿真模型,如圖7所示。
表3列出了三維虛擬危險勢能場的主要參數和數值,并設定了智能車輛以及其他車輛在道路坐標系下的初始位置和初始速度。另外,假設其他車輛的速度隨時間變化的趨勢如圖8所示。

圖7 聯合仿真系統(tǒng)模型

表3 聯合仿真系統(tǒng)主要參數

圖8 其他車輛的速度曲線
將上述道路交通狀況帶入聯合仿真模型,得到PF和PL的變化曲線如圖9所示。根據道路坐標系下的危險勢能場三維模型,制定有限狀態(tài)機的狀態(tài)觸發(fā)條件,從而獲得智能車輛的自動駕駛行為模式實時決策情況以及車輛速度變化曲線,如圖10和圖11所示。

圖9 PF和PL位置的勢能場

圖10 自動駕駛系統(tǒng)行為模式

圖11 智能車輛速度變化曲線
從仿真結果可以看出,在0~5.0 s仿真范圍內,智能車輛所在車道上的危險勢能PF始終小于車輛跟隨模式的觸發(fā)閾值(如圖12a所示)。根據表2所示的決策執(zhí)行依據,該工況下不論PL如何變化,智能車輛始終執(zhí)行車道保持行為模式(即缺省模式)。

圖12 車道保持及車輛跟隨模式下的危險勢能場
在第5.0~11.0 s仿真范圍內,隨著智能車輛與前方車輛不斷接近(如圖13中寬線所示),PF大于車輛跟隨決策閾值且小于制動避撞決策閾值,同時,PL大于車道變換決策閾值(見圖12b),車輛進入跟隨駕駛行為模式。
在第11.0~16.0 s仿真范圍內,隨著相鄰車道上其他車輛與智能車輛的距離不斷增大,PL逐漸小于車道變換決策閾值,智能車輛進入車道變換駕駛行為模式并持續(xù)5 s。在此過程中,車輛與所在車道前方車輛的最小間距為49.8 m,能夠有效保證車輛的主動安全性,如圖13所示。車道變換完成后,所在車道與相鄰車道的區(qū)域劃分互換。

圖13 智能車輛與其他車輛的間距
當智能車輛在超車道上行駛時(即第16.0~26.5 s仿真范圍),根據所在車道及相鄰車道上的危險勢能場變化情況,智能車輛分別完成了車道保持模式、車輛跟蹤模式。當被控車輛與前方車輛的間距為33.5 m時(見圖13),PL小于決策閾值時(見圖14a),觸發(fā)車道變換模式并于第31.5 s時刻切換到主車道行駛(見圖10)。

圖14 車道變換及制動避撞模式下的危險勢能場
智能車輛從超車道變換到主車道后,道路前方的車輛速度逐漸降低并于第34 s時刻靜止;另外,由于PL始終大于車道變換決策閾值,不具備車道變換條件(如圖14b所示)。因此,智能車輛于第34.71 s時刻進入主動制動避撞駕駛行為模式,并在距離前方車輛18.1 m的處制動停車(如圖13中第40 s處寬線所示),從而保證了智能車輛的主動避撞安全性。
在微縮比例為1∶20的道路交通環(huán)境下,基于機器視覺算法及無線通信技術,建立具有靜態(tài)障礙物道路工況下的危險勢能場,并對自動駕駛行為決策過程進行試驗驗證,如圖15所示。

圖15 比例道路試驗模型
在比例道路模型試驗場景下,利用固定在上方的攝像頭獲得道路環(huán)境及車輛模型運動的實時圖像信息并進行信號分析,如圖16所示。首先,通過Hough變換算法獲得道路場景圖像中的邊緣直線坐標信息;接著,利用SURF算法對道路環(huán)境中的障礙物特征信息進行提取并匹配,獲得障礙物的坐標信息;最后,根據道路邊緣及障礙物的坐標信息,利用本文提出的方法構建實時的虛擬危險勢能場三維圖像,并將危險勢能場的等高線圖像疊加到原始的比例道路交通場景中,從而為自動駕駛行為決策提供道路交通場景的定量信息,并為自動駕駛行為狀態(tài)轉移提供判斷依據。

圖16 障礙物及道路邊界信息感知
另外,自動駕駛行為決策功能的實現,還需要實時獲取車輛模型在三維虛擬危險勢能場中的位置信息。在本試驗場景中,由于比例道路模型上的障礙物為靜態(tài),車輛模型是圖像中唯一運動的物體。采用機器視覺領域中較為成熟的高斯混合模型(Gaussian Mixture Model)法對道路工況視頻圖像進行運動目標檢測,能夠準確獲得智能小車在道路模型中的坐標信息,如圖17所示。

圖17 基于高斯混合模型法的車輛模型檢測
利用MATLAB軟件中的Computer Vision System工具箱計算出車輛模型在道路坐標系下的坐標信息,將其與危險勢能場信息一起導入自動駕駛行為決策系統(tǒng)。利用前文設計的有限狀態(tài)機方法,實時確定車輛模型的自動駕駛行為狀態(tài)。另外,計算機與車輛模型之間通過無線傳輸模塊APC220進行實時通信。利用MATLAB軟件的Instrument Control Toolbox以及Simulink Support Package for Arduino Hardware相關命令,將計算得到的前輪轉向角度信息傳遞到車輛模型的APC220接收器中。車輛模型上的Arduino控制器根據APC220的無線信號控制前輪舵機的轉向角和直流電機的速度,并形成閉環(huán)控制回路,如圖18所示。最終,控制車輛模型實現主動避撞的自動駕駛行為決策。

圖18 無線通信及控制系統(tǒng)
Simulink仿真模型采用Arduino模塊作為外部時鐘,保證試驗過程的實時性。分別完成6次自動駕駛行為決策試驗,對車輛模型的運動軌跡進行記錄,并求取軌跡平均值,如圖19所示,6次試驗均能有效避開障礙物并回到原車道,證明了駕駛行為決策系統(tǒng)的有效性。

圖19 車輛模型運動軌跡試驗結果
基于有限狀態(tài)機理論構建的智能車輛自動駕駛行為決策系統(tǒng),可將復雜的自動駕駛過程分解為有限個駕駛行為模式,并根據實時虛擬危險勢能場進行駕駛行為模式決策,從而實現多車輛道路環(huán)境下的自動駕駛功能。
本文構建的三維虛擬危險勢能場能夠對道路上的實時交通狀況進行綜合描述和定量評估,通過分析關鍵位置的危險勢能場觸發(fā)閾值,可為自動駕駛系統(tǒng)的有限駕駛行為狀態(tài)提供轉換執(zhí)行依據。
本文主要為了驗證智能車輛自動駕駛行為決策系統(tǒng)的有效性和安全性,未充分考慮整個道路交通環(huán)境下的通行效率和駕乘舒適性,另外,本研究采用的無線通信模式也需要通過實車試驗進一步驗證。今后的工作將利用車-車、車-路互聯技術提高自動駕駛行為決策系統(tǒng)的信息維度以及整個道路的通行能力。