張效宇 趙祥磊 楊科



摘 要:行為決策系統在很大程度上反映了自動駕駛汽車的智能化水平,作為自動駕駛汽車的大腦,行為決策系統決定了自動駕駛車輛的可行性和安全性。文章基于行車效率與行車安全對高速自動駕駛汽車的智能決策進行了研究。通過引入能效函數與動態子區域監測系統,實時計算本車道與相鄰車道的行車能效值以及本車與周邊車輛的碰撞風險,并基于此確定最優駕駛策略,一定程度上提升了自動駕駛車輛的行車效率與安全。
關鍵詞:智能駕駛;決策;安全;效率
Abstract: The Principal objective of this work is to study intelligent decision for highway automated driving. The Proposed framework develops, implements and tests a framework for intelligent decision based on efficiency and safety. It considers the vehicle-around situation based on a state space with eight subareas, which makes the real-time assessment for current traffic situation possible and efficiency. Based on the proposed framework, realistic simulation has also been carried out and presented. Results show that the intelligent decision based on the proposed framework is feasible and effective.
前言
作為自動駕駛車輛智能化水平的重要體現,智能決策系統在自動駕駛中起著至關重要的作用。近年來,隨著人工智能及環境感知技術的快速發展,智能駕駛的相關研究也取得了長足進步。但是在面對真實復雜的駕駛環境及多樣的交通狀況時,人們對汽車自動駕駛的安全性要求仍在不斷提高,這些對智能駕駛的決策提出了更大的挑戰。本文的研究重點則是基于現有的車輛感知信息及實際的道路狀況,考慮基于行車安全和行車效率的智能駕駛決策。
本質上講,智能決策的好壞很大程度體現為對本車周圍目標信息的準確判斷上,其具體的實施可以從兩方面來考慮,即戰略和戰術。戰略層面更多的是基于規則去判斷該怎么走或走哪條道,而戰術層面則更多的是考慮車流交通等實時信息,從而更高效更安全的完成任務。換句話說,戰略層面更多的是結合已有的固定信息,如導航軌跡,高精度地圖的車道信息等對車輛進行運動軌跡的約束,而戰術層面則更多的考慮本車周圍的實時交通流信息,實時的進行車輛決策控制,因此其在實際應用時具有更強的靈活性,這也是本文研究的重點。
1 決策模型的建立
智能決策中一個很重要的問題就是安全問題,即避免車輛在運行過程中與其它車輛發生碰撞風險。碰撞風險主要從兩個維度去考慮[1]:
一是本車與前車距離,即主要考慮兩車之間的時間距離與理想時間距離tHW的比值:
式中:XTrgt,VTrgt分別表示目標車輛與本車的距離以及目標車輛的絕對速度。VEgo表示本車速度。tRatio本質上反映了本車與目標車的距離的接近程度。
二是本車為避免與目標車碰撞時所需的減速程度,即本車所需的減速度與其所能接受的最大減速度之比(參見式(2))。 當避免碰撞所需的最大減速度超過了所設定的臨界閾值時即認為有碰撞風險。BRatio本質上反映了碰撞的危險程度,其中Bd max表示本車所能接受的最大減速度。
通過對這兩個特征參數的實時監控,可知道本車與周邊車輛的實時碰撞風險并在決策中加以防范。
除了上述提及的駕駛安全風險,實際的決策過程還應考慮如下幾方面的決策屬性:即行車效率和駕駛舒適性。行車效率主要考慮本車當前速度與駕駛員期望速度的偏差,研究表明,駕駛員在行車途中,總是期望以最快的速度到達預期的終點[2]。駕駛舒適性則主要考慮車輛在跟隨軌跡過程中可能產生的側向加速度及橫擺角速度等變量,此部分主要在路徑規劃時考慮,本文基于決策的角度暫不考慮駕駛舒適性指標的影響。 鑒于此,本文主要考慮以下幾個方面的決策屬性:
(1)智能駕駛車輛距離本車道內前方最近車輛的距離X0;
(2)智能駕駛車輛與道路左側車道內障礙物的距離X1;
(3)智能駕駛車輛與道路右側車道內障礙物的距離X2;
(4)目標車道的最高限速Vmax;
(5)駕駛員設定速度與本車當前車速的偏差。
為了能夠實時比較不同車道的車流信息并進行基于安全和效率的決策判斷,本文引入了如下的“能效函數”,其中U1反映了系統的行車效率,U2和U3則從安全性角度進行考量。通過對安全和效率兩指標的定量分析,可實現對車道行車信息的實時比較,假定:
式(7)反映了碰撞的危險程度,但其未考慮制動減速度的限制,若進一步考慮制動減速度的要求,可用式(2)替換。
至此,基于效率和安全的能效函數構建完畢,考慮如上所述的能效函數U1,U2和U3并進行權重分析,引入權重系數ωi得到總的能效函數U。
此能效值反應了當前時刻本車道的評判情況,通過比較不同車道的能效值,可實時判斷出當前的最優駕駛決策。
為能更客觀的比較,能效函數還應考慮未來時刻及歷史時刻的值,以保證決策的連續性[3]。未來能效函數的計算取決于傳感器本身對本車當前周邊環境的感知信息(包括障礙物距離,速度等)并進行推測,假定某一時刻車輛感知所得的周邊系統狀態信息為Xk,則下一時刻車輛的周邊系統狀態信息可表述為:
其中Pk表示預測的車輛運動狀態,如車輛在駛出高速匝道口時,可以提前預測其在下一時刻會進入匝道旁邊相鄰的車道上。
再考慮歷史時刻的能效值,本車在當前車道的變道能效函數可用式(10)表示,式中Wk表示權重系數。 權重系數的引入可實現能效值對歷史和未來的權重調節。需要注意的是,能效函數對歷史值的平均可使決策的變化變得平緩,但另一方面也會引入一定的遲滯,因此式(10)中人為引入了控制因子δk,通過設定δk為0,可重置系統的記憶。此外,式中引入1-Uk-n, past表示系統的不滿意度,即如果當前的能效函數不是最優的,且在一定時間內沒有改變,系統的能效值會逐漸降低至零,當不滿意度累積到一定程度時,系統決策便會基于周邊的交通流做出相應的改變[4]。
2 碰撞風險的概率評估
實際中由于傳感器本身特性的限制以及駕駛環境的復雜性,上述特征參數所涉及的變量未必能準確反映實際情況(比如傳感器檢測的目標車輛速度并不一定是實際的速度,而是帶有一定噪聲信號的隨機信號,另外由于融合算法導致的測量不準確性在實際測量中也時常會有體現),因此可引入隨機變量并進行碰撞風險的概率估計[1][3][5]。
上述兩式可對實際道路上任意兩車的碰撞概率進行評估。需要注意的是,實際計算時需對上式概率形式進行離散化處理,通過比較累積概率,決策會選擇安全性相對較高的駕駛策略并執行。
3 決策算法實現的架構流程
圖1給出了能效函數的總體算法框架,即系統首先根據車身傳感器等外部信息進行能效函數的計算并對比確定各車道能效值的高低,此能效值的高低反映了理想狀況下的車流信息,實際應用時還需考慮車道邊界及車道線虛實等限制條件,因此基于效率和安全的能效值還需進一步經過規則約束模塊做進一步的判斷直至最終輸出。 例如系統經過能效計算確定左側車道能效最高,但是此刻車道線為實線,則左側車道的能效值將被直接賦0。
以上基于安全和效率的能效函數在一定程度上實現了全自動駕駛的車道智能選擇,在實際執行時,除了考慮以上所描述的部分,本車還得實時監控周邊的交通流信息(如左右側盲區內是否有危險車輛),以免發生碰撞風險。因此,決策模塊有必要對本車周圍的車輛信息做進一步評估。文獻[6]中給出了一種基于勢場的連續狀態空間產生法并基于此狀態空間進行車輛的行駛決策,然而此法由于實時性較差,并不適合用于實際的測試。
文獻[3]給出了一種相對簡單的方法,即全狀態空間法。該方法將車身周邊劃分成8個子區域,然后分別對每個子區域進行實時監控并給出相關信息以供決策參考。
如圖2所示,本車周邊的8個子區域分別為1-前方,2-左前方,3-右前方,4-左側,5-右側,6-左后方,7-后方,8-右后方。其中 1,2,3,7為固定區域,其橫向寬度的選取主要考慮實際車道的寬度。4,5,6,8為動態區域,其區域長度與實際的車速相關。
實際運行時,車輛周邊的8個子區域會實時監控本區域的車輛狀況,當有車輛在本區域出現且該車輛與本車有碰撞風險時,本區域會給出標志位1,反之則為0。對應的8個標志位會被存入一個8維數組以供決策使用。
綜上,基于安全和效率的智能決策大體流程如下:
(1)首先基于導航,高精度地圖等信息,系統進行大類決策,即判斷當前可行駛車道;
(2)如果基于導航和高精度地圖判斷當前可沿本車道行駛,則系統會基于效率和安全自動比較當前車流狀況以及左右兩側可行使車道情況并判斷是否需要變道干預;
(3)若基于智能決策判斷需要變道,則系統會自動進行變道環境檢測。整個決策流程可參見圖3。
4? 決策模型的測試驗證
圖4給出了一組基于上述方法的實測數據分析圖,圖中,棕色車輛表示本車,其余顏色的車輛表示環境感知模塊識別的周圍車輛。本車當前車速為9.3 m/s,以本車前保中心為坐標原點,前向為正。 圖示各目標車輛的中心點距離及速度分別為ID1(38.4m,10.4m/s),ID2(23.9m,8.4m/s),ID3(-18m,9.1m/s),ID4(3.3m,10.4m/s),ID5(17.8m,10.24m/s)。
基于當前信息,可計算出此刻本車與左側車輛ID4有碰撞風險,因此決策層會給出禁止向左變道的提示。 從圖右側基于模型計算出來的危險評估列表來看,模型的危險分析與實際情況一致。另一方面,基于安全和效率的能效函數會計算出此刻右側車道的行車效率大于本車車道,因此系統會給出建議右轉的智能決策,查子區域風險表得右轉風險為0,進而給出車輛右轉的決策。
當本車變道或是彎道行駛時,情況會變得相對復雜,此時需要進行空間坐標變換或是借助高精度地圖、V2X等獲得更多的信息以用于決策。
5 結論
本文基于行車效率和行車安全兩方面對自動駕駛的智能決策進行了研究,通過實時對比交通流的信息,智能選擇最適合本車的行駛車道,有效的提升了自動駕駛車輛的行車效率與安全。在實際的交通流環境中,還需進一步考慮本車在變道過程中可能面臨的復雜場景,例如,智能決策判斷當前應該向左側變道且變道無風險,于是本車開始執行變道,但是變道還未完成時,軌跡道路上突然出現風險車輛,此時智能決策則需要重新決策去規避風險,這也是本文下一步要進行的工作。
參考文獻
[1] Niehaus,Stengel. Rule-Based Guidance for Vehicle Highway Driving in the Presence of Uncertainty[C]. American Control Conference. IEEE,2009.
[2] 陳佳佳.城市環境下無人駕駛車輛決策系統研究[D].中國科學技術大學, 2014.
[3] Ardelt M, Coester C, Kaempchen N. Highly Automated Driving on Freeways in Real Traffic Using a Probabilistic Framework[J]. IEEE Transactions on Intelligent Transportation Systems, 2012, 13(4): 1576-1585.
[4] Ardelt M, Waldmann P, Homm F, et al. Strategic Decision-Making Process in Advanced Driver Assistance Systems[C]. Advances in Automotive Control. 2010:566-571.
[5] Ulbrich S, Maurer M. Probabilistic online POMDP decision making for lane changes in fully automated driving[C]. International IEEE Conference on Intelligent Transportation Systems. IEEE, 2013.
[6] Reichardt D. Kontinuierliche Verhaltenssteuerung eines autonomen Fahrzeugs in dynamischer Umgebung[D].Universit?t Kaiserslautern, 1996.