趙辰浩
(長安大學 汽車學院,陜西 西安 710064))
無人駕駛汽車(Automatic Vehicle, AV)作為近幾十年來學術界和工業界最有前途的主題之一,有望以各種方式改變世界的未來。隨著自動駕駛技術的發展,出現了混合交通的城市環境,在這種環境中,無人駕駛汽車必須與人類駕駛的車輛進行交互。在無人駕駛與人為駕駛的互動中,如何避免由無人駕駛引起的交通事故已成為人們關注的研究領域。通常,無人駕駛汽車必須在動態和不確定的環境中做出決策。不確定性源于以下事實:無法直接測量駕駛員的意圖。本文將從無人駕駛汽車中的駕駛行為描述、駕駛行為預測算法、駕駛策略三個方面來介紹當前無人駕駛中的典型駕駛行為預測模型。
為了使駕駛行為預測模型易于求解,需要將一定交通場景中目標車輛的駕駛行為進行歸納和分類,進而區分并量化不同的駕駛行為,使得處理后的駕駛行為作為參數可以滿足預測模型的要求。因此,本文將駕駛行為的描述歸納為主觀定義、有限狀態機和軌跡特征三種方法。
主觀定義是指基于人為駕駛經驗對駕駛行為進行分類與描述。如文獻[1]中,將駕駛行為分為:直行(Lane Keep, LK),向左轉車道( Lane Change Left, LCL),向右轉車道(Lane Change Right, LCR),向右轉(Turn Right, TR),向左轉(Turn Left, TL),在交叉路口(Go Straight, GS)直行,在停車線前停下(Stop before the Stop line, SS)。而文獻[2]則是將駕駛行為以形容詞分為:侵略的,魯莽的,有威脅的,小心的,謹慎的,保守的,同時設計了一個問卷調查以確定人們對以這些不同程度駕駛行為的認可度,并用主成分分析法找出在一般交通場景下的常見駕駛行為。
有限狀態機是指將復雜的行為在某一時刻描述為一個有限狀態集中的某一狀態,且不同狀態之間在一定觸發條件下可以發生轉換,如圖 1所示。

圖1 車輛行為的有限狀態機示意圖
文獻[3]將駕駛行為描述成一個有限狀態機。這一有限狀態機描述了五種一般駕駛行為:直行,左變道,右變道,左轉,右轉。在一般道路交通條件下,無人車輛始終保持直行狀態,在有變道或轉向需求的條件下,無人駕駛車輛會切換至變道或轉向狀態,并執行相應的駕駛策略;當脫離具有變道或轉向的交通條件時,無人駕駛車輛會切換回一般行駛狀態,即直行狀態。
軌跡特征是指通過目標車輛在一段時間內行駛軌跡的特點來描述其駕駛行為。文獻[2]中定義了一組軌跡的特征,以此形成軌跡到行為的映射,10個候選特征。分別用—定義了相對于前車的平均速度;相對于后車的平均速度;相對于左車道的車輛的相對速度;相對于右車道的車輛的平均相對速度;與鄰居的相對速度;平均速度;與前車的距離;縱向加速度;漸進加速度和車道中心跟隨度。
在對駕駛行為進行描述并合理量化后,需要將其作為參數代入到預測模型來估計目標車輛之后一段時間內可能的駕駛行為。
文獻[1]建立了一個 Oontology模型,將道路場景細分為車道區、交叉路口區等不同區域,從而使不同交通場景作為參數易于代入模型參與運算。于是建立由隱藏狀態、觀測值、狀態轉移矩陣、發射概率矩陣、初始概率分布矩陣組成的隱馬爾科夫模型(Hidden Markov Model,HMM)(,,,,,)。提取不同場景下駕駛行為的觀察值,并將其用于訓練HMM。應用K-means算法對訓練數據聚類并估計高斯函數的初始分布。接著,應用Baum-Welch算法來估計最大似然HMM參數,即

通過式(1)可由λ確定一個HMM模型,再使用前向算法,測試每個選定模型λ,以估計模型對給定觀測值的擬合程度P(O|λ)以預測接下來目標車輛的駕駛行為。
在駕駛行為預測模型中,所有參數估計與行為預測最終都是為了給駕駛策略的制定提供參考。駕駛策略制定思路有很多,本文歸納了三種典型方法進行介紹。
AutonoVi規劃算法分多個步驟進行。首先,使用圖搜索在道路網絡上規劃路線。其次,將交通規則和車道遵循規則結合起來,為車輛的下一個規劃階段創建一條引導路徑。轉換該引導路徑以生成一組候選控制輸入。使用數據驅動的車輛動力學模型以及通過擴展控制障礙物的無碰撞導航,可以評估這些控件的動態可行性。使用優化算法對那些剩余的軌跡進行評估,以確定下一個執行周期最合適的一種控制策略。如圖2所示。

圖2 車輛行為的有限狀態機(FSM)流程圖
文獻[2]根據已有視頻資料中不同車輛的駕駛軌跡定義了10種駕駛風格特征,并設計了問卷調查人們對不同目標車輛的駕駛風格所需的注意力。結果表明,過于激進的駕駛行為需要投入更多的注意力,而相對保守的駕駛風格則注意力需求較少。由不同的注意力需求,文獻[2]在文獻[3]研究的基礎上改進了AutonoVi規劃算法,重點分析了識別駕駛員行為的優勢以及這些行為如何確保安全導航,并通過使用駕駛員行為識別算法和駕駛軌跡映射展示了其性能的提高。AutonoVi是基于數據驅動的車輛動力學模型和基于優化的路徑規劃,該規劃策略從一組可能的候選對象中生成一組有利的軌跡,并使用優化在這組軌跡中進行選擇。如圖3及圖4所示。

圖3 簡單場景的注意力需求

圖4 復雜場景的注意力需求
自2006年以來,深度學習方法被廣泛應用于各個領域如自動駕駛等領域,以提高這些領域的技術水平和實踐水平。文獻[4]利用卷積神經網絡(Convolutional Neural Networks,CNN)與全連接網絡(Fully Connected Neural Network,FCN)和長短期記憶網絡(Long Short-Term Memory,LSTM)組合,基于駕駛數據的先驗知識建立新的深層神經網絡,訓練出應對不同道路條件的駕駛策略,而后通過在模擬軌道測試,對比了應用不同組合網絡的無人車在模擬形式軌道的偏移量,結果發現 Inception+LSTM+FCN結構的深層神經網絡效果最好,在數據集上的準確度是86.94%,在驗證集的準確度是85.67%。
本文概述了目前無人駕駛車輛中的典型駕駛行為預測模型,在駕駛行為描述方面,主觀定義的方法是基于一般人為駕駛經驗對駕駛行為進行分類和描述的,此方法可以應對一般道路情景;在駕駛行為預測算法方面,隱馬爾可夫模型的預測效果由隱狀態與顯狀態決定;在駕駛策略的制定方面,基于不同目標車輛的注意力需求來規劃行駛路徑的方法要求足夠精確地獲取目標車輛的行駛軌跡;在駕駛行為預測模型未來的發展中,可以進一步考慮應用計算機視覺的方法,采用雙目或深度相機收集數據,雖然在精度上不如激光雷達,但可縮減研發成本,其設備也便于安裝,具有一定普適性。