熊明強,譙 杰,夏 芹
(1.汽車噪聲振動和安全技術國家重點實驗室,重慶 401122;2.中國汽車工程研究院股份有限公司 重慶 401122)
自動駕駛近年受到全世界廣泛關注[1-10],普遍認為該技術可以有效解決交通擁堵,提高交通安全性[1,6,11]。目前一些自動駕駛廠商已經進行了大規模的道路測試,比如谷歌自動駕駛汽車和蘋果自動駕駛汽車。然而,由于交通系統的復雜性,現在的自動駕駛或多或少都存在著一些安全性問題,導致這些自動駕駛車輛在進行測試時發生了一系列事故,其主要原因是自動駕駛車輛內部的自動駕駛算法不足以應對動態變化的交通環境。據研究[12],目前近三分之一的交通事故是由不安全的換道操作導致的。
利用機器學習進行人類換道執行模型屬于數據驅動模型,其模型參數需要經過大量換道執行數據的訓練而確定。目前,利用機器學習進行人類換道軌跡規劃的研究還很少[13-15],YAO Wen 等[13]將k最近鄰算法應用到換道軌跡規劃中,然而該模型用到的數據量非常有限;考慮到已有的機器學習算法只能預測換道車輛的位置,DING Chenxi 等[14]構建了兩層BP 神經網絡對車輛換道進行實時預測,該模型對NGSIM 數據[16]進行學習,在已有研究的基礎上擴大了數據量。但是,換道數據是一種時間序列,以上兩種機器學習方法只是單一的復制車輛在某個狀態下的位置,并沒有考慮到換道時每個規劃步長之間的換道數據存在聯系[17]。在此基礎上,XIE Dongfan 等[15]構建了LSTM 神經網絡對車輛換道軌跡進行預測,對于人類換道軌跡學習取得了99%以上的精度。盡管都是在對人類換道行為進行學習,但這些研究沒有考慮到換道過程中產生的安全性問題,而基于規則的換道模型對于換道軌跡的數學描述不統一,產生了大量的軌跡曲線方程,比如極坐標多項式軌跡和五次多項式的軌跡等[18-27]。此外,對何種方程可以最佳地描述換道軌跡曲線尚無定論,當前對換道過程的運動學模型描述也有較大的誤差,考慮到現有方法存在的不足,本文對LSTM 神經網絡進行了改造,提出了一種新的基于安全性敏感的改進長短期記憶網絡的自動駕駛換道軌跡規劃模型。
用傳統運動學描述自動駕駛換道軌跡規劃的方式存在著誤差大、無法發現隱形因素之間的關系、不能充分利用真實數據等方面的不足。LSTM[28]神經網絡可以彌補以上不足,且相對其他深度學習方法可以更好地處理時間序列數據,但經典LSTM 神經網絡無法對換道數據的安全性進行判別和校驗,因此選擇LSTM 神經網絡進行改進。傳統LSTM 神經網絡主要由“遺忘門、輸入門、輸出門、狀態”組成,這些“門”結構實際上是全連接神經網絡構成的,如圖1 所示。

圖1 經典LSTM 神經網絡結構
LSTM 神經網絡有著高效的學習優勢,這種神經網絡被認為是研究和預測時間序列極佳的方法,但由于神經網絡中隱層神經元的物理作用不明確,訓練過程不可控,這樣建立的換道軌跡規劃模型可能隱含著人類不良駕駛習慣,最終無法滿足安全性和舒適性的換道要求,所以在傳統LSTM 神經網絡中引入“安全門”,在訓練過程中對數據進行安全性監控和校驗,有目的地提高模型安全性,“安全門”輸入的運動學軌跡包括最優軌跡約束和安全性約束數據,從而提出安全性敏感的自動駕駛換道軌跡規劃LSTM 神經網絡模型,嵌入結構如圖2虛線框所示。

圖2 改進LSTM 神經網絡結構
在這個結構中,神經網絡的輸入數據xt包括換道車輛以及周邊車輛的軌跡數據,xt將會同時被傳遞給各個“門”結構以及嵌入的運動學模型結構,進行神經網絡的迭代訓練。改進之后的LSTM 神經網絡如圖3 所示。

圖3 改進LSTM 神經網絡結構
1.1.1 神經網絡各個部分的計算方式
當前時刻數據傳入長短期記憶網絡時要決定哪些歷史數據需要從細胞狀態ht-1中刪除。這是由遺忘門決定的:

式中:Wf為遺忘門的權重;ht-1為上一時刻神經網絡的狀態;xt為NGSIM 數據中換道軌跡規劃數據;bf為遺忘門的偏置項;σ為一個sigmoid 函數,用于增強神經網絡的非線性擬合能力,其表達式為:

神經元刪除歷史數據后還需決定哪些新的信息需要被存儲進細胞狀態:輸入門中包括一個類似于遺忘門的結構,用于在訓練過程中決定需要更新的數據,然后一個tanh 函數會從當前時刻的輸入數據中確定更新的向量,從而更新到神經元狀態中:

式中:Wi為輸入門中決定遺忘的數據權重;bi為對應的偏置項;~Ct為準備更新的數據矩陣;Wc為更新數據的權重矩陣;bc為更新數據的偏執項。tanh 為雙曲正切函數,同樣用于增強神經網絡的非線性擬合能力,其函數表達式為:

最后決定將要輸出的部分。輸出通過一個sigmoid 函數層來決定Ct中哪些部分需要被更新,然后將Ct經過一個tanh 函數處理(歸一化),并將遺忘門里sigmoid 層的輸出相乘,從而決定輸出,如式(8)所示。

式中:Ot為神經元的預測輸出值;Wo為輸出門的輸出權重;bo為輸出門偏置項。
改進后更安全的原因如下,改進前細胞狀態為:

這樣,更新的數據值很有可能等于遺忘的數據值,如初始狀態[ht-1, 0.5xt]經過遺忘門之后細胞狀態變為[ht-1, 0.5xt],而輸入門更新的數據又恰是0.5xt,那么經過輸入門以后,細胞狀態變回為[ht-1,0.5xt]。顯然,這對于自動駕駛換道的安全性是無法保證的,所以提出的改進LSTM 神經網絡模型彌補了經典LSTM 神經網絡在自動駕駛車輛換道軌跡規劃安全性方面的不足,使訓練過程變得部分可控,改進后的細胞狀態為:

輸出為:

式中:Pt為車輛在運動學模型經過歸一化處理后的動力學輸出值。
經過多次試驗,該模型將改進的LSTM 神經網絡的層數設置為兩層,隱層神經元個數為8 個。輸入變量確定為縱向位置x0,橫向位置y1和速度v0,輸出變量為下一時刻規劃的速度,采取的神經網絡學習率是0.01。
由于車輛行駛過程中要求加速度連續變化,所以自動駕駛換道軌跡所采用的多項式曲線不應少于3次,為了避免多項式曲線次數太高造成的參數求解過于復雜,將多項式曲線確定為三次多項式曲線。其表達式為:

式中:a0、a1、a2、a3為需要后期確定的參數;xn為換道車輛縱向位置;yn為換道車輛橫向位置。
確定各項參數有:

式中:θi為規劃步長起點的航向角。
Gipps 模型[29]是領域內經典的車輛安全距離模型,可以較好地擬合兩輛跟馳車輛之間的行駛狀態,但其將車輛視作質點,沒有考慮車輛的車身長度,所以在經典Gipps 模型的基礎上加入車身長度進行改進,作為三次軌跡曲線的約束條件。
車輛換道過程中受到周圍車輛實時的影響,為了保證換道過程的安全性,需要實時檢測周圍車輛的行駛狀態,并對周圍車輛的行駛狀態進行預測。

式中:j為車輛n-1;xj(t0)和vj分別為當前狀態各個車輛的縱向位置坐標和速度;xj(t)為t時刻車輛j的縱向位置坐標。
Gipps 模型求解的是當前車輛緊急停車時,后車在經過反應時間τ后也采取緊急停車動作,從而不和前車發生碰撞的速度。在經典的Gipps 模型中,車身的長度沒有被考慮到,也沒有考慮到實際跟馳過程中前后兩車的時變速度,針對此情況,對經典Gipps 模型進行改進,如圖4 所示。

圖4 安全距離示意圖
后車緊急制動距離如式(17)和式(18)所示:



使用的是美國聯邦高速公路公布的NGSIM[16]數據。作為高精度且高可靠性實車數據,其被廣泛應用于車輛研究[30-32]。NGSIM 數據包括車輛位置、速度等,非常符合仿真研究的要求。更多詳細的介紹參見相關文獻。數據采集選用的兩段高速公路路段,如圖5 所示。

圖5 NGSIM 高速公路路段示意圖
對于基于LSTM 神經網絡的換道軌跡規劃模型訓練和測試,同樣基于Python 通過深度學習的Tensorflow 框架搭建所需的LSTM 神經網絡。
在迭代過程中,訓練誤差隨著迭代次數的增加而變化的情況如圖6 所示。在迭代次數小于20 次時,訓練誤差下降較快,隨著迭代次數的增加,訓練誤差下降緩慢。迭代次數達到25 次左右時,訓練誤差趨于收斂。因此,將基于LSTM 神經網絡的換道軌跡規劃模型的迭代次數設為30 次。

圖6 迭代次數設為30 次
如圖7 所示,藍色曲線是理想的安全性換道軌跡曲線,黃色曲線是本模型預測的換道軌跡曲線,綠色曲線是真實換道軌跡曲線。由圖可知,經過本模型的訓練和預測,輸出的軌跡曲線更靠近安全性換道軌跡曲線,又保留了一些人類原始換道軌跡曲線的特征且比人類更早地完成了換道。

圖7 神經網絡學習效果
擬用平均絕對誤差(Mean Absolute Error,MAE)以及平均絕對相對誤差(Root Mean Squared Error,MARE)這兩個統計學中常用的統計量對模型進行誤差統計:

式中:N為測試數據樣本數;dr,i為第i輛車的真實值;ds,i為第i輛車的預測值。
針對實際情況,定義如下:MAEreal和MAREreal分別表示預測值與真實值的平均絕對誤差和平均絕對相對誤差,這兩個統計量可以表征實際值和預測值的誤差。
本節對改進LSTM 神經網絡的輸出軌跡和真實軌跡進行誤差統計,結果顯示,兩個統計量數值都比較小,見表1。

表1 誤差對比表
CarSim 是用于車輛動力學的專用仿真軟件,該軟件可以對駕駛員、路面條件以及空氣動力等方面進行仿真輸入,對車輛制動性、穩定性參數等進行輸出。CarSim可以方便靈活地定義試驗環境和試驗過程[33]。
將提出的深度學習模型輸出的車輛軌跡數據作為CarSim 輸入,擬用該軟件對模型軌跡進行可跟蹤性、平穩性等參數的評估。
圖8 顯示了CarSim 在車輛換道成功場景下的換道軌跡、加速度輸出結果的對比。CarSim 對真實換道軌跡跟蹤情況如圖8a 所示,其中紅色曲線為CarSim 仿真軟件對于原始數據的跟蹤結果,藍色曲線為原始軌跡曲線,可以看出CarSim 跟蹤的換道軌跡曲線和真實換道軌跡曲線相對存在較大誤差。CarSim 對本模型預測的換道軌跡曲線的跟蹤情況如圖8b 所示,可以看出CarSim 能較完美地跟蹤本模型輸出的換道軌跡,且軌跡很平滑。CarSim 對真實軌跡的加速度仿真結果如圖8c 所示,可以看出真實軌跡的加速度變化較為劇烈,乘客舒適性體驗不高。CarSim 對本模型輸出軌跡的加速度仿真結果如圖8d 所示,可見相對真實軌跡的加速度變化而言,CarSim 對于本模型軌跡曲線加速度仿真結果更均勻,乘客的舒適性體驗較好。


圖8 CarSim 仿真結果
以研究自動駕駛的車輛換道技術為目的,在自動駕駛領域提出一種改進LSTM 神經網絡的換道軌跡規劃算法。從安全性和效率兩個角度入手建立深度學習換道軌跡規劃模型,改進LSTM 神經網絡模型在一定程度上提高了車輛換道過程的安全性,使車輛一邊學習一邊利用基于規則算法對軌跡進行安全性監督和修正。另外還驗證了改進LSTM 神經網絡模型的舒適性和效率比真實軌跡更高,并通過Python 仿真結果分析了換道車輛和周圍環境車輛對車輛換道過程的影響。雖然常規換道軌跡規劃模型在換道執行過程中對目標軌跡學習精度很高,但是忽略了車輛周圍環境的變化,換道車輛無法對突發情況做出反應,因此在安全性方面還存在不足。得到以下主要結論:
(1)利用本模型可以規劃出一條合適的自動駕駛換道軌跡,且能保證換道車輛更安全、更舒適地完成換道。
(2)在規劃過程中,LSTM-NN 模型可能比人更早完成換道,主要是因為該模型不僅考慮了安全性還考慮了效率。
(3)CarSim 的仿真顯示,提出的模型所規劃出的換道軌跡和速度能夠很好地被自動駕駛跟蹤,車輛行駛穩定性良好。