何東 趙茂杰 王梓楠
(重慶交通大學,重慶 400074)
高速混行環境下,自動駕駛車輛可以通過車聯網技術實時共享彼此的駕駛意圖,理解當前的行駛環境,但是人工駕駛汽車無法與車聯網發生相關信息的交換,自動駕駛汽車只能通過人工駕駛汽車外在的行為特征對駕駛員的意圖(直行、左換道、右換道等)進行推斷。
目前,駕駛意圖識別方法可以分為基于傳統機器學習的駕駛意圖識別方法和基于深度學習的駕駛意圖識別方法。在基于深度學習的方法中,神經網絡模型和長短時記憶(Long Short-Term Memory,LSTM)網絡模型應用較為廣泛[1]。Huang 等[2]將深度學習神經網絡(Deep-Learning Neural Network,DNN)應用于換道行為辨識,對復雜的換道行為特征進行有效擬合,但DNN對時序特征的捕捉能力較弱,因此近年來該模型關注度較低。LSTM 網絡因其具有強烈的時序捕捉能力,十分貼合駕駛意圖識別的應用場景,是當前研究者關注的重點[3]。Phillips 等[4]通過對采集的十字路口交通數據使用LSTM 搭建意圖識別模型,實現對左轉、右轉和直行意圖的預測,驗證了LSTM網絡對真實采集時序數據特征的捕捉能力。黃玲等[5]提出了一種高速公路人機混行環境下基于LSTM神經網絡的換道意圖識別模型,該模型在人機混行環境下對車輛換道行為具有較高的識別精度,其改進在于引入均方根傳播(Root Mean Square propagation,RMSpro)算法優化神經網絡的超參數,以規避人工調參帶來的影響。惠飛等[6]使用雙向長短時記憶(Bidirectional Long Short-Term Memory,Bi LSTM)網絡模型識別駕駛行為中的異常狀態,將Bi LSTM 與全連接神經網絡(Fully Connected Neural Network,FCNN)相結合,充分發揮了二者的優勢。
從研究進程和相應的指標來看,深度學習模型總體表現優于傳統機器學習模型。以LSTM 模型為代表的深度學習模型以強大的擬合能力與對時間序列特征的捕捉能力使其在駕駛意圖識別上的表現整體強于傳統機器學習模型。然而,部分研究還存在周圍車輛交互特征考慮不足、忽視駕駛風格、人工調參困難等問題。
本文提出一種基于改進Bi LSTM 網絡的駕駛意圖識別模型,以目標車輛軌跡序列、駕駛風格、周圍車輛的交互特征作為模型的輸入,并使用鯨魚優化算法對模型的超參數進行尋優來規避人工調參。最后對NGSIM數據集的數據進行處理、驗證,證明該模型在車輛駕駛意圖識別方面具有較高的準確性。
LSTM 神經網絡是循環神經網絡(Recurrent Neural Networks,RNN)的一類變種,相較于RNN,它通過引入“門”結構和細胞概念控制信息的流動,從而克服了困擾RNN 的梯度爆炸及梯度消失問題。該網絡最基本的單元結構如圖1 所示,它與RNN 的區別在于,該單元結構中存在遺忘門(Forget Gate)、更新門(Input Gate)、輸出門(Output Gate)3 種特殊的“門”結構以及用于儲存和傳遞之前時刻狀態信息的細胞(Cell)結構,以實現信息的流通[7]。圖1 中,xt為當前時刻t的輸入,ht、Ct分別為t時刻的輸出信息和存儲在細胞中的狀態信息為輸入門對輸入xt進行信息更新后產生的新的輸入向量,σ為sigmoid 激活函數,ft、it、Ot分別為遺忘門、輸入門、輸出門,wf、wi、wo分別為遺忘門、輸入門、輸出門的權重系數,wc為(t-1)時刻與t時刻的連接權重系數。

圖1 LSTM基本單元結構
LSTM 雖然解決了RNN 存在的問題,但它自身只能利用過去的特征信息,而忽略了未來的信息,故在此基礎上誕生了Bi LSTM 神經網絡[8]。該模型包含2個獨立的LSTM網絡,模型所需的參數分別以正向和反向的形式輸入到2個LSTM網絡中,然后將2 個網絡提取出的特征向量進行拼接獲得模型最終特征向量,經過正向和反向的特征提取,最終的拼接向量同時擁有過去和未來的信息,其結構流程如圖2 所示。為正向運算過程為反向運算過程:

圖2 Bi LSTM結構流程
式中,f為激活函數為t時刻正向LSTM 網絡的輸出分別為正向偏置和權重為t時刻反向LSTM網絡的輸出分別為反向偏置和權重。
將正向LSTM 網絡及反向LSTM 網絡的輸出向量拼接在一起,即為Bi LSTM網絡的輸出:
本文基于Bi LSTM 網絡搭建駕駛意圖識別模型,模型架構如圖3所示。

圖3 Bi LSTM駕駛意圖識別模型
圖3中,時間序列輸入層將Xt=(x1,x2,x3,…,xt)分別輸入正向和反向LSTM 網絡,序列中的每一個時刻t的輸入xt在該模型中都會獲得正向輸出和反向輸出再進行拼接獲得向量將xt'輸入到全連接層中獲得輸出yt=wxt'+b,其中w、b為全連接層的權重和偏置。將yt輸入SoftMax 層,通過激活函數獲得t時刻輸入的左換道、右換道、直行3 種類別各自的概率,然后使用分類層將概率最大的類別輸出,作為當前時刻的駕駛意圖。
Bi LSTM 網絡的超參數對模型的性能影響較大,隱含層節點數、學習率是其中重要的超參數指標。隱含層節點數越多,模型的性能越好,精度也會越高,但需要的計算資源會越大,也越耗時,且節點數超過一定閾值后反而會降低模型的性能,但節點數過小則可能不會收斂,準確率也會降低;學習率的選擇決定模型能否收斂,學習率過大時模型難以收斂,學習率過小時模型訓練耗時更長,且可能陷入“局部最優”陷阱。
正確選擇隱含層節點數和學習率既可以提高訓練速度,也能提高模型精度。因此,為獲取這2個超參數的最優解,本文使用鯨魚優化算法(Whale Optimization Algorithm,WOA)對Bi LSTM 的損失函數進行尋優,算法迭代曲線收斂且損失函數結果最小時對應的超參數即為最優解。WOA Bi-LSTM 的算法流程如圖4所示。其中,p為行為選擇概率,X(t)為t時刻鯨魚所處的位置,X*(t)為最佳包圍位置,Xrand(t)為當前隨機鯨魚個體的位置,D、D'、D"分別為當前鯨魚個體與最佳個體、最佳包圍位置、隨機鯨魚個體之間的距離,A、C分別為權重系數,b為常量系數,l為[-1,1]區間上的隨機數。

圖4 WOA-Bi LSTM 算法流程
鯨魚優化算法通過模擬鯨魚族群的捕獵行為來更新優化參數,該算法包括包圍獵物、攻擊獵物和隨機搜尋獵物3 個環節[9]。每條鯨魚的位置都代表一個可行解,對于N個待優化參數,可將鯨魚的位置設定為X=(x1,x2,x3,…,xN)。
使用WOA 模型對Bi LSTM 網絡的損失函數進行尋優。優化算法的迭代次數均設置為50次,優化器均使用Adam,損失函數設為交叉熵,WOA- Bi LSTM 模型中的鯨魚種群數設為30 個,迭代次數設為20 次,Bi LSTM 網絡的輸入為目標車輛的運動狀態特征方程構造的駕駛意圖數據集;根據WOA 模型迭代收斂的輸出結果,適應度曲線收斂時的適應度對應的鯨魚位置向量即為最優解,對應的最優隱含層節點數為82個,最優學習率為0.001 6。
交互場景中通常存在多個交通參與者,自動駕駛汽車會受到周圍車輛間交互的影響,交互特征的選擇對于準確識別人工駕駛車輛的意圖至關重要。考慮到橫向距離對車輛行駛安全的重要性[10],將橫向距離作為交互特征之一引入駕駛意圖識別任務,設li、di分別為第i輛目標車輛與自動駕駛汽車的橫、縱向相對距離,周圍車輛交互特征fsocial可表達為:
式中,xi為第i輛目標車與自動駕駛汽車的橫、縱向相對距離構成的向量。
交互特征描述的是自動駕駛車輛與周圍車輛的交互行為,識別駕駛意圖還需選擇目標車輛的運動狀態特征ft=(v,a,x,y,vy,ay),其中v、a分別為目標車輛的速度、加速度,x、y分別為目標車輛的縱、橫坐標,vy、ay分別為目標車輛的橫向速度、橫向加速度。
不同風格的駕駛員面臨相同駕駛場景時產生的駕駛意圖有所不同,因此,精準識別目標車輛的駕駛意圖還需要引入其駕駛風格特征,其特征向量為:
綜上所述,駕駛意圖識別模型的輸入iv由交互特征、目標車輛運動狀態特征、駕駛風格特征構成:
完成特征參數選取后,需要對NGSIM 數據集中的數據進行篩選并提取相應的特征數據,同時,分類模型是有監督學習模型,需要對駕駛意圖數據進行車輛行為標注。Deo 等[11]針對該問題提出了一種通過時間標定換道行為的方法,首先尋找車輛在換道點的時刻t,然后將車輛處于區間[t-4 s,t+4 s]的車輛行為標定為左、右換道,但Wang 等[12]通過對NGSIM 數據集的觀察發現,許多車輛在t-4 s時刻并未產生換道意圖,仍然處于車道保持狀態,因此直接根據4 s 的時間標定換道行為存在一定誤差。而李文禮等[13]使用橫向位移達到車道寬作為換道完成的標定參數,提高了換道行為標定的準確率。受以上研究的啟發,本文提出一種結合橫向位移的滑動窗口算法對相應數據進行提取并賦予標簽,如圖5所示。

圖5 改進滑動窗口數據提取算法
由圖5可知,改進的數據提取方法定義為:找尋車輛換道點St對應的時刻t,然后提取車輛軌跡序列中t-4 s 和t+4 s 時刻對應的采樣點并計算二者橫向位移的差值。若該差值大于車道寬3.75 m,則將該條軌跡標定為換道成功。若該差值小于3.75 m,則以換道點所在的時刻為中心,在兩端取相互對稱的2 個采樣點S1、S2并計算二者橫向位移的差值,當該差值達到3.75 m 時,則將S1對應的時刻t1定義為換道起始時刻,將S2對應的時刻t2定義為換道結束時刻,落入區間[t1,t2]的采樣點均為換道過程點。
用以上方法對NGSIM 數據集中的數據進行換道行為標定,并采用前文駕駛意圖識別模型進行數據處理,提取時長為4 s的軌跡序列作為試驗時模型的輸入數據,最終共獲取樣本數據23 800 組,其中左換道標簽數據4 977 組、右換道標簽數據6 331組、直行標簽數據12 492 組,按7∶1.5∶1.5 的比例將數據集劃分成訓練集、驗證集和測試集。
選擇使用不同超參數的Bi LSTM 網絡作為試驗對比,網絡的迭代次數均設置為50 次,損失函數均為交叉熵損失函數,各模型參數設置及在訓練集上的訓練耗時和最后一次迭代的準確率如表1 所示。訓練時各模型損失函數下降曲線及準確率上升曲線分別如圖6、圖7所示。

表1 不同超參數網絡訓練集表現

圖6 損失函數下降曲線

圖7 準確率上升曲線
從表1、圖6、圖7中可以看出,WOA-Bi LSTM 在各模型中損失函數最低、收斂速度最快、性能最優。此外,從表1中可以看出,學習率及隱含層節點數對模型的準確率和訓練耗時均有影響。在采用與WOA-Bi LSTM 相同的學習率的條件下,選擇Bi LSTM1 和Bi LSTM2 這2 個不同隱含層節點數的網絡進行訓練時,隱含層節點數增加,模型的準確率提高,但是訓練所需的時間和計算資源也會隨之增加。此外,當隱含層節點數到達一定閾值后,增加隱含層節點數反而可能導致準確率下降,這在WOA-Bi LSTM 和Bi LSTM2 中均有所體現。當選擇與WOA-Bi LSTM 節點數相同的網絡Bi LSTM3、Bi LSTM4 進行訓練時,相較于較小初始學習率的模型,較大初始學習率的模型訓練所需的時間較短,但準確率相對較低。而學習率數值過小,會使網絡陷入局部最優,同樣降低模型的識別準確率,例如Bi LSTM3 網絡。雖然該網絡在損失函數上的表現較為優異,但其識別準確率卻是所有模型中最低的。
綜上所述,選擇合理的隱含層節點數和初始學習率對模型的性能有較大影響。使用優化后的Bi LSTM 對測試集數據進行識別,結果如圖8 所示。其中:前3 行白色方格給出了模型辨識正確的樣本數量和該類駕駛意圖辨識正確的樣本數占測試集總樣本數的比例;深灰色方格給出了模型辨識錯誤的樣本數量和該類駕駛意圖辨識錯誤的樣本數占測試集總樣本數的比例;第4 列淺灰色方格給出了模型對各類駕駛意圖辨識正確的樣本數占該類別駕駛意圖總樣本數的比例;第4 行淺灰色方格給出了該類別駕駛意圖辨識準確率;第4 行白色方格給出了模型在測試集上的總體辨識準確率。

圖8 測試集混淆矩陣
從圖8 中可以看出,模型在測試集上的識別準確率較高,達到97.5%,且模型對右換道數據識別準確率(97.2%)大于左換道數據識別準確率(95.3%),這是因為左換道訓練數據相對于右換道較少,模型在訓練時,對于右換道特征的理解學習強于左換道,但二者的識別準確率均較高,說明模型對于左、右換道識別能力較強。
本文針對高速混行環境下周圍車輛的駕駛意圖識別問題,首先,提出一種結合橫向位移的滑動窗口算法對NGSIM 數據集的數據進行處理、提取并構造駕駛意圖特征數據集,然后基于該數據集提出一種改進雙向長短時記憶網絡駕駛意圖識別模型,并使用鯨魚優化算法對該模型中的學習率和隱含層節點數進行超參數優化,以規避人工調參對模型性能的負面影響。通過對比發現,鯨魚優化算法獲得的最優超參數可有效提高模型的識別準確率。在NGSIM 數據集測試集上,模型的識別準確率達到了97.5%,左、右換道和直行的識別準確率分別為95.3%、97.2%、98.3%,識別耗時為1.35 s,表明該模型能夠實時精確識別駕駛意圖,為周圍車輛的軌跡預測提供幫助。