譚紫陽 高忠文 鄧宇
(1.哈爾濱理工大學,哈爾濱 150080;2.西安交通大學,動力工程多相流國家重點實驗室,西安 710049)
軌跡預測是智能汽車進行可行域判斷的基礎[1]。目前,車輛軌跡預測主要采用基于物理的運動模型(Kinematic Model)和基于機器學習的模型。其中,基于物理的運動模型,如運動學和動力學模型,將車輛視為受物理定律支配的對象,主要控制輸入和車輛狀態[2]。這種預測方法對于短期軌跡預測是相當準確的,但對于長期軌跡預測(超過1 s)不可靠。這是因為沒有考慮駕駛員操縱車輛引起的運動變化,而且機動目標運動軌跡非常復雜,要得到準確目標位置的表達式非常困難,且建立的模型很難與目標的真實運動特性相吻合,預測模型及其方法難以選擇,而且會導致預測位置偏差大,預測精度不夠高。為了解決這個問題,謝彬等提出了一種基于軌跡相似度的軌跡預測算法,在軌跡模式匹配過程中,查詢當前軌跡與歷史軌跡模型的相似度[3]。范文超等針對高斯混合模型的運動目標檢測算法的不足,提出一種基于分塊思想和高斯模型數量自適應的高斯混合算法[4]。
基于機器學習的軌跡預測主要對馬爾科夫模型、概率圖模型[5]、支持向量機模型[6]、神經網絡模型等機器學習模型進行改進,挖掘移動對象歷史軌跡的行為特征,實現移動對象軌跡預測。特別地,長期短期記憶(Long Short-Term Memory,LSTM)網絡已成功應用于分析數據中的時間結構[7]以及橫向位置預測[8]和駕駛員意圖預測[9]等領域。Byeoungdo Kim 直接將LSTM 網絡應用于預測車輛在網格上的軌跡[10]。Florent Altché 提出了一種用于公路軌跡預測的LSTM網絡,該網絡利用了目標車輛周圍車輛的信息[11]。分析現有的機器學習模型可以發現:高斯和馬爾科夫等模型的訓練需要耗費大量時間[12-14],預測的時空復雜度高,不能滿足實時預測的要求;時間序列法易受外界條件影響,預測精度較低。此外,因為前期模型的訓練不足,對于不同類型的道路會無法適應。
針對上述問題,為了更加可靠地預測車輛軌跡,本文提出一種基于深度神經網絡(Deep Neural Networks,DNN)的多元信息融合方法來解決回歸問題,以期在1 s、2 s、3 s 的預測中得到較好的效果。
為了更加可靠地預測車輛軌跡,本文提出了一種基于深度神經網絡的多元信息融合方法,利用DNN、極限學習機(Extreme Learning Machine,ELM)建立模型,該模型將車輛速度、加速度、偏航角速度、轉向角和道路曲率作為輸入。深度神經網絡可以通過輸入數據、模型建立訓練和測試網絡進行預測[15-16]。極限學習機的優勢有[17]:需要手動設置的參數只有隱含層結點個數,算法執行過程中不需要人工調整參數;避免了傳統訓練算法反復迭代的過程,快速收斂,極大地縮短了訓練時間;所得解是唯一最優解,保證了網絡的泛化性能。將相同數據分別輸入到2 個性能不同的神經網絡(DNN、ELM),將2個神經網絡融合,可獲得不同神經網絡的優點。因此,多信息融合系統將比使用單個網絡具有更好的性能。其中,融合系統分為3個部分:數據處理、信息收集和結果信息融合。采用基于深度神經網絡的信息融合預測方法可以構建無需設計且具有復雜方程的系統模型。此外,通過擴展當前的仿真場景,該方法可以很容易地擴展到在各種駕駛場景中預測車輛的軌跡。
將輸入數據歸一化到[-1,1]范圍內,主要方法是將信息反映到共同的描述空間,然后單獨輸入2個神經網絡,其中DNN 和ELM 的隱藏層分別為hDNN、hELM,然后通過1個完全連接(融合)層融合2個神經網絡的隱含層輸出,模型結構如圖1所示。將來自融合層的輸出傳遞到輸出層進行預測,輸出層分別計算1 s、2 s、3 s預測的橫向和縱向位置。融合層執行的計算為:

式中,Wf、bf為學習到的模型參數;e為融合層的輸出。

圖1 模型結構
訓練過程的損失函數采用預測軌跡與地面真實軌跡之間的均方誤差(Mean Square Error,MSE):

式中,yt為t時刻的實際位置;pt為t時刻位置的預測值;T為總體時間。
此時,神經網絡結果的融合已經生成,信息融合已經完成。
DNN 用于軌跡預測時,可以對各種駕駛條件和駕駛模式進行訓練,在離線階段的訓練過程中計算連接的權重。為了提高車輛軌跡預測的準確性,進行了離線訓練,其中包括各種道路曲率的各種駕駛場景。輸入的數據經過輸入層和多個隱藏層到達輸出層,每個層由幾個節點組成。數據在層間傳輸時需要乘以權重,隱藏層需要通過激活函數將數據傳送到下一層。Sigmoid和雙曲正切函數是常用的激活函數,但是,這兩種激活函數可能產生梯度消失的問題,因為當存在許多隱藏層時,數據不會正確地傳播到輸入層,這影響了網絡的成功訓練。此問題可以通過使用修正線性單元(Rectified Linear Unit,ReLU)函數替換激活函數來解決,ReLU 函數在輸入數據大于零時輸出與輸入相同。然而,ReLU函數不適合在本模型中使用,因為DNN 模型的最終輸出包括預測未來的橫向運動。這里使用帶泄露修正線性單元(Leaky ReLU)激活函數,Leaky ReLU 激活函數與原始ReLU激活函數的定義有所不同,其定義為:

式中,λ=0.15為固定常數。
成本函數將輸入所需的值和輸出值作為輸入來計算成本C:

式中,m為用于培訓的數據集的數量;為DNN的輸出值;yi為期望值。
為實現成本最小化,使用梯度下降算法來更新權重:

式中,α為學習率;Wi為i時刻的權重。
然后使用均方根反向傳播(Root Mean Square Propagation,RMSProp)算法來優化深度神經網絡,該算法使用變量M(w,to)來保留前一時間段每個周期梯度平方的平均值,從而實現學習率的自適應調整。RMSProp算法為:

式中,w為深度神經網絡的工作權重;to為訓練的步驟;為訓練步驟to中w的梯度。
輸入層數據包括車輛速度、加速度、偏航角速度、轉向角和道路曲率等車輛狀態信息。輸出層有6個節點,分別對應后續1 s、2 s、3 s處的縱向預測和橫向預測,采用Leaky ReLU激活函數。隱藏層的數量設置為5,神經元的數量設置為200,小批量數量設置為128,學習率設置為0.1,迭代次數設置為100。
ELM[18]具有強大的網絡概括性,其模型輸入矩陣X和輸出矩陣Y假定為:

假設隱藏層激活函數為g(x),隱藏層神經元的數量為1,網絡輸出T為:

式中,ti為網絡輸出;l為隱藏層節點的個數;為連接隱藏層與輸出層的輸出權重;bj為隱藏層偏置;為第K個輸入層與隱藏層之間的權值;g(ωj,bj,xi)為第i個隱藏層神經元的輸出。
式(11)可表示為T=Hβ,其中H為隱藏層輸出矩陣[18],β可以通過最小二乘估計,即=H+T,H+為H的Moore-Penrose 廣義逆,T由訓練樣本輸出Y代替。
粒子群優化(Particle Swarm Optimization,PSO)的本質是搜索最佳位置,并通過迭代找到全局最優解。假設粒子群位置和速度是S維向量,則更新公式為:

式中,tm為迭代的步驟;vis、xis分別為第i個粒子的速度和位置;c1和c2分別為粒子群學習因數;r1、r2為[0,1]范圍內的隨機數;pis為目前個體的最優極值;pgs為目前的全局最優極值;ω為功率常數。
ω較大時,全局搜索能力強,但很容易跳過最優解;ω較小時,局部搜索能力強,但很容易陷入局部最優解,并且收斂緩慢。因此,本文提出了一種基于模擬退火粒子群算法的改進的ω自適應公式:

式中,ωmin和ωmax分別為功率常數的最小值和最大值;f為粒子的當前個體適應度;fmin為整個粒子群的最小適應度;favg為整個粒子群適應度的當前平均值。
設粒子群算法迭代次數為50、群體個體數量為100、學習因子c1和c2均為1.539 2,設ωmin=0.4、ωmax=0.9,激勵函數為S 型函數,隱藏層神經元的數量為15。ELM 輸入權重矩陣和隱藏層閾值由隨機算法給出,通常需要更多隱藏層神經元才能達到理想的預測精度。測試集均方誤差被認為是適應度函數,利用SAPSO 算法可以提高ELM 模型的隨機性,因此ELM 只需要少量隱藏層神經元便可以獲得更好的預測效果,改善網絡泛化的問題。
為了驗證基于信息融合的深度神經網絡的軌跡預測的性能,使用PreScan 和MATLAB/Simulink 構建了仿真環境。從車輛駕駛模擬中獲得了用于學習和驗證的必要數據集,從模擬試驗收集了車輛狀態信息,同時在真實數據集Lankershim Boulevard Dataset 上進行了驗證。車輛狀態信息包括車速、加速度、偏航角速度、車輪轉向角和道路曲率。
為評估本文提出的車輛軌跡預測方法的可靠性,針對每個預測項計算均方誤差(Mean Square Error,MSE)和標準偏差(Standard Deviation,Std Dev)。使用70%的模擬數據進行訓練,另外20%用于驗證,其余10%用于測試。用于測試的數據集是在2 條彎曲道路組成的單獨模擬駕駛場景中收集的。仿真場景如圖2所示,車速設定為72 km/h。

圖2 模型結構
實際車輛軌跡以及測試場景的預測結果如圖3 所示,預測在1 s之后進行。

圖3 車輛軌跡的實際位置與預測位置
將本文提出的方法與3 層隱藏層的人工神經網絡(Artificial Neural Network,ANN)、ELM、DNN 等數據驅動的預測方法進行比較,軌跡預測結果的均方誤差、標準偏差如表1 所示,基于動態時間規整(Dynamic Time Warping,DTW)的相似度計算結果如表2所示。

表1 不同算法的軌跡預測可靠性

表2 不同方法的軌跡相似度
兩條軌跡間的相似度Sm用公式表示為:

式中,‖· ‖ 為兩點坐標的二范數,即歐氏距離;P、R分別為兩條軌跡相應點的集合;pi、ri分別為對應的點的坐標。
將所提出的DNN+ELM 方法在真實數據集Lankershim Boulevard Dataset 上進行驗證,該數據收集區域的長度約為500 m,包括3~4個車道,并完全覆蓋3個信號交叉口。數據是由安裝在毗鄰美國101 號高速公路和Lankershim 大道的36 層建筑物屋頂上的5 個攝像機獲得的。該方法與基于物理的運動模型、高斯過程回歸(Gaussian Process Regression,GPR)在3 種場景下左轉、右轉、直行的預測結果如圖4所示,軌跡中前10個位置用于對模型進行訓練,誤差范圍如圖5所示。
與其他模型相比,本文提出的融合模型在1 s、2 s、3 s的預測更精準。該結果表明,采用基于融合的深度神經網絡的車輛軌跡預測可以用于風險評估和駕駛輔助。


圖4 不同方法在真實數據集上的預測結果

圖5 3種方法誤差范圍的比較
本文提出了一種基于改進極限學習機和深度神經網絡融合的車輛軌跡預測方法,改進的極限學習機以模擬退火粒子群優化算法為基礎,改進的深度神經網絡使用修正線性單元函數替換激活函數,并使用均方根反向傳播算法來優化深度神經網絡。模擬結果驗證了該方法在道路曲率變化工況下的可行性。在未來的工作中,該方法將擴展到基于周圍環境中其他車輛進行軌跡預測,以及碰撞檢測和警告算法的研究。