孟憲偉,唐進君,王 喆
中南大學 交通運輸工程學院,長沙 410075
不合理的車道變換是導致交通事故的常見原因之一,由于不當的換道行為導致的交通事故占事故總數的27%,且其所導致的交通堵塞時間占全部碰撞事故交通延遲的10%[1]。提前預知周邊車輛的換道行為并做好應對措施可有效降低事故的發生率。近年來,隨著自動駕駛技術的不斷發展和對人工智能技術的深入挖掘,使得車輛在行駛過程中具有了信息收集能力和環境感知能力,并可以通過采集的實時數據預測周邊車輛的未來動向。然而由于駕駛員風格和換道環境的差異性使得車輛在換道過程中呈現出不同的特征,模型在車輛軌跡預測中表現不穩定,對于精準穩定的預測換道軌跡研究還有待提高。
國內外學者在智能車輛預測軌跡上取得了一系列成果。對于實際情景中行駛的車輛,預測換道車輛軌跡之前需要先了解駕駛員的換道意圖。文獻[2]建立了SVM(support vector machine)分類器對車輛駕駛意圖進行預測,在城市道路和高速公路上得到了良好的效果。文獻[3]將SVM意圖識別的結果輸入別貝葉斯濾波器降低下虛錯誤率和漏檢率,近一步提高模型性能。文獻[4]利用自車采集的GPS、IMU 和里程表數據融合的位置、航向和速度來訓練LSTM 模型,評估模型在距換道多久前的時刻意圖預測的效果能達到100%。文獻[5]設計了一種基于模糊邏輯和編輯距離的意圖檢測算法,可以更早的時間提出警告,同時抑制不必要的警告和行動。文獻[6]從駕駛員眼動數據提取視覺表征參數,通過連續隱馬爾可夫模型預測車輛未來行為的變化。文獻[7]將連續隱馬爾可夫模型應用到危險換道行為和安全換道行為的識別中。
軌跡預測需要對一定長度上的時間序列做出推測,相比于意圖預測更加復雜。目前,很多學者運用動力學模型預測車輛的運動軌跡[8-10],并使用多項式軌跡規劃[8]和卡爾曼濾波[9]來克服模型在長序列預測精度不足的缺點,但由于軌跡的高度非線性,基于動力學模型的軌跡預測方法并沒有達到滿意的精度。隨著神經網絡的不斷成熟,越來越多的學者嘗試用深度學習的方法對車輛軌跡進行研究。長短期記憶網絡(LSTM)因其在處理時間序列問題上表現出的信息挖掘能力和深度表征能力而被研究者們廣泛應用于軌跡預測中。文獻[11]通過分析車輛運動軌跡的影響因素建立運動軌跡方程,充分地考慮了車輛軌跡形成的層次性和時序性,并通過模糊Petri 網實現車輛軌跡的短時域預測。文獻[12]也通過解編碼器結構進行軌跡預測,編碼器對采集到的行駛數據進行處理,生成捕獲過去軌跡時間結構的固定長度向量,解碼器基于這個固定長度向量,在占用網格圖(OGM)上搜索可能性最大的未來軌跡。文獻[13]對長短期記憶模型的結構進行優化,提出了一種基于徑向連接結構的多狀態共享方法,用雙層LSTM結構表示車輛間的交互作用,但并未對周圍換道車輛對本車的影響進行詳細分析。文獻[14]重點分析了密集交通裝填下車輛的相互作用,將空間相互作用嵌入LSTM 模型中,并在每個層次中引入快捷連接處理梯度小時的問題。文獻[15]用LSTM將車輛換道行為和跟馳行為同時建模,提出了一種混合再訓練約束(HRC)訓練方法來進一步優化LSTM 模型。文獻[16]將強化學習與LSTM 網絡結合,在LSTM預測車輛軌跡的基礎上通過Q-learning算法將車輛行駛中的交互作用考慮其中,更加真實地反應車輛在行駛過程環境對車輛軌跡的影響。文獻[17]在意圖預測的基礎上進一步對軌跡預測,并在軌跡預測上引入MDN 層提高模型的魯棒性。盡管現有研究證實了LSTM模型可以很好地應用于軌跡預測中,然而換道場景的不同和駕駛風格的差異導致單一模型會在個別車輛的預測中表現不佳的情況還沒有很好的解決。
在總結大量學者的研究基礎上,針對上述問題,構建了一種連續隱馬可夫模型與LSTM-AdaBoost 的組合算法,在考慮換道意圖影響下對換道軌跡進行預測,有效提升不同場景下的軌跡預測精度。同時采用AdaBoost集成的方法提升LSTM的預測結果,使其更好的適應不同車輛運動特征和軌跡變化。
在車輛行駛過程中駕駛員經常會進行換道操作來達到自己的駕駛目的或更舒適的駕駛環境。處在換道目標車道上的車輛會根據周圍車輛的換道軌跡來調整本車的速度位置和速度,將行駛環境改變帶來的影響降到最小。如圖1 所示,當自動駕駛汽車EV 左車車道的車輛發生右換道操作變換到本車道時,車輛需要做出相應調整,保持直行或左轉并不對本車產生影響。同樣,對處在右側車道的車輛需要關注其是否發生左換道。車輛在行駛中得向左換道、直線行駛、向右換道3 種不同行為所表現出來的行駛特征并不相同。有研究表明,向左換道的持續時間比向右換道的時間長[18],且換車道方向對車輛安全狀態的影響不同[19]。若用所有車輛行駛數據訓練一個軌跡預測模型,模型會因為左右換道的差異而達不到滿意精度。在進行軌跡預測時考慮換道意圖的影響,將換道樣本分為左換道車輛和右換道車輛分別訓練軌跡預測模型,可以使模型更好地擬合車輛的行為特征。

圖1 換道場景劃分示意圖Fig.1 Diagram of lane-changing scene division
對于實際場景中的車輛,車輛未來狀態是未知的,因此先通過意圖預測模型對周圍車輛的未來狀態進行檢測,再對可能進行換道操作的車輛進行軌跡預測。將一定的時間長度的車輛歷史軌跡序列輸入到連續隱馬爾可夫模型,得出的向左換道、直線行駛及向右換道的概率最大值即為車輛的意圖預測結果,將預測結果為左換道或者右換道的歷史軌跡序列輸入到相應的軌跡預測模型中。為了減小軌跡預測模型對不同車輛的預測波動,將換道軌跡數據劃分為多個訓練集并通過訓練得到多個LSTM 基軌跡預測模型,再通過AdaBoost 算法對基預測器進行同質集成,增加其精度和穩定性,具體過程在文章第二節進行說明。換道軌跡預測方法總體框架如圖2所示。

圖2 換道軌跡預測方法框架Fig.2 Framework of lane-changing trajectory prediction method
隱馬爾可夫模型(hidden Markov model,HMM)是支持時間數據模式識別的概率模型,它將事物在不可觀測的狀態之間轉換描述為一個隱藏的隱馬爾可夫鏈,通過各個狀態下可觀測的序列反應隱藏狀態的變化。在車輛意圖識別中車輛的未來狀態是不可觀測的,即隱藏狀態,觀測向量是在各個狀態下車輛所表現出來的行駛特征。而對于一個連續的觀測數據來說,車輛在某一狀態下產生觀測向量的概率往往不是一個確定的值,因此需要通過觀測向量的概率分布代替觀測概率,也就是連續隱馬爾可夫模型(continuous hidden Markov model,CHMM)。連續隱馬爾可夫模型表示如下:


圖3 CHMM換道意圖識別模型Fig.3 Recognition model of CHMM based lane-changing intention
長短期記憶神經網絡(LSTM)是循環神經網絡(recurrent neural network,RNN)的一種變體,引入記憶單元來實現長序列預測中梯度消失的問題,并通過控制門結構協調各個記憶細胞之間的信息傳遞,滿足時間序列預測中的長期依賴問題。LSTM的控制門有遺忘門、更新門和輸出門3種,其中遺忘門ft控制輸入和上一個隱藏層h輸出被遺忘的程度大小,更新門it決定輸入中新的有價值的信息被加入,輸出門ot控制輸出和當前計算的狀態更新到記憶單元的程度。LSTM 單元內的數據流向如圖4所示。

圖4 LSTM單元數據流向圖Fig.4 Data flow diagram of LSTM units



圖5 軌跡預測解編碼器結構Fig.5 Encoder-decoder structure of trajectory prediction
單一的LSTM 模型不能很好的適應不同狀態的車輛軌跡預測需求,會出現對個別車輛誤差較大的情況。因此考慮通過AdaBoost 算法提升LSTM 軌跡預測精度。AdaBoost算法(adaptive boosting)是一種集成學習算法,它建立在Boosting 算法的框架基礎上,通過對多個基學習器進行迭代訓練,根據誤差調整權重,減小誤差較大的學習器權重同時增大誤差較小的學習器權重,最終加權集成為強學習器。AdaBoost 算法不易受到過擬合問題的影響,可以彌補單一LSTM模型不能很好的適應不同狀態行駛車輛的問題,提高軌跡預測模型的泛化能力。已有很多學者通過LSTM-AdaBoost增強模型的預測性能,如Xiao 等人[21]通過LSTM-AdaBoost 算法對中短期海面溫度進行了預測,但采用的組合算法僅是對兩個模型得出的結果進行算數平均,并不能體現出AdaBoost 的優勢。李達等[22]將LSTM-AdaBoost 算法分類實驗中,提升了用于多天氣車輛分類準確率;Bai等[23]在制造質量預測中利用AdaBoost 提升LSTM 的預測精度,但其預測模型解決的是多對一的非序列問題。本文將LSTM-AdaBoost 應用于軌跡序列預測問題,并在誤差更新依據上選用預測軌跡和真實軌跡的均方根誤差(RMSE)作為判別標準,構建軌跡預測算法步驟如下:
步驟1 通過k個訓練集訓練LSTM 神經網絡得到基預測器pk,k=1,2,…,N。

本文采用NGSIM數據集對提出的換道軌跡預測模型進行訓練和測試。該數據集來源于美國聯邦公路管理局發起的next generation simulation(NGSIM)計劃,致力于采集真實場景下的車輛行駛數據以供學者進行分析研究。數據通過高處的攝像頭對目標路段的車輛進行拍攝,以0.1 s的采樣頻率提取車輛的橫縱坐標、速度、加速度、車頭時距、車頭間距等特征。通過圖像識別技術獲得的數據參在一定的誤差和噪聲,尤其速度和加速度波動明顯,因此先采用對稱指數移動平均濾波法[24]對原始數據做平滑處理。NGSIM中I-80高速公路的研究區域如圖6所示,其中1~5車道為主路車道,6車道為集散車道,7、8號車道分別為匝道進出口。由于匝道上的換道車輛和主路上車輛的換道特征并不相同,因此只考慮在主路上行駛的小汽車,同時選取的換道車輛只發生一次換道行為或換道間隔大于150 幀以排除連續換道車輛帶來的影響。

圖6 I-80高速公路研究區域圖Fig.6 Study area of I-80 express way
對于如圖7所示的完整車輛換道軌跡,車輛軌跡與車道線的交點作為車輛的換道點,即數據中車輛所在車道編號發生變化的時間點。距換道點前T 秒即為軌跡提前預測時間,提前預測時間點前L秒內的軌跡數據即為歷史軌跡數據,提前預測時間點后L′秒的軌跡數據為預測軌跡數據,其中L、L′為歷史數據和預測數據的序列長度。車輛所在車道編號變小為左變道車輛,變大為右變道車輛,最終從數據集中提取到737輛左變道車輛、3 628輛直行車輛和182輛右變道車輛。由于數據集本身左變道車輛就多于右變道車輛,因此加入相同篩選條件下US-101 中的163 輛右轉車輛以避免軌跡預測中基學習器樣本過少導致整體偏差過大。

圖7 換道軌跡劃分圖Fig.7 Partition of lane-changing trajectory
車輛在高速公路中換道持續時間3.5~6.5 s,平均為5 s完成一次完整的換道過程[25],因此取提前預測時間T為1 s,歷史軌跡時長L為5 s,預測軌跡時長L′為3 s,幾乎可以涵蓋車輛從接近車道線到換道完成調整速度的階段,即軌跡預測模型通過長度為50 步的歷史軌跡序列預測未來30步的軌跡序列。意圖預測模塊輸入歷史軌跡數據的速度、加速度、橫向位移、橫向速度的平均值,通過這些特征預測車輛的未來狀態。將向左換道,直線行駛和向右換道3 種樣本均按75%、25%隨機劃分為訓練集和測試集。
對于軌跡預測模塊,軌跡預測模型研究中不需要設置太多基預測器,當基預測器數量過多模型提升效果并不會有明顯提升,還會因訓練樣本數的減少降低每個基預測器的精度。通過3 個基學習器對模型進行集成測試,取所有車輛歷史軌跡序列的橫縱坐標、速度和加速度序列為模型的訓練數據,更好地反應車輛變道前的特征變化。左、右換道序列均按3∶3∶3∶1∶1的比例隨機劃分為3組訓練集、1組驗證集和1組測試集。訓練集用于訓練軌跡基學習器,驗證集通過AdaBoost 算法得出各基學習器權重,測試集用于評價模型性能。以被檢測車輛的橫縱向位置信息、速度和加速度作為軌跡預測模型的輸入變量。LSTM 軌跡預測模型中很多超參數的設定會影響模型的性能,通過多次實驗取Dropout 率為0.2,每層隱藏單元個數為128,訓練樣本批量為256,選擇較為常用的Adam 和均方誤差MSE 作為模型訓練的優化器和訓練損失函數,迭代次數為1 000。模型在Python中的Keras平臺上實現,實驗操作在配置為CPU:Intel Core?i9-9900K@3.6 GHz,GPU:NVIDIA 2080Ti,RAM:32 GB 的硬件環境下運行。采用Multiprocessing對多個模型進行多核并行運算,以保證最短的程序運行時間。
3.3.1 意圖識別分析
意圖預測的準確性直接關系到軌跡預測工作的開展。為了驗證連續隱馬爾可夫模型的意圖識別效果,選取精確率、召回率、F1-分數和準確率等指標對模型進行評價,同時選用支持向量機預測模型進行對比,精準率表示預測正確的正樣本個數占預測結果為正樣本的樣本個數的比例,召回率表示預測正確的正樣本個數占真正的正樣本個數的比例,F1-分數為精確率和召回率的調和平均值,準確率為總樣本中預測正確的樣本比例。預測結果如表1所示。

表1 意圖預測性能度量Table 1 Performance measurement of intention recognition module
從表中可以看出,連續隱馬爾可夫模型的意圖識別的精確率、召回率和F1-分數均接近90%及以上,與SVM模型相比,除了左右換道的精確率略低于SVM模型外,其余指標均優于支持向量機模型。有小部分樣本存在預測不準確的情況,分析原因可能是模型對于較為平滑的換道行為,其橫縱向速度和加速度變化并不明顯,可能會被預測為保持直行,或是保持直行車輛受到某些因素影響車速產生較大波動或嘗試換道但未完成的車輛易誤判為換道。總體看模型表現良好,可以為接下來的軌跡預測提供有力支撐。
3.3.2 軌跡預測分析
換道軌跡預測效果通過軌跡橫縱向預測均方根誤差(RMSE)、平均絕對誤差(mAE)、平均絕對百分比誤差(mAPE)的平均值進行評價,從表2可以看出,無論橫向和縱向預測中,LSTM-AdaBoost模型的預測結果在每個指標中均優于單個基預測器。以預測軌跡的均方誤差為例,相對于單個基預測器,集成模型在左換道橫向預測中分別提升22.46%、12.7%、12.22%,橫向預測中分別提升38.12%、13.4%、11.1%;右換道橫向預測中分別提升4.23%、17.6%、23.4%,縱向預測中分別提升34.19%、14%、24.03%,可以說明采用的集成預測模型可以提高換道軌跡預測的精度。右轉整體精度不如左轉,原因可能是由于右轉樣本相對較少,基學習器沒有得到更好的學習能力,當右轉樣本增多時,右轉軌跡預測的整體精度也會更高。

表2 模型預測性能對比Table 2 Comparison of model prediction performance
如圖8 展示了不同歷史軌跡時長和預測軌跡時長的對軌跡預測精度的影響。在相同的歷史軌跡時長下,誤差會隨著預測軌跡時長的增加而增大。這是因為在序列預測問題中,神經網絡中的誤差處于不斷積累的過程,使得較遠的軌跡點距離車輛真實軌跡偏差較大。在同樣的預測時長下,歷史軌跡時長的增加也使得整體誤差呈下降趨勢。從圖中可以看出,歷史軌跡時長在4~5 s的預測效果明顯優于時長小于4 s的。因為在實際駕駛環境下駕駛員往往在到達車道線前就開始調整車輛的位置和速度,較長的歷史軌跡序列可以涵蓋整個換道過程,更好的捕捉整個換道階段的特征變化以達到更加的預測效果。

訓練LSTM-AdaBoost 模型時誤差閾值的設定會得到不同的集成權重,對于不同的數據集閾值的設定是不同的。本文對LSTM軌跡預測進行多次預實驗,并在預實驗的誤差范圍內探究閾值的變化對各基預測器集成權重的影響。以右換道縱向預測為例,其閾值設置的不同帶來的集成模型效果和權重系數的變化如圖9 所示。可以看到閾值在2.7 m至3.6 m之間時,集成模型的預測效果相對于基預測器都有著不同程度上的提升。整體平均預測誤差相對較大的基預測器1和3得到的權重系數較小,最后得出相對精度提升也較大,整體表現較好的基預測器2 一直保持著較大的權重系數。可見閾值的設定會使精度提升效果不同,但集成模型的效果還是優于基預測器的。在進行集成預測時,閾值的設定在基預測器對數據集的平均預測誤差附近,閾值過小會產生整體預測效果不好的基預測器得到負權重的情況,閾值過大則平均誤差較大的預測器也會得到較大的權重使得最終集成結果不好。

圖9 不同閾值下基預測器的提升度和權重系數Fig.9 Accuracy improvement and weight coefficient of each base predictor under different thresholds
如圖10展示了測試樣本在基預測器和集成預測器下的預測誤差分布,其中軌跡預測誤差為以預測軌跡點與真實軌跡點的幾何距離。可以看出,集成模型的預測結果更加穩定,整體精度更高。其中左換道軌跡誤差均在3 m以下,有一半的車輛預測誤差不超過1.5 m。右換道軌跡誤差均在4 m以下,一半的車輛預測誤差不超過2 m。左右轉預測誤差的上四分位數、中位數和下四分衛數均低于各基預測器。此外,集成模型的異常點要少于基預測器,且異常點的預測誤差更低,說明LSTMAdaBoost對不同場景下的軌跡預測具有較強適應能力。

圖10 左、右換道軌跡預測誤差分布Fig.10 Error distribution of LCL and LCR trajectory prediction
3.3.3 軌跡預測系統整體效果分析
為了驗證提出的軌跡預測系統的優越性,分別采用傳統的回歸預測模型AdaBoost 和SVM 不考慮變道意圖影響的LSTM軌跡預測模型,在相同的測試集下進行預測精度對比實驗。實驗結果如圖11 所示,AdaBoost和SVM 的左轉軌跡預測均方根誤差分別為5.65 m 和3.35 m,右轉軌跡預測均方根誤差分別為8.23 m 和5.94 m。回歸預測模型在短期內的預測效果較好,但當預測的時間序列較長時,單純的回歸預測無法適應時間序列發生的變化,對于復雜的換道軌跡預測更是如此。長短時記憶模型LSTM左、右轉軌跡預測均方根誤差分別為1.69 m 和2.66 m,誤差明顯更小,也證明了深度學習神經網絡在長時域軌跡預測的優越性。另外,考慮換道意圖的LSTM-AdaBoost軌跡預測模型與未考慮意圖預測的LSTM模型與進行相比平均精度更高,泛化能力更強。因為用所有的車輛換道數據構建的軌跡預測模型,左、右換道軌跡變化特征會因其他不同的訓練樣本的存在而無法充分表現出來,導致平均預測誤差增大,也說明了軌跡預測系統中意圖預測模塊的必要性。

圖11 不同模型軌跡預測性能對比Fig.11 Trajectory prediction performance comparison of different models
(1)換道軌跡預測具有很強的時效性,需要在短時間內預測出車輛未來的行駛軌跡。本文將意圖預測和軌跡預測相結合,構建換道軌跡預測方法系統。首先通過換道前的軌跡數據對模型進行訓練并存儲在系統中,然后將車輛行駛時采集到的周圍車輛實時軌跡數據以一定的間隔輸入至CHMM 意圖預測,再基于意圖預測結果采用相應的換道軌跡模型進行預測,保證軌跡預測的精度和實時性。經實驗得出在多核并行運算的情況下,系統可在很短時間內預測出未來3 s的換道軌跡,可以滿足實際應用的需求。
(2)采用LSTM-AdaBoost 進行換道軌跡預測,將長短期記憶模型(LSTM)作為AdaBoost的基學習器,以軌跡預測的均方根誤差為判定指標調整每個基學習器的權重,再通過加權集成得到最終的軌跡預測結果;利用NGSIM 數據證明了模型性能進行測試,結果顯示LSTM-AdaBoost 模型的預測結果各項指標均優于單一模型,且異常數據更少,具有較好的穩定性。
(3)軌跡預測是在意圖預測的結果上進行的,意圖預測的結果直接影響到軌跡預測的效果。連續隱馬爾可夫模型可在再換道前1 s對車輛意圖預測的準確率達到92%。今后的研究工作將集中于提高意圖預測的準確率及提前預測時長,并給出在預測錯誤時的合理解決方法。