



















摘 要:為提高智能汽車在動態行車環境下的行駛安全和通行效率,研究了基于周邊車輛軌跡預測的路徑規劃方法,并進行了仿真。提出了一種基于時空圖卷積網絡(STGCN)的周邊車輛軌跡預測方法,通過STGCN對車輛歷史軌跡進行編碼,提取交通圖的時空特征,并結合長短時記憶網絡實現周邊車輛的軌跡預測。在此基礎上,提出了一種基于改進人工勢場(APF)的路徑規劃方法;建立了基于APF的行車危險評價模塊;利用Frenet坐標描述駕駛危險度,通過目標障礙物和道路邊界的勢能分布及梯度下降法完成路徑規劃。結果表明:本算法的短時預測精度提高了3%,長時預測精度提高了1%;所得路徑曲線的前輪轉角不超過0.12 rad,曲率不超過0.1;因此,在確保有效避撞的前提下,保證了車輛行駛的舒適性和高效性。
關鍵詞:智能汽車;路徑規劃;軌跡預測;時空圖卷積網絡(STGCN);人工勢場(APF)
Intelligent vehicle path planning method based on peripheral vehicle trajectory prediction
Abstract: A path planning method was investigated based on the peripheral vehicle trajectory prediction with doing digital simulations to improve the driving safety and access efficiency of intelligent vehicles in dynamic driving environments. The peripheral vehicle trajectory prediction method was proposed based on the Spatio-Temporal Graph Convolutional Network (STGCN), which encoded the historical vehicle trajectories through STGCN, extracted the spatio-temporal features of traffic maps and combined with long and short-term memory networks to achieve the trajectory prediction of peripheral vehicles. On this basis, a path planning method was proposed based on an Improved Artificial Potential Field (APF), and an APF-based driving hazard evaluation module was established, which described the driving hazard by using the Frenet coordinates, and completed the path planning through the potential distribution of target obstacles and road boundaries and the gradient descent method. The results show that the proposed algorithm improves prediction accuracy by about 3% in the short-time prediction and by 1% in the long-time prediction with a path curve of the front wheel angle not exceeding 0.12 rad, and a curvature not exceeding 0.1, ensuring comfort and high efficiency during vehicle travel while effectively avoiding collisions.
Key words: intelligent vehicles; path planning; trajectory prediction; spatiotemporal graph convolutional network (STGCN); artificial potential field (APF)
自動駕駛汽車卓越的安全性和道路利用效率使其成為改善道路交通系統的前景之一。然而,在復雜多變的交通環境中,自動駕駛汽車需要進行精確的軌跡預測和規劃,才能確保行駛的安全性和效率。
車輛軌跡預測的方法主要包括基于物理的方法、基于機器學習的方法、基于深度學習的方法[1]和基于強化學習的方法。基于物理的方法計算成本低,時間短,但無法描述駕駛環境和其他參與者的影響,僅限于短期預測和靜態場景。ZHANG Lei等[2]將基于恒速和加速度的運動預測模型與基于機動的運動預測模型融合,采用多模型交互的方法對周邊車輛的運動軌跡進行預測。宗長富等[3]提出一種雙層隱Markov模型(hidden Markov model,HMM)來識別駕駛意圖和預測駕駛行為:下層的多維Gauss HMM用于短期駕駛行為預測,上層的多維離散HMM用于復合情況下的長期駕駛意圖預測。基于傳統機器學習的方法考慮的因素比物理模型多,準確度有所提升,但大多需要針對特定場景提供特定策略,難以有效預測復雜交通場景中的軌跡。GUO Hongyan等[4]提出了一種基于長短期記憶的雙注意力機制軌跡預測方法,該方法結合自我車輛的運動趨勢,利用時間注意機制最大限度地利用歷史軌跡信息,并通過空間注意機制分析相鄰車輛對目標車輛軌跡的影響,從而減少潛在軌跡的不確定性。近年來,基于深度學習的軌跡預測方法被廣泛應用。李文禮等[5]采用社會生成對抗網絡(social generative adversarial network,Social-GAN)和注意力機制,對自車與周圍車輛進行交互軌跡預測,并結合自車時空(spatio-temporal,S-T)圖及約束條件獲得最優軌跡。李旭川等[6]在長短期記憶(long short-term memory, LSTM)軌跡預測模型基礎上,考慮車型和車輛輪廓,利用五次多項式生成軌跡簇,并通過目標優化函數選出最優軌跡。劉啟冉等[7]采用改進的社會力模型對周圍車輛進行軌跡預測,并將軌跡投影到時空占用圖,結合加速度和曲率篩選最優軌跡。王安杰等[8]通過Frenet坐標系下的運動學模型建立預測風險場,考慮車輛動力學、速度、加速度與曲率約束,采用多項式曲線和二次規劃方法優化決策軌跡。
此外,還有學者采用圖卷積神經網絡- 循環神經網絡(graph neural network-recurrent neural network, GNN-RNN)編碼的網絡[9]、人工勢場(artificial potential field,APF)和模糊神經網絡相結合的方法[10]、彎道引力勢能場[11]、無人駕駛“行車意圖—風險復合場”[12],以及重新構建包含汽車縱向和側向車速的道路勢場[13]等方法開展了相關研究。這些研究成果為實現自主駕駛提供了重要的理論支持和技術基礎。
盡管有大量研究積累,但基于軌跡預測的車輛軌跡規劃方法仍然存在顯著的局限性。首先,現有方法忽略了自車規劃軌跡與周圍車輛之間的交互影響;其次,一些方法如人工勢場算法僅適用于特定道路場景,難以滿足結構化道路場景的需求。這些局限性不僅影響了自動駕駛汽車的安全性,還限制了其通行效率。因此,迫切需要進一步探索新的解決方案。
本研究旨在從車輛軌跡預測和運動規劃兩個關鍵角度進行探討,提出一系列創新方法以應對這一挑戰。首先,通過對歷史軌跡進行編碼并提取時空特征,添加規劃耦合模塊,以考慮自動駕駛車輛規劃軌跡對周圍車輛的交互影響,實現更準確的周圍車輛軌跡預測;其次,構建 Frenet 坐標系下的人工勢場模型,以提高在結構化道路上的主動避碰性能。該方法結合梯度下降法的變道策略和目標障礙物及道路邊界的勢能分布,以便實現自動車輛的安全變道路徑規劃。
1"" 考慮周邊車輛交互的軌跡預測
軌跡預測任務可以表示為基于歷史軌跡估計自動駕駛場景中周圍所有車輛未來位置的問題。本文在時空圖卷積網絡(spatiotemporal graph convolutional network,STGCN)軌跡預測模型的基礎上,添加了規劃耦合模塊,構建了規劃耦合預測計劃(graph planning interaction prediction plan,GPIP-plan),以考慮自動駕駛車輛規劃軌跡對周圍車輛的交互作用。GPIP-plan網絡結構如圖1所示,藍色車輛是一輛自動駕駛汽車,當前時刻的規劃軌跡用綠色線條表示,車輛歷史軌跡用黑色線條表示,車輛預測軌跡用紅色線條表示。
通過圖卷積網絡提取車輛之間的時空交互特征,然后通過2 個LSTM 網絡分別對圖卷積神經網絡(graph convolutional network,GCN) 提取的時空交互特征和規劃耦合模塊對自動駕駛汽車的未來規劃軌跡特征進行編碼。接著,將規劃特征合并到交通場景的時空圖特征中,使軌跡預測算法能夠更好地捕捉自動駕駛汽車與周圍車輛的交互關系。最后,將耦合好的時空交互特征輸入 LSTM 網絡進行解碼,生成該場景下所有車輛的預測軌跡。
模型的輸入為周邊車輛的歷史軌跡點,可表示為
X = [p1, p2,…, pth]." ""(1)
其中:pth表示th時刻場景中所有車輛的橫縱坐標,表達式如下:
pth = [xth1, yth1; xth2, yth2;…; xthn, ythn]." ""(2)
此外,模型的規劃輸入 Xp 為自動駕駛汽車的規劃軌跡:
Xp = [pth+1, pth+2,…, pth+tp]," " (3)
pth+tp = [xth+tp, yth+tp]." " (4)
其中:n是距離本車100 m范圍內的車輛個數;th表示輸入的歷史時間步長,tp表示輸出的預測時間步長,本文選取范圍為3 s的歷史軌跡序列。
模型的輸出 Xout 是時間步長 th+1 到 th+tp 期間周圍所有車輛的位置信息:
Xout = [pth+1, pth+2,…, pth+tp]," " (5)
pth+tp = [xth1+tp1, yth1+tp1; xth2+tp2, yth2+tp2;…, xthn+tpn, ythn+tpn]." " (6)
1.1"" 圖卷積神經網絡(GCN)
軌跡特征提取通常使用卷積神經網絡 (CNN),但 CNN 需要較為復雜的結構來描述車輛之間的交互作用。因此,將自動駕駛應用場景中的所有可能影響自動駕駛車輛的軌跡數據映射到無向圖中,以表示車輛間的交互作用。當場景中有 n 輛車行駛時,則構造出 n×c×th 維數組作為模型的輸入節點,其中 c 代表車輛的特征維度。只考慮車輛位置之間的交互關系,因此 c = 2。如圖1 所示,用 V 作為節點集,表示交通場景中車輛軌跡的集合。由于每個車輛在不同時刻的狀態不同,因此節點集可表示為
V = {vit|i = 1,2,…,n; t = 1,2,…,th}." " (7)
以自動駕駛車輛為中心構建圖,以生成一條數據。 n 表示以自動駕駛車輛為中心的區域內的車輛數量。如圖1 所示,選擇藍色車輛作為自動駕駛車輛,虛線框內為中心區域。
為了模擬車輛之間的空間相互作用,GCN 中通過邊連接表示同一時刻相鄰車輛之間的交互作用。E 表示各車輛在空間維度上的交互特征:
如圖1 所示,圖卷積神經網絡主要由卷積層和圖結構組成。卷積層用于提取時間特征,而圖結構用于捕捉車輛間的交互特征:
將歷史軌跡數據處理成節點特征矩陣和鄰接矩陣,完成了圖1 所示的特征提取和交互關系構建。
時空圖卷積網絡以交通場景中所有車輛的歷史軌跡作為輸入。通過批歸一化層對歷史軌跡進行歸一化,并通過具有1×1大小的卷積層將二維坐標映射到高維空間。卷積層后得到形狀為(b,C,th,n)的特征fconv,其中: b為批大小,C為新的通道數。
空間圖卷積網絡以歸一化的歷史軌跡作為輸入,提取交通場景中所有車輛的交互特征。為了確定車輛節點之間的連接類型 ( 自連接或與其他節點的連接 ),并考慮間接二次連接,將空間鄰接矩陣 Aij 擴展如下:
Aext = [A0, A1, A2]," " (12)
fgra = (Anorm + Atrain) fconv ." " (13)
采用時間圖卷積網絡對車輛在不同時間步長之間的時間相互作用進行建模。對于每一輛車,相鄰時間步長通過邊相連,從而得到了其時空特征。空間圖卷積網絡和時間圖卷積網絡交替進行 3 次,以充分提取時空特征。
1.2"" 規劃耦合網絡
規劃耦合網絡以自動駕駛汽車的規劃軌跡和時空圖卷積網絡生成的交通場景圖特征作為輸入。首先,將規劃軌跡的維度從 (b,2,th) 擴展到 (b,2,th,n),使其可以應用于每輛周圍車輛。然后,對規劃軌跡進行規范化,以增加模型的訓練穩定性。
接著,通過線性化層處理歸一化的規劃軌跡,將通道數從 2 增加到 C,以學習規劃軌跡。然后,將圖特征 fgra 和規劃特征 fplan 的形狀都變為(b×n,th,C),并將它們輸入 LSTM 編碼器。最后,將圖隱特征與規劃隱特征進行串聯,得到耦合特征。
fcpl = LSTMgra( fgra)|| LSTMplan( fplan)." " (14)
1.3"" 長短時循環神經網絡(LSTM)
在車輛軌跡預測中,常用的方法之一是基于長短期記憶網絡 (LSTM) 的模型。這些模型能夠利用歷史軌跡數據,結合當前環境信息,對車輛未來的行駛軌跡進行預測。通過學習歷史數據中的模式和規律,這些模型可以預測車輛在未來幾秒或幾十秒內可能采取的行動。
LSTM 網絡由多個門控單元組成, 包括輸入門 (input gate)、遺忘門 (forget gate)、輸出門 (output gate)和細胞狀態(cell state)。這些門控單元通過激活函數( 通常是 sigmoid 函數 ) 來控制信息的流動,從而實現對序列數據的建模和學習。
遺忘門主要解決應該丟棄的信息:
ft = σ(Wf ·[ ht-1,xt] + bf )." " (15)
輸入門主要用于更新信息:
完成細胞狀態更新:
輸出門主要決定將要被輸出的當前時間步的信息:
軌跡預測網絡以規劃耦合網絡生成的圖特征與規劃特征的耦合特征作為輸入。將這些耦合特征輸入LSTM 解碼器,以預測每個時間步長的位置變化。
Xout = LSTMfut( fcpl)." " (23)
1.4"" 預測效果
選擇美國高速(next generation simulation,NGSIM)數據集對模型進行訓練。該數據集涵蓋了結構化道路的路口、高速上下閘道等車路協同研究的熱點區域,被廣泛用于車輛軌跡預測研究。在實驗過程中,首先提取 NGSIM數據集中換道場景的軌跡,選取橫縱向坐標2個維度的數據,并對數據進行異常值剔除和濾波處理,使其更加符合實際行駛情況。然后,每隔8 s采集一段數據,包括自動駕駛車輛和周圍車輛在交通場景中3 s的歷史軌跡和5 s的未來軌跡。將70%的數據用于模型訓練, 20%的數據用于測試,10%的數據用于評估。由于訓練需要大量的規劃軌跡,將NGSIM數據集中車輛在未來5 s的軌跡作為規劃耦合模塊的參考輸入。軌跡預測通常使用預測軌跡(pre)與實際軌跡(tru)之間的均方誤差 (root mean square error,RMSE)來描述算法的精度,均方根誤差為
將訓練結果與V-LSTM(visual LSTM,V-LSTM) [14]、 CS-LSTM(contextual sequence LSTM,CS-LSTM) [15]和 CNN-LSTM(convolutional neural network LSTM,CNN- LSTM) [16]等軌跡預測模型在預測時域分別為1~5 s的情況下進行對比。訓練進行了80 0 次,使用的設備為 Windows 10操作系統、Intel i7-10700K CPU、NVIDIA GeForce RTX 3060 GPU,深度學習框架為P ytorch 1.11.0,CUDA 11.3和cuDNN 8.2.1。
本文軌跡預測模型通過引入目標車輛對環境車輛的影響,增加了模型的自由度,從而更細致地模擬了交通參與者之間的交互關系。這種增加自由度的方式,使得模型能夠捕捉到更多的動態變化,從而提升了軌跡預測的精度。雖然增加自由度可能帶來一定的計算復雜度,但實驗結果顯示,這種復雜度的增加是值得的,因為它顯著提高了模型的預測性能和實用性。
從圖 2 可知:本文軌跡預測模型在均方根誤差 (RMSE) 方面明顯優于同類模型,這表明了本文模型的預測準確性更高,較低的 RMSE 值意味著本文的模型能夠更精確地預測車輛未來的行駛軌跡,提高了決策規劃的可靠性和安全性。
從表 1 可知:添加了規劃耦合特征的模型均方根誤差相比不考慮這些影響的模型平均下降了15%,考慮影響的模型 RMSE 從 0.68下降到 0.44,顯著提高了預測精度。這些結果證明了目標車輛對環境車輛影響的存在性和引入這些參數的必要性。
2"" 智能汽車路徑規劃
2.1"" 坐標變換
為了在一個統一的框架內對駕駛環境的危險性進行評價,安全系統需要一個固定的坐標系。曲線在直角坐標系中通常很復雜,而 Frenet 坐標系提供了一個更自然的框架,可以更簡單地描述曲線的特性,避免直角坐標系中的復雜數學運算。
根據預先獲得的路點序列,道路參考中心線(xc,yc) 可以參數化為三次多項式樣條:
其中:s是弧長,(a0,a1,a2,a3,b0,b1,b2,b3)表示道路的擬合參數。其他點可以根據[xc(s),xc(s)]通過正交向量法映射到Frenet坐標中。
如圖3所示,P1(x1,y1)為不在參考中心線上的任意點,P0i(i"= 1,2,…,n)為參考中心線上的點,其Frenet坐標為(si,0),笛卡爾坐標為(xci,yci)。P1和P0i連接線的向量為P1P0i,P0i點中心線的切向量為[x'ci(s),y'ci(s)]。總能在參考中心線上找到一個對應的點P0r,其法向量為向量 P1P0r。|P1P0r|為P1到參考中心線的最短距離。因此,P1的Frenet坐標為(sr,|P1P0r|)。
2.2" " 基于人工勢場的路徑規劃
大多數基于人工勢場 (APF) 的路徑規劃研究都是在直角坐標系下進行的,這對于直線道路場景來說非常方便。然而,在非直線道路場景下,不同的位置需要不斷修正勢場模型。在 Frenet 坐標系中構建人工勢場模型則可以省去這些繁重的修改任務。無論何種幾何類型的道路,在 Frenet 坐標中總是可以被視為一條“直線道路”。因此,與以往的研究相比,本文在 Frenet 坐標系下構建算法模型,使算法不拘泥于直線道路的規劃,對道路幾何形狀的適應性顯著提高。在道路環境中的危險勢能主要包括道路勢能和障礙物勢能:
PU(s,d ) = PR(s,d ) + Po(s,d )." " (26)
道路邊界勢能模型是一種基于交通規則的勢場模型,旨在確保車輛在正常行駛和避障完成后能夠沿著道路中心線行駛。當車輛靠近道路兩端邊界時,勢能應逐漸增加,當車輛到達道路邊界時,勢能最大。因此,道路邊界勢能如式 (27) 所示:
PR(s,d ) = A(s)A(d) + PA(s,d )." " (27)
其中:PA(s,d )表示目標點的引力勢能,主要是吸引自車向期望點移動。A(s),A(d)表示振幅路在s軸和d軸方向上的勢能值,其數學表達式為:
其中:Pm是道路中心線的勢能,它在防止自動駕駛車輛產生不必要的變道機動方面起著至關重要的作用。L 是車道寬度。Dl和Dr分別是左右車道相對于參考中心線的偏移量,障礙物的位置是(s ,s )。在本文中,會將預測出的周圍障礙物的位置點(s ,d )代替障礙物位置(s ,d )進行規劃。St和Sd表示斥力勢能在s軸方向上的范圍,且St總是比Sd小。Sd為駕駛員期望的跟車距離,由自動駕駛車輛的速度決定,它可以表示為
Sd = thvh + d0." " (31)
其中:th為車頭時距,vh為自動駕駛車輛的速度,d0為安全距離。
斥力勢能主要使自我車輛與障礙物保持安全距離。本文引入了二維 Gauss 函數來描述碰撞風險,并將其在 Frenet 坐標系下進行了轉換。當自動駕駛車輛靠近障礙物時,斥力勢能變大,對自動駕駛車輛產生排斥勢能,從而避免碰撞。斥力勢能表示為
其中:Pt和Ps為斥力勢能的閾值,c1和c2是2個系數,決定了障礙物三維勢能的范圍和形狀。
APF 算法主要是通過梯度下降來尋找最優路徑。梯度下降的原理是計算勢能場的梯度,并沿著梯度的負方向逐步調整位置,以尋找最優路徑或達到目標點。
其中:Ft為總勢場力,Fs和Fd分別表示APF在s和d方向上的力。在2個方向合力的作用下,自動駕駛車輛總是朝著梯度下降較快的方向行駛。根據當前的位置(sk,dk)和s、d方向上的力,可以得到車輛下一步的位置(sk+1,dk+1):
其中,γ為每個規劃步驟的步長。
大量與駕駛員轉向避障行為相關的研究表明[17],車輛行駛過程中的換道軌跡近似于五次多項式曲線。五次多項式用于規劃避碰參考路徑,各點的位移和曲率曲線均具有連續性和光滑性,符合駕駛員的習慣。因此,本文采用五次多項式對規劃出的路徑點進行擬合,得到最終的軌跡曲線:
d(s) = a + a s + a s2 + a s3 + a s4 + a s5." " (36)
3"" 不同場景下的仿真驗證
3.1"" 仿真平臺及場景建立
為了驗證軌跡規劃算法在動態交通場景中的有效性,本文在高速公路場景中進行了軌跡預測和軌跡規劃算法的聯合仿真測試。具體而言,軌跡規劃和控制算法使用 C++ 編程并在 ROS 環境中運行;PreScan 提供了動態交通場景及傳感器模擬;CarSim 則提供了車輛動力學模型。通過 Simulink 提供的通訊模塊,這三者被集成在一起進行聯合仿真,如圖 4 所示。
這種聯合仿真環境能夠真實地再現復雜的交通狀況,使得對軌跡規劃算法在實際應用中的性能進行評估成為可能。通過該仿真平臺,可以更全面地測試算法在不同交通場景下的響應和適應能力,從而驗證其在提高行車安全性和效率方面的效果。
3.2"" 實驗驗證及結果分析
為了確保駕駛的安全性和舒適性,自動駕駛車輛必須具備高效的響應機制和合理的路徑規劃能力,以規避潛在的危險。本文通過圖 5、圖 6 和表 2 展示了不同駕駛場景下的路徑規劃效果和性能對比。
圖 5 展示了3 種不同駕駛場景下自動駕駛車輛的路徑規劃效果。
通過使用本文提出的 GPIP-plan 算法,車輛在各種復雜駕駛環境中都能有效地進行路徑規劃。在圖 5a中,自動駕駛車輛在檢測到前方車輛變道意圖后,及時調整自身軌跡,成功避免了碰撞。圖 5b 展示了多車共行的場景,車輛通過 2 次變道操作,成功完成超車,展示了算法在動態交通環境中的靈活性。圖 5c 展示了車輛在S 型彎道上的規劃軌跡,車輛能夠平穩通過復雜彎道,證明了算法在應對不同幾何形狀道路上的適應性和有效性。這些結果表明,本文算法能夠在多種駕駛場景下保持車輛行駛的穩定性和安全性。
圖 6 詳細展示了自動駕駛車輛在不同場景下的航向角和曲率變化。
圖 6a 和圖 6b 分別展示了場景 1 中車輛的航向角和曲率變化,結果顯示:車輛的航向角和曲率變化均保持在合理范圍內,確保了車輛的穩定性。圖 6c 和圖 6d展示了場景 2 中車輛的航向角和曲率變化,車輛在多車共行時,通過精確的軌跡規劃,確保了變道操作的平穩性,航向角和曲率沒有劇烈變化。圖 6e 和圖 6f 展示了場景 3 中車輛的航向角和曲率變化,車輛在 S 型彎道上的航向角和曲率變化均勻,確保了行車的舒適性。這些數據表明,本文算法能夠在不同復雜駕駛場景中保持穩定的軌跡規劃,提升了駕駛的安全性和舒適性。
表 2 對比了3 種實驗場景下不同路徑規劃算法的性能指標,包括最大曲率、最大前輪轉角、平均曲率和平均前輪轉角等關鍵指標。
結果顯示,加入預測的路徑規劃在所有指標上均表現出顯著優勢。預測其他車輛的行為使路徑規劃更加靈活,避免了突然的曲率變化和轉向,使得規劃出的路徑更加平穩、合理。相比之下,未加入預測的路徑規劃可能導致路徑曲率波動較大,車輛轉向頻繁,增加了駕駛的難度和不確定性。因此,加入預測的路徑規劃顯著提高了車輛行駛的安全性和舒適性,適應復雜的交通環境,證明了其在實際應用中的潛力和優勢。
4"" 結""" 論
本文提出了一種適用于高速公路場景的實時軌跡規劃算法,該算法綜合考慮了自車與周圍車輛的交互情況。與現有研究相比,本文的方法在多個方面取得了顯著提升:
不僅提高了車輛軌跡預測的準確性,還優化了路徑規劃的安全性、舒適性和通行效率。通過引入規劃耦合模塊,本文的算法能夠更加精確地預測周圍車輛的行駛軌跡,從而規劃出更穩定、更安全的行車路線。此外,本文在 Frenet 坐標系下改進了APF 算法,使其更適應結構化道路場景的需求,提高了算法的適用性和效率。
最后,將車輛軌跡預測模型的預測結果與改進的人工勢場算法相結合,實現了路徑的動態更新,進一步提升了行車的安全性和舒適性。
然而,需要指出的是,本文所提出的自動駕駛車輛軌跡規劃方法目前僅適用于高速公路場景。未來的研究將致力于擴展該方法,以適應更復雜的城市道路場景,如環形交叉口和十字路口等。