林 程,汪博文,呂沛原,宮新樂,2,于 瀟
(1.北京理工大學,電動車輛國家工程研究中心,北京 100081;2.清華大學車輛與運載學院,北京 100084)
不合理的換道行為容易造成安全事故,道路曲率和環境車速的變化也會使風險成倍增加,嚴重影響道路交通安全及通行效率。隨著車路云一體化融合系統的發展,打破了車輛間僅通過自身傳感器獲取周圍環境及自身信息的局限性。通過網聯化技術,建立自動駕駛多車系統協同運動規劃方法,可以實現駕駛安全減少交通擁堵[1]。近年來,自動駕駛運動規劃問題受到了廣泛關注[2]。現有的換道合流研究中大多聚焦于車輛縱向控制,并依靠于簡化的質點模型,其可以很好地應用于直道場景中,而在變曲率道路下仍有很大挑戰。
在變曲率道路上進行多車協同運動規劃須綜合考慮合流時機和橫向運動控制。目前針對選取合適合流時機問題,傳統智能車輛中,基于場景驅動的決策控制方法被廣泛采用。其主要是根據指定的判斷條件,如安全距離和碰撞時間(time to collision,TTC)等,進行自適應巡航(adaptive cruise control,ACC)、換道避障(collision avoidance,OA )和緊急制動(autonomous emerging braking,AEB)等駕駛模式的切換[3]。文獻[4]中通過考慮不同道路、車輛橫縱向狀態來對周車環境風險進行評估和決策。另外,網聯化技術的發展衍生了協同自適應巡航技術(cooperative adaptive cruise control,CACC),其通過綜合考慮多車信息,可以更加安全地實現車輛跟馳和換道等動作[5]。然而,人類復雜的個性化駕駛行為難以簡單地用既定規則進行描述,多車協同駕駛下的高收益的駕駛決策仍須被進一步探索。
隨著硬件計算能力的逐漸提高,優化類的方法如模型預測控制(model predictive control,MPC)[6-7],因其能夠處理多約束多目標問題,被嘗試用于求解高收益的協同駕駛多車決策。其核心思想是將協同運動規劃問題轉化為一個具有多約束的非線性優化問題[8],通過求解可以得到最優決策控制策略。求解該問題的方法可以分為集中式和分布式兩類架構。集中式的方法依賴于一個中心協調單元,能夠得到系統最優的協同控制策略,但是往往須具備較高的算力[9]。例如,結合期望車道等離散變量,可以將多車換道模型轉化為一個帶約束的集中式混合邏輯動態(mix logical dynamic,MLD)系統[10],通過混合整數規劃來進行最優換道決策求解。分布式的方法不需要中心單元,只需自身及周圍環境信息,在實際中更易于部署[11]。如文獻[12]中,提出了一種隨機MPC 換道決策與控制框架,通過獲得其他車輛狀態進行概率預測并得到換道最優運動控制。文獻[13]中利用魯棒MPC 實現了參數不確定下的無偏置多車運動控制。另外,與其他經典交互模型相比,采用基于博弈的換道模型能對人類多車交互行為進行更個性化的描述[14]。博弈論,如納什均衡[15]和斯塔克伯格博弈[16],通常采用分布式的架構來搭建車輛決策模型,兩種非合作決策博弈方法的比較在文獻[17]中列出。
機器學習方法如強化學習(reinforcement learning,RL)[18]、深度強化學習(deep reinforcement learning,DRL)等[19]在近幾年發展迅速,其有在復雜環境中進行準確決策的潛力。文獻[20]中提出了一種基于深度強化學習的多車協同決策框架,文獻[21]中采用模仿學習和強化學習相結合的方式進行換道決策。由于模型的不可解釋性和對數據的依賴,RL 算法較難在實際車輛中使用。為此,文獻[22]中提出了一種優化嵌入式強化學習,以實現多車自適應決策。文獻[23]中設計了一種混合強化學習算法,結合物理模型和歷史數據得到最優策略??偟膩碚f,機器學習方法能夠很好地處理決策問題,尤其適用單車智能,但在多車協同的場景仍須進一步地研究。
另一方面,道路曲率變化下橫向運動控制至關重要,車輛位姿和狀態的描述是進行協同決策的基礎。為了方便描述系統內多車之間的關系,虛擬隊列方法,即將處于不同車道上的車輛近似看作成一個車道上的隊列,常被用于沖突區域下的協同合流控制之中[24-25]。而在這些研究中,通常將變化的曲率道路投影視作直線,或默認忽略不計,且較少考慮非線性橫向動力學的影響。為了消除曲率變化帶來的影響,文獻[26]中利用道路中心坐標來描述車輛的運動,并設計了一個面向超車避障的模型預測控制器,但是僅適用于單車決策控制。
不同于僅考慮單車或多車集中式協同控制的方法,本文綜合考慮動態道路曲率變化和周車運動狀態,提出一種基于博弈的多車分布式換道合流運動規劃與協同控制方法。為了準確描述車輛位置姿態與道路之間的關系,本文首先分析了曲率坐標系下車輛橫縱向運動對車間安全的影響機制,建立了多車交互動力學模型。之后,提出了適配變曲率道路的多車博弈速度規劃算法,設計兩步驟分布式地求解兼顧安全、效率、舒適多目標最優的速度軌跡及換道時機,縮小優化問題求解規模,提高計算求解效率。最后,通過變頻率采樣B 樣條曲線識別道路曲率,構建基于前步最優控制反饋的自適應時變模型預測控制算法(adaptive time-varying MPC,ATVMPC)實現軌跡跟蹤,通過每一步實時迭代更新控制矩陣和狀態矩陣,減少了縱向車速和曲率變化帶來的控制偏差累積。聯合仿真結果表明,提出的方法能夠更好地適應道路環境的變化,較傳統方法能夠選取高效益的合流時機并準確地跟蹤目標軌跡。
合理地描述車輛姿態與道路之間的相對位置關系對自動駕駛運動規劃起著重要作用。傳統笛卡爾坐標系往往是基于大地坐標,通常需要從大地坐標系轉化為車體坐標系進行車輛狀態計算。當車輛沿著曲率道路行駛時,大地坐標系下的坐標X和坐標Y具有極強的非線性關系,使車身姿態的描述更加復雜,因此采用曲率坐標系來描述車輛在全局道路下的位姿。圖1 展示了不同坐標系之間的關系,其中曲率坐標系以給定的任意曲率參考線為基線,以沿著基線走過的距離作為縱向位移si,以垂直于該基線的誤差作為橫向偏移ey,i。定義車輛i在曲率坐標系下的位置坐標向量為

圖1 不同坐標系之間的車輛狀態關系
式中eψ,i表示為曲率坐標系下的橫擺角。圖1 中:vx,i和vy,i代表在車身坐標系下的車輛橫向和縱向速度;ψd,i為大地坐標系下的車輛橫擺角為對應的橫擺角速度;ψs,i=ψd,i-eψ,i表示中心線切線與大地坐標系橫軸的夾角表示相應的橫擺角速度;δf,i表示車輛的前輪轉向角;Fxf,i和Fxr,i為前后輪縱向力;Fyf,i和Fyr,i為前后輪的橫向力;lf,i和lr,i分別代表質心到前軸和后軸的距離;βi為大地坐標系下的質心側偏角;αf,i和αr,i表示車輛的前后輪胎側偏角。
變曲率道路下須綜合考慮車輛的橫縱向動力學性能。車輛的動力學特性表現為外界作用力對車輛的影響,分別定義車輛i的動力學狀態向量xi和控制向量ui為
式中ai表示車輛坐標系下的縱向加速度。為了更好地考慮變曲率道路下的車輛動力學特性,以適應動態工況下的精確跟蹤控制,保證多車協同駕駛的安全性和穩定性,采用如下橫縱向動力學模型對狀態進行描述,其中各個狀態之間的幾何關系可以在圖1中得到。
式中:mi為汽車質量;Iz,i表示車體轉動慣量。
由于變曲率道路下輪胎發生側偏和滑移的概率較大,輪胎力表現出高度非線性橫向動力學特征,一個高保真的非線性輪胎模型對車輛的精確控制至關重要。當側偏角較大時,輪胎力的非線性特征明顯,由于魔術輪胎公式能準確地擬合不同工況下的輪胎力學特性,被廣泛應用于車輛在極端工況下的輪胎力描述。當側偏角較小時,線性輪胎模型可以很好地描述輪胎橫向力與側偏角之間的線性關系,由于其計算簡單通常應用于一般工況的車輛控制中。綜合線性輪胎模型和魔術輪胎公式的優勢,采用如下混合輪胎模型對前后輪胎側向力進行建模:
當車速較低(<6 m/s)且前輪轉角變化率較小時,為了降低模型計算復雜度,同時也避免車輛動力學模型在車速為零時產生奇點的問題,采用簡化的車輛動力學模型如下:
式中βi的計算表達式為
為了更好地在曲率道路下描述車輛動力學特性及多車間的相對位置關系,本部分首先推導曲率坐標系下的縱向車速橫向車速和橫擺角速度的表達式。如圖2 所示,先將有橫向偏差的車輛投影至基線上,根據基線上的投影和實際所在位置之間的相對關系可得:

圖2 曲率坐標下車間相對位置關系
式中k(si)表示曲率坐標下沿著縱向位移si的曲率變化函數,其具體計算方法將在第3 部分進行詳細分析。圖中(Xc,Yc)代表車身坐標系。帶有上標“'”的參數表示在基線上的投影。
其次,當在變曲率的道路環境中存在多輛車時,傳統笛卡爾坐標系下常采用歐幾里得范數的方法來描述車輛之間的安全關系,即
當虛擬隊列間存在dr≤dsafe時,說明此時車輛i和j在基線上的投影存在重疊,此時換道會有潛在碰撞危險。
為了方便后續描述,綜合姿態向量pi和動力學向量xi,將車輛i的狀態統一表示為
車間信息流拓撲模型對多車系統的協同控制有著重要影響。本文中,研究對象為多輛自動駕駛汽車,且假設車車通信的信道是理想的,不存在延時和丟包的情況,重點檢驗基于博弈的控制方法對多車系統綜合性能的積極影響。合流區域采取的通信拓撲描述如圖3 所示,每輛跟隨車輛可以獲取對應領導車輛的狀態信息,并通過車路協同的設備對周圍其他環境車輛信息進行信息補償。

圖3 通信拓撲示意
為保證合流過程中車輛行駛安全和系統整體道路的通行效率,多車協同換道合流的控制目標為規劃出理想的縱向速度軌跡并選擇合適的合流時機,并最終保持安全間距以及按照期望的車速行駛。當不存在外界擾動時,對于車輛i,j∈N,協同控制的目標可以表示為
基于上述控制目標,將變曲率道路下的多車協同速度規劃問題轉化為多車博弈問題,博弈的目標是總代價最小。一個博弈問題G主要由3 個部分組成:
式中:N 代表車輛集合;A 代表車輛動作集合;πi表示第i個參與者的策略集;J 代表車輛代價集合。本文在速度規劃算法中綜合考慮了自動駕駛汽車的個性化駕駛偏好及整體通行效率,通過駕駛安全性、乘坐舒適性和通行效率的比例來進行表征,同時也作為博弈收益組成的重要參考。
首先,駕駛安全性的代價由自車與環境車之間的碰撞時間倒數和安全相對距離兩部分組成,并通過系數來調整各部分權重。其中,將碰撞時間倒數定義為
式中Δsij和Δvs,ij分別代表車輛i和車輛j在曲率坐標系下的相對距離和速度。基于式(14),將駕駛安全代價寫作
式中kΔt和kΔs為碰撞時間因子和相對距離因子的權重系數;H(?)為階躍函數,如式(16)所示。
式中κ∈R代表函數H(?)的自變量參數。
為保證系統內車輛能按照期望車速運行,快速到達合流點并完成合流動作,減少速度損失,本文定義效率代價:
乘坐舒適性通常與車輛加速度和加速度增量相關,定義乘坐舒適性系數為
式中Δai表示車輛的加速度增量。
結合式(14)~式(18)綜合考慮車輛安全、舒適、效率,構建車輛i博弈總體代價函數Ji:
多車博弈的目標是選擇合適的時機進行合流并得到使所有交通參與者代價最小的速度曲線。對應的最優聯合策略集合為A*,表示為
需要說明的是,將未來N步的多車預測狀態也考慮在內,因此得到的結果是未來一段時間內的納什均衡,最終得到的最優動作策略同樣是帶時間信息的狀態序列:
為了得到車輛i的納什均衡策略將預測最小博弈代價問題轉化為N步預測域下的有限時域約束優化問題:
式中:zi=[si,vs,i]T;Ai和Bi為自車i狀態矩陣和控制矩陣;l代表虛擬隊列中車輛i的前方車輛。當在t時刻車輛i前方無車輛時定義sl,vs,l=+∞,同時將匝道合流點視作在車道處的靜止障礙物為由簡化的運動學模型推導得到的其他車輛的狀態矩陣和控制矩陣;amin、Δamin和amax、Δamax分別為加速度控制量和控制增量的上下邊界。
為進一步求解得到多車系統的納什均衡策略集A*,本文構建了多車分布式換道博弈速度規劃算法來對式(23)進行求解。如算法1 所示(表1),分兩個主要步驟來得到最優速度控制策略和換道時機。首先,通過單步求解算法1中第4行的標準二次優化問題得到系統內每一輛車的最優速度控制策略然后,基于該策略和式(19)計算換道時刻在t~t+N-1時的綜合代價集合:
式(24)集合中最小代價對應的時刻即作為車輛i的最優換道動機不同于集中式的優化方法,分布式的優化方法的核心在于采用多個節點來優化全局目標函數,算法中節點的含義對應系統內的每一輛車。通過節點間的相互信息交換,使得所有節點上的局部目標函數之和最終收斂于全局目標函數的最小值。因此基于算法1,最終可以得到系統納什均衡的速度控制序列和換道時刻
道路曲率的準確識別和預測是影響控制因素的關鍵之一,一般可通過采樣計算來得到道路曲率,此外,也可通過擬合曲線進行近似計算。B 樣條曲線是B-樣條基數函數的線性組合,相比于貝塞爾曲線,B 樣條曲線能指定階數,并且在改變某個控制點情況下不會影響大范圍的曲線變化?;谏鲜鎏卣鳎侠碓O置B 樣條曲線控制點個數能夠準確地估計道路曲率,同時可預測未來曲率狀態。然而由于道路曲率實時多變,且偶爾會伴隨著突變的發生,增加了曲率識別的難度,為了能夠在變曲率道路上快速地識別曲率并規劃出參考軌跡,本文設計了基于B 樣條曲線的自適應采樣方法來計算和預測曲率,如圖4所示。定義生成的k階B樣條曲線如下:

圖4 曲率識別和路徑規劃示意
式中:P0~Pn表示為在車道保持和換道合流兩個典型場景下的采樣點,即可定義樣條線曲線的走向和界限范圍的控制點;λ是一組由非遞減的連續變化值構成的節點矢量;Bi,k(λ)是第i個k階B 樣條基函數,其具有德布爾-考克斯遞推式,見式(26)。
為了使擬合曲線盡可能地逼近真實值同時減少計算采樣的頻率,本文采用變頻率控制點采樣的方法生成B 樣條參考曲線,即當車輛檢測到當前路段的曲率變化較小時,進行低頻采樣;當預測到未來路段曲率將增大時,轉化為高頻率采樣。由于B 樣條曲線的局部支撐性和可微性,增加更改控制點可以僅改變局部的曲線,整體曲線不會受到很大影響。因此,自適應采樣的方法可以保證實時識別曲線的光滑性和完整度,以及曲率的準確性和連續性。
基于上述討論,定義通過B 樣條曲線擬合的N步預測域下的橫向參考軌跡為
道路曲率變化給車輛循跡控制增加了難度,尤其需要執行橫向運動控制時,需要綜合考慮輪胎的動力學因素、曲率和縱向車速的變化。在傳統線性模型預測控制中,狀態方程中的狀態矩陣和控制矩陣均為常矩陣,即將車速或輪胎剛度設為定值。這種方法可以很好地應對一般工況,而當道路曲率變化導致車輛表現出非線性動力學特征時,預測模型則無法真實表達車輛狀態,進而會造成較大的控制誤差,甚至會引發算法失效。為此,本文設計了自適應時變預測控制算法對車輛進行協同控制。
首先,通過泰勒展開式線性化車輛模型:
基于式(28),定義時變狀態矩陣Actrl,i和控制矩陣Bctrl,i為
式(29)可表示為標準狀態方程形式:
進一步將式(30)離散化。下面以第k步的預測為例進行描述,離散化式(30)后可以預測第k+1步的車輛狀態增量為
對于車輛名義狀態量和控制量的預測更新,通過前向歐拉公式可以得到離散方程。對于車輛i在時刻t下第k+1步的名義狀態量和控制量可表示為
基于式(31)和式(32),預測估計車輛i在時刻t下的第k+1步狀態ξi和輸入ui:
進一步地,將跟蹤問題轉化為一個N步預測域的標準凸約束優化問題:
上述過程只能保證在單步計算過程中得到最優控制。為了能夠降低曲率、車速等參數的連續不斷變化造成的控制誤差,本文中提出了如圖5 所示的自適應時變模型預測控制算法(ATV-MPC)。其特點在于,基于上一步預測得到的最優控制,在每一時刻t下迭代更新狀態矩陣和控制矩陣從而減少曲率、車速頻繁變化帶來的控制偏差累積。在當前時刻計算結束后,將中第一個元素作為輸入作用于被控車輛之中。

圖5 自適應時變預測算法流程
為了驗證所提出的面向變曲率道路的多車協同控制算法的有效性,本文基于MATLAB 和CarSim 的聯合仿真平臺進行算法實現和場景搭建,整體算法的框架流程如圖6 所示。本文構建了一個單向雙車道的變曲率道路場景,并選用4 輛自動駕駛汽車作為實驗對象。此外,設計了車道保持和換道合流兩種工況進行驗證。

圖6 整體算法框架
預測控制中的時域大小對計算效率和控制效果有很大影響,時域過短會削弱預測控制的精度;過長的時域則會導致預測模型誤差增大,計算效率下降,難以達到理想的控制效果。因此,凸優化問題的預測時長通常選擇在0.6~1 s 左右[27-28]。本文選擇預測時長為1 s,其中預測域N=10,步長ts=0.1 s。其他參數如表2所示。

表2 仿真參數設置
為了評估橫向運動控制算法的性能,在設置的車道保持場景中,4 輛智能網聯車均設置在同一車道上行駛,并采用經典的斯坦利(Stanley)算法和未采用變頻率采樣B 樣條曲率計算的時變預測控制算法進行對比。
圖7 展示了協同控制算法對測試道路的曲率識別結果。對比算法為未采用變頻率采樣B 樣條曲線曲率計算方法,可以看出當曲率發生較大變化時,容易產生劇烈波動,曲率是計算控制量的重要參數,數據的頻繁變化會嚴重影響控制精度。相比較,提出的算法能夠根據B 樣條曲線顯示地預測未來曲率變化從而優化采樣頻率,消除了數據的震蕩,減少了對后續控制的影響,相關結論也可在圖8中看出。

圖7 曲率識別計算結果

圖8 橫向跟蹤結果
圖8 為本文提出的橫向跟蹤控制算法在變曲率道路上的仿真結果,圖9 為仿真過程中的轉角變化。隨著道路曲率的增大,3 種算法的跟蹤誤差都會有所增加。經典Stanley 算法由于未系統地考慮車輛橫向動力學,控制誤差較大。相比較而言,文中提出的基于最優狀態反饋的時變預測控制算法能夠減少58%的跟蹤誤差。同時可知,更加精確和平滑的連續曲率能夠降低控制過程中轉角的頻繁波動,是減少控制誤差的關鍵。

圖9 前輪輸入轉向角
本部分搭建的實驗場景用于檢驗變曲率道路下協同控制算法的換道合流性能。道路曲率變化與場景1 設置相同。圖10 為CarSim 中的仿真時刻截圖,在距離起點50 m 處增加了道路合流點,車輛#1和#3被設置在右車道,車輛#2 和#4 在左車道。為了便于觀察,圖11 展示了各車在曲率坐標下的相對位置??刂颇繕耸鞘沟缆分兴熊囕v高效安全地通過設定的合流點。測試中選用集中式MPC 算法和協同自適應巡航算法(CACC)進行比較。

圖10 CarSim仿真時刻場景圖

圖11 曲率坐標系下投影的時刻場景圖
圖12~圖15 展示了在該場景下3 種協同控制算法下的車輛狀態變化。圖12 給出了車輛相對距離的變化大小,從投影時刻圖11 和圖12 中可以看出,車輛#4 起始的質心處相對距離均在4~5 m 左右,在本文提出的速度規劃方法的作用下,相對距離逐漸增大,并最終能夠穩定安全地達到理想的相對距離。相比較而言,集中式MPC 的方法也能夠更快地實現類似的效果。CACC 算法盡管也能最終實現期望值,但是在控制過程中會造成較大波動。

圖12 相對距離變化結果
圖13顯示在3種算法下的碰撞時間倒數均維持在-0.2~0.2 范圍內,由文獻[29]中可知均處于安全狀態。而提出方法下各車碰撞時間倒數值略低于另外兩種方法,且數據分布更加集中,能夠實現更加安全穩定的多車協同駕駛。

圖13 碰撞時間倒數結果
類似的結論也可以從圖14 車速變化和圖15 加速度變化中得到。車輛#1 處于最靠近合流點的位置,故3 種算法下車輛#1 和車輛#3 先加速,車輛#2和車輛#4 減速來創造更多安全換道的空間。之后,在速度調節算法的作用下,均趨向于理想車速。由圖可知,無論是集中式還是分布式,本文中提出基于博弈的速度規劃方法能夠使各車車速平穩地變化到期望車速。而在CACC 方法下各車速度和加速度變化超調量大,波動頻繁,鎮定時間長。

圖14 車速變化結果

圖15 加速度變化結果
圖16 展示了車輛的橫向位移變化。從圖中可以看出,在本文提出的橫向運動控制算法的作用下,車輛均能夠準確跟蹤期望橫向軌跡。此外,在不同算法作用下車輛#1 和車輛#3 的換道時機均不同?;诓┺牡姆椒軌蚺袛喑龈哂行б娴膿Q道時機。相比較而言,CACC 方法下的車輛換道時刻更加保守。

圖16 橫向位移變化結果
為了更加直觀的展示換道時機的選取,圖17 和圖18 給出了有換道需求的車輛#1 和車輛#3 的代價變化,其中當換道代價突變至20 左右時表明此時車輛已通過合流點。對于車輛#1,如圖17 所示,博弈的算法判斷在起始時刻綜合的代價最小,最終車輛#1 在當前時刻即實施了換道動作,直至到接近1.7 s完成換道,此時的換道博弈代價要遠高于原始車道代價,車輛即繼續保持在已換道結束的車道上行駛。CACC 算法下的車輛#1 在初始時刻換道代價顯示具有高收益,但是車輛仍然等待到2 s左右后才執行換道行為,合流效率降低。與車輛#1 不同,車輛#3 需要合理地并入到車流內部中,如圖18 所示,在初始時刻換道博弈的代價要高于原始車道代價,直至0.5 s左右算法判斷此時換道具有高收益,車輛#3選擇執行換道合流。

圖17 車輛#1換道與原始代價

圖18 車輛#3換道與原始代價
圖19歸納了3種算法下的換道時機和對應的廣義換道代價。結果顯示,相較于CACC 算法,提出的基于博弈的方法無論集中式還是分布式都能以更低的代價獲取更高效益的換道時機,節省了74%的合流時間,提高了協同換道合流的效率。

圖19 廣義換道代價結果
圖20 給出了算法分別在集中式和分布式兩種架構下的計算效率,表3 歸納了兩種架構下的優化問題規模。結果顯示,分布式算法計算效率更高,計算時間僅為集中式MPC 的10%,從而降低了算法對硬件設備的需求,更容易在實際中部署。

表3 優化問題規模

圖20 單步計算時間結果
為使多自動駕駛汽車能夠安全高效地在高動態的道路環境中執行換道任務,本文中提出了一種基于博弈的多車換道合流運動規劃與協同控制方法。主要研究內容如下:(1)分析了曲率變坐標系下的車輛運動狀態,解析了車輛之間的相互影響機制,建立了多車交互動力學模型。(2)通過系統地考慮道路環境信息,提出了基于博弈的多車協同速度規劃算法,并采用分布式框架計算多車最優速度軌跡及換道時機。(3)基于變頻率采樣的B 樣條曲線識別的道路曲率及規劃的路徑,構建了自適應時變預測控制算法實現底層軌跡跟蹤,在車速和曲率頻繁變化時仍能保證控制策略的有效性。
分別在車道保持和換道合流兩種測試場景下對算法進行驗證,結果顯示提出的協同控制方法能夠選取最高效的換道時機,同時保證駕駛安全和控制精度。其中,相比于經典橫向運動控制Stanley 法,提出的方法能夠改善時變工況下的軌跡跟蹤性能,減少58%的跟蹤誤差;相比于CACC 法,提出方法能夠規劃更平滑安全的速度軌跡和具備更高效益的換道時機,減少74%的合流時間;相比于集中式MPC的方法,提出方法能縮小優化問題規模,計算求解效率僅為集中式MPC的10%。
在后續的工作中,將考慮混合交通流中存在的各種不確定因素,并結合學習類的方法,使本文提出的協同控制方法能夠應用于具有更加復雜多變的道路場景中。