周 欣,謝耀華,王潤民,鄭兵兵
(1.國家山區公路工程技術研究中心,重慶 400067;2.自動駕駛技術交通運輸行業研發中心,重慶 400067;3.招商局重慶交通科研設計院有限公司,重慶 400067;4.長安大學信息工程學院,陜西 西安 710016;5.中航光電科技股份有限公司,河南洛陽 471000)
自適應巡航控制通常采用分層架構,將ACC 策略分為速度控制和距離控制[1-6]。當前ACC 策略通常認為前方目標車速度或者加速度恒定不變,然而由于實際交通環境的動態隨機性,以及駕駛人內在的不確定性,前方目標車運動狀態存在很強的隨機性[7-12]。
針對實際行駛環境中前車運動狀態的隨機性特點,該文研究了隨機最優ACC 控制算法。采用分層ACC 控制架構,通過相對速度-相對距離相平面進行工作模式之間的切換;基于駕駛人實際駕駛數據,建立了速度控制過程模型;設計了前車運動的馬爾科夫加速度控制模型,然后利用策略迭代算法進行求解[13-16]。構造滿足實際駕駛環境下車輛運動隨機性特征的測試工況,對文中所提策略進行了測試驗證。
為研究駕駛人在真實駕駛環境下的駕駛特點,搭建了實車道路試驗數據采集平臺,如圖1 所示。

圖1 駕駛員駕駛數據采集平臺
車上安裝有激光雷達、相機和一套RT3002。利用激光雷達和相機能夠準確檢測車輛周圍目標。RT3002 通過固定基站和車輛移動站進行差分定位,能夠精確地確定車輛位置信息。同時能夠精確測量車速、航向角、加速度等車輛狀態信息。通過安裝在車輛后備箱的工控機能夠對各信號進行同步、記錄。
基于該實車平臺,該文在長安大學智能汽車封閉測試試驗場進行了試驗。試驗中前車駕駛人按照不同速度自由行駛,主車保持跟隨行駛,基于采集的駕駛數據,構建了真實駕駛數據庫。
設計了如圖2 所示的分層ACC 系統控制架構,主要包括上層加速度決策算法和下層驅動/制動控制算法[17-19]。

圖2 控制器結構
下層加速度跟隨控制基于車輛逆縱向動力學模型設計,現已有大量研究,該文不再展開介紹。系統工作模式仲裁模塊根據駕駛員輸入、駕駛員操作信號和傳感信息決定ACC 工作模式。為實現速度跟隨模式下的擬人車速控制,基于實際駕駛數據建立指數加速度過程模型。
基于距離的模式切換策略僅當車間距小于期望距離時才開始控制主車減速,會使主車響應遲鈍。該文利用相對速度-相對距離相平面進行兩工作模式之間的切換。如圖3 所示,當車輛運動狀態位于切換線上方時,系統工作于速度跟隨控制,此時車輛以駕駛員設置的巡航速度穩定行駛;當系統狀態位于切換線下側時,系統切換至距離跟隨控制,ACC 系統控制主車與前方目標車保持一定的安全距離。為避免當車輛運動狀態位于切換線附近而導致系統工作模式頻繁切換的現象,設置切換線。工作模式切換策略為:

圖3 工作模式切換策略
基于所獲得的駕駛數據對駕駛員的縱向駕駛隨機特性展開了研究,針對ACC 系統在距離跟隨模式下的控制問題建立了考慮前車運動不確定的SDP 最優距離控制策略。
ACC 系統設計中通常假定前車加速度固定不變,然而前車運動的變化可能會導致ACC 決策的加速度出現較大變化而導致較大沖擊度。為研究車輛加速度變化的不確定性,基于采集的駕駛員真實道路駕駛數據,建立其加速度分布概率模型,并將其作為前車運動不確定模型。
將加速度變化建模為馬爾科夫隨機過程,為獲得前車加速度變化的概率轉移矩陣,將加速度離散為有限數值。記車輛加速度變化范圍為[amin,amax],其中,amin、amax分別表示最小、最大加速度,按照0.2 m/s2加速度差進行離散得到若干加速度點。當在k時刻前車加速度為ap=amin+0.2n(n=0,1,2,…)時,下一時刻前車加速度分布密度函數為:
式中,Pnm表示加速度由an轉移至am的概率,Nnm為駕駛數據庫中加速度從an轉移至am的樣本數,Nn是加速度為an的樣本數。以車速差為10 km/h變化范圍分別統計得到在速度區間為[0,10 km/h],(10 km/h,20 km/h],…內的加速度轉移概率矩陣。圖4為車速在(20 km/h,30 km/h]范圍內的加速度轉移概率矩陣,其中圖4(a)、(b)、(c)分別為1 步、3 步、5 步轉移概率分布。

圖4 車輛加速度轉移概率與構造的仿真工況
采用固定時距模型計算期望車間距為:
其中,th表示設定的跟車時距,vh(k)為主車速度,d0表示最小車間距。
采用一階慣性時滯傳遞函數描述車輛加速度控制過程為:
式中,ah(k) 表示實際加速度,u(k) 為期望加速度,τ為時間常數,Kg為系統增益。
根據當前時刻實際距離d(k)計算車間距跟隨誤差為:
車輛沖擊度j(k)為:
記相對車速為Δv,可得距離跟隨模式下的狀態空間模型為:
其中:
車輛跟隨控制是一個涉及跟蹤性、舒適性和經濟性等目標在內的多目標優化問題。基于車間距誤差和相對車速設計跟蹤性二次型指標函數:
式中,ωΔd和ωΔv分別為車間距、相對速度權重系數。
為實現主車的駕乘舒適性,ACC 系統應避免出現較大沖擊度,為此設計舒適性指標函數:
另外,車輛的燃油經濟性與加速度大小直接相關,設計經濟性指標函數為:
由于車輛跟隨行駛狀態方程中前車運動的不確定性,導致未來的運行狀態是一個隨機分布,因此系統的求解目標函數為:
上式表示無限時域下的各指標函數之和的期望,其中γ∈(0,1)為折扣因子。
將系統狀態離散化,根據Bellman 方程,將上述目標函數表達為:
其中,k表示迭代步數,P(x'|x,u) 表示在狀態x下采取控制u系統達到狀態x'的概率。
針對上述SDP 問題的求解,通常有值迭代算法、策略迭代和逆向遞推三種方法。逆向遞推算法存在計算量大問題,策略迭代通常比值迭代具有更快的收斂速度。該文利用策略迭代對系統最優控制進行求解,算法交替執行策略評估和策略改進,直至收斂到最優策略。根據Bellman 原理,最優控制等價于最小化式(12),最優期望加速度通過如下迭代得到:
策略迭代算法偽代碼如算法1 所示,其中第三行通過下式求得:
式中,R(x,x',a)為在狀態x下采取動作a到達x'獲得的獎賞,通過計算設置的目標函數得到。
算法1:策略迭代SDP 求解算法
由于實際控制中,系統狀態不一定為離散的狀態點,為此通過多維線性插值獲得具體期望縱向加速度。
為驗證所提出的隨機最優ACC 控制策略的有效性,基于Carsim 軟件搭建了仿真環境及控制器,利用所獲得的車輛縱向加速度概率轉移矩陣構造了一組前車運動變化曲線,對控制策略進行測試。測試內容主要包括速度跟隨和距離跟隨兩種,設置主車巡航速度為70 km/h,初始時刻主車距離前車較遠,此時ACC 系統工作于速度跟隨模式。
如圖5、6 所示,當車間距減小至一定范圍,系統切換至距離跟隨,在9.7 s 附近系統從速度跟隨切換至距離跟隨,車輛開始減速。其中,圖6 虛線為構造的前車速度變化曲線。從中可以看出主車能夠與前車保持在期望間距附近安全行駛。

圖5 車間距跟蹤結果

圖6 主車與前車的速度對比
為清晰顯示跟隨行駛模式下的距離跟隨誤差和相對車速,分別作車間距誤差和相對車速變化曲線如圖7(a)、(b)所示。通過統計可得,距離跟隨模式下主車穩定跟隨前車行駛過程中,平均車間距誤差約為0.17 m,平均相對車速約為0.18 m/s。

圖7 跟蹤誤差曲線
在現有ACC 系統研究的基礎上,該文分別對系統中的速度跟隨模式和距離跟隨模式進行了研究。首先搭建了實車數據采集平臺,采集了大量真實駕駛環境下的駕駛數據。基于真實駕駛數據庫,文中提出了一種能夠符合駕駛員加速控制特性的指數加速模型。為使ACC 系統能夠適應真實駕駛環境下的前車運動變化的隨機性,基于真實駕駛數據庫分析了車輛縱向運動不確定性特點,將車輛縱向加速度變化建模為若干不同車速區間范圍內的馬爾科夫模型,利用該模型能夠采樣生成符合真實運動變化分布的前車運動曲線;將ACC 系統距離跟隨控制建模為隨機最優控制下的隨機動態規劃問題,采用策略迭代方法對問題進行求解,從而得到在設定目標函數期望最小下的車輛縱向控制;最后,該文在構造的前車運動工況下對所提出的ACC 控制策略進行測試。算法在速度跟隨模式下能夠實現擬人加速過程控制,同時在距離跟隨模式下控制主車與前車的間距維持在期望車間距附近。