陳慧巖, 關海杰, 劉海鷗, 龔建偉, 吳賀禹
(1.北京理工大學 機械與車輛學院, 北京 100081; 2.中國兵器工業導航與控制技術研究所, 北京 100089)
地面無人機動平臺能夠代替人類在越野環境下完成危險物資運輸、災情救援、戰場環境偵察等任務,減輕或避免人類在越野危險環境中的負擔與消耗。地面無人機動平臺一般由環境感知、運動規劃、運動控制、底盤執行4個基本模塊組成[1]。在越野環境中,如何利用更多的高階語義信息有效地串聯無人駕駛系統中的各個模塊以提升地面無人機動平臺在越野環境中的通行能力,成為重要的研究方向。
越野環境下無人駕駛系統環境感知模塊可通行區域的提取的準確性與穩定性對于提升地面無人機動平臺的通行能力至關重要[2],而其中環境語義信息的獲取對于可通行區域的分類提取必不可少。目前環境感知模塊關于環境中語義信息的提取主要在城市道路等結構化場景下進行[3],而越野環境相較于城市結構化場景具有環境特征不明顯、地形地勢復雜、地表形式多樣等特點,對無人駕駛系統提出了更高的要求。目前越野環境語義信息分割主要是基于深度網絡學習人工標注語義標簽特征,利用端到端的方法將環境特征與語義信息建立映射關系,輸出環境信息中的語義特征[4]。文獻[5]采用對比學習的方法訓練具有語義區分度的特征提取器,實現不同通行度的類別建模。
越野環境下無人駕駛系統運動規劃模塊利用環境感知模塊提供的信息的方式主要有兩種,第一種是基于平面假設的二維柵格地圖,將環境信息分為可通行與不可通行兩類,該類方法主要是對不可通行的障礙物進行規避[6-7],但是缺少環境感知模塊對于三維環境高度以及語義信息的輸入,在具有連續起伏路面或者有大量可通行植被,煙霧等環境中會出現運動規劃出現錯誤解甚至不可行解的情況。另一種是將環境高度特征進行表征,又分為2.5D類型的地圖[8-10]、三維點云地圖[11]以及三維柵格地圖[12]。2.5D地圖是在地圖柵格中賦予高度或者其他相關信息,其中賦予高度信息的地圖類型又稱為數字高程地圖。文獻[8]考慮了環境中的坡度和粗糙度利用混合A*圖搜索算法進行運動規劃。文獻[9]將環境分類為環境態勢場、道路層、威脅層、障礙層等多層數字高程地圖建立最終的態勢場模型利用人工勢場的方法進行運動規劃。文獻[10]采用地形層,坡度層,地表特征分類層,地圖不確定性層考慮能量消耗進行運動規劃。三維點云地圖是使用相機或者激光雷達等傳感器直接輸出的原始數據得到的地圖。文獻[11]采用三維點云地圖結合快速隨機擴展樹(RRT)、改進快速隨機擴展樹(RRT*)和基于數值優化的方法生成具有三維信息路徑。該方法在生成路徑的過程中,利用點云信息通過擬合平面得到當前位置的三維空間姿態,通過包含三維空間姿態的代價函數進行節點的選擇與路徑的優化。三維柵格地圖是通過對點云信息進行局部離散化計算,可以避免進行大規模點云計算時間效率低下的問題。文獻[12]采用三維柵格地圖對環境中的局部障礙進行分析,并通過平臺結構與環境信息對于平臺的位姿進行估計,用于運動規劃來避免平臺姿態的突變。
越野環境下無人駕駛系統運動控制模塊主要解決復雜環境下的地面無人機動平臺與接觸地面難以完全表征的關系,即模型的不確定性。文獻[13]針對越野環境的不確定性,設計了一種基于反饋校正的模型預測控制器。文獻[14]考慮控制延時與執行機構的執行延時的模型預測控制器,針對平臺延時問題進行了控制模型的設計。文獻[15]提出利用自適應前饋調節器采用粒子群優化算法和支持向量機的方法,通過軌跡中的曲率與速度信息對控制器進行策略調整。文獻[16]針對行為軌跡與操控層上映射關系進行了相關研究。
前期的研究針對無人駕駛系統中的各個模塊均開展了相應的工作,但各個模塊之的串聯方式比較弱化。針對該問題,本文利用語義信息串聯環境感知模塊、運動規劃模塊、運動控制模塊,豐富了無人駕駛系統模塊之間的輸出信息,提升了地面無人機動平臺在越野環境的通行能力。
圖1為本文所提無人系統框架。圖1中,加粗字體為框架中包含語義信息的兩方面內容:一是串聯環境感知與運動規劃模塊的三維語義柵格地圖,二是串聯運動規劃與運動控制模塊的行為語義軌跡;T(sx,sy,sz,syaw,spith,sroll,sv,stype)為三維姿態信息的軌跡,sx、sy、sz為軌跡點以在平臺局部三維坐標系x軸、y軸、z軸的三維坐標,syaw、spith、sroll為軌跡點在繞平臺局部三維坐標系軸的旋轉角度量,sv為軌跡點上的期望速度,stype為軌跡點對應行為基元的類型;(px、py、pz)為柵格的三維坐標,pt為柵格的可通行度,pγ為柵格對應的法向量;C(vl,vr)為運動控制模塊輸出,其中vl、vr分別為履帶平臺左右側履帶速度。

圖1 基于語義信息的無人駕駛系統框架
三維語義柵格地圖將環境基于圖像語義屬性、激光雷達點云特征更詳細地建模分類,形成更加豐富的通行度語義分類,運動規劃模塊基于該地圖通過利用離線生成的運動基元庫首先根據參考速度與平臺前方可通行區域的通行度選擇當前最優的運動基元簇,其中的運動基元是指在有限的時間并符合自身約束條件下車輛從起始位姿到目標位姿的軌跡,運動基元簇是通過采樣不同的目標位姿形成的軌跡簇。之后與根據與全局參考線的偏差、曲線能量、碰撞風險、通行度代價等在線選擇出最優的運動基元,生成具有平滑且姿態變化小的軌跡,根據不同行為語義的運動基元對生成軌跡進行分段得到行為語義軌跡。
行為語義軌跡將規劃軌跡基于行為語義基元進行分段,運動控制通過軌跡匹配,利用數據集合中的優化參數在線實時調整控制參數,減小運動跟蹤控制跟蹤軌跡的橫向偏差、航向偏差、速度偏差。
本文采用圖2所示中型無人履帶平臺作為無人駕駛系統的底盤執行模塊。該平臺通過串聯式混合動力輔助動力裝置(APU)系統結合能量管理算法為平臺提供驅動能量,同時動力電池可以單獨為平臺供能。該平臺的驅動形式為雙側獨立電驅動,兩側驅動鏈為驅動電機分別串聯兩擋機械式自動變速器(AMT)行星變速箱與側減速器將動力傳遞至履帶。由于兩側驅動電機之間無機械結構連接限制,平臺可在復雜越野環境中靈活行進。平臺搭載64線主激光雷達與2個16線激光雷達形成激光雷達組;采用3個相機作為圖像傳感器;采用定位信息接收機結合千尋網絡差分與慣性導航系統作為平臺的定位源。采用3臺工控機作為計算設備,其中一臺配備RTX 2080Ti作為圖像語義分割處理工控機,另外兩臺分別處理激光雷達點云和運動規劃控制程序。

圖2 中型混合動力地面無人履帶機動平臺
如圖3所示,環境感知模塊利用相機與激光雷達融合感知的方案,結合全局拓撲參考路徑,考慮障礙物、起伏地形、地表粗糙度、地面語義屬性以及地面無人機動平臺穩定性等,輸出帶有局部可通行度語義柵格地圖。

圖3 三維可通行度語義柵格地圖
1.3.1 圖像語義分割與點云融合
首先基于BiSeNet V2[17]網絡在數據集上訓練來提取圖像特征完成輸入圖像的語義分割,在圖像分割出的可通行語義的類別中,如土路、草地等,通過激光雷達系統與相機系統之間的坐標轉化關系將圖像提取到的語義信息投影至激光雷達點云上形成激光雷達語義點云,將不可通行語義類別如車輛等,直接賦值為不可通行區域。之后采用激光雷達語義點云進行可通行區域的粗提取。圖4所示為實際場景中激光雷達語義點云。

圖4 激光雷達語義點云
1.3.2 可通行區域粗提取
通過相機與激光雷達數據融合得到語義點云信息描述環境,考慮本文所用平臺的橫縱向通過性能,縱向包括最大坡度、垂直墻跨越高度,橫向包括平臺發生傾覆的最大橫坡角度。通過對三維點云的擬合法向量以及高度梯度進行提取與履帶平臺通過能力的閾值進行比較,提取不可通行和未知區域。其中,未知屬性可以根據點到車體距離遠近和點云局部密度大小進行判斷,距離平臺較遠和點云密度過低的判定為未知屬性;不可通行屬性可以通過比較點云特征與平臺的坡度穩定角、垂直墻最高高度等進行判斷,點云特征值大于這些閾值的直接判斷為不可通行。最終完成越野環境下可通行區域的粗提取。
1.3.3 可通行區域內可通行性分析
本文通過利用高斯混合聚類(GMM)方法訓練出聚類模型,并對輸入點云進行在線實時估計,分為三類,即易通行、可通行和難通行。
在點云特征的提取過程中,首先利用平臺搭載慣導對點云位姿進行矯正,之后在平臺水平坐標系計算所有點云特征,所有環境地形特征全部基于當前時刻平臺所處位置進行判斷。
點云特征的高斯聚類模型L(D)是根據點云樣本集D={p1,p2,…,pm}為過濾后的m個點,每個點的局部特征向量為F={f1,f2,f3},高斯混合聚類的目標是最大化對數似然函數,如(1)式:
(1)

本文選取以下3個矢量作為高斯聚類的局部特征向量:
f1:點云及其鄰近區域點云的法向量矢量和的模的均值,可以表示道路的不平度信息。
f2:點云及其鄰近區域點云的法向量矢量和在車體水平坐標系Oyz平面投影與z軸的夾角,表示縱坡坡度。
f3:點云及其鄰近區域點云的法向量矢量和在車體水平坐標系Oxz平面投影與z軸的夾角,表示橫坡坡度。
其中,領近區域選取平臺幾何形狀占據的區域。
將特征向量進行歸一化處理,利用GMM方法進行多元聚類,得到易通行、可通行和難通行三類可通行度標簽。
在實際在線感知過程中,將點云的特征向量輸入至GMM模型,可得到當前點云的對應環境的可通行度。
1.3.4 三維語義柵格地圖構建與地圖融合
本文采用八叉樹的數據管理地圖數據,采用基于貝葉斯核推理的柵格屬性推理,對三維柵格的可通行性屬性進行建模,從而對點云缺失部分的柵格的屬性進行推理,以實現連續的三維建圖。
地圖融合基于文獻[18]所提方法進行融合。
運動規劃模塊分為離線基于最優控制理論的二維行為運動基元生成與在線基于三維語義柵格地圖與全局參考路徑的行為運動基元選擇擴展。通過將二維運動基元向三維環境進行投影,最終輸出具備三維姿態信息的軌跡為
T=[sx,sy,sz,syaw,spitch,sroll,sv,stype]
圖5所示為行為運動基元投影方法與拼接過渡方法示意圖,其中運動基元投影方法采用基于文獻[11]的方法。首先基于二維平面生成行為運動基元,得到離散的運動基元軌跡點p=[x,y] ,之后根據需要拼接的父行為運動基元末位姿確定拼接后的子行為運動基元軌跡點p′=[x′,y′],之后將拼接后的二維軌跡點投影至三維環境中=[,,] ,并在車體范圍如圖5中綠色矩形框所示,利用主元分析法計算法向量進而計算平臺在該處的俯仰角、側傾角、航向角。圖5中不同軌跡顏色為不同類型的行為運動基元,軌跡點上的坐標系反映了當平臺運動至該軌跡點時平臺的姿態信息。
1.4.1 行為運動基元的生成
行為運動基元的生成考慮履帶平臺的基本運動學約束、平滑過渡約束、平臺- 地形約束、平臺行為約束,以生成行為運動基元盡可能平滑為目標,離線生成用于在線規劃時所用的行為運動基元庫。生成行為運動基元的優化問題定義如(2)式:

s.t.
(2)
式中:f是履帶平臺的運動學約束;g(·)為考慮生成運動基元在路徑曲率和速度層的平滑性目標函數;B為區分運動基元的行為約束;Ue為考慮平臺- 地形之間關系對控制量與狀態量的不等式約束;Up為考慮平臺執行機械結構與運動學約束的不等式約束;T為考慮運動基元拼接過渡的約束;優化的控制量為u(t)=[ηx(t),αΔv(t)]T,ηx(t)為平臺縱向的沖擊度,αΔv(t)為速差變化率的導數;平臺的狀態參量s(t)=[x(t),y(t),θ(t),vx(t),ax(t),Δv(t),ωΔv(t)]T,其中x(t)、y(t)和θ(t)為全局坐標系下的位置坐標值和航向角,vx(t)為平臺坐標系下沿平臺坐標系x軸的縱向速度,ax(t)為相對應的加速度,Δv(t)為兩側履帶的速差,ωΔv(t)為兩側履帶速差的變化率;t1為基元生成的起始時刻,tg為基元生成的終止時刻。
雙側獨立驅動無人履帶平臺的運動學微分約束f如(3)式:

(3)
式中:B為兩側履帶接地點中心距。圖6所示為履帶平臺微分約束中各參量示意圖,其中L為履帶接地長度。

圖6 履帶平臺微分約束參量示意圖
平臺行為約束主要對生成行為運動基元的起始與目標狀態進行限制,常見的行為如類直線行駛,類直角彎轉向,類U形彎大角度轉向,調頭,雙移線,上下坡等行為。起始與目標狀態的約束如(4)式:
(4)
式中:d為首末位姿橫向移動的距離;β為首末位姿的角度差。
在運動基元生成過程中,由于平臺執行機構的機械結構約束,以及平臺-地形之間關系,在運動基元生成過程需要滿足不等式約束如(5)式:
(5)

由于運動規劃最終的輸出軌跡是由行為運動基元序列組成,在離線生成基元時需要考慮橫向和縱向參量的平滑過渡,約束形式如(6)式:
Tt=[ax(t1),ηx(t1),Δv(t1),ωΔv(t1),αΔv(t1),ax(tg),ηx(tg),Δv(tg),ωΔv(tg),αΔv(tg)]T=0
(6)
行為運動基元生成的目標函數從橫縱向兩個方面考慮了橫縱參量的平滑度,離散化的目標函數表示如(7)式:
(7)
式中:c1、c2、c3、c4、c5為目標函數中各參量的權重系數;N為生成運動基元的軌跡點數。
1.4.2 行為運動基元的拼接與過渡
行為基元的拼接與過渡考慮環境感知模塊提供的三維語義地形以及全局參考路徑的引導,以行為運動基元的擴展代價為依據從離線行為運動基元庫中選出不同種類的行為運動基元進行拼接與過渡,最終生成由多個行為基元序列組成的軌跡。
本文采用兩層的運動基元選擇邏輯,首先通過參考軌跡參考速度與地面無人平臺參考軌跡前方可通行區域的通行度選擇出合適的運動基元簇。之后在運動基元簇中通過比較運動基元的擴展代價遍歷選擇出最優的運動基元,其中擴展代價包括行為運動基元與參考軌跡的橫縱向偏差Jo、碰撞風險代價Jc、平滑代價Js、通行度代價Jt。
本文全局規劃采用基于谷歌地球衛星地圖制作的環境拓撲地圖[20],在環境拓撲地圖的基礎上利用A*搜索,完成經過必經點的全局規劃,輸出具有良好引導效果的全局參考軌跡[21]。因此被選擇的行為運動基元上的軌跡點需要與參考軌跡匹配點在橫向偏差、航向偏差、速度偏差盡可能小,代價計算如(8)式:
(8)
式中:Np為行為運動基元上等間隔采樣點的總數目;p為正態分布函數;jn為生成軌跡采樣點與參考線匹配點之間的橫縱向偏差代價;x為運動基元軌跡點距離軌跡末端點的距離;μ為軌跡末端點設定的距離值,一般取0,σ為軌跡長度的三分之一,dn為生成軌跡采樣點與參考線匹配點之間的橫向偏差,Δθn為生成軌跡采樣點與參考線匹配點之間的航向偏差,Δv為生成軌跡采樣點與參考線匹配點之間的速度偏差;ωd、ωh、ωv分別為橫向偏差、航向角偏差、速度偏差的系數。
碰撞風險代價的計算首先將地面無人平臺利用文獻[6]所提6覆蓋圓的方法對地面無人平臺外形結構進行近似,采用6覆蓋圓圓心距離最近障礙物的距離do與覆蓋圓半徑r的差值作為運動基元的碰撞風險代價,如(9)式:
(9)
行為運動基元的平滑度評價采用綜合曲率和長度的軌跡能量函數,該值越小表明該運動基元的能量越低,軌跡越平滑,該代價值計算如(10)式:
(10)
式中:κn為基元采樣點上的曲率值;Δsn為相鄰采樣點之間的間距。
在環境感知提供的三維語義柵格地圖下,運動基元的通行度代價計算包含兩個方面,一方面是將行為運動基元軌跡點匹配柵格附近平臺外形結構大小區域的擬合平面法向量與垂直方向的夾角,另一方面是與匹配區域通行度代價的均值。擬合平面法向量計算方法如(11)式:

(11)

(12)
式中:pit為柵格的可通行度;I為垂向z軸單位向量。
行為基元的最終選擇是對多目標進行綜合評價,選擇代價的計算公式如(13)式:
J(mp)=Jo(mp)+ωsJs(mp)+ωtJt(mp)+ωcJc(mp)
(13)
式中:ωs、ωt、ωc為相應代價的權重系數。
在線基元選擇的原則是選擇總代價值最小的行為運動基元,通過選擇基元向前擴展,當行為運動基元的末狀態與規劃終點區域后完成擴展后,形成最終的具有時空信息的三維軌跡。
在選擇過程中,相鄰行為運動基元之間的過渡基元為變速直線運動,采用三次Hermite插值完成過渡段中速度的生成。

(14)

行為運動基元組成的軌跡包括道路的坡度、路面不平度、曲率特征等語義信息,以上信息對運動控制模型約束以及目標函數設計上提供更多的參考信息。在進行模型預測軌跡跟蹤控制模型的建立過程中,主要考慮執行機構的機械約束、平臺的運動學約束以及平臺動力學約束。根據道路類型、曲率特征、平臺速度等信息,對電機外特性以及履帶車輛坡道轉向的動力學分析,增加關于驅動系統后備功率的約束,保證極限工況下履帶平臺的軌跡跟蹤的穩定性。當平臺在坡道上進行低速勻速轉向時,結合參考軌跡上平臺姿態與規劃速度,對車輛在坡道上跟蹤行駛時所需的功率和力矩進行預測,結合電機外特性的邊界值,對車輛的控制量進行約束,使得平臺可以在坡道上進行穩定的軌跡跟蹤。 最終建立如(15)式的約束不等式。
umin≤u(k+i)≤umax,0≤i≤Nc
Δumin≤Δu(k+i)≤Δumax
Δu(k+i)=u(k+i)-u(k+i-1)
ymin(k+i)≤yb(k+i)≤ymax(k+i),0≤i≤Np
Δu(k+i)=0,Nc≤i≤Np
(15)
式中:umin、umax的約束求解主要是結合電機外特性,道路坡道信息、車輛動力學模型等,在保證車輛具備足夠的后備功率、轉向力矩的前提下,得到的該工況下車輛速度邊界值。Δumin、Δumax為驅動電機調速的變化率約束。Np、Nc分別是預測時域和控制時域;yb為狀態量的約束輸出;k為預測時域內的時刻。
基于模型預測控制方法的運動控制模塊根據運動規劃模塊提供的由行為運動基元組成的具有語義分類的參考軌跡,采用多組控制目標函數權重系數對不同語義分類軌跡進行跟蹤。根據控制目標函數如(16)式中所考慮的軌跡跟蹤控制的橫向偏差、航向偏差以及控制量變化率為指標反映的軌跡跟蹤穩定性等構建最優軌跡跟蹤控制精度的評價體系,從而得出不同控制目標函數權重系數以及不同的系數比例對最終軌跡跟蹤控制效果的影響規律,建立不同語義軌跡下的控制策略數據集。

(16)
式中:ωl為橫向偏差的權重系數;le為橫向偏差;ωh為航向偏差的權重系數;he為航向偏差;ωv為速度偏差的權重系數;vd為期望速度值;后兩項為兩側履帶卷繞速度的變化率;ωu為控制量變化率的權重系數。
通過試驗數據積累和分析,在平臺能夠進行穩定軌跡跟蹤控制的可行域內,平臺的軌跡跟蹤效果主要受到橫向跟蹤權重以及航向跟蹤權重的影響,同時兩權重系數的比例關系在不同語義軌跡下平臺的表現具有較大差異。如圖7所示,平臺在跟蹤具有語義分類的參考軌跡時,在不同語義屬性的軌跡上采用不同的控制參數來提升軌跡跟蹤的精度與穩定性。

圖7 控制參數語義匹配原則示意圖
本節展示了在地形起伏的越野場景下環境感知以及運動規劃結果,基于二維柵格地圖與三維語義地圖的差異化的運動規劃結果進行討論,同時本文對于具有行為運動基元語義的軌跡進行了運動控制跟蹤試驗,對比分析了基于行為語義軌跡適配參數對于軌跡跟蹤效果的提升。
試驗場地選取越野環境場地,該場地道路不平度,道路表面屬性差異明顯,環境復雜度高。試驗平臺采用圖2中型混合動力地面無人履帶機動平臺進行方法的實車測試,各模塊的試驗參數如表1所示。

表1 各模塊試驗參數
圖8為環境感知模塊對越野環境的不同方式建模結果。圖8(a)是利用三維語義柵格地圖對試驗環境進行建圖。圖8(b)是根據不可通行相對高度閾值h對環境進行了二值分類。通過對比可以看出,對于環境進行簡單的二值建模,造成環境中的很多信息丟失,而本文采用的三維語義柵格地圖盡可能地保留了環境中信息,對運動規劃模塊具有很好的約束引導作用。在輸入圖像寬高像素為640×480、點云過濾距離為20 m、限制融合幀數為80幀的情況下本文生成單幀三維語義柵格地圖的時間消耗平均為130 ms,生成單幀平面二維柵格地圖的時間為96 ms,雖然時間略有增加,但時間消耗仍可以滿足實時性要求。

圖8 環境感知建圖結果對比
圖9為運動規劃模塊基于不同類型地圖的運動規劃結果,圖9(a)中,S為直線行為運動基元,C為單移線行為運動基元,U為類U型彎行為運動基元,G為普通小曲率行為運動基元,R為類直角彎行為運動基元。

圖9 運動規劃結果對比
為了驗證基于三維語義柵格地圖的運動規劃方法,將本文與文獻[6]規劃方法進行對比,圖9為整體規劃結果的對比,在整體結果對比之后選取A、B兩個典型場景進行細化對比,其中A場景為類U型彎場景,如圖10所示;B場景為上縱坡場景,如圖11所示。無人履帶平臺在環境中行駛時,平臺的姿態一方面影響無人駕駛系統中環境感知與運動控制模塊的精度,另一方面較大的姿態變化容易對平臺硬件造成損害。本文選取平臺行駛過程中的平均俯仰角與平均側傾角對平臺的姿態變化進行表征。最終選取的對比指標包括規劃時間、平均俯仰角、平均側傾角、平均曲率。其中平均俯仰角、平均側傾角、平均曲率為全部路點相關量之和與路徑長度的比值。

圖10 A場景運動規劃結果對比

圖11 B場景運動規劃結果對比
通過圖9結合表2規劃結果的對比可以發現,本文規劃方法采用離線生成的運動基元、在線選擇運動基元規劃路徑,規劃耗時集中在對于豐富運動基元的選擇過程,與文獻[6]規劃時間基本持平。由于環境感知提供了可通度語義信息,運動規劃利用該信息在規劃時盡量選擇易通行區域通行,而文獻[6]規劃方法采用二值柵格地圖由于沒有相關信息,在提取道德可通行區域內盡量選擇較短路徑,造成規劃路徑對應的平均俯仰角、平均側傾角較本文方法較高,同時本文采用的運動基元在生成與選擇均考慮了軌跡平滑性,因此本文在軌跡平均曲率上具備一定的優勢。

表2 規劃軌跡指標對比
如圖10所示,在A場景中,本文規劃方法規劃路徑在路面不平度更低的區域,而文獻[6]方法由于沒有利用到該方面的信息,因此規劃路徑所在區域路面不平度較高,在入彎時文獻[6]規劃方法采用了切彎的策略,雖然使得路徑的平均曲率較小,但是軌跡在入彎處規劃軌跡的位姿發生較大變化,該種情況對于平臺的穩定行駛具有較大的考驗,而本文規劃方法則繞開入彎處的難通行區域,在整個過彎過程中車輛位姿變化較小。
如圖11所示,在B場景中,本文規劃方法在通過縱坡類難通行區域時以相對較小的曲率通行,同時本文規劃方法在上坡時基本處于坡道正中央,規劃軌跡通過縱坡時側傾角變化不大,而文獻[6]規劃方法規劃軌跡通過縱坡時由于軌跡與和縱坡存在一定的夾角,因此規劃軌跡通過縱坡時側傾角變化較大。
本文在規劃時間與文獻[6]基本持平的基礎上,在平均俯仰角、平均側傾角、平均曲率等體現無人機動平臺通過穩定性的重要指標中具有顯著優勢。同時本文所提運動規劃方法,根據行為運動基元的不同,將軌跡進行了語義分段,對運動控制模塊的參數優化起到參考作用。
將運動規劃模塊生成的具有行為語義的軌跡作為參考軌跡,運動控制模塊修改目標函數中的橫向偏差權重ωl以及航向偏差權重ωh分別對軌跡進行跟蹤,通過對比跟蹤的航向偏差、橫向偏差以及速度偏差,將在不同行為語義軌跡下的最佳參數組成語義參數集合,對模型預測的目標函數在線修正,形成變參數的運動控制模型。如圖12所示,將變參數模型與權重比例分別為1∶1,1∶5,1∶10的定參數控制模型的三項跟蹤偏差進行對比,可以發現不同權重比例的模型對于不同行為語義軌跡的跟蹤效果具有偏差,而變參數模型由于針對不同行為語義軌跡進行了參數適配,從表3中可以看出,變參數模型相較于固定參數比例的模型在橫向偏差最少提升20.7%,航向偏差最少提升2.7%,速度偏差最少提升6.9%;方法平均消耗時間為18.784 ms,相較于不變參算法計算成本基本沒有增加。

表3 軌跡跟蹤偏差對比

圖12 不同權重系數下軌跡跟蹤結果
本文提出利用語義信息將無人駕駛系統中環境感知模塊、運動規劃模塊、運動控制模塊之間息進行串聯的方案。結果表明:所提出的基于語義信息你串聯的無人駕駛系統,將難以標準量化的環境特征或軌跡特征以語義的形式表述,將定義的語義信息在無人駕駛系統模塊之間的傳遞,不同模塊利用模塊間傳遞的語義信息對模塊中模型或方法中的關鍵參量進行限制或約束,豐富了模塊間信息交互的內容。
本文的主要結論如下:
1) 環境感知模塊通過激光雷達點云與相機圖像融合感知的方案,利用圖像語義分割結合點云環境特征提取對環境進行建模,最終輸出具有可通行度信息,地形語義信息的三維語義柵格地圖。相較于平面二值柵格地圖能夠提供更多的環境通行度信息。
2) 運動規劃模塊離線基于最優控制理論生成行為運動基元,在線基于三維語義柵格地圖選擇合適的行為運動基元生成具有行為語義信息的軌跡。本文所提規劃方法相較于基于二值柵格地圖運動規劃方法在軌跡的平均俯仰角、平均側傾角、平均曲率分別降低46.1%、46.5%、14.2%。同時軌跡的語義類別屬性可用于運動控制模塊的參數優化。
3) 運動控制模塊根據軌跡信息結合平臺動力學約束,基于行為基元類型對控制目標函數權重進行在線的優化匹配,相較于定參數跟蹤軌跡的方法分別在橫向偏差、航向偏差、速度偏差降低17.1%、2.7%、6.1%。