劉平 ,巫超輝 ,楊明亮 ,黃雨陽
(1.西南交通大學 機械工程學院,四川 成都 610031;2.西南交通大學 先進驅動節能技術教育部工程研究中心,四川 成都 610031)
近年來,隨著社會經濟的快速發展,我國汽車保有量呈現穩步上升的趨勢,交通擁堵問題越來越嚴重,并由此引發更多的駕駛安全問題,研究無人駕駛技術對于改善交通環境、提高交通通行效率和減少交通事故的發生具有重要意義.由于客觀原因,現有汽車智能化水平不會在短期內到達L4/L5 級,因此,人機共駕技術成了研究熱點[1].由于避障在智能駕駛任務中的安全要求非常高,所以研究人機協同避障策略具有較高價值[2-3].
對于人機協同避障策略,已有相關學者進行了研究,張紅志[4]提出一種基于空間和角度碰撞危險度的雙駕雙控的駕駛權分配策略,自動駕駛系統的權重隨危險度的上升而上升,在危險狀況下,自動駕駛系統能夠跟蹤安全的軌跡.Shi 等[5]提出一種卡方檢測法來分析駕駛員對自動控制系統的信任度,并采用模糊控制方法分配駕駛員和自動控制系統之間的權重,保證車輛安全并減少人機沖突.張銳陳[6]從車輛穩定性和安全性的角度出發,設計一種復合控制器,在保障換道過程中穩定性的同時,提高軌跡跟蹤的精度.對于在人機共駕模式下采用雙駕雙控結構的車輛,在避障過程中通常是基于空間碰撞危險度來分配駕駛員與自動駕駛系統之間的權重關系,由于缺乏對駕駛員狀態的考慮,會導致當駕駛員處于疲勞或分心狀態時,汽車離障礙物較近的狀況下,自動駕駛系統才會有足夠的權限去跟蹤規劃出的軌跡,而使汽車的穩定性下降,駕駛人員或乘坐人員的舒適性較差.基于人機動態協同控制的智能駕駛輔助系統可以利用車輛狀態、駕駛員狀態、外部環境等信息,從而平滑地改變駕駛員與自動控制器之間的駕駛權限[7].在人機協同駕駛過程中,對駕駛員狀態檢測主要有基于駕駛員操縱信息以及基于駕駛員生理信息的方法.張新鋒等[8]設計一種分層的車道保持輔助系統,當駕駛員由于疲勞而偏離車道線時,由上層控制器對轉向角進行修正而完成車道保持的任務.Saito 等[9]設計基于駕駛員監管的車道保持輔助系統,當車道偏離時,自動控制系統給予轉角補償;當駕駛員識別系統檢測到駕駛員未正常操作時,自動控制系統實施減速策略.孫浩[10]使用圖像識別的方法設計基于疲勞檢測的人機協同車道保持算法,使人機權重根據駕駛員疲勞狀態和車道偏離狀態進行動態調整.Kassem 等[11]提出一種基于視覺的疲勞檢測方法,該方法用于檢測駕駛員疲勞的早期階段,總體準確率為93.3%.一些研究將駕駛意圖考慮在協同駕駛策略中,也有一些研究直接使用駕駛人的生理信號來預測自然駕駛人的意圖,將轉向盤作為信號,允許自然駕駛人和自動控制系統以連續的方式進行駕駛操作和交換信息[12].Lu 等[13]通過將傳感器安裝在轉向盤上,采集駕駛員的肌電信號并以此來檢測駕駛員的疲勞狀態.Li 等[14]通過RNN 網絡捕捉疲勞駕駛的各種潛在特征以及駕駛中的非線性特征之間的相互關系,建立駕駛員疲勞特征識別模型.
針對目前已有的人機協同避障策略對駕駛員疲勞狀態考慮較少的情況,提出一種基于駕駛員操作信息并使用BP 神經網絡對駕駛員疲勞狀態進行在線識別的疲勞識別模型.結合空間碰撞危險度,設計駕駛權限分配策略,以達到在駕駛員清醒的狀況下,控制系統對駕駛員不產生干預;在駕駛員疲勞狀況下,由于自動駕駛系統預先擁有一部分控制權,因此汽車的避障軌跡更加平緩.通過搭建Carsim、PreScan 和 Simulink 三方聯合仿真平臺,在不同工況下驗證所提出的駕駛權分配策略的有效性.
無人駕駛汽車的避障,本質上是橫向跟蹤控制問題.圖1 為車輛動力學模型,并基于此建立汽車的橫向跟蹤誤差模型.圖1 中,φ為汽車航向角,θr為參考航向角,kr為參考曲率,αf、αr分別表示前、后輪的側偏角,Fyf、Fyr分別表示作用在車輛前、后軸的輪胎側向力的合力,a、b分別為質心到前、后軸中心的距離,vx、vy分別為汽車的縱向和側向速度,δf為前輪轉角.

圖1 車輛動力學模型Fig.1 Vehicle dynamics model
將汽車二自由度微分方程寫成矩陣的形式:
式中:Cαf、Cαr分別為前、后軸側偏剛度(兩個車輪);m為汽車質量;Iz為車輛繞z軸轉動慣量;ω為橫擺角速度.
定義橫向位置誤差ed,橫向角度誤差為φ-θr,將其記為eφ,其中θr為參考航向角,經過推導可以得到:
避障問題的解決需要考慮汽車的橫擺穩定性,已有研究表明,基于橫擺角速度-側向速度的相平面能夠很好地體現車輛的橫擺特性以及對輪胎側偏角的限制,適用于前輪主動轉向的穩定性評價[15].為了保證線性輪胎模型的有效性,需要限制輪胎側偏角的取值范圍,由于當車輛發生橫擺失穩時后軸側滑會造成較大的危害,因此,通常對后輪側偏角進行約束,并依此推導車輛的橫擺穩定性判據.根據后輪的最大側偏力約束,可以得到橫擺角速度的控制閾值如式(4)所示.
式中:lf、lr分別為質心到前、后軸距離.對后輪側偏角進行約束,即-αr,lim≤αr≤αr,lim,此約束可以轉化為對車輛側向速度vy的約束:
由式(4)與式(5)聯合確定了一個封閉的包絡線,如圖2 所示,分別表示橫擺角速度和側向速度的邊界,當車輛狀態處于包絡線之內時即可保證車輛的橫擺穩定性.

圖2 車輛穩定性相平面Fig.2 The phase plane of vehicle stability
已有文獻研究表明,相對于清醒狀態,駕駛員疲勞狀態下的轉向盤轉角相關的信息有明顯變化[13].當駕駛員處在疲勞狀況下操縱車輛時,轉向盤的大幅修正次數會顯著增加,選用2 個指標來描述駕駛員的疲勞程度,分別為一段時間內轉向盤轉角的方差和轉向盤瞬時角速度超過某一閾值的次數.由于BP 神經網絡算法具有較好的泛化能力和容錯能力,所以采用BP 神經網絡進行疲勞識別.BP 神經網絡結構如圖3所示,其中隱含層包括10個節點,輸入為xi(i=1,2),分別為滑動窗口中駕駛員轉向盤轉角的方差以及轉向盤瞬時角速度超過某一閾值的次數,輸出為疲勞因子z1.

圖3 BP神經網絡結構Fig.3 The structure of BP neural network
為了建立能夠識別駕駛員疲勞信息的疲勞檢測模型,使用轉向盤結合PreScan 和Simulink 搭建駕駛員疲勞駕駛數據采集平臺.試驗場景為雙車道,車型選取為Audi A8,車道寬3.5 m,總長8 km,駕駛速度60 km/h,仿真步長為0.01 s,采用轉向盤分別采集駕駛員在清醒、輕度疲勞、疲勞狀態下進行駕駛的操作數據.駕駛員數據采集平臺如圖4所示.

圖4 駕駛員數據采集平臺Fig.4 Driver data collection platform
對每種狀態下駕駛員轉向盤操縱信息使用窗口法來統計,窗口時長60 s,數據為轉向盤轉角的方差和轉向盤瞬時角速度超過某一閾值的次數(分別為x1和x2),每種狀態分別采集10 組,總共600 000 個采樣點.圖5為不同狀態下操作信息隨時間的變化圖.
將采集到的駕駛員操作信息數據進行處理,駕駛員在清醒、輕度疲勞和疲勞狀態下采集的樣本疲勞因子分別為0.25、0.50和0.75,如表1 所示.并將采集到的數據用于訓練疲勞識別網絡.

表1 駕駛員操作特征樣本格式Tab.1 Sample format of driver manipulate feature
利用駕駛員數據采集平臺進行疲勞識別模型的驗證.采集5 組駕駛員疲勞數據,仿真工況與采集時所設置一致.將轉向盤轉角的方差和轉向盤瞬時角速度作為疲勞識別網絡的輸入,將最終識別為疲勞的樣本數與采集數據的總樣本的比值作為模型的疲勞識別精度,經過計算可以達到85.61%.
人機協同避障策略采用雙駕雙控結構,如圖6所示.基于LQR 設計自動駕駛控制器,為了模擬駕駛員操控汽車,基于最優預瞄側向加速度理論建立駕駛員模型.控制權分配策略以疲勞因子和空間碰撞危險度(Space Risk of Collision,SRC)作為輸入,以自動駕駛系統控制權作為輸出.駕駛員模型輸出的轉角δh與自動駕駛系統輸出的轉角δa經過控制權分配策略后得出的轉角δ作為最終的控制信號.

圖6 人機協同避障策略結構Fig.6 The structure of human-machine cooperative obstacle avoidance strategy
LQR 是一種依賴被控對象狀態空間方程的最優控制方法.設定代價函數為:
式中:Q、R分別為與狀態量和輸入量有關的權重矩陣.需要求出J在滿足式(7)約束下的極小值:
其中Q、R通過單移線路徑跟蹤工況仿真試驗確定,其值為:
已有研究推導[16]了LQR 的求解方法.最終的反饋控制量為:
式中:k是求解Riccati 方程的解.將反饋控制量代入式(3)可得:
由式(9)可以看出,誤差不可能等于0.引入前饋控制量δf來盡量減小誤差,得到前輪轉角u為:
狀態空間方程為:
在駕駛員實際駕駛過程中,會使汽車在未來一段時間內的行駛軌跡與期望軌跡之間的偏差盡可能小,利用駕駛員的這一特性[17],構建目標函數:
式中:f(t)、y(t)分別為汽車實際與期望的側向位置坐標;τ為與時間相關的積分項;Tp為預瞄時間.假設汽車側向以勻加速運動,可得:
通過求解目標函數,可以得到最終理想的側向加速度為:
由于駕駛員的身體和生理限制,存在各種延遲因素.延時環節可以表示為:
式中:td為駕駛員的神經反應延遲時間,取0.2 s;th為動作延遲時間,取0.1 s.為了減小延時因素對駕駛員模型的影響,引入校正環節來修正:
式中:Gay為穩態下的側向加速度增益.根據文獻[18],取Gay=3.865 m·(s2·rad)-1,Tc=0.057 s.轉向盤轉角可表示為:
H(s)為延時環節,C(s)為校正環節[19].經過轉換,得到駕駛員作用的前輪轉角可以表示為;
式中:k為轉向傳動機構傳動比,通過在Carsim 中查找獲得;轉向器傳動比Cfac=43.7 mm·rev-1.
在駕駛員與自動駕駛系統共同作用于汽車的狀態下,駕駛員和自動駕駛系統對應的權重應當在駕駛過程中隨著駕駛員狀態和駕駛環境的變化而發生變化,并且兩者權重之和應當為1.為了在這一過程中合理分配權重系數,本文提出一種基于空間碰撞危險度和駕駛員疲勞因子的控制權動態分配策略.
3.3.1 空間碰撞危險度對駕駛權分配的影響
空間碰撞危險度考慮兩方面因素:汽車與障礙物之間的相對距離以及汽車運動方向與障礙物之間的角度(航向角)關系[4].
1)相對距離對危險度的影響.當汽車與障礙物的相對距離d處于汽車行駛的安全距離dmax與允許的最小距離dmin之間時,汽車與相對距離相關的危險度dN用式(20)計算.
與相對距離有關的危險度最終采用分段函數的形式來描述.
式中:λ(d)為與相對距離有關的危險度值.當相對距離大于等于安全距離時,危險度為0;當相對距離處于安全距離與最小距離之間時,危險度隨相對距離的減小而增大;當相對距離小于等于允許的最小距離時,危險度為1.
2)航向角φ對危險度的影響.為了描述汽車航向角對危險度的影響,令汽車與障礙物之間2 個臨界角度分別為θ1和θ2,如圖7 所示.θ1和θ2中最小和最大的值分別為θmin和θmax.

圖7 航向角關系示意圖Fig.7 Schematic diagram of heading angle
對航向角進行處理得θN為:
當汽車的航向角為[θmin,θmax]時,危險度應當一直存在;航向角在[θmin,θmax]之外時,危險度為0.當航向角越接近臨界角度,危險度應當越來越小,而當φ=(θmax+θmin)/2 時,危險度應當最高.定義航向角危險度λ(θ)為:
綜合考慮相對距離和航向角,描述空間碰撞危險度的數學模型為:
3.3.2 基于模糊邏輯規則的駕駛權動態分配策略
模糊邏輯規則具有不依賴精確的數學模型,魯棒性強且容錯能力較強等優點.本文采用模糊邏輯規則完成駕駛權動態分配,輸入為空間碰撞危險度和駕駛員疲勞因子,輸出為自動控制器的駕駛權重.定義空間碰撞危險度的論域為{0,0.25,0.5,0.75,1},模糊子集為{HR,LR,LZ,JQ,HQ},分別表示不危險、有一點危險、較危險、很危險和危險;駕駛員疲勞因子的論域為{0.25,0.5,0.75},模糊子集為{LF,MF,HF},分別表示清醒、輕度疲勞和疲勞,采用貝塞爾形和高斯形隸屬度函數來描述.駕駛權重的論域為{0,0.25,0.5,0.75,1},模糊子集為{LL,TD,MD,RD,RH},分別表示為低、較低、中、較高、高,采用三角形隸屬度函數來描述.建立模糊邏輯規則如表2 所示,對應的模糊邏輯控制平面圖如圖8 所示.所設計的模糊規則在駕駛員疲勞程度較低以及危險度較低時,自動駕駛系統的權限較低;當駕駛員處于疲勞狀態而危險度較低時,自動控制系統具有一部分權限.

表2 模糊邏輯規則Tab.2 Fuzzy logic rules

圖8 模糊邏輯控制平面圖Fig.8 Fuzzy logic control plane
通過模糊邏輯推理,可以得到自動駕駛系統的控制權重,最終作用到車輛上的實際控制量為:
式中:w為自動駕駛系統權重;θsw為加權后的前輪轉角;u為自動駕駛系統前輪轉角;θd為駕駛員模型前輪轉角.
為了驗證本文提出的智能汽車人機協同避障控制策略,借助于轉向盤搭建了Carsim、PreScan 和Simulink 聯合仿真平臺.Carsim 提供車輛動力學模型,PreScan 提供駕駛場景,Simulink 編寫規劃控制算法.對比的策略有2 個:一是僅考慮SRC 的駕駛權分配策略;二是考慮空間碰撞危險度和駕駛員疲勞因子(Space Risk of Collision and Fatigue,SRCF)的駕駛權分配策略.避障前已識別駕駛員的疲勞因子,車輛參數如表3 所示.仿真工況為72 km/h 的條件下分別進行靜態障礙物和動態障礙物避障.

表3 整車參數Tab.3 Vehicle parameters
設置靜態障礙物避障仿真場景,設置前車1 和前車2的坐標分別為(120,0)和(240,3.5),分別對基于SRC 的駕駛權分配策略和基于SRCF 的駕駛權分配策略進行仿真試驗.靜態障礙物避障軌跡如圖9所示.

圖9 靜態障礙物避障軌跡Fig.9 Static obstacle avoidance trajectory
當駕駛員處于一種較為疲勞的狀態時,在基于SRCF 的控制權分配策略中,自動控制系統擁有一部分控制權限,自車在接近障礙物的過程中危險度逐漸升高,此時自車分別在t1和t3時刻開始避障;在基于SRC 的避障策略下仿真時,由于剛開始離障礙物較遠,自動駕駛系統的權限較低,只有在接近障礙物時,自動駕駛系統的控制權限才會快速上升,最終在t2和t4時刻開始避障,因此,汽車行駛的軌跡曲率變化較大.圖10 為在2 種策略下進行避障的過程中自動駕駛系統駕駛權重的變化圖.

圖10 自動駕駛系統駕駛權重變化圖Fig.10 The diagram of automatic driving system driving weight
由圖10 可知,在SRCF 策略中,當駕駛員處在一種疲勞的狀況下時,經過控制權分配,在避障過程中自動控制系統的權限變化更為平緩.基于SRC 的駕駛權分配策略以及基于SRCF 的駕駛權分配策略在靜態障礙物下的仿真結果如圖11 所示.由圖11 可知,相較于基于SRC 的駕駛權分配策略,基于SRCF的駕駛權分配策略在汽車避障過程中由于提前進行避障,側向加速度、質心側偏角和橫擺角速度分別降低了8.9%、18.2%、11.1%,表明汽車在避障過程中的穩定性更好.

圖11 靜態障礙物工況下仿真結果Fig.11 Simulation results on static obstacles condition
靜態避障過程中橫擺角速度與側向速度在相平面中的分布如圖12 所示.由圖12 可知,相較于基于SRC 的駕駛權分配策略,SRCF 的駕駛權分配策略在避障過程中的橫擺角速度與側向速度在相平面中的分布更加集中,并且橫擺角速度始終處于±0.1 rad/s內,驗證了提出的控制策略能夠在汽車避障過程中保持良好的橫擺穩定性.

圖12 靜態障礙物工況橫擺角速度與側向速度在相平面中的分布Fig.12 Yaw rate-lateral velocity distribution in the phase plane under static obstacle condition
如圖13 所示,設置動態障礙物仿真工況,前車1和前車2 的起始坐標分別為x10(70,0)和x20(145,3.75).障礙物速度均為8 m/s.自車車速為20 m/s.對2種工況進行仿真,t0為初始時刻.t1、t2和分別為2 種工況下躲避前車時的時刻.當駕駛員處于疲勞狀況下駕駛時,采用基于SRC 的駕駛權分配策略在時刻進行避障,此時,前車1 和前車2 分別位于;而采用基于SRCF 的駕駛權分配策略,由于當前駕駛員疲勞程度較高,當自車接近障礙車輛時,危險度上升導致自動控制系統所占的控制權上升,因此,分別在t1、t2時刻就會開始避障,此時前車1 和前車2 分別位于xt1和xt2,實線避障軌跡t1時刻與障礙物之間的距離較虛線避障軌跡在時刻與障礙物之間的距離更遠,表示更加安全,并且汽車行駛出的軌跡更加平滑.

圖13 動態障礙物避障軌跡Fig.13 Dynamic obstacle avoidance trajectory
在2 種駕駛權分配策略下進行避障的過程中,自動駕駛系統的控制權隨時間的變化,如圖14 所示.由圖14 可知,與基于SRC 的駕駛權分配策略相比,基于SRCF 的駕駛權分配策略在避障過程中,自動控制系統的權限始終維持在0.4左右,在避障過程中不會出現劇烈的變化.圖15 為2 種駕駛權分配策略在動態障礙物工況下仿真結果.

圖14 動態障礙物工況自動駕駛系統駕駛權重變化圖Fig.14 The diagram of automatic driving system driving weight under dynamic obstacle condition

圖15 動態障礙物工況下仿真結果Fig.15 Simulation results on dynamic obstacles condition
在基于SRC 的駕駛權分配策略下,當自車與障礙物較近時,自車才有足夠的權限完成避障任務,而基于SRCF的駕駛權分配策略在汽車避障過程中,由于駕駛員處于疲勞狀態下,自動駕駛系統本身占據一定的權重,當自車的危險度升高時,自動控制系統所占的權重可以到達足夠大從而控制汽車進行避障.通過比較2 種策略在避障過程中的表現,基于SRCF 的駕駛權分配策略在避障過程中的側向加速度、質心側偏角和橫擺角速度相比于基于SRC 的駕駛權分配策略分別降低了51.5%、53.4%、50.6%.表明在動態障礙物的避障工況中,基于SRCF的駕駛權分配策略相比于基于SRC 的駕駛權分配策略具有更好的表現,汽車在行駛過程中具有更好的穩定性.
對橫擺角速度與側向速度在相平面中的分布進行分析,如圖16所示.

圖16 動態障礙物工況橫擺角速度與側向速度在相平面中的分布Fig.16 Yaw rate-lateral velocity distribution in the phase plane under dynamic obstacle condition
在動態障礙物避障過程中,基于SRCF的駕駛權分配策略相比于SRC 的駕駛權分配策略,橫擺角速度與側向速度在相平面中的分布更加集中,并且橫擺角速度一直處于±0.1 rad·s-1內.橫擺角速度與側向速度組成的散點在相平面中的分布更加集中,驗證了所提出的人機協同避障策略能夠在動態障礙物避障過程中保持良好的橫擺穩定性.
在靜態障礙物和動態障礙物的避障工況中進行仿真試驗分析的結果表明,與基于SRC 的駕駛權分配策略相比,基于SRCF的駕駛權分配策略在避障過程中可以進行提前避障的動作,自動控制系統和駕駛員的權限變化更加平緩,汽車在避障過程中的側向加速度、質心側偏角以及橫擺角速度的峰值均有一定程度的削弱,橫擺角速度和側向速度相平面的分布更加集中,表明汽車在避障過程中的穩定性更好.
本文通過實驗數據采集平臺,對駕駛員疲勞操作數據進行采集,并基于所采集的數據訓練BP 神經網絡對駕駛員的疲勞狀態進行檢測,使用模糊邏輯規則設計基于空間碰撞危險度和駕駛員疲勞因子的駕駛權分配策略.通過Carsim、PreScan 和 Simulink三方聯合仿真平臺,在高速工況下,對靜態障礙物和動態障礙物的避障性能分別進行仿真來驗證所設計的駕駛權分配策略的有效性.仿真結果表明,在相同環境中,基于SRC的駕駛權分配策略和SRCF的駕駛權分配策略均能夠完成避障.不同的是,與基于SRC的駕駛權分配策略相比,SRCF 的駕駛權分配策略在駕駛員疲勞狀態下,進行避障過程中由于對駕駛權限進行更合理的分配,汽車行駛的軌跡更加平滑,汽車在避障過程中的側向加速度、質心側偏角、橫擺角速度的峰值均有一定程度的減小,并且駕駛權限的變化更加平緩.通過對汽車的橫擺角速度與側向速度相平面進行比較,結果顯示,SRCF 的駕駛權分配策略在汽車避障過程中橫擺角速度與側向速度組成的散點更加集中,驗證了控制權分配策略的有效性.