中圖分類號:U491 文獻標志碼:A
Abstract:In thecontext of paralel collaborative lane-changing control fordriversand intellgentsystems, issues such as human-machineconflicts and driving discomfort arise due to frequent or substantial changes in the control authority alocation between humans and machines.To solve these problems,this paper proposes a lateral human-machine driving weight allcation strategythat combines pre-allcation with real-time allcation to achieve a reasonabledistribution of vehiclecontrol.Initially,to characterize the driving styleof thedriver,a single-point preview driver model is constructed,which includes decision functions for lateral preview error and lateral acceleration.Concurrntly,a model predictive controller(MPC) is establishedas a co-driving control system,and a vehiclelane-changing trajectory isdesigned basedonaquintic polynomial.Subsequently,apre-allocation method fordriving rightsisdesigned,incorporating stylecoeffcients,preview time,androadadhesioncoeffcients.Criteria for real-time allocation of weights are designed based on risk level and human-machine conflict measures,with adjustments introduced to prevent frequent changes in weights.Joint simulation results indicate that when humanmachine intentions arealigned,this strategy significantly reduces the driver's burden.When driving risk is high, control weights shift towards the system,alowing timely intervention to ensure traffc safety.When human-machine intentionsare inconsistent,anddriving risk is lowbut human-machineconflictishigh,itissurethatcontrol is transferred to the driver atafixedvalue,alowing thevehicleto operateaccording tothe driver's intent,and he overall controlefect is superior to fixed-weightcontrol strategies.Driver-in-the-loop platform tests show that when driversadapt to moderate intervention by the control system,this strategycan provide personalized lane-changing assistance for drivers of different styles.
Key words:autonomous vehicles; preview driver;risk assessment;model predictive control (MPC);driving au. thority allocation;human-machine conflict
自21世紀起,以智能車輛為平臺的無人駕駛技術承載著“零事故、零傷亡\"的美好愿景.然而,由于廠商間通信技術的差異、法律法規的不完善以及社會倫理的限制,駕駛員作為車輛控制的主體在未來很長一段時間內仍將是一個不爭的事實.與此同時,人機共駕技術因能夠實現從有人駕駛到無人駕駛的有效過渡,得到了廣泛的關注和研究[1.人機共駕中,駕駛員與控制系統同為控制主體,共享車輛控制權并協同完成車輛駕駛任務.以車輛橫向控制為核心,人機共駕技術涵蓋了駕駛員模型、橫向控制系統模型以及控制權分配策略等多個方面.
駕駛員模型用于表征駕駛員的行為特征,從經典控制理論出發,包含遠近兩點視角模型、神經肌肉模型[3、預瞄駕駛員模型等.深度學習算法中的神經網絡模型、隱馬爾可夫模型4等也被嘗試用于構建個性化的駕駛員模型.張琦等5提出了一種遺傳算法優化的BP神經網絡橫向駕駛員模型,可以解決原有模型收斂速度慢、易陷入局部最優的問題.學者們多將上述模型進行改進及融合,使得駕駛員模型更加擬人化,然而,現有的模型尚未全面考慮駕駛員的神經系統反應、駕駛操作的滯后性,以及期望控制量與實際輸出量之間的誤差修正等關鍵因素,對駕駛特性的研究尚不夠深人.
橫向控制系統模型主要基于車輛橫向控制算法來實現,例如模型預測控制(model predictivecontrol,MPC)、線性二次調節器(linearquadratic regulator,LQR)[7等,其中,MPC方法較為系統地考慮了車輛動力學等約束條件,并構建多目標函數進行滾動優化求解,最終實現車輛軌跡的有效跟蹤[8-9],被廣泛應用于人機共駕策略設計中.劉瑞等提出了一種基于非合作MPC的人機共駕策略,該方法通過迭代方法求解納什均衡解,更新置信度矩陣實現控制權交接.Dai等1提出了基于MPC的擬人化人機共駕橫向協同控制策略,將線性參數變化模型與MPC相結合,以實現駕駛員與系統的輸人交互.
人機共駕系統設計可根據交互方式分為觸覺交互式[12-13]與輸入修正式[14]兩大類.觸覺交互式適用于傳統機械式轉向系統,通常在轉向盤上疊加一個輸入力矩,駕駛員可接收該力矩的反饋效果;輸入修正式適用于線控轉向及主動轉向系統,該方式使得駕駛員指令與控制動作解耦,保證人機同時在環,根據控制系統介入程度可分為串聯式與并聯式.串聯式控制系統接收駕駛員的輸人信號,對其進行修正或補償,系統介入程度較低[5;并聯式中,駕駛員和控制系統各自操作,以相應權重作用于車輛.本文重點對并聯式人機共駕策略進行研究.
在并聯式人機共駕策略中,確保駕駛員與控制系統這兩個控制主體之間的權重得到合理分配,是實現車輛安全性和駕駛舒適性等駕駛目標的關鍵.在早期研究中,學者們通常將駕駛員及控制系統的各自權重設為定值,如Li等將人機共駕中人機控制權重分別設定為0.7和0.3,IWANO等將駕駛員權重設置為0.5.該控制策略未考慮駕駛員對控制系統的個性化接受程度,未能實現定制化的輔助功能.之后,學者們考慮根據行車風險要素或駕駛員要素[18]來調節車輛控制權.劉思晗19]構建了行車風險場進行交通安全態勢評估,將評估結果作為控制權分配策略的依據.吳超仲等[20]提出了一種基于間接共享控制的車輛接管控制方法,該方法根據橫縱向的行車風險分配控制權,然而,該策略存在控制權重由1驟降至一個較小值的情況,變化幅度較大.周曉宇2建立了基于駕駛能力補償的人機協同轉向控制策略,可針對不同駕駛能力的駕駛員提供相應的駕駛輔助.這些策略主要側重于駕駛員能力和行車安全的權重分配,但未能充分考慮駕駛員與外界環境之間的相互作用,因此在應對駕駛員狀態不佳且行車風險較高的緊急情況時,效果并不理想.
目前,綜合考慮駕駛員狀態、車輛狀態以及外界環境等多個因素,實現控制權的實時調節,已經成為人機共駕控制領域的熱門話題.劉俊等22提出了考慮軌跡跟蹤精度和駕駛員負荷的駕駛權重分配方案,并基于模糊推理方法實現控制權的柔性分配.Liu等23提出了一種人機協同轉向控制框架,控制權的分配考慮了道路邊界及車輛穩定性邊界條件,并權衡駕駛員操作及行車風險.這些研究在人-車-路綜合判定后進行權重分配,安全性得以保證,但是人機共駕控制權分配仍存在亟須解決的問題.一方面,現有研究較少考慮駕駛員風格差異化在權重分配中的作用,沒有有效地實現駕駛員的個性化輔助;另一方面,在權重分配中,權值往往頻繁變化或變化幅度較大,導致駕駛員操作與路感反饋之間存在嚴重的不匹配,這不僅會引起駕駛不適感和不信任感,而且容易引發人機沖突[24],不利于行車安全.
鑒于上述情況,本文首先構建了一個考慮駕駛風格的單點預瞄駕駛員模型和橫向模型預測控制器,作為車輛的兩個主要控制實體;接著,提出了一種結合預先分配和基于行車風險、人機沖突的實時分配的駕駛控制權分配策略,旨在實現控制權的合理分配;最后,通過聯合仿真平臺模擬了駕駛員及控制系統意圖一致及不一致的測試工況,以驗證本文提出的控制權分配策略在不同風格駕駛員中的有效性,并通過駕駛員在環平臺測試進行進一步的驗證.本研究關鍵部分的模型結構圖如圖1所示.
1單點預瞄駕駛員模型
1.1橫向駕駛特性分析
在車輛橫向運動控制領域,預瞄駕駛員模型展
第三部分控制權限分配策略第一部分 (預先分配+實時分配)單點預瞄 橫向權重1駕駛員模型 控制量綜合權重1+權重2=1C+ 車輛第二部分 控制橫向模型 橫向 量 控制對象預測控制器 控制量 權重2
車輛實時運動狀態并結合環境信息第四部分 測試驗證及結果分析聯合仿真平臺測試 駕駛員在環平臺測試
駕駛意圖不一致:人換道、系統直行; 保守型、平衡型、激進型駕駛員人直行,系統換道; 平均換道時間提取換道軌跡設計駕駛意圖一致:人、系統均換道
現了若干關鍵特性:當車輛行駛時,駕駛員力求最小化當前行駛軌跡與期望路徑之間的偏差,并基于此偏差值來確定橫向控制量.不同駕駛風格的駕駛員通常會展現出不同的決策行為,而且在感知階段或操作階段的延遲特性也會對駕駛員的決策結果造成影響.
1.2單點預瞄駕駛員模型構建
基于上述特性分析,對現有的預瞄駕駛員模型進行優化與改進,可歸納為以下兩點:
1)引入橫向預瞄誤差和橫向加速度雙決策函數,構建駕駛風格系數,用于表征不同駕駛員的駕駛風格特性;
2)引入感知階段的神經滯后及操作階段的動作滯后時間,基于橫向加速度誤差值對決策出的前輪轉角進行在線修正.
假設車輛在橫向做勻加速運動,當前時刻駕駛員模型以一個理想的期望橫向加速度 ay* ,以期經過時間 T 后達到期望橫向位移,如圖2所示,即:

式中: T 為預瞄時間,取 T 為 1s;Y(t) 與 vy 分別為當前時刻 Φt 的車輛橫向位移與橫向速度, Y(t+T) 為 t+ T時刻的橫向位移.圖2中 ,f(t) 為期望路徑,若車輛在 t+T 時刻到達期望路徑,即 Y(t+T)=f(t+T) 可得期望橫向加速度的值為:

式中: e 為實時的橫向預瞄誤差.式(2)通過實時的橫向預瞄誤差e與理想比例系數 相乘得到期望橫向加速度.而實際上,不同類型的駕駛員可能表現出不同的橫向決策特性,同一駕駛員在面對不同運行工況時也會采取不同的策略.例如,較為激進的駕駛員可能選取較大的橫向加速度以保證橫向跟蹤效果,降低橫向誤差;較為保守的駕駛員可能選取較小的橫向加速度以保證車輛運行安全;路面條件變差(如路面摩擦系數變?。r,駕駛員可能會適當降低橫向加速度來保證安全.因此,本研究將駕駛員的橫向決策特性定義為橫向預瞄誤差和橫向加速度的雙決策函數,其中橫向預瞄誤差子函數 Le 與橫向加速度子函數 La 定義如下:


同時引入權重系數 α 及 β ,用以表示駕駛員的駕駛風格特性,最終得到雙決策的單點預瞄駕駛員模型,建立的綜合決策函數 Ls 如下:

式中:
分別為橫向預瞄偏差標準值及橫向加速度標準值.駕駛員正常行駛時,為保證輪胎始終在線性區內,汽車橫向加速度不超過 0.4g,g 為重力加速度;定義標準車道寬度 W=3.75m ;為保證車輛在車道內行駛,考慮一般家用小轎車的寬度為 1.6~2.0m ,則車輛橫向預瞄偏差不得超過 1m ,選取
2.25m/s2 :
將式(3)代入式(4)中,兩邊同時對 ay* 求偏導數,得到可表征駕駛員駕駛特性的期望橫向加速度ay*. ,表達式如下:

由式(5)可知,駕駛員模型的最優橫向加速度不僅與預瞄時間T有關,也與 α/β 有關,因此將 α/β 定義為駕駛風格系數.選取 e=1.875m ,T的范圍為 1~1.5s 參考文獻[25]并依據式(5)求得的橫向加速度選取α/β 的值.為方便計算,最終選取 α/β 的值為1\~9的正整數,得到車輛期望橫向加速度與預瞄時間的關系曲線如圖3所示.

由圖3可以看出,在同一預瞄時間下,期望橫向加速度隨著 α/β 的增大而增大;而在相同駕駛風格系數 α/β 的情況下,當 α/β?3 時,期望橫向加速度隨著預瞄時間的增加近似等比例減小,而當 α/β=1 或者2時,期望橫向加速度并未隨著預瞄時間有明顯的變化,曲線較為平穩,此時駕駛員在不同工況下都采取較為穩定且謹慎的駕駛行為.因此激進型駕駛員對應較大的 α/β ,保守型駕駛員可以取較小的 α/β 最終駕駛風格系數的對應取值為:保守型駕駛員為[1,2,3],平衡型駕駛員為[4,5,6],激進型駕駛員為[7,8,9].并將期望橫向加速度轉化為期望轉向盤轉角:

式中: δsw* 為期望的轉向盤轉角; Kay 為輪胎工作在線 性區內轉向盤轉角的穩態增益值; vx 為汽車縱向車 速; L 為汽車的軸距; Is 為轉向盤轉角到車輪轉角的 轉向系角傳動比; K 為汽車的穩定性因數,選取 K= 0.00054s2/m2
將預瞄駕駛員的滯后特性歸納為感知階段的神經滯后及操作階段的動作滯后.其中,神經滯后是指駕駛員對車輛及環境信息的感知過程,動作滯后是指駕駛員對車輛操縱上的延時,用傳遞函數 G1(s) 和G2(s) 表達上述兩個滯后環節:

式中: tn 為神經反應滯后時間,取值通常為 0.2~0.6s 選取 tn=0.2s;s 為拉普拉斯變換算子; tm 為動作滯后時間,通常為 0.05~0.2s ,選取 tm=0.05s 由于駕駛員在操作動作上的滯后及車輛運行工況變化等因素,決策得到的橫向加速度 ay 與期望橫向加速度值 ay* 之間有一個較小的偏差,因此基于橫向加速度誤差值對駕駛員決策出的轉角進行在線修正,修正量定義為 Δδsw ,具體表達式如下:

式中: ay 為實時的車輛橫向加速度; G 為轉角增量比例系數,取 G=0.05. 最終得到角度值的期望前輪轉角δfd 表達式為

2車輛模型預測控制器設計
2.1車輛三自由度動力學模型
假設車輛在縱向上保持勻速行駛,選取包含縱向運動、橫向運動與橫擺運動的車輛三自由度動力學模型作為模型預測控制器的預測模型,如圖4所示,模型規定輪胎工作在線性區,前輪轉角較小.在車輛坐標系xoy下,將車輛假設為只有前后兩輪的單軌模型,其動力學模型的表達式如下:

式中: Iz 為車輛繞 z 軸的轉動慣量;
分別為車輛在縱向及橫向上的加速度;
為車輛橫擺角的二階導數; Frf 和 Fxr 為前輪和后輪在縱向 x 軸上的輪胎分力; Fyt 和 Fgr 為前輪和后輪在橫向 y 軸上的輪胎分力.將 Fxf,Fxx,Fyt,Fyt 轉化為相對于車輛輪胎來說的縱向與橫向上的輪胎力 Flf,Flr 和 Fcf?Fcr ,表達式如下:


式中: δfsδr 分別為控制系統下的車輛前輪轉角與后輪轉角; Flf?Flr?Fcf?Fcr 的表達式如下式所示.

式中: Clf,Clr 分別為前后輪胎的縱向剛度; af,ar 和sf,sr 分別為前后輪的橫向滑移角和滑移率.同時,將車輛運動從車輛坐標系xoy轉換到全局坐標系XOY.綜上可得用于橫向控制的車輛動力學模型如下:

2.2五次多項式換道軌跡
選取五次多項式作為車輛換道的期望軌跡曲線,具體表達式如下:

式中: a1?a2?a3?a4?a5 為曲線的系數; b 為常數項;(X0,Y0) 為換道初始時刻車輛對應的坐標.車輛初始位置在(0,0)處,向前行進 50m 后,由當前車道換道至目標車道,完成換道后在當前車道上繼續行駛50m .當車輛橫向位移為一個車道寬度時車輛完成換道.定義換道初始時刻與換道完成時刻分別為 t0 、te ,對應的車輛狀態量如式(15)所示:

式中: D 為換道所需縱向位移; vx0 為換道初始時刻及完成時刻的車輛縱向車速.將式(15)中的狀態量代入式(14)中:

基于橫擺角
,最終得到包含兩段直線行駛軌跡的五次多項式換道軌跡的參考橫向位移 Yref 及橫擺角 φref 信息如式(17)和式(18)所示.以 D 取 60m,80m,100m 為例,得到 Yref 及 φref 隨縱向位移X 變化的曲線圖如圖5所示.


2.3模型預測控制器設計
結合上述非線性動力學模型,定義狀態變量導數為 d(ξ)/d(k)=f(ξ,u) ,其中狀態量 ξ 定義如下:

系統控制量輸入 u 及輸出 η 定義如下:

式中: δfs 為系統輸入前輪轉角.在參考時刻 k 對方程(13)進行線性化、離散化處理,得到 k+1 時刻下的

離散狀態空間表達式為

其中系數矩陣 A(k) , B(k) , c(k) 的表達式如下:
A(k)=I+TsA(t),B(k)=TsB(t),

式中:矩陣
;矩陣 B(t)=
,即函數f對狀態變量與控制量的雅可比矩陣; Ts 為求解步長; I 為單位矩陣.定義橫向模型預測控制器的目標函數為:

式中: NpΩrNc 為預測時域與控制時域大小; Q,R 分別為狀態變量、輸入增量值的權重矩陣;為在規定時間內得到有效解,加入松弛因子 ε ,對應權重系數為 ρ ηref 為參考輸出量.
在控制器設計過程中,約束條件被設定為以前輪轉角作為橫向控制量,并對控制量增量進行約束,旨在滿足駕駛平穩性的需求.具體如下:

式中: umax?umin?ΔumaxΔumin 分別為系統控制量及控制增量的上下邊界值.松弛因子滿足 0?ε?M , M 為其最大取值.輸出量滿足nmin≤nk≤mmax
綜上,每個控制周期內優化模型定義如下:

s.t.umin?uk?umax,Δumin?Δuk?Δumax
ηmin?ηk?ηmax,0?ε?M
ξ(k+1)=A(k)ξ(k)+B(k)u(k)
基于有效集法求解上述二次規劃問題,可得控制時域內一系列的控制輸入增量及松弛因子,即
Δu=[Δuk*,Δuk+1*,…,Δuk+Ne-1*,ε]T
將控制序列中的首個元素作為實際控制量輸入系統中,即 Φt 時刻下的控制量為:

當前控制周期結束后,進入下一控制周期,循環迭代并實現對期望換道軌跡的跟蹤.
3控制權分配策略
3.1控制權分配策略總體方案
人機共駕協同橫向控制權分配策略的總體框架如圖6所示.

首先考慮駕駛員的駕駛風格、預瞄時間及路面條件給控制系統預先分配控制權重 wsl ;計算車輛運行的風險值及人機沖突,結合修正規則得到實時分配控制權重 ws2 ;兩部分相加即為控制系統最終權重ws. 該方案將控制系統權重控制在一個較小范圍內,且不瀕繁變化.人機控制權重大小及車輛最終橫向控制量輸入 δf 分別為:

式中: wd 為駕駛員的控制權重.
3.2行車風險場構建
本文通過構建行車風險場來量化自車在換道過程中的實時風險值,作為車輛控制權實時調整的依據.風險場的構建綜合考慮了自車與他車的相對位置、相對速度及車輛與道路邊界的距離等信息.風險場模型的常系數參考文獻[26]、文獻[27]進行選取.
定義自車為交通單元0,道路環境中存在一輛車,定義為交通單元1,交通單元1在交通單元0處產生的風險場強度 E10(t) 與兩單元間的相對距離、相對運動速度及與道路邊界的距離有關,與風險單元1的風險量成正比,與風險單元0的風險量成反比,風險場強度的表達式如下:

式中: D10(t) 為基于相對距離的風險分布; Dmol(t) 為基于相對運動速度的風險分布; Droad(Ωt) 為考慮道路邊界條件的風險分布; Q1(t) 和 Q0(t) 分別為交通單元1和0的風險量.以能量的方式定義交通單元的風險量 Qi(t) ,即:

式中: Ttype 為交通單元 i 的類型系數,與載貨類型、形狀等車輛參數有關, Ttype=1;mi 為交通單元的總質量; k1 為常系數, k1=0.2;vi 為交通單元的運動速度,近似可取為車輛的縱向速度;
為最大限制速度,vlim=120km/h
基于相對距離的風險分布 D10(t) 定義如下:

式中: di0 為交通單元1到0的距離矢量; k2 為該風險分布下的比例系數, k2=5;λ 為相對距離指數, λ= 0.5;d0 為風險影響范圍, d0=200m 業
基于相對運動速度的風險分布 Dmol(t) 定義如下:

式中: k3 為相對速度基準值, k4 為該風險分布下的比例系數, k3=30m/s , k4=0.5;v10 為兩交通單元間的相對速度矢量; θa 為兩交通單元的相對速度矢量與相對距離矢量的夾角.
為了防止車輛碰撞道路邊界,風險場的構建也考慮了道路邊界條件.車輛與道路邊界的距離越短,風險值越大,具體如下:

式中: arb 為道路邊界風險勢場形狀系數, arb=1.3;ΔY 為車輛質心與道路邊界的距離; k5 為道路邊界風險可調參數, k5=1
假設道路環境中存在 n 輛車,不考慮環境車輛間的相互作用,將所有車輛在自車(交通單元0)處產生的風險量按照所在車道進行加權疊加,得到多源綜合風險值,將其歸一化得到標準化的行車風險值
如下:


式中: κ1,…,κn 為不同風險來源下的權重值,由于駕駛員對不同車道上車輛的注意力分配及風險感知不同[28],因此可根據風險源和自車是否處于同一車道進行賦值,同一車道時 κj=1 ,不同車道時 κj=0.8
3.3人機沖突指標
在人機并行控制系統中,當駕駛員與車輛控制系統對同一環境的解讀出現分歧,導致不同的駕駛意圖時,不同的控制目標和控制量作用于同一輛車上,從而引發了操作上的人機沖突,當沖突過于激烈時,不僅無法獲得良好的駕駛體驗,而且安全性也難以得到保障;當人機駕駛意圖一致時,由于通信延遲、系統故障等因素,也會產生一定程度上的人機沖突.因此,有必要構建標準化的人機沖突值δcon(ι) ,表達式如下:

式中: δfd(t),δfs(t) 分別為駕駛員與控制系統輸出的
實時前輪轉角量.
3.4駕駛權重分配原則
當路面附著系數 μ 較大時,能提供較大的橫向力及橫向加速度,可以相應增大控制系統控制權值以保證行車安全,結合駕駛員預瞄時間及駕駛風格系數得到最終的控制權預先分配權重值 wsl ,如下式所示:

式中: kT,kα/β 分別為預瞄時間和駕駛風格系數的權重; aΠy-se* 即將式(5)中的 α/β 取值為駕駛風格系數基準值; Tse 為預瞄時間基準值.
根據標準化的行車風險值及人機沖突的大小設定控制系統的權重實時調整量 ws2. 人機共駕中行車風險值較大時,期望適當增大其實時權重 ws2 以提高行車安全性;當人機沖突值較大并且行車風險值較小時,車輛控制權向駕駛員轉移,以保證車輛盡可能按照駕駛員的操作運行;其他條件下,不進行控制權重的實時調整,駕駛員及控制系統以當前權重值操作車輛.表1為實時分配量 ws2 的節點值設計,圖7為ws2 取值的三維擬合曲面圖.

針對行車風險值較小且人機沖突值較大的情況,實時調整量 ws2 為負值,但是控制系統權重存在初始權值 wsl ,此時可保證控制系統的權值保持在一個較小的正數,車輛主要由駕駛員來操控.為保證該情況下車輛控制權不頻繁發生變化,降低駕駛員不適感,對此部分權重進行修正:

當人機沖突較大導致控制系統權重下降時, ws2 取-0.1,駕駛員權重相應增加0.1,其他情況仍按照圖7的三維擬合曲面進行求算.

4測試驗證及結果分析
本文采用仿真測試與駕駛員在環平臺測試相結合的方式驗證車輛控制權分配策略的有效性.基于聯合仿真平臺在期望換道軌跡下,選取人機駕駛意圖一致及不一致的駕駛工況進行驗證,隨后進行駕駛員在環平臺測試,以換道時間為特征設計期望換道軌跡,驗證該策略在不同真實駕駛員執行換道中的有效性.
4.1換道場景及模型參數設置
定義換道場景道路為標準的單向兩車道,路面附著系數 μ=0.85 ,定義自車(交通單元0)的初始縱向車速 vx0 為 20m/s ,縱向保持勻速運動,橫向初始位置為0.在自車當前車道前方及目標車道前方分別有一輛車,定義為交通單元1和交通單元2,如圖8所示.交通單元1的初始縱向位置為 70m ,初始縱向速度為 15m/s ;交通單元2的初始縱向位置為 110m ,初始縱向速度為 12m/s. 兩交通單元縱向上保持勻速,初始橫向位置均位于道路中心線上,車輛換道所需縱向位移 D=100m
控制權實時分配中,選取 kr=0.08,kα/β=0.02 (α/β)se=9 Tse=1.5s .表2為車輛基本參數設置,橫向模型預測控制器中,考慮到預測時域及控制時域大小在不同縱向車速下對軌跡跟蹤效果的影響,多次嘗試選取最優參數并參考文獻[29],具體參數設置如表3所示.


4.2仿真測試及結果分析
仿真測試中選取的3個測試工況如下.
工況1:人機意圖一致,駕駛員及控制系統的駕駛意圖均為換道行駛;
工況2:人機意圖不一致,駕駛員駕駛意圖為換道,控制系統駕駛意圖為直行;
工況3:人機意圖不一致,駕駛員駕駛意圖為直行,控制系統駕駛意圖為換道.
仿真階段假定駕駛員及控制系統的駕駛意圖恒定,時刻以本文設計的五次多項式曲線為參考軌跡.分別選取 α/β=1,5,9 ,分別代表保守型、平衡型和激進型3類駕駛員的駕駛風格系數,并在工況2及工況3中選取駕駛員定權重分別為0.7,0.8,0.9及0.95,與本文提出的控制權分配策略進行對比分析.
工況1的試驗結果如圖9及表4所示.從換道操作中的跟蹤誤差及控制輸入來看,激進型駕駛員優于平衡型駕駛員,平衡型駕駛員優于保守型駕駛員.激進型駕駛員傾向于選取較大的橫向速度保證車輛按照期望軌跡行駛,而保守型駕駛員傾向于降低橫向速度來保證車輛換道安全性.總體來看,人機共駕條件下3類駕駛員的控制量輸人明顯降低,駕駛員控制部分得到的前輪轉角最大值由 0.510°?0.461° 、0.450° 變為 0.234°,0.372°,0.393° ,有效減輕了駕駛員的駕駛負擔,轉角曲線更加平穩,滿足駕駛員的舒適性要求,對保守型駕駛員的輔助效果明顯,有效降低了跟蹤誤差.
根據圖9(d)、(e)和(f可知,人機共駕下3類駕駛員的初始權重為 0.888?0.910 及0.913,由于激進型駕駛員采取更大的期望橫向加速度,因此初始權重大小結果為激進型駕駛員大于平衡型駕駛員大于保守型駕駛員.從實時權重來看,因駕駛員與控制系統的駕駛意圖一致,期望進行換道操作,因此人機沖突量始終保持在較低水平,為0.3以下;在5s左右,車輛行車風險達到最小值,可知此時車輛在換道軌跡中點即兩條車道中間附近;在6.5s左右,車輛的行車風險值達到0.5,并且自車與交通單元1和2間的相對距離也在不斷減小,行車風險值也在不斷增大,此時控制系統進一步介入,控制權逐漸向控制系統轉移,駕駛權重曲線下降平緩,避免了由于控制權重大幅變化造成的駕駛不適感,最終3類駕駛員的權重保持在[0.70,0.80]的區間內,變化幅度較小.

綜上可知,人機駕駛意圖一致時,駕駛權控制分配策略重點是在保證行車安全的前提下減輕駕駛員的駕駛負擔,人機沖突在工況1中對分配策略的影響忽略不計,同時保守型駕駛員相比較而言被賦予了最小的駕駛權重,即系統介入程度最大.
工況2的試驗結果如圖10所示.由圖10(a)可知,3類駕駛員期望進行換道操作而控制系統期望直行時,人機共駕下均可保證車輛按照駕駛員的操作完成換道,相比之下,駕駛員定權重為0.7及0.8時車輛仍在原車道內行駛,駕駛員定權重為0.9及0.95時車輛可以完成換道.其中駕駛員定權重在0.9時,車輛最終位置在兩車道的中間位置附近,繼續行駛時安全性無法得到保證;駕駛員定權重在0.95時與人機共駕下的控制結果相近.圖10(b)表明在減輕駕駛員負擔方面,人機共駕的控制權分配策略整體優于定權重控制策略.
分析圖10(c)(d)和(e)可知,行車風險值曲線中,整體上人機共駕策略下車輛的行駛風險值要略大于定權重控制策略,定權重控制策略下車輛運行曲線更加平緩且與車道線邊界間的距離更大.人機共駕下3類駕駛員駕駛車輛的行車風險最大值位于[0.44,0.52],固定權重策略下車輛行駛風險最大值位于[0.34,0.46],而激進型駕駛員及平衡型駕駛員在人機共駕控制下,在仿真末期的風險值大于節點設定值0.5,因此在駕駛員權重曲線的末期出現權重下降的情況,控制系統介人進行車輛控制.由人機沖突值曲線可知,較于人機共駕控制策略,定權重控制策略下的人機沖突值整體上較低,而定權重控制策略中控制系統仍保留一定權重,因此也會產生一定的人機沖突.由駕駛員權重曲線可知,針對3類共駕駕駛員,在仿真時間為2.5s左右,車輛由直行開始進入換道軌跡,且人機沖突值開始增大,到4s左右沖突值達到一個較大值,此時駕駛權向駕駛員轉移,駕駛員權重在原有權重上增大0.1,且最大值位于[0.94,0.99],盡量保證了車輛按照駕駛員的意圖行進而降低人機沖突,且0.1的權重增幅也不會引起駕駛員過強的不適感或對控制系統的不信任感.
工況3的試驗結果如圖11所示.由圖11(a)可知,3類駕駛員期望直行,而控制系統期望進行換道操作,駕駛權分配策略下及駕駛員定權重為0.9、0.95時均可保證車輛按照駕駛員的操作保持直行,相比之下,駕駛員定權重為0.7及0.8時車輛換道至相鄰車道.圖11(b)表明在工況3下該策略仍可以有效減輕駕駛員的負擔.


分析圖11(c)(d)及(e)可知,人機共駕控制策略及定權重控制策略下車輛的行車風險值都沒有達到控制權轉移的邊界值0.5,因此駕駛員權重曲線中不存在權值下降的情況.與工況2相似,人機共駕下3類駕駛員的人機沖突值曲線在4s左右增大到較大值,此時車輛控制權向駕駛員轉移,轉移量為0.1,最終3類駕駛員的控制權重保持在[0.94,0.99].
綜合工況2和工況3的仿真結果可知,在人機駕駛意圖不一致的情況下,共駕策略的整體控制效果優于定權重控制策略,降低人機沖突的同時盡量保證車輛按照駕駛員的操作行駛,實現“以人為主”的控制思想,且駕駛員權重增大0.1后,駕駛員轉角曲線依然保持穩定,即該控制權分配策略下仍可滿


4.3駕駛員在環平臺測試驗證
為進一步驗證所設計的權重分配策略的有效性,分析系統介入對駕駛員操作的影響,搭建駕駛員在環平臺測試如圖12所示.軟件部分由Carsim、Prescan、Simulink組成,硬件部分為羅技G293轉向盤套件,包括轉向盤、踏板套件及排擋桿.顯示屏將車輛的實時情況傳遞給駕駛員.

測試中車輛縱向車速為 20m/s ,駕駛員只需轉動轉向盤完成換道操作.選取若干名駕駛員,在4.1節中設定的場景中在不進行權重分配的前提下進行多次自由換道試驗,每次測試時間為 11s ,引導駕駛員在行進 50m 后開始進行換道,提取每次換道中的軌跡、橫擺角、換道時間等數據.
分析其中3名駕駛員的換道時間可知,不考慮換道前原車道行進的 50m 及換道完成后目標車道行進的位移,無系統介人下,平均換道時間分別為4s,3.4s,2.6s ,換道所需的縱向位移 D 分別為 80m 、68m.52m ,因此將上述3名駕駛員分別定義為保守型、平衡型及激進型駕駛風格,并設計基于上述 D 值的系統期望換道軌跡,以完成人機共駕中車輛控制權的分配,測試結果如圖13所示.
由圖13(a)可知,3類駕駛員在無智能系統輔助的條件下在完成換道時均存在一定的超調量,且該超調量最大時對應的橫向偏差最大,而智能系統參與控制權分配時可有效消除該超調量,換道中橫向位置嚴格遵守由小到大的變化過程.圖13(b)和13(c)中,人機共駕條件下3類駕駛員在換道初期的橫向輸入量更大,而在行駛到目標車道后的控制輸入量明顯減小.分析可知,換道前期駕駛員對控制系統的信任度不高,控制系統的介人讓3類駕駛員產生了不適感及不信任感,因此此時駕駛員傾向于輸入更大的轉角以完成期望的換道操作,此時人機沖突值增大;而在換道中后期,當駕駛員漸漸適應了智能系統的適量介入時,駕駛員嘗試減小自身的轉向盤轉角輸入,此時駕駛員的駕駛負擔較小,人機沖突值也下降了.風險值曲線表明3類駕駛員中,保守型駕駛員選取了最大的換道縱向位移,其風險值保持最大.圖13(d)中保守型駕駛員的初始權重和實時權重最小,智能系統的介人程度最大.


5結論
1)構建了考慮駕駛風格的單點預瞄駕駛員模型.基于橫向加速度反饋求解轉向盤轉角值,并考慮駕駛員的反應滯后特性,構建了包含橫向預瞄誤差及橫向加速度的雙目標的單點預瞄駕駛員模型,最終獲得不同駕駛員對應的駕駛風格系數.
2)提出了駕駛權預先分配結合實時分配的人機橫向駕駛權分配策略.依據駕駛風格參數、預瞄時間以及路面附著系數進行駕駛權預先分配,同時結合行車風險及人機沖突程度進行駕駛權重的實時分配.
3)采用仿真測試及駕駛員在環平臺測試相結合驗證本文提出的控制權分配策略的有效性.仿真測試表明,人機駕駛意圖一致時,該策略可有效減輕駕駛員的負擔,保證行車安全.駕駛意圖不一致時,在風險值較高時,控制系統可及時介入;風險值較低且人機沖突較大時,控制權按定值向駕駛員轉移,降低駕駛不適感,且整體控制效果優于定權重控制策略;駕駛員在環平臺測試結果表明當駕駛員適應了控制系統的適量介入時,該策略可為不同風格的駕駛員提供個性化的換道輔助.
下一步工作將基于駕駛員在環平臺測試,提取駕駛員真實換道過程的多個行為特征值,開發駕駛員意圖識別算法,并為智能系統設計更加符合駕駛員特性的軌跡規劃及控制算法,以期為駕駛員提供高度個性化的換道輔助.
參考文獻
[1]FLEMISCHF,ABBINK D,ITOH M,et al. Special issue on shared and cooperative control[J].Cognition,Technologyamp; Work,2019,21(4):553-554.
[2]楊浩,薛鋒,稅永波,等.預瞄距離自適應的路徑跟蹤駕駛員 模型[J].汽車實用技術,2021,46(15):30-33. YANGH,XUEF,SHUI YB,et al.A path-following driver model with adaptivepreview distance[J].Automobile Applied Technology,2021,46(15):30-33.(inChinese)
[3]田彥濤,趙彥博,謝波.基于駕駛員轉向模型的共享控制系統 [J].自動化學報,2022,48(7):1664-1677. TIANYT,ZHAO YB,XIEB. Shared control system based on driver steering model[J]. Acta Automatica Sinica,2022,48(7): 1664-1677.(in Chinese)
[4]WANG W S,ZHAO D,HAN W,et al.A learning-based approach for lane departure warning systemswith apersonalized driver model[J].IEEE Transactions on Vehicular Technology, 2018,67(10):9145-9157.
[5]張琦,張德虎.遺傳算法優化的方向駕駛員模型研究[J].承 德石油高等專科學校學報,2021,23(1):59-62. ZHANGQ,ZHANGD H.Directional driver modeloptimized by genetic algorithm[J].Journal of Chengde Petroleum Collge, 2021,23(1):59-62.(in Chinese)
[6]陳進.智能汽車人機共駕信息物理建模及控制方法研究[D]. 重慶:重慶大學,2021:25-30. CHENJ.Research on information physical modeling and control method of man-machine co-driving of smart car[D]. Chongqing: Chongqing University,2021:25-30(in Chinese)
[7]劉平,巫超輝,楊明亮,等.一種新的考慮駕駛員疲勞的人機 協同避障策略[J].湖南大學學報(自然科學版),2023,50(6): 19-28. LIU P,WU C H,YANG ML,et al.A new human-machine cooperative obstacle avoidance strategy considering driver fatigue [J].Journal of Hunan University(Natural Sciences),2023, 50(6):19-28.(in Chinese)
[8]張維剛,張朋,韋昊,等.一種基于LTVMPC改進的無人駕駛 汽車路徑跟蹤控制算法[J].湖南大學學報(自然科學版), 2021,48(10):67-73. ZHANG WG, ZHANG P,WEI H,et al.An improved path tracking control algorithm for autonomous vehicle based on LTVMPC[J].Journal of Hunan University(Natural Sciences), 2021,48(10):67-73.(in Chinese)
[9]GUTJAHR B,GROLL L,WERLING M.Lateral vehicle trajectory optimization using constrained linear time-varying MPC[J].IEEE TransactionsonIntelligent Transportation Systems,2017,18(6):1586-1595.
[10]劉瑞,朱西產,劉霖,等.基于非合作模型預測控制的人機共 駕策略[J].同濟大學學報(自然科學版),2019,47(7):1037- 1045. LIU R,ZHU X C,LIU L,et al. Cooperative driving strategy based on non-cooperative model predictive control[J].Journal of TongjiUniversity(Natural Science),2019,47(7):1037-1045. (in Chinese)
[11]DAI C H, ZONG C F, ZHANG D. A cooperative game-based lateral control authority allocation for human-machine co-driving in large conflict scenarios [C]//2O21 5th CAA International Conference on Vehicular Control and Inteligence(CVCI). October 29-31,2021.Tianjin,China:IEEE,2021:1-6.
[12]BENLOUCIF A,NGUYEN A T,SENTOUH C,etal. Cooperative trajectory planning for haptic shared control between driver and automation in highway driving[J]. IEEE Transactions on Industrial Electronics,2019,66(12): 9846-9857.
[13]PNO B,CHEVREL P,CLAVEAUF,et al. Obstacle avoidance inhighly automated cars:can progressive haptic shared control make it safer and smoother?[J]. IEEE Transactions on HumanMachine Systems,2022,52(4):547-556.
[14]MAB,LIUYL,NAXX,et al.Ashared steering controller design based onsteer-by-wire system considering humanmachine goal consistency[J].Journal of the Franklin Institute, 2019,356(8):4397-4419.
[15]JIXW,YANGKM,NAXX,etal.Feedback game-based sharedcontrol scheme design for emergency collision avoidance:a fuzzy-linear quadratic regulator approach[J]. Journal of Dynamic Systems,Measurement,and Control,2019,141(8):081005.
[16]LIRJ,LISB,GAOHB,et al.Effects of human adaptation and trust on shared control for driver-automation cooperative driving[C]//SAE Technical Paper Series.SAE International, 2017:1-8.
[17]IWANO K, RAKSINCHAROENSAK P, NAGAI M S. A study on shared control between the driver and anactive steering control system in emergency obstacle avoidance situations [J]. IFAC Proceedings Volumes,2014,47(3): 6338-6343.
[18]孫博華.考慮駕駛能力及駕駛習性的個性化人機共駕策略研 究[D].長春:吉林大學,2020. SUNB H. Research on personalized man-machine co-driving strategy consideringdrivingabilityanddriving habits[D]. Changchun:JilinUniversity,2O2O.(inChinese)
[19]劉思晗.基于交通態勢的人機共享控制策略研究[D].長春: 吉林大學,2021. LIU S H. Research on man-machine sharing control strategy based on traic situation[D].Changchun:Jilin University, 2021.(in Chinese)
[20]吳超仲,吳浩然,呂能超.基于間接共享控制的智能車協同接 管方法[J].中國公路學報,2022,35(3):101-114. WUCZ,WUHR,LUNC.Cooperativetakeovermethodfor automated vehicles based on indirect shared control [J].China Journal ofHighwayand Transport,2022,35(3):101-114.(in Chinese)
[21]周曉宇.考慮駕駛能力補償的人車共享轉向控制方法[D]. 長春:吉林大學,2021. ZHOU X Y.Vehicle-man shared steering control method considering driving ability compensation[D].Changchun:Jilin University,2021.(in Chinese)
[22]劉俊,時婉晴,郭洪艷,等.一種駕駛權動態調整的人機主從 博弈共駕方法[J].中國公路學報,2022,35(3):127-138. LIUJ,SHIWQ,GUOHY,etal.Stackelberggamebased driver-automation cooperative steering control with dynamic drivingauthority[J].China Journal ofHighwayand Transport, 2022,35(3):127-138.(in Chinese)
[23]LIUJ,GUOHY,SONGLH,etal.Driver-automation shared steeringcontrol forhighlyautomated vehicles[J].Science China InformationSciences,2020,63(9):190201.
[24]JUGADESC,VICTORINOAC,CHERFAOUIVB.Shared driving control between human and autonomous driving system via conflict resolution using non-cooperative game theory[C]//2019 IEEEIntelligent Transportation Systems Conference (ITSC). October27-30,2019,Auckland,NewZealand.IEEE,2019: 2141-2147.
[25]汪選要,魏星,謝東,等.基于權值懲罰法自適應人機協同避 撞策略[J].科學技術與工程,2022,22(13):5463-5471. WANGXY,WEIX,XIED,etal.Adaptivehuman-machine cooperative collision avoidance strategy based on weight penalty method[J].Science Technology and Engineering,2022,22(13): 5463-5471.(in Chinese)
[26]LIU K,WANG H L,FU Y,et al. A dynamic path-planning method forobstacle avoidance based on the driving safety field [J].Sens0rs,2023,23(22):9180.
[27]LIMJ,SONGXL,CAO HT,etal.Shared control with a novel dynamic authority allocation strategy based on game theory and drivingsafety field [J].Mechanical Systems and Signal Processing,2019,124:199-216.
[28]YUD,TIANK,LIUYH,et al. Lane change decision-making ofautonomous driving based on interpretable soft actor-critic algorithmwith safety awareness[M]//ArtificialIntelligence. Cham:Springer Nature Switzerland,2022:501-512.
[29]劉志強,張晴.自適應時域參數MPC的智能車輛軌跡跟蹤控 制[J].鄭州大學學報(工學版),2024,45(1):47-53. LIUZQ,ZHANGQ.Intellgent vehicle trajectory tracking control based on adaptive time domain parameter MPC[J]. Journal of Zhengzhou University(Engineering Science),2024, 45(1):47-53.(inChinese)