劉通,曾小華?,李泰祥,宋大鳳,莊曉
(1.吉林大學汽車仿真與控制國家重點實驗室,吉林長春 130025;2.中車青島四方車輛研究所有限公司,山東青島 266031;3.一汽解放青島汽車有限公司,山東青島 266043)
在整車控制策略設計過程中,基于仿真模型進行控制策略開發可以顯著節約研發時間和成本.目前,車輛控制策略仿真模型可分為前向模型和后向模型.相較于后向模型,前向模型的控制信號和功率流均為正向傳遞,符合車輛實際使用情況.通過引入駕駛員模型,前向模型中在線控制策略開發和測試更易實現[1-2],實車整車控制策略開發和驗證過程中多采用前向仿真模型.在臺架或仿真測試過程中,車輛輪速或仿真車速與目標車速的偏差,即工況跟隨偏差對油耗有顯著影響.此外,駕駛風格對整車油耗的影響也不可忽視,相同的控制策略和測試條件下,不同駕駛風格對車輛油耗的影響差異可高達40%[3].因此,構建縱向駕駛員模型時,除了工況跟隨偏差需要滿足國標要求外[4],加速與制動踏板等輸出信號也要盡可能符合實際駕駛員的操縱行為,以實現合理評價車輛能耗的目的.
目前,基于PI 控制的駕駛員模型是最常用的駕駛員模型.PI 駕駛員模型以實際車速和目標車速偏差為輸入,通過調整PI參數得到合適的踏板輸出,進而實現工況跟隨[5].為了改進簡單PI 駕駛員模型參數難以確定的缺點,文獻[6]采用遺傳算法對PI參數進行優化,在給定工況下實現了良好的工況跟隨效果.有研究人員[7-8]采用模糊PI控制和單神經元自適應PID 控制建立駕駛員模型,能夠實現控制參數的在線自整定,具有較好的適應性和魯棒性.但是,以上模型僅以工況跟隨誤差最小為目標,均未考慮模型特征和實際駕駛行為之間的差異.
面向復雜的駕駛行為決策問題,有研究人員提出采用智能控制算法建立駕駛員模型:文獻[9]采用局部神經網絡和遠端學習控制方法建立面向駕駛風格的駕駛員模型,充分考慮了環境因素對駕駛行為的影響,既保證了良好的車速跟隨效果,又保留了原始數據中的駕駛風格.根據駕駛員預瞄行為特征,沈沛鴻等[10]建立了基于自適應網絡模糊推理方法的縱向駕駛員模型,實現了良好的工況跟隨效果.但是,實際的駕駛行為往往由多種影響因素決定,以上研究并未充分考慮.另外,智能控制算法盡管能較好地模擬駕駛行為,但模型較為復雜,會顯著影響優化效率.
本文以一款行星式混合動力物流車為研究對象,通過轉鼓試驗臺試驗,采集整車和駕駛行為數據,建立二次線性回歸駕駛員模型,采用Lasso 回歸方法篩選變量并優化回歸模型;最后,建立整車仿真模型、PI 駕駛員模型和一次Lasso 回歸駕駛員模型,對3 種不同的駕駛員模型進行仿真驗證,并論述了本文所建模型的有效性和合理性.
縱向駕駛行為是決定車輛縱向運動特征的駕駛員操縱行為,具體為駕駛員操縱加速踏板、制動踏板、離合器、變速器和駐車制動器的行為.本文所研究的行星式混合動力物流車動力系統無變速器和離合器,在進行循環工況測試時,駕駛員的縱向操縱信號只有加速和制動踏板開度信號.研究樣車及轉鼓試驗平臺如圖1 所示.駕駛員在操縱踏板跟隨目標工況時,正前方放置工況跟隨顯示器,可動態顯示目標工況車速和實際車速軌跡,駕駛員通過觀察車速跟隨偏差,實時調整踏板開度以保證良好的工況跟隨效果.鑒于駕駛過程中歷史車速、加速度、駕駛員行為信息對駕駛員決策有顯著影響,本研究從實車控制器中提取車速、加速踏板開度、制動踏板開度等信息,從轉鼓試驗臺提取目標車速、加速度信息.

圖1 樣車及轉鼓試驗平臺Fig.1 Prototype of the truck and drum test platform
樣車臺架測試由熟練駕駛員進行操作,其駕駛行為與多數駕駛員的平均駕駛水平相吻合,然后按照國標GB∕T 27840—2021 的要求進行10 次C-WTVC 工況測試[4].測試數據通過整車CAN 網絡和臺架數據進行采集.
根據臺架測試駕駛員反饋,歷史駕駛行為、歷史車速狀態、未來目標工況對駕駛行為均有影響,且影響時間不超過5 s.駕駛員模型初選輸入參數如表1所示.駕駛員在操縱過程中加速和制動踏板不存在同時踩下的情況,本研究將兩踏板信號統一為踏板開度,以減少參數數量,提高模型運行效率.當踏板開度大于0、制動踏板開度為0 時,表示為加速踏板開度,車輛處于驅動狀態,反之亦然.

表1 駕駛員模型初選輸入參數Tab.1 Driver model input parameters
駕駛員行為決策具有復雜的非線性特征,輸入變量之間存在一定交互關系.兼顧模型效率和非線性特性,本文采用二次回歸模型.為了消除變量間量綱不同、自身變異或者數值相差較大所引起的誤差,首先需要對影響駕駛行為的多項參數進行標準化處理,然后建立二次回歸模型:

式中:x1,x2,…,xp為p個標準化后的模型自變量,按次序和表1 中變量相對應;y為因變量;β0為回歸常數;β1,β2,…,βp為一次項回歸系數;β1,1,β1,2,…,βm,m為二次項回歸系數;ε為隨機誤差[11];二次項xixj(1 ≤i≤j≤m)包括二次主效應(i=j)和雙向交互效應(i≠j)[12],二次項可認為是新的自變量,綜合一次和二次項,輸入變量由27個初始變量擴展為406個.
在初始建模時,為了盡量考慮所有可能的影響因素,通常會選擇盡可能多的自變量.但是多維度自變量容易造成“維數災難”,使得模型求解困難.另外,高維自變量之間可能存在顯著的相關性,建模時容易出現過擬合的問題,進而影響模型性能.因此,有必要對回歸模型進行多重共線性檢測.方差擴大因子法(Variance inflation factor,VIF)是一種有效的多重共線性驗證方法.VIF定義式為:

針對多重共線問題,本文采用Lasso 回歸剔除相關性較高的自變量.Lasso 回歸是一種有效的變量篩選方法,該方法是在嶺回歸的基礎上將懲罰項由L2范數變為L1范數,通過把一些不重要的變量的回歸系數縮減為0,以獲得稀疏解,進而篩選得到對因變量有顯著影響的自變量,并完成參數估計[13].
設因變量y∈R,輸入矩陣為X∈Rm,可得Lasso模型[14]:

式中:λ為正則參數或收縮算子;β0、βi為回歸系數向量.
Lasso 回歸懲罰項非連續可導,需要采用求極值解法、坐標軸下降法和最小角回歸法等方法進行求解.其中,坐標軸下降法是一種最快解法,但是其變量計算過程只能沿坐標軸進行,而最小角回歸法是一種基于前向選擇算法和前向梯度算法的變量篩選算法,能夠得到更為精確的特征向量,本文采用最小角回歸法求解回歸系數.由于本研究采集的工況測試數據是典型的小樣本數據,因此采用K折交叉驗證的方法以充分利用數據信息,取參數K為9(即測試集為9 個C-WTVC 工況數據),可得式(3)中各參數回歸系數隨參數λ變化軌跡如圖2所示,交叉驗證均方誤差隨λ變化如圖3所示.圖3中MSE和誤差條分別表示9次訓練和測試得到的均方誤差和誤差限.

圖2 回歸系數隨λ的變化軌跡Fig.2 The trajectory of the regression coefficient with respect to λ

圖3 交叉驗證均方誤差隨λ的變化軌跡Fig.3 Trajectory of mean square error with λ for cross validation
從圖2 可以看出,隨著λ增大,越來越多的回歸系數壓縮為0,當λ取0.565 0 時,回歸系數趨于穩定,這時只有28 個參數的系數不為0,極大地降低了模型復雜程度.同時由圖3 可知,當λ逐漸增大至0.565 0 的過程中,盡管回歸均方誤差有所增大,但是,在預測誤差范圍基本保持不變,能夠較好地兼顧預測精度和模型效率.綜合考慮,最終λ取0.565 0,相應28 個參數(包括復合參數)及其系數如表2 所示,共需要22 個初始變量,即建立的駕駛員模型為22元二次回歸模型.
從表2 中可以看出:1)車速跟隨偏差(歷史車速跟隨偏差以及當前車速和未來目標車速的偏差)對駕駛行為的影響最明顯;2)歷史踏板開度信息對駕駛行為也有一定程度的影響;3)歷史特征和未來目標車速越接近當前決策時刻,對駕駛行為影響越大.以上分析充分說明駕駛行為同時受到了歷史駕駛行為、車輛狀態信息以及未來預期狀態的影響,體現了駕駛決策的復雜性.

表2 Lasso回歸篩選參數Tab.2 The parameters obtained by Lasso regression filtering
為了充分驗證二次Lasso 回歸駕駛員模型的合理性,本文基于MATLAB∕Simulink 建立了整車仿真模型和實車控制策略模型.為了驗證本文提出的駕駛員模型的合理性,基于表1 參數構建一次線性Lasso 回歸駕駛員模型和PI 駕駛員模型.將3 種駕駛員模型仿真結果和實車測試結果進行了對比,從多個角度分析了各模型優缺點.
駕駛員模型首先應具備良好的工況跟隨效果,在此基礎上仿真得到的工況跟隨偏差和油耗測試結果偏差等指標也應該盡可能接近實車測試結果.仿真結果和臺架試驗結果如表3 所示,不同駕駛員模型工況跟隨偏差如圖4 所示.由于本研究基于多個C-WTVC 工況測試結果建立駕駛員模型,仿真結果與單個實車測試工況進行對比是不合理的.因此,圖4 展示了3 種仿真模型單個工況測試結果,未考慮與實車測試工況進行對比.

表3 仿真結果和臺架試驗結果Tab.3 The results of simulation test and bench test

圖4 不同駕駛員模型工況跟隨偏差Fig.4 The driving cycle following deviation of different driver models
由表3 和圖4 可以看出,3 種駕駛員模型都具有良好的工況跟隨效果,車速偏差大于3 km∕h 的時間均滿足國標測試要求.其中,二次Lasso 回歸駕駛員模型工況跟隨偏差大于其他兩種模型,但是跟隨偏差接近真實駕駛員,油耗相比實車小1.07%,接近實車測試結果.相比之下,PI駕駛員模型工況跟隨偏差最小,但是踏板開度波動劇烈,這說明PI駕駛員模型良好的工況跟隨效果是通過頻繁操縱踏板實現的,和實際駕駛行為差別較大.而激烈的駕駛行為會顯著增加油耗,表3 中PI 駕駛員模型油耗比實車大4.5%,顯然不利于車輛燃油經濟性分析.此外,一次線性Lasso 回歸駕駛員模型踏板輸出特征與二次Lasso 回歸駕駛員模型類似,但是油耗和工況跟隨效果較實車駕駛員存在較大偏差.
為了深入分析不同駕駛員模型輸出特征,本文對各駕駛員模型和臺架測試駕駛員輸出分布進行了量化分析.
如圖5 所示,本文統計了實車以及各駕駛員模型在不同踏板開度和不同車速下的工作時間分布.由圖5 可知,兩種基于Lasso 回歸的駕駛員模型的踏板開度分布相比PI駕駛員模型更接近實車駕駛員.

圖5 不同駕駛員模型踏板輸出分布Fig.5 Pedal output distribution of different driver models
進一步采用分布相似性評價方法量化對比各模型與實車駕駛員之間踏板輸出分布差異.本文以常用的JS 散度(Jensen-Shannon Divergence)作為相似性評價指標[15].JS 散度源于信息熵和KL 距離(Kullback-Leibler Divergence).其中,KL 距離也是一種度量兩個概率分布相似性的指標.假設分布P和Q對應的概率密度函數分別為p(x)和q(x),則兩分布的KL距離如式(4)所示,該距離滿足非負性.

式中:p(x) ≥0;q(x) >0.顯然,P和Q的分布越相近,KL距離越小,當兩分布相同時,DKL(P,Q)=0.但是,DKL(P,Q) ≠DKL(Q,P),所以KL 距離是非對稱的.JS散度在此基礎上進行了改進,其表達式如下:

可見,JS散度具有對稱性,值域為[0,1],相較于KL 距離,JS 散度能夠更確切地判別兩個概率分布的差異性.但是JS 散度要求p(x) >0,q(x) >0,顯然本文中踏板開度分布不滿足要求.一種有效的解決方法是對p(x)和q(x)相加極小值ε,使得概率值均大于0,在不明顯影響概率分布特征的基礎上得到合理的JS散度值.
分別計算各駕駛員模型與實車駕駛員踏板開度分布之間的JS 散度值,結果如表4 所示.由表4 可見,基于二次Lasso 回歸的駕駛員模型與實車駕駛員的踏板輸出分布最為接近.

表4 駕駛員模型與實車駕駛員踏板開度分布之間的JS散度Tab.4 The JS divergence of pedal opening distribution between driver model and real driver
本文以一款行星式混合動力物流車為研究對象,通過對3 種縱向駕駛員模型的研究和仿真對比,可得出如下結論:
1)基于二次Lasso 回歸的縱向駕駛員模型的工況跟隨效果較好,滿足國標測試要求.
2)與PI 駕駛員模型和一次線性Lasso 回歸駕駛員模型相比,基于二次Lasso 回歸的縱向駕駛員模型充分考慮了多種因素對駕駛行為的影響,縱向駕駛行為和能耗特征更接近真實駕駛員.