沈沛鴻,趙治國,郭秋伊
(同濟大學汽車學院,上海 201804)
基于仿真模型的整車控制策略開發可以大大節省開發的時間與成本。能量經濟性是車輛的重要性能,面向能量管理策略開發的汽車仿真模型關注車輛的縱向動力學行為,按照控制信號與能量流的傳遞路徑分為前向仿真和后向仿真[1-2]。后向仿真根據工況需求反求各部件工作需求,以此為目標對各動力源(如電池、電機與發動機)進行動力分配。而對于前向仿真,縱向駕駛員模型根據當前的實際車速與目標車速控制踏板行程得到需求轉矩,能量管理模塊根據需求轉矩分配動力源的動力,動力部件的動力響應通過傳動系統作用在車輪上,得到實際車速,進而再將實際車速傳遞給駕駛員模型,構成閉環仿真系統[3-4]。前向仿真模型更接近于真實的車輛行駛過程,它實現了控制信號與能量流的正向傳遞,在各部件間傳遞實際的工作轉速與轉矩。且前向仿真易于實現模型的動態化建模[5]。因而,前向仿真模型更有利于整車能量管理策略的開發。而縱向駕駛員模型作為前向仿真模型區別于后向仿真模型的典型特征部件,同時也是整個仿真過程的起始環節,具有重要的作用。
縱向駕駛員模型的作用除了更好地跟蹤目標工況,還要反映駕駛員的實際操縱行為,從而使整車仿真模型能更好地反映實車的運行特征,應用于整車能量管理策略的開發。目前最為常見的縱向駕駛員模型是基于PI控制的駕駛員模型[6-8]。基于PI控制的縱向駕駛員模型對目標車速的跟蹤效果依賴于比例系數與積分系數的整定,需要大量的調試工作,效率較低[9]。文獻[9]中以循環工況內的累積目標工況跟蹤誤差最小為目標,采用遺傳算法優化了PI參數,實現了較好的工況跟蹤效果,但優化的PI參數只適用于該特定工況。也有學者提出了基于模糊PI控制的駕駛員模型,可實現更好的工況跟蹤精度[2,4,10],但隸屬度函數和模糊 控制規 則的制 定仍須根據經驗反復調試,不斷修改。
無論是基于PI控制還是基于模糊PI控制的駕駛員模型都未考慮駕駛員的反應滯后和踏板操作的連續性,其決策出的加速(或制動)踏板行程與實際的踏板行程存在一定的差距,且波動較為頻繁。由于車輛的驅動需求轉矩、換擋決策與加速踏板行程有關[3,6],基于 PI控制或模糊 PI控制的駕駛員模型決策的加速踏板行程會造成驅動需求轉矩和擋位與實際情況不符,不利于基于仿真模型的能量管理策略開發。
采用機器學習的方法基于數據對研究對象進行建模可反映對象的原始特征。而對于駕駛員模型,基于機器學習的建模方法主要應用于橫向駕駛員模型的研究,對于縱向駕駛員模型的研究較少。文獻[11]和文獻[12]中分別采用模糊神經網絡建立了以橫向預瞄偏差、橫擺角速度等為輸入,以汽車轉向盤轉角為輸出的橫向駕駛員模型,基于采集的數據對網絡進行訓練,所建立的模型能較好地吻合實際的運動軌跡,符合駕駛員的操作行為。文獻[13]和文獻[14]中采用 BP神經網絡,對駕駛員橫向駕駛行為數據進行學習,建立了基于車輛側向速度、側向位移和預瞄軌跡等輸入參數的橫向駕駛員模型。
基于數據訓練的橫向駕駛員模型為縱向駕駛員模型的建立提供了思路。文中基于試驗樣車,采集了大樣本的縱向駕駛行為數據,采用基于自適應網絡的模糊推理系統(adaptive network-based fuzzy inference system,ANFIS)建立了基于二輸入參數的縱向駕駛員模型和基于預瞄的縱向駕駛員模型,對不同縱向駕駛員模型進行了仿真,并與實車試驗結果進行對比評價。
嘗試建立基于數據的縱向駕駛員模型,以期更好地反映駕駛員的實際駕駛特征。首先針對研究對象——某插電式混合動力汽車(plug-in hybrid electric vehicle,PHEV),采集了實車試驗數據。考慮到駕駛員對加速踏板操作的行程可能與當前時刻的實際車速、目標車速和未來預期車速有關,因此,從記錄的實車試驗數據中提取了車輛的目標車速、實際車速、未來時刻的預期車速和加速踏板行程等信號。其中,目標車速和未來時刻的預期車速在實車試驗的過程中由上位機通過CAN通信發送給CANape軟件進行記錄,在完成試驗后根據定義的通信地址進行數據解析和提取。
為更好地反映駕駛員縱向操縱車輛的行為特征,基于試驗樣車在轉鼓試驗臺上進行了5組NEDC標準工況的試驗,如圖1所示。此外,針對如圖2所示的校園行駛路線,設計了如圖3所示的校園行駛工況,進行了7組道路試驗。實車試驗均由一位駕駛員完成。最終獲取了NEDC行駛工況604 753組轉鼓試驗數據和校園行駛工況下141 467組實車道路試驗數據,每組數據表示各個采樣時刻記錄的實際車速、目標車速、預計車速和踏板行程。

圖1 轉鼓試驗
在橫向駕駛員模型研究中,ANFIS已經得到了應用[11-12]。其核心思想是利用神經網絡對知識的表達機理,通過學習訓練來實現控制規則的記憶,從而實現模糊輸入輸出的映射。ANFIS將模糊控制方法與人工神經網絡相結合,通過其學習訓練駕駛行為,更接近于駕駛員的控制思想和方法[12]。本文中采用ANFIS建立縱向駕駛員模型。

圖2 校園行駛路線

圖3 校園行駛工況
ANFIS是一種基于Takagi-Sugeno模型的模糊推理系統,將模糊控制的模糊化、模糊推理和反模糊化3個基本過程全部用神經網絡來實現,通過離線訓練和在線學習算法進行模糊推理控制規則的自調整,使其系統本身朝著自適應、自組織、自學習的方向發展。采用結構如圖4所示的ANFIS[15]建立縱向駕駛員模型。
第1層為計算輸入的模糊隸屬度:

式中OEi和ORi表示第1層上的輸出。
第2層為計算每條規則的使用度:

第3層為計算適用度的歸一化值:

第4層為計算每條規則的輸出:


圖4 ANFIS拓撲結構
第5層為計算模糊系統的輸出:

在獲得ANFIS結構后,即可采用駕駛員的縱向駕駛行為數據和BP神經網絡算法[15]來訓練ANFIS的參數,修正連接ANFIS各單元之間的ωk值,使訓練誤差減小。
駕駛員對加速踏板行程的操作可能取決于當前時刻對目標車速的跟蹤,而對目標車速的跟蹤可表現為當前的加速度或目標車速與實際車速的偏差。因此,可建立基于車輛當前時刻的目標車速v、加速度a或目標車速與實際車速的偏差err的二輸入參數ANFIS縱向駕駛員模型。設每個輸入參數由3個隸屬函數表述,隸屬函數采用常用的鐘型函數-gbellmf[16];ANFIS輸出參數采用擬合效果較好的線性函數-linear[17]。輸入參數的隸屬函數如圖 5所示。所建立的ANFIS模型結構如圖6所示。
首先建立基于目標車速與加速度的ANFIS縱向駕駛員模型。在采集得到的車輛行駛數據中抽取60 000組目標車速、加速度和加速踏板行程數據對ANFIS模型進行訓練,得到的模糊規則和模糊推理曲面分別如圖7和圖8所示。在得到基于訓練數據的ANFIS模型后,從采集到的樣本數據中抽取10 000組數據對模型進行檢驗。檢驗結果如圖9所示,平均檢驗誤差為8.63%。

圖5 輸入參數隸屬函數

圖6 基于二輸入參數的ANFIS結構
同理,可建立基于目標車速與車速偏差的ANFIS駕駛員模型。以60 000組實車試驗數據中的目標車速和車速偏差為輸入參數、加速踏板行程為輸出參數對ANFIS模型進行訓練,得到的模糊規則和模糊推理曲面分別如圖10和圖11所示。抽取10 000組實車試驗數據對基于目標車速和車速偏差的ANFIS訓練模型進行檢驗。檢驗結果如圖12所示,平均檢驗誤差為5.93%。從ANFIS訓練模型的檢驗結果來看,基于目標車速與車速偏差的二輸入參數ANFIS模型的訓練效果優于基于目標車速與加速度的二輸入參數ANFIS模型。

圖7 基于目標車速和加速度的ANFIS模糊規則

圖8 基于目標車速與加速度的ANFIS模糊推理曲面

圖9 基于目標車速與加速度的ANFIS模型檢驗結果
在橫向的駕駛員模型研究中,引入了未來軌跡的修正,得到基于預瞄的橫向駕駛員模型,能更好地跟蹤車輛目標軌跡[11-12]。對縱向的駕駛行為而言,駕駛員對加速踏板的操作不僅反映駕駛員對當前目標車速的跟蹤需求,可能還受未來預期車速的影響。若須加速,則駕駛員可能會在當前時刻加大加速踏板行程;若須減速,則反之。因此,可引入未來時刻的目標車速作為輸入參數,將未來時刻的目標車速與當前時刻的加速踏板行程產生關聯,以期反映駕駛員對加速踏板的操作受未來預期車速的影響特性。

圖10 基于目標車速和車速偏差的ANFIS模糊規則

圖11 基于目標車速與車速偏差的ANFIS模糊推理曲面

圖12 基于目標車速與車速偏差的ANFIS模型檢驗結果
假設駕駛員對加速踏板的操作只受未來短時域內預期車速的影響,在當前時刻目標車速與加速度作為輸入參數的基礎上,引入了未來3 s的預期車速也作為輸入參數,建立基于預瞄的縱向駕駛員模型。同樣采用ANFIS模型訓練基于預瞄的縱向駕駛員模型。
所采用的模糊推理系統輸入參數的隸屬函數數目與類型和ANFIS輸出參數函數類型均同二輸入參數的ANFIS訓練模型。由于具有3個輸入參數,所建立的ANFIS結構如圖13所示。

圖13 基于三輸入參數的ANFIS結構
同樣抽取60 000組數據對ANFIS模型進行訓練,得到基于預瞄的駕駛員模型。訓練得到的模糊規則和模糊推理曲面分別如圖14和圖15所示。抽取10 000組原始數據對訓練得到的基于預瞄的ANFIS縱向駕駛員模型進行檢驗。檢驗結果如圖16所示,平均檢驗誤差為4.04%。可見,基于預瞄的縱向駕駛員模型訓練效果優于基于二輸入參數的ANFIS縱向駕駛員模型。

圖14 基于ANFIS預瞄縱向駕駛員模型模糊規則
為測試評價以上基于數據的縱向駕駛員模型的效果,基于Matlab/Simulink建立了PHEV試驗樣車的仿真模型與基于規則的控制策略[6]。仿真所用的能量管理策略與實車保持一致,所采用的純電動模式下的換擋策略如圖17所示。

圖16 基于ANFIS預瞄縱向駕駛員模型檢驗結果

圖17 PHEV純電動模式下換擋策略
抽取轉鼓試驗中跟蹤NEDC工況最好的一組實車試驗的行駛時間-車速曲線(見圖18)作為具有代表性的實際行駛工況,并作為仿真模型的目標輸入工況,采用參數整定后的PI控制的駕駛員模型和不同的ANFIS縱向駕駛員模型進行仿真,與實車試驗數據進行對比。為使PHEV工作在純電動模式下,設初始SOC為50%。

圖18 PHEV試驗樣車實際行駛時間-車速曲線
圖19 為不同駕駛員模型的工況跟蹤情況。為更好地描述各駕駛員模型的工況跟蹤效果,采用車速跟蹤偏差的最大值、最小值,以及如式(7)所示的均方根誤差(RMSE)來表征,結果如表1所示。由表可見,基于ANFIS的預瞄縱向駕駛員模型具有最好的跟蹤車輛實際行駛車速的能力,基于PI控制的駕駛員模型的工況跟蹤能力次之,基于目標車速與車速偏差或加速度的ANFIS駕駛員模型的工況跟蹤能力相對較差,但總體上能跟蹤實際車速的趨勢,且車速變化更為平緩。

式中:vs,i為仿真車速;va,i為實際車速;m為工況點個數。
圖20 為加速踏板行程對比。由圖可見:基于ANFIS的預瞄縱向駕駛員模型決策得到的加速踏板行程與駕駛員實際的加速踏板行程最接近;基于PI控制的駕駛員模型次之;基于二輸入參數的ANFIS駕駛員模型決策得到的加速踏板行程幅值較小,與實際的加速踏板行程相差較大。這也證明了工況跟蹤的結論,仿真所得的加速踏板行程與實際加速踏板行程越接近,工況跟蹤效果越好。此外,基于PI控制的駕駛員模型決策得到的加速踏板行程波動較大,而基于數據訓練得到的ANFIS駕駛員模型加速踏板行程較為平順,更符合駕駛員對加速踏板行程的實際操作。

表1 各駕駛員模型工況跟蹤統計 km/h

圖20 加速踏板行程對比
圖21 為實車試驗的擋位變化以及采用各駕駛員模型仿真的擋位變化情況。由于擋位決策與車速和加速踏板行程有關,因而采用各駕駛員模型的擋位變化情況各不相同。工況跟蹤效果最好的ANFIS預瞄駕駛員模型的擋位變化情況與實車試驗的擋位變化最為接近。基于PI控制的駕駛員模型次之。而工況跟蹤效果相對較差的二輸入參數的ANFIS駕駛員模型的擋位變化情況與實際存在較大的差別,但由于其加速踏板行程相對較小也更平順,其擋位也更為穩定。

圖21 擋位對比
圖22 和圖23分別為變速器輸入端需求轉矩和車輪端需求轉矩。驅動需求轉矩也與加速踏板行程直接相關,從圖可以看出:采用工況跟蹤效果最好的ANFIS預瞄駕駛員模型仿真得到的需求轉矩最接近實際的需求轉矩;采用基于PI控制的駕駛員模型次之;采用二輸入參數的ANFIS駕駛員模型得到的需求轉矩與實際需求轉矩相差較大。此外,基于PI控制的駕駛員模型的驅動需求轉矩波動較為頻繁,基于數據訓練的ANFIS駕駛員模型驅動需求轉矩較為平順,更符合車輛的實際情況。由于PHEV的能量管理策略是基于驅動需求轉矩來優化動力源功率分配的,較頻繁的需求轉矩波動不利于反映能量管理策略的實際效果。因此,基于ANFIS駕駛員模型更有利于能量管理策略的開發。

圖22 變速器輸入端需求轉矩對比

圖23 車輪端需求轉矩對比
對照不同駕駛員模型的工況跟蹤、加速踏板行程、擋位以及驅動需求轉矩可知,基于ANFIS預瞄駕駛員模型具有最好的綜合效果。
通過以上對各縱向駕駛員模型的研究與仿真對比,可得出以下結論。
(1)基于PI控制的縱向駕駛員模型的工況跟蹤RMSE值為1.736 3 km/h,工況跟蹤效果有待提高,且存在明顯的弊端。基于PI控制的駕駛員模型決策出的加速踏板行程波動較頻繁,進而造成需求轉矩波動也較頻繁,不能反映車輛的實際行駛特征,不利于能量管理策略的開發與優化。
(2)采用ANFIS方法基于數據訓練得到的二輸入參數(目標車速與加速度或車速偏差)的縱向駕駛員模型決策出的加速踏板行程和對應的需求轉矩均較平順,擋位也相對較為穩定,但對工況跟蹤的效果較差,基于車速與加速度和基于車速與其誤差兩種模型的工況跟蹤RMSE值分別為3.616 6和2.317 5 km/h,比PI控制模型的RMSE值還大。
(3)基于ANFIS預瞄駕駛員模型對工況跟蹤效果最好,工況跟蹤的RMSE值為0.993 0 km/h,且其決策出的加速踏板行程、擋位以及需求轉矩與實車試驗結果最為接近。因此,基于ANFIS預瞄駕駛員模型具有最佳的綜合效果,可反映車輛的實際行駛狀態,更有利于整車能量管理策略的開發與優化升級。