盧 靜,金智林
(1.南京航空航天大學金城學院, 南京 210016;2.南京航空航天大學 能源與動力學院, 南京 210016)
自動跟車系統能夠有效提高道路的通行效率與安全性、減輕傳統駕駛員疲勞駕駛的操縱負擔[1-4]。在交通擁堵時,跟車系統往往會控制車輛自動以小制動強度進行剎車,以一定的安全距離跟隨前方車輛行駛。在上述過程中,電動汽車再生制動系統能夠有效提高續航里程[5-6]。雖然電動汽車可通過驅動電機再生制動使車速降為0,但僅通過電機再生制動實際能夠為車輛提供的瞬時最大制動減速度是有限的,而在跟車過程中,大制動強度的制動需求是客觀存在的。也就是說,僅通過驅動電機進行制動不能實現大制動強度、短制動距離的制動,更不能實現急剎車等操作,因此不滿足日常跟車時的制動需求(如前車急剎車)。例如:廣泛應用在電動汽車上的由德國博世公司所研發的ESP hev系統,當整車控制器需求的制動強度小于0.3g時,制動力可完全由驅動電機提供,此時液壓制動系統不參與工作;而當整車控制器需求的制動強度大于0.3g時,單獨由驅動電機進行再生制動已無法滿足需求,液壓制動系統將會介入,與驅動電機再生制動共同為車輛提供制動力。因此,受限于驅動電機輸出的最大力矩,在對于制動強度需求較高的工況下必須配合摩擦制動來保證跟車安全。此時,部分制動能量將以摩擦熱能的形式損失,無法回收[7-10]。此外,大制動強度的跟車策略即緊急制動雖然能夠提高跟車安全性,但會造成乘客的不舒適[11]。因此,如何在跟車工況下平衡各目標之間的博弈關系,對智慧物流等領域自動跟車控制的大規模推廣意義重大[12]。
目前,傳統燃油車自動跟車控制系統的經濟性優化已趨于成熟[13-14]。相比傳統燃油車,混合動力電動汽車和電動汽車更容易通過再生制動來設計節能控制策略,以提高車輛在跟車行駛過程中的制動經濟性[15-17]。然而,上述研究并未考慮跟車工況下前方車輛運動學特性對被控車輛在進行跟車決策時的影響。受驅動電機能夠輸出的最大力矩的限制,制動系統的運行方式與交通環境的復雜程度密切相關,從而造成了車輛在頻繁制動過程中的能量損失。因此,需要在設計跟車策略時將車輛間動力學特性與被控車輛能量回收機理相結合。
在目前的跟馳過程多目標決策控制研究中,模型預測控制因其動態協調優化能力而得到廣泛應用[18-19]。在滾動優化過程中,理想的控制方法是根據交通環境動態調整各性能指標的權重系數。對于多個指標之間的沖突,通過建立博弈模型并求解其納什均衡,可以得到各績效指標的合理收益分配[20-22]。因此,在控制策略的設計中應考慮各指標之間的博弈關系。根據求解博弈模型得到的混合策略納什均衡,確定各指標的權重,理論上能夠有效實現跟車場景下被控車輛性能的動態調整。
針對上述問題,首先結合交通環境分析建立了制動能量傳遞模型和車間縱向模型,提出了混合策略下跟車場景中各博弈方納什均衡的最優解方法。在此基礎上,提出了基于跟車博弈模型混合策略納什均衡的預測控制方法,通過制動力的分配和對前車縱向行為的預測,提高了被控車輛理論可回收制動能量占總制動能量的比例。
本文的主要貢獻在于:提出了基于模型預測控制的多目標節能控制策略,實現了通過對前車制動行為的預測,根據工況動態調整模型預測控制器中指標的權重(權重動態調整的依據為當前采樣時刻下被控車輛跟車博弈模型的混合策略納什均衡,即各個參與者的偏好),從而實現提高制動能量回收效率,同時提高車輛續航能力、提高舒適性以及保證安全性的控制目標。
為了在控制器設計中定量地分析和控制車輛跟馳過程中的各項指標,建立了制動能量傳遞模型和交通環境中的車輛間縱向動力學數學模型。
通過對制動過程中縱向力進行分析,得到車輛在制動過程中的總能量消耗[23],如式(1)所示:
(1)
式中:ΔE為制動過程中包括風阻等因素在內的總能量損失。也就是說,ΔE由2部分組成,一部分由于風阻、剎車片機械摩擦等因素以熱能的形式消耗,無法回收;另一部分能量可以通過電機的再生制動轉化為電能并儲存起來。P為車輛的負載功率,v為制動過程中每個采樣時刻的縱向車速,Ff為滾動阻力,Fw為風阻,Fb(zt)為包括再生制動力和摩擦制動力在內的總制動力,是制動強度zt的函數。
接下來從車輪到儲能單元逐級分析了可回收能量在傳輸過程中的損失,提出了可回收能量的定量表達式,如式(2)所示:
(2)
式中:E為考慮傳遞過程損失后的理論可回收制動能,P4為儲能單元瞬時功率,K1為機械傳動機構的傳遞效率系數,K2為驅動電機再生制動能量轉換系數,K3為儲能單元的能量轉換系數,Fb_re為驅動電機可提供的車輪上的再生制動力。

(3)
式中:ax_ego為當前時刻被控車輛的理想縱向加速度,Vx_ego為被控車輛的縱向速度,τ為控制系統的時滯常數。
以跟車過程中被控車輛與前方車輛的相對距離和相對速度誤差為狀態變量,建立跟車模型[24-26],如式(4)所示。

(4)
式中:Δv和d(t)為被控車輛和前車間的縱向相對速度和相對距離,可由傳感器測得。dsafe(t)為理想安全距離,Δd為相對距離的跟蹤誤差。當安全距離過小時,在跟車過程中容易發生追尾事故。雖然長距離的安全距離可以保證跟車的安全,但會減少單位時間和單位道路長度的車輛數量。也就是說,從宏觀上看,過長的安全距離降低了特定路段車輛的通行效率,這也是造成日常交通擁堵的主要原因之一。本文中的安全距離模型如式(5)所示。
dsafe(t)=thvx_ego+d0
(5)

對制動能量回收效率、跟車安全性和制動舒適性3個主要指標之間的矛盾關系進行了分析,綜合考慮多目標間的博弈關系,建立了跟車場景的博弈模型,并提出了混合策略納什均衡求解方法,設計了跟車過程博弈控制策略。
通過對電動汽車跟車過程進行分析,構建了安全性、舒適性和節能性3個跟車決策過程中的評價指標,3個指標作為博弈模型參與者時的決策收益定性描述為:
1) 安全性參與者
若一旦發現跟車距離小于閾值,此時收益最大的決策為輸出最大制動減速度,使被控車輛進行緊急制動,則可以最大程度地避免碰撞的發生。
2) 舒適性參與者
當制動減速度過大即車輛急剎車時,必然造成乘客的不舒適,因此,收益最大的決策為任何時候都采取盡量小的制動減速度。
3) 節能性參與者
當理想制動減速度較小時,僅通過電機再生制動即可滿足需求,此時理論上所有制動能量都是可回收能量;而當理想制動減速度較大時,僅通過電機再生制動無法滿足需求,需要摩擦制動介入來使實際總制動強度達到理想值。然而,此時必然有一部分能量以熱能的形式散失,無法被回收。因此,收益最大的決策也為任何時候都采取盡量小的制動減速度。
由上述分析可見,任何時候都采取盡量小的制動減速度這種決策,對于舒適性和節能性來說都是收益最大的決策,但對于安全性來說,采取盡量小的制動減速度這種策略收益很小甚至收益為負,即會導致碰撞,反之亦然。3個指標間的博弈關系如圖1所示。

圖1 3個指標間的博弈關系曲線
制動能量回收效率指標如式(6)所示,用于衡量理論可回收能量占總制動能量的比例。
(6)
式中:E為可回收制動能量,ΔE為總制動能量,η為可回收制動能量占總制動能量的比例。由此可見,當指標值η較低時,在多目標優化控制器中增加指標的權重系數,可以迫使優化器獲得較小的制動強度,從而達到提高理論可回收制動能量占總能量比例的目的。但從前面的分析來看,制動強度過低會影響跟車安全。因此,在滾動優化控制器中,需要通過博弈模型動態確定指標的權重系數。綜上所述,在博弈模型中,將制動能量回收效率定義為參與者1,其收益函數如式(7)所示。
u1(zt)=a1ηN+b1
(7)
式中:u1(zt)為制動能量回收效率收益函數,a1和b1為超參數。
與制動經濟性相比,在設計制動舒適性收益時,不僅要考慮成本函數的現值,還要考慮成本函數的積分值。也就是說,制動舒適性指數允許在短時間內增加,但不允許長時間處于較高的狀態。綜上所述,在博弈模型中,將制動舒適性定義為參與者2,博弈模型中參與者2的收益函數設計如式(8)所示。
(8)
式中:u2(zt,zt-1)為制動舒適性收益函數,zt-1為被控車輛在t-1時刻的制動強度,ts為策略執行時間(即執行器的采樣時間)。在這項工作中,模擬驗證和試驗車輛的控制器采樣時間為100 ms,a21、a22和b2為超參數。
對于汽車跟馳安全而言,其收益不僅是制動強度的函數,而且受交通環境中相對速度和距離的影響。因此,在博弈模型中,將汽車跟馳安全性定義為參與者3,參與者3的收益函數如式(9)所示。
(9)
式中:ΔV和Δdt分別為當前采樣時刻下被控車輛與前車之間的相對速度和相對距離,g為重力加速度,取9.8 m/s2,a3和b3為超參數。
上述問題被轉換為包含有限個參與人的博弈模型策略求解問題。對于有限個參與人的非合作博弈來說,其策略的一般形式Γ如式(10)所示。
(10)
式中:N為博弈過程參與者個數,在本文中為跟車過程中的安全性、舒適性和節能性3個參與者;Si為第i個參與者的策略偏好,即在當前采樣時刻下其對于制動強度的偏好;ui為當前采樣時刻下第i個參與者采取相應的策略時所能夠獲得的收益;S為由所有參與者的策略所構成的策略集合。
而對于混合策略博弈模型來說,其納什均衡必然存在,純策略只是混合策略的一個特例。當前混合策略下參與者i的收益是純策略收益和混合策略的乘積之和[27-28]。因此,如果玩家i的最優收益被記錄為βi、參與人i的混合策略求解問題轉換為如式(11)所示的優化問題。
(11)

提出了基于博弈模型混合策略納什均衡的預測控制跟車控制策略,并通過博弈模型動態求解目標權重,以平衡再生制動能量回收效率、跟車安全性和制動舒適性之間的矛盾。
控制策略的核心思想為根據博弈模型的輸出,對再生制動力和摩擦制動力進行分配,提高再生制動力占總制動力的比例,從而提高理論上可回收制動能量占總制動能量比例,如圖2所示。首先,將跟車過程中的安全性、舒適性和節能性視為跟車博弈過程的3個參與者,構建博弈模型,通過求解上述博弈模型的混合策略納什均衡,得到當前采樣時刻下模型預測跟車控制器中優化目標所需的目標函數權重系數。
其次,通過安全性、舒適性和節能性3個指標建立優化模型,基于模型預測控制在每個采樣時刻對理想的被控車輛的理想制動強度進行計算。在每個采樣時刻,將博弈模型求解得到的權重系數賦值給模型預測跟車控制器中優化模型的3個優化目標,以實現根據博弈模型參與者對于策略的偏好,來對跟車過程的決策進行調整,從而得到當前時刻理想的被控車輛制動強度,輸出到理想制動強度跟蹤控制器。
得到目標制動強度之后,再對目標制動強度進行跟蹤控制,具體控制的過程如下:將目標壓力制動強度與實際制動強度做差得到Δz,輸入到跟蹤控制器中,跟蹤控制器分別決策出再生制動系統驅動電機和液壓制動系統電磁閥的PWM占空比,通過PWM產生模塊,輸出給定占空比的PWM信號,通過驅動板進行功率放大后控制驅動電機和線性閥的開關,以產生所需要的目標輪缸壓力。輪缸壓力傳感器采集當前的實際輪缸壓力,通過A/D 采集模塊為跟蹤控制器提供反饋,由此實現一個閉環控制回路。

圖2 多目標節能控制策略框圖
首先,利用混合策略納什均衡在每個采樣時刻構造參與方i的權重,并作為自變量實現對各指標的調整,如式(12)所示。
Gi(k)=gi·find[σi[max(σi(k))]]
(12)
然后,通過量化性能指標函數并將權重系數集成到全局成本函數中,建立在線滾動時域優化問題。車輛間離散狀態空間如式(13)所示。
X(k+1)=AdX(k)+Bdu(k)
(13)

在模型預測跟車控制器的每一次循環中,通過預測模型實現根據跟車模型的歷史相對車速、相對距離信息輸入,對被控車輛未來的制動減速度輸出序列進行預測,即最終模型輸出的是制動減速度序列,并將序列中的第一個元素取出作用在被控車輛上,再進入下一次循環。在不考慮滾動優化階段加權計算的情況下,預測模型的預測輸出如式(14)所示。
Y(k)=ψ(k)ξ(k)+θ(k)ΔU(k)
(14)
式中:
Y(k)為k時刻預測模型的輸出向量,Np為預測時域,Nc為控制時域,η(k+i)為第k+i時刻的預測值誤差,其中i∈(1,Np),η(k+i)表達式如式(15)所示。
(15)
式中:ηd(k+i)和ηv(k+i)分別為第k+i時刻相對距離和相對速度的預測值誤差,Δd(k+i)p和Δv(k+i)p分別為第k+i時刻由預測模型得到的相對距離和相對速度的預測值,Δdi(k+i)和Δvi(k+i)分別為第k+i時刻由動力學模型計算得到的相對距離和相對速度的理想值。
而在滾動優化過程中,根據對跟車過程中的博弈節能設計,在每個采樣時刻,跟車博弈模型的輸出為滾動優化過程中優化目標的權重系數。而對于安全性參與者來說,由于在預測模型中,相對速度、相對距離誤差均為長度為NP的序列,即考慮預測時域內前車制動行為的序列,因此在優化過程中需要加以相應的權重系數,對于安全性參與者的收益函數進行改寫得到如式(16)所示。
(16)
式中,i∈(1,Np)。
根據以上分析,建立了采樣時間k時的制動經濟性指標和舒適性指標,如式(17)所示。
(17)
然后,將上述優化問題轉化為預測形式,并在每個采樣時刻進行求解。在每個采樣周期內,系統根據當前狀態預測未來車輛信息,求解二次優化問題,得到最優控制序列,如式(18)所示。
(18)
為了驗證跟車控制策略的有效性,同時考慮到實車道路試驗的風險,建立了半實物試驗平臺,如圖2所示。測試系統以NI PXI實時操作系統為核心,基于CarSim軟件和LabVIEW軟件的聯合仿真,構建虛擬跟車交通環境,實現完整的整車硬件在環跟車仿真環境。該測試平臺主要分為2部分,分別為上下位機和底層執行機構,其中上位機為工控機,運行人機交互軟件,進行系統狀態監控和數據存儲;下位機為NI PXI,一方面,CarSim構建的整車動力學模型在下位機實時運行,向本文提出的跟車控制算法模塊實時提供整車狀態參數,另一方面,基于快速原型,利用Matlab/Simulink開發跟車控制算法,控制算法在接收到環境信息及車輛參數,向底層控制器發送制動控制指令;底層執行機構主要包括電驅動系統、制動系統和傳感器模擬系統,底層控制器接收到上層算法的控制信號,基于底層算法,精確控制執行機構響應,并利用傳感器反饋于車輛動力學模型,實現閉環仿真模擬。

圖3 半實物仿真試驗平臺示意圖
該平臺的主要創新之處在于實現了試驗平臺與虛擬跟車交通環境的閉環仿真,并以典型工況紐約循環(NEDC)為例,比較了本文提出算法與目標權重確定的基本MPC算法的差異。
為進一步說明本算法與基本MPC算法的差異性,對前車靜止的極端情況進行分析,在仿真開始時刻被控車輛與前車相距100 m。仿真結果如圖4所示,可得相比現有控制策略,本文提出的方法實際上改變了現有跟車策略的決策方式。也就是說,現有的決策方式是以跟隨性為主導,實現的效果為被控車輛緊緊跟隨前車的動作。這樣帶來的不足是沒有對前車的行為進行預測,不可避免地會有急剎車等大制動強度的決策,從而造成制動能量的浪費和不舒適。而本文提出的方法通過對安全性、舒適性和節能性3個指標的博弈,直觀地來看拉長了被控車輛與前車之間的相對距離,同時也帶來了相對速度的跟蹤不像現有技術一樣讓被控車輛的車速十分精確地跟蹤前車車速。但這樣的好處是當前車一旦出現緊急制動等行為時,被控車輛仍可以相對較小的制動強度進行制動,從而盡可能的保證舒適性和制動能量回收效率。

圖4 跟隨過程相對距離、相對速度曲線
對瞬時再生制動功率和回收能量進行分析,如圖5、圖6所示。由圖5可以看出,與指標權重固定的基本MPC算法相比,本文提出算法得到的瞬時再生制動功率平均值提高了18.25%。由圖6可以看出,在循環結束時,回收的制動能量提高了13.4%。

圖6 回收的制動能量曲線
根據HIL測試結果,對本文提出算法的跟車安全性進行了分析,證明了本文提出算法在整體性能上的優越性。當前車執行NEDC循環時,被控車輛和前車之間的相對速度和距離如圖7、圖8所示。相對速度方差和相對距離期望值見表1。與指標權重固定的基本MPC算法相比,本文提出算法的相對速度方差平均提高了15.89%。這是因為當被控車輛處于緊急制動時,采用提出算法得到的被控車輛速度變化率較小,因此相對速度的變化率較大。
而在相對距離方面,本文提出算法平均提高了58.37%。本文提出算法的相對速度跟隨性能相對較差,但由于有足夠的安全裕度,仍能有效地保證跟車安全。本文提出算法的相對速度跟隨性能相對較差,但由于有足夠的安全裕度,仍能有效地保證跟車安全。

圖7 試驗過程中的跟車相對速度曲線

圖8 試驗過程中的跟車相對距離曲線

表1 跟車過程中的平均相對距離和相對速度方差
在制動舒適性方面,前車執行NEDC循環時,計算被控車輛舒適性性能指標及其積分值,如圖9、圖10所示。

圖9 本文提出算法試驗結果曲線

圖10 指標權重固定的基本MPC算法試驗結果曲線
與指標權重固定的基本MPC算法相比,在循環結束時,舒適度指數的積分值降低了49.15%。因此,在相同的試驗條件下,該方法不僅有效地提高了制動能量回收效率,而且顯著地優化了跟車場景下被控車輛的制動舒適性。
為了提高跟車場景下制動能量回收效率,揭示了電動汽車制動能量回收特性與車間縱向動力學的博弈關系,提出了一種基于跟車博弈模型混合策略納什均衡的預測控制方法。該算法能在跟車過程中盡可能地提高被控車輛的再生制動能量回收效率,同時保證在前車緊急制動條件下的跟車安全性和制動舒適性。
未來的研究將集中在以下兩個方面:一是改進算法設計以及制動模式切換策略,提高博弈模型求解和模型預測控制系統動態求解的整體運行效率。其次,在合法許可和測試安全的前提下進行道路測試,進一步驗證算法的有效性。