譚穎琦, 許景懿, 熊光明, 李子睿, 陳慧巖
(1.北京理工大學 機械與車輛學院, 北京 100081; 2.北京工業職業技術學院 機械工程學院, 北京 100042)
現代傳感、電子控制、機器視覺和導航定位等先進技術的飛速發展,推動了地面無人機動平臺的高速化進程以及越野環境下行駛能力的迅速提升。履帶式無人車輛因其承載能力大、可靠性高、機動性強,是無人機動平臺的重要分支[1]。面對世界新軍事變革和國內軍事變革形勢需求,各種高電能武器迅速發展,履帶式混合動力無人平臺因其優良的特性[2],成為了地面無人機動平臺的重要領域。履帶式混合動力無人平臺可以在多種工作模式下適應不同行駛工況的需求,獲得比傳統車輛更好的整車效率、燃油經濟性和機動性,對提升陸戰平臺整體性能、適應未來作戰需求具有重要意義。
對于混合動力無人平臺來說,能量管理技術是影響系統性能的關鍵因素。能量管理技術是根據混合動力系統不同組件的狀態反饋和能量管理策略,實現不同動力源之間的功率調控,滿足動力性需求,將動力電池的電池荷電狀態(SOC)維持在一定范圍,從而提高燃油經濟性、降低燃油消耗并減少尾氣排放。由于履帶式無人車輛行駛路況復雜多變,所以對其能量管理策略的工況適應性提出了更嚴苛的要求。因此,設計具有良好工況適應性的能量管理策略是履帶式混合動力無人平臺綜合性能的最關鍵任務。
隨著能量管理技術的迭代,根據實現方式的差異,混合動力車輛能量管理策略主要分為基于規則的能量管理策略和基于優化的能量管理策略[3-9]。其中,基于優化的控制策略是近年來能量管理策略研究的主要方向,分全局最優和實時優化兩種策略。實時優化控制策略不依賴于預先計算的控制策略,而是根據車輛信息在每個時間步長內執行主要計算,以產生控制決策。近年來國內外學者提出的實時優化的能量管理策略,包括等效燃油最小[10-12]、機器學習[13-14]、模型預測控制(MPC)[5,7,15-17]等算法,能在線對能量管理決策進行優化計算。MPC是實時優化的一種實現方法,通過不斷預測、求解、控制、更新形式實時優化。
本文將以履帶式混合動力無人平臺為研究對象,面向能量管理進行混合動力無人平臺建模,合理分配發動機- 發電機組及動力電池組的輸出功率,在越野工況軌跡規劃設計上,提出基于卷積神經網絡(CNN)與長短期記憶網絡(LSTM)的預測模型,并設計MPC能量管理策略對混合動力無人平臺進行能量管理優化。通過實車試驗,驗證基于軌跡規劃的MPC策略的有效性,實現能量管理優化目標,提高燃油經濟性。本文研究內容結構圖如圖1所示。

圖1 本文研究內容結構圖
本文研究對象是履帶式混合動力無人駕駛平臺,如圖2所示。

圖2 履帶式混合動力無人駕駛平臺
該履帶平臺是以我國63式履帶裝甲車為基礎,保留履帶和側減速器,具有良好的動力性能。文獻[18]對該履帶平臺進行了無人化、電控化的改造,配備激光雷達、毫米波雷達、雙目攝像機、慣性導航單元、實時差分定位導航系統、CAN通訊網絡和工控機等器件組成,即具有完整的感知、規劃及運動控制系統,能自主完成環境探測、避障、超車等無人駕駛車輛的能力。該車的基本結構參數如表1所示。

表1 無人履帶平臺結構相關參數
該平臺由原車的柴油機傳動系統替換為串聯式混合動力系統。圖3為該履帶式無人駕駛平臺的混合動力系統結構圖。
該平臺采用雙電機獨立驅動方案,主要由發動機- 發電機組、動力電池組、電力集成控制器、雙側驅動電機、傳動系統等組成。發動機- 發電機組與動力電池組通過功率耦合與電力集成控制器為平臺各用電設備提供電能。發動機不直接參與機械傳動,無機械能直接輸出到驅動輪,僅帶動發動機- 發電機組實現發電,從而提供穩態功率,滿足平臺各部件功率需求,使動力電池SOC維持在一定的范圍內,保持系統功率平衡。當動力電池SOC較低時,發動機為整車提供動力并為動力電池充電;當動力電池SOC較高時,發動機停止工作,由動力電池提供整車需求功率。通過調控發動機的工作狀態及工作點維持動力電池電能平衡以提高燃油經濟性。
對于本文研究的履帶式串聯混合動力無人駕駛車輛,其混合動力能量管理技術是決定混合動力系統綜合性能的關鍵技術。能量管理策略的主要目標是在滿足行駛動力性的前提下,合理分配發動機- 發電機組或動力電池組的輸出功率,從而提高燃油經濟性、降低排放和提高電池壽命等性能指標。
發動機輸出軸與發電機輸入軸剛性連接,二者的轉速相等,考慮發動機和發電機的轉動慣量,發動機和發電機的轉速、轉矩和輸出功率滿足:
(1)
式中:ne為發動機轉速;ng為發電機輸入軸轉速;Te為發動機轉矩;Tg為發電機輸入軸轉矩;Je和Jg分別為發動機和發電機的轉動慣量;Pg為發電機輸出到直流母線的電功率;ηg為發電機效率。
本文對履帶車輛動力學進行簡化,忽略履帶的滑轉、滑移等運動,根據車輛動力學方程、滾動阻力、空氣阻力、坡度阻力方程以及轉向阻力矩公式等可獲得串聯混合動力車輛的需求功率為
(2)

發動機- 發電機組和動力電池組共同提供能量,滿足整車功率需求,功率平衡方程為
Pg+Pb=Preq
(3)
式中:Pg為發動機- 發電機組輸出功率;Pb為動力電池組的輸出功率。
以上介紹了履帶式混合動力無人平臺的結構和能量管理系統工作模式,并構建了發動機- 發電機組模型、整車動力學模型和功率平衡方程,為后續平臺的能量管理策略研究奠定了基礎。
本節通過分析混合動力履帶車輛運動學模型,進行局部軌跡規劃設計,并基于軌跡規劃提出CNN-LSTM的預測方法,對工況進行精準預測,采用MPC能量管理策略,在履帶式混合動力無人車輛上實現能量管理優化控制,其策略原理圖如圖4所示。

圖4 基于MPC能量管理策略
MPC是一種針對多變量難控問題的先進控制方法。MPC的基本思想是利用已有的模型、系統當前的狀態和未來的控制量去預測系統未來的輸出,通過滾動地求解帶約束優化問題來實現控制目的。
以某一時刻作為當前時刻,預測系統在未來預測時域內的系統動態過程和狀態軌跡,計算控制時域內使得系統優化目標取得最優解的最優控制序列,獲得預測控制軌跡,并將最優控制序列的第1個控制量作用于系統,并在下一個時刻,重復上述過程,如此滾動完成帶約束的優化問題,實現對系統的持續控制[19]。MPC的優化過程使得系統對于動態特性的變化和不確定性的干擾具有較強的魯棒性。
基于MPC的能量管理策略包含三步:預測模型建立、實時滾動優化、反饋校正控制。本節將按這三個步驟設計MPC方法進行混合動力無人平臺能量管理實時優化[20]。
建立預測模型是MPC方法的首要步驟,通過對未來信息的預測,為實時滾動優化提供基礎。
本節將基于局部軌跡規劃提出CNN-LSTM工況預測方法實現對預測時域內車速預測,從而構建能量管理最優控制問題。
2.1.1 局部軌跡規劃
本文采用3階螺旋線作為狀態采樣的曲線模型[21]獲得了一條運動可行的無碰撞路徑,并將控制輸入表示為3階螺旋線,如(4)式所示:
k(s)=a+bs+cs2+ds3
(4)
式中:k(s)為曲線在一定長度內的曲率;a為起點曲率;b、c、d為擬合參數。
基于車輛運動學方程得到車輛弧長運動學模型,如(5)式所示:
(5)
式中:x(s)、y(s)為某一長度上路徑點的坐標;θ(s)為曲線的走向;x0、y0為起點的位置;s為弧長;θ0為起點的走向。
在以3階螺旋線為狀態空間采樣中,通過對(4)式和(5)式進行積分求出最終路徑點坐標,再對路徑分割和選擇。
采用迭代式算法進行速度規劃設計。通過對每個路徑點的速度施加橫向加速度約束、縱向加速度約束以及沖擊度約束,每個約束將以連續和有限差分形式表示,以生成速度剖面。通過迭代式算法修改速度剖面,在每次循環中考慮所有約束,調整當前路點的速度以滿足約束值,直到速度剖面不改變,最終的速度剖面即為規劃速度序列。
2.1.2 CNN-LSTM預測方法
為了同時處理歷史速度序列和規劃速度序列,本文提出了基于CNN-LSTM的預測模型。
CNN是深度學習的代表算法之一,用于學習時間序列數據的局部趨勢特征。由于其局部連接和權值共享等特性,降低其處理多變量時間序列的網絡的復雜度,減少了訓練參數的數量,在提高學習效率的同時,也提高了魯棒性和容錯能力。但是時間序列數據(如車輛速度)會表現出對過去數據的依賴。CNN的淺層學習模型由于沒有考慮對歷史數據的依賴性,在處理時間序列問題時無法取得良好效果。
LSTM作為循環神經網絡的一個變種,可以通過隱藏記憶狀態來體現這種依賴性,揭示時間序列的本質。LSTM可用于從對應的時間序列數據中獲取長期相關特征。LSTM由4個神經網絡層以一種特殊的連接方式構成,通過4個相互作用的層可以有效解決梯度消失問題,其結構如圖5所示。

圖5 長短期記憶網絡
如圖5所示,LSTM除了典型的循環神經網絡中的tanh層以外,增加了3個門層:遺忘門、輸入門和輸出門。通過4個相互作用的層可以有效解決梯度消失問題。典型的LSTM單元模塊計算過程如(6)式所示:
(6)
式中:WX、UX分別為隱藏狀態和輸入狀態的權重矩陣,bX為偏置,X=i,f,o,g,分別表示輸入門、遺忘門、輸出門和內部隱藏狀態;ht是新的隱藏狀態。
基于規劃速度與預測速度的CNN-LSTM的流程圖如圖6所示。首先將歷史速度序列與規劃速度序列合并,并作為CNN的輸入量,經過CNN與LSTM的處理,輸出預測速度序列。

圖6 基于規劃速度與預測速度的CNN-LSTM預測模型
2.2.1 能量管理優化設計
將預測的工況模型代入履帶式混合動力無人車輛的控制模型(2)式和(3)式中,可以求解出預測時域內無人駕駛車輛的功率需求,從而構建出最優控制問題。能量管理優化控制問題是在滿足系統約束條件下,求解使得性能指標最小的最優控制量,是一個非線性時變最優控制問題。本文僅考慮混合動力履帶車輛的燃油經濟性,即獲得最小燃油消耗值。因此,本文的能量管理最優控制問題的性能指標為
(7)

(8)
φfuel為根據臺架試驗數據確定的發動機油耗特性圖查表函數。
維持動力電池組平衡是能量管理目標之一,即初始時刻的電池SOC與結束時刻的電池SOC應相同。由于MPC的優化問題中的預測時域比全局優化的預測時域短,且初始SOC也不等于目標SOC,因此在MPC的優化過程中不做電池SOC的硬約束。但為了達到維持電池SOC穩定的目的,在性能函數中加入電池當前SOC與目標SOC的差值作為一個優化目標,所以將(7)式性能函數改為
(9)
式中:ω1、ω2為權重因子;SOC(t)為當前電池SOC;SOCtar為目標電池SOC。
可將(9)式寫成離散時間形式

(10)
動力電池組的SOC作為系統的狀態變量,狀態方程為
(11)
式中:Voc為動力電池組開路電壓;Rb為電池內阻;Pb為電池功率;Cb為電池的額定容量。可將(11)式寫成離散時間形式

(12)
在本文研究的串聯混合動力系統中,發動機輸出軸和發電機輸入軸直連,發動機采用轉速控制方式,發電機采用轉矩控制方式,發動機轉速和發電機轉矩需要符合發動機和發電機的外特性,并且在相鄰兩個控制區間,發動機轉速ne和發電機轉矩Tg的變化不能太快,否則無法完成工作點的轉移,發動機- 發電機組無法達到目標輸出功率。因此需要滿足如下約束
(13)
式中:ne為發動機轉速;ne,min、ne,max分別為發動機的最小轉速和最大轉速;Δne為發動機轉速變化率;Δne,min、Δne,max分別為發動機轉速變化所允許的最小值和最大值;Tg為發電機轉矩;Tg,min、Tg,max分別為發電機的最小轉矩和最大轉矩;ΔTg為發電機轉矩變化率;ΔTg,min、ΔTg,max分別為發電機轉矩變化所允許的最小值和最大值。
本系統中動力電池組的充放電能力有一定的限制,為了防止動力電池過充和過放,需滿足如下約束
(14)
式中:SOCmin、SOCmax為動力電池組SOC所允許的最小值和最大值;Pbmin、Pbmax為動力電池組的最大充電功率和最大放電功率。
2.2.2 動態規劃算法優化設計
本節設計優化的前向動態規劃算法[22]求解能量管理最優控制問題。
求解履帶式混合動力無人平臺能量管理最優問題的前提是全局工況已知,即每個時刻車輛的動力學約束是已知的。由2.2.1節可知,能量管理最優控制問題為求解最小成本函數,即獲得最小燃油消耗值。本文根據最小成本對應儲存的轉移狀態,設計優化的前向動態規劃算法逆向搜索最優狀態,從而獲得最優狀態軌跡,即燃油消耗最小值各時刻的SOC值以及對應的控制量序列。
根據能量管理最優控制問題,將動力電池SOC作為系統的狀態變量x,對SOC狀態進行離散化處理,將電池SOC范圍等分為p份,其上下限需滿足能量管理控制目標的要求,本文為0.6~0.8,n為總離散階段數,k為當前階段,k=1,2,…,n-1。
對于采樣時刻k=1時,第i個SOC狀態xi時的最小成本函數為
J1(xi)=L1(xi)
(15)
式中:J1(xi)為第1個采樣時刻xi狀態的最小成本函數;L1(xi)為在第1個階段的系統約束下狀態從初始狀態轉移到xi的瞬時成本函數。
以此類推,可以得到所有階段的最小成本函數,即對于采樣時刻k(1 Jk(xi)=minj[Jk-1(xj)+Lk(xi,xj)] (16) 式中:Jk(xj)為第k個采樣時刻xj狀態的最小成本函數;Jk-1(xj)為第k-1個采樣時刻xj狀態的最小成本函數;Lk(xi,xj)為在第k個階段的系統約束下狀態從xj轉移到xi的瞬時成本函數。 對于本文研究的混合動力能量管理最優問題,由(17)式可知,系統在采樣在采樣時刻k的瞬時成本函數為 (17) 該瞬時成本函數的計算取決于系統狀態變量電池SOC(j)和控制變量u(j),其中控制變量為發動機轉速ne和發電機轉矩Tg。由發動機- 發電機組約束(13)式和動力電池組約束(14)式可知,狀態變量SOC(j)和兩個控制變量u(j)都有上下限約束,本文選擇狀態變量電池SOC和發動機轉速來確定系統的狀態,然后將動力電池SOC范圍和發動機轉速范圍離散化,從而可以計算瞬時成本函數。但是,隨著離散化網格數的增加,計算量呈指數增長,計算時間過長。為降低動態規劃的算法的計算量,提高計算效率,本文根據履帶式混合動力無人車輛的特性,通過減小電池SOC和發動機轉速這兩個量的搜索范圍,提高算法的求解速度。 系統的狀態變量電池SOC是根據離散化后的所有離散點進行計算,從動力電池組約束(14)式可知,動力電池SOC在每一個時刻的變化收到電池充放電功率的約束,無法過大變化。因此,通過減小動力電池SOC的變化范圍,從而縮小每個時刻電池SOC的搜索域,即對于一個SOC值,只在紅色線處進行搜索,而另外其他的SOC值不進行計算,減小計算量。由于電池SOC終端沒有固定,所以最后一個狀態不再固定,而是與前面狀態相同,計算所有離散化的SOC值,從而獲得預測時域內的最優控制序列,實現預測時域內的局部優化,如圖7所示。 圖7 基于動態規劃的實時滾動優化 對于系統控制變量發動機轉速,可根據發動機- 發電機組約束(13)式,將上一狀態對應的最優控制量作為基準,僅搜索附近區域,如(18)式所示,即可減小發動機轉速的搜索范圍。 ne(k-1)+Δne,min≤ne(k)≤ne(k-1)+Δne,max (18) 以上考慮到電池充放電功率約束和發動機轉速變化約束,通過縮小電池SOC和發動機轉速的搜索范圍,減少動態規劃算法的計算量,提高動態規劃的計算效率,從而得到最優軌跡,實現了前向動態規劃算法的優化。求解最小成本函數流程圖如圖8所示。 根據圖8,針對每一個SOC離散值,求得時刻k-1 到k的SOC變化值ΔSOC,如 圖8 求解最小成本函數流程圖 ΔSOC=SOCk-SOCk-1 (19) 由動力電池模型可計算電池的充放電功率為 Pb=-VocCbΔSOC-(CbΔSOC)2Rb (20) 整車需求功率Preq可由(2)式計算求解。根據功率平衡,發動機- 發電機組的目標輸出功率可Pg由(3)式計算求解。因為發動機和發電機剛性連接,所以轉速相同,將發動機轉速代入發動機- 發電機組模型(1)式,可求解發電機轉矩和發動機轉矩,從而由發動機油耗模型(8)式求解油耗。 根據約束(13)式,比較控制變量的可行解,從而得到最小瞬時成本函數。如果在計算過程中,無可行解,則說明此時的電池SOC的值無法達到,即系統狀態不可獲得,則設定該過程的成本函數為最大值。 根據前向動態規劃優化算法,當前總成本為上一時刻狀態對應的總成本與轉移狀態最小成本的和的最小值,即為 (21) 按照(21)式一直計算到終止時刻,獲得系統整個過程的總成本函數、每個時刻的最優狀態量和控制量。 采用優化動態規劃解決MPC中的最優控制問題是局部最優控制,而不是全局最優控制。由于存在預測誤差和外部干擾,求解出的最優控制序列不能全部作用于系統,只能將第一個最優控制量作用于系統,在下一個控制周期重新觀測系統狀態,根據歷史速度序列和規劃速度序列重新預測速度,對上一時刻的預測值進行修訂,然后重新求解新預測時域內的最優控制問題,如此循環。 本試驗采用履帶式混合動力無人平臺,即圖2所示平臺,可設置純電動模式和混合動力模式。本試驗是在某試驗場越野環境中,以混動模式為前提,比較兩種不同的能量管理策略方法,對基于軌跡規劃預測的MPC能量管理策略進行驗證。在無人駕駛模式和混合動力模式下,考慮到動力電池SOC維持在70%左右能發揮較好的充放電特性,因此將其電池SOC初始值設置為70%[2]。試驗場環境如圖9所示。圖10為實車試驗中的無人駕駛全局路徑。 圖9 實車試驗環境 圖10 實車試驗無人駕駛全局路徑 本試驗首先根據2.1.1節介紹的軌跡規劃算法輸出規劃速度序列,如圖11所示。 圖11 規劃速度序列 該規劃速度序列與歷史速度序列合成為合并速度序列,作為后續基于軌跡規劃的工況預測方法的輸入量;其次將基于規劃速度序列的直接預測精度與采用CNN-LSTM工況預測精度進行對比;最后通過對比基于多步神經網絡的等效燃油消耗量,進一步驗證基于CNN-LSTM工況預測的能量管理策略的有效性。 本研究利用采集的大量的實車無人駕駛數據訓練基于軌跡規劃的CNN-LSTM工況預測模型,以實際無人駕駛工況作為測試,驗證模型效果。 圖12顯示了直接用規劃速度作為預測速度的預測效果與同時使用規劃速度和歷史速度并采用CNN-LSTM模型進行工況預測的比較結果。表2給出了預測精度對比,預測精度用均方根誤差作為評價指標,其計算公式為 表2 兩種模型的預測精度對比 圖12 兩種預測模型對比圖 (22) 式中:e為均方根誤差;vpre和vreal分別為預測速度和實際速度。 由表2可知,通過對比不同工況預測方法,采用CNN-LSTM模型預測方法效果比基于規劃速度的直接預測模型的預測精度提高了3%,說明使用CNN-LSTM模型可以提高工況預測效果。 為了驗證本文研究的基于CNN-LSTM預測的MPC能量管理策略,本節將傳統的基于多步神經網絡預測的策略與其進行對比實驗。圖13 顯示了兩種不同策略下動力電池SOC變化的結果。 圖13 兩種能量管理策略的電池SOC結果對比圖 由圖13可知,兩種能量管理策略都能使電池SOC維持在目標值附近。對于基于CNN-LSTM預測的能量管理策略SOC曲線,在50~150 s期間,工況比較穩定,履帶車輛需求功率比較平穩,電池SOC穩定在目標值處;在150~180 s期間,需求功率較大,動力電池和發動機共同提供電能,SOC下降至0.695左右;在180~210 s期間,需求功率較小,發動機發電機組的輸出功率不僅用于驅動車輛,還給動力電池充電,使動力電池SOC上升至初始值。此過程為該履帶車輛在混動模式下的輸出結果,證明基于CNN-LSTM預測能量管理策略較基于多步神經網絡的能量管理策略更有效地使動力電池發揮削峰填谷的作用,能夠完成維持動力電池SOC穩定的目標,并且能夠適時調節電池的充放電功率,從而更有利于調節發動機的工作點使之更多地工作在高效區,提高燃油經濟性,如圖14所示。 圖14 兩種能量管理策略的發動機工作點對比圖 通過比較兩種能量管理策略下發動機工作點的狀態,如圖14展示可知,與基于多步神經網絡策略相比,基于CNN-LSTM預測的MPC優化策略使得發動機能有更多的工作點落在高效區內,工作范圍得到更多改善,經過SOC修正后,兩種能量管理策略的等效燃油消耗量對比情況如表3所示。 表3 兩種能量管理策略等效燃油消耗量對比 通過對比可知,基于CNN-LSTM預測的MPC的能量管理優化策略比基于多步神經網絡策略的等效燃油消耗量減少了3.9%,改善了燃油經濟性,也體現了基于CNN-LSTM預測方法的預測精度高。 本文以履帶式混合動力無人平臺為研究對象,面向能量管理對平臺進行建模;對發動機- 發電機組及動力電池組的輸出功率進行分配;基于局部軌跡規劃提出CNN-LSTM模型預測的方法;設計了MPC的優化策略,實現了能量管理優化目標。 通過實車試驗,驗證了基于CNN-LSTM預測模型的有效性;證明了基于CNN-LSTM預測的能量管理策略比基于多步神經網絡預測的策略燃油經濟性要好,減少了燃油消耗,提高了控制策略的優化性、適應性和魯棒性。


2.3 反饋校正控制
3 實車驗證與結果分析



3.1 基于CNN-LSTM工況預測的能量管理策略驗證


3.2 能量管理策略對比驗證



4 結論