隨著經濟水平和科技實力的不斷提升,汽車消費市場逐漸擴大,但面對全球范圍日益嚴峻的能源形勢和環保壓力,發展新能源汽車已成為社會可持續發展的重要戰略及市場新的增長點。其中,油電混合動力汽車作為新能源車的一種,其技術相對成熟,且市場發展前景良好,成為傳統車向新能源汽車過渡的最好方式。一般來說,混合動力汽車是具有2種或2種以上能量源來驅動的汽車,現階段研究的多為由發動機、電機、電池組構成的HEV,分為串聯式、并聯式和混聯式。針對目前混合動力汽車能量管理控制策略,一般分為兩大類:基于規則的控制策略和基于優化的控制策略。本文針對混合動力汽車能量管理控制方法進行相關研究。
基于規則的控制策略包括基于門限值規則的控制策略和基于模糊規則的控制策略。其中基于門限值規則的控制策略,主要依據工程經驗和相關動力部件的效率特性進行設計。以當前的車速、需求轉矩、SOC等為控制參量,通過一系列門限值將整車劃分成不同的工作模式,當車輛運行狀態滿足門限的切換條件時,進行模式的切換。該控制策略操作簡單,易于實現,且計算量小,實時性好,但其燃油經濟性較差,無法實現工況的自適應[1]。
基于模糊規則的控制策略是在固定門限控制的基礎上,將預定義的控制規則通過輸入模糊化-模糊決策-輸出逆模糊化來達到優化目的,具有較強的自適應性和魯棒性。
由于基于規則的控制策略會陷入局部最優解,得到的燃油經濟性較差,因而提出基于優化的控制策略,其中動態規劃在能量管理方面可實現全局最優,是目前在控制理論中所能達到的車輛經濟性最優解。
基于優化方法的控制策略包括實時優化和全局優化,其中實時優化算法包含等效油耗最小原理(ECMS)、龐特里亞金最小值原理(PMP)、模型預測控制(MPC)等[1],通常結合一些智能算法,如遺傳算法(Genetic Algorithm,GA)、粒子群優化算法(Particle Swarm Optimization,PSO)、模擬退火 (Simulated Annealing,SA)等,實現能量管理系統的瞬時最優。全局優化算法主要包括動態規劃(Dynamic Programming,DP)[2]、隨機動態動態規劃(Stochastic Dynamic Programming,SDP)。
基于實時優化,針對能量管理系統(EMS),提出一種簡單、易優化的數學表示法,得到使用遺傳算法進行優化的能量管理實時優化系統[3]?;旌蟿恿ο到y中的第i裝置的功率Pi是負載功率P0的一部分,該部分的大小由系數γ決定。假設γ是負載功率的連續函數,策略中的變量只有函數系數(即A,B,C,D)。將4個系數的常數值進行優化,取值范圍為[-1.2 1.2],其中A和C的值詳細說明可能由電池提供的負載功率的最大部分;B和C的值詳細說明負載功率γ函數的值達到A和C指定的最大值。使用GA作為優化方法進行EMS優化,包括以下6個步驟[3]:
1)染色體編碼:函數參數取決于系數A、B、C和D,它們均經過GA優化。
2)進行理論驅動周期:分析不同SOC下的電力情況,然后將每個GA生成期間的解決方案與理論驅動循環期間的能量消耗進行比較。
3)選擇:最佳適應個體具有重現Qmax的最高概率,最不適應的個體具有重現Qmin的最低概率。
4)執行交叉操作,重復m次。
5)進行突變:防止GA局部的過多堆積。
6)進行全局優化:由GA執行的代數取決于處理器的計算能力和TR的值,為了確保代數足以找到近似解,針對使用相同算法的NEDC全局優化8次。
基于全局優化控制策略,針對插電式混合動力汽車,基于駕駛模式識別和動態規劃,提出自適應能量控制策略,瞬時成本函數包含電池能量損耗、燃料能量損失,基于貝爾曼最優原理將兩點邊界問題分解為最小化序列問題,建立基于規則的多模式切換策略,具體步驟包括[3]:
1)從DP提取控制規則;
2)確定控制規則中的閾值;
3)DPR技術的建立;
4)將實際駕駛情景分類進行驅動模式的切換。
動態規劃方法本質上是一種非線性規劃方法,其核心是貝爾曼的最優原理,雖然基于動態規劃的能量管理控制策略得到的是理論上的最優解,但是需要已知工況信息,無法實現在線控制。同時隨著狀態變量和控制變量維數的增加,傳統的動態規劃后向求解的計算量和存儲量顯著增加,往往導致“維數災”現象的發生。因此,基于自適應動態規劃(Approximate Dynamic programming,ADP)[4]的能量管理控制策略應景而生。自適應動態規劃由3個部分組成,各個部分均可用神經網絡來代替。其中,執行網(Action network)用來近似最優控制律,評價網(Critic network)用來近似最優性能指標函數。當非線性系統未知時,一般采用模型網(Model network)來近似非線性系統。常見的結構是啟發式動態規劃(HDP),其結構如圖1所示:

圖1 HDP結構示意圖[4]
在理論層面上,自適應動態規劃在非線性離散系統的軌跡跟蹤、最優控制等問題上取得了一定的成果。針對非線性系統最優控制問題[5],提出一種多步啟發式動態規劃(MsHDP)和開發評價-決策神經網絡結構,其中評價網以最小二乘法計算神經網絡的權值向量,決策網采用最速梯度下降法來更新神經網絡的權值向量,將多步啟發式動態規劃方法簡化為線性二次調節(LQR)問題。在二次啟發式動態規劃(DHP)結構的基礎上,提出一種全局二次式啟發動態規劃,以處理離散時間非線性系統的近似最優跟蹤控制。全局二次式啟發動態規劃算法構建3個神經網絡分別計算系統動力學誤差、成本函數及其梯度、每次迭代中的控制策略。其中,在當前時刻調整評價網1的權值向量,評價網2僅用于計算下一時刻的近似成本函數。
在實際應用層面,自適應動態規劃算法已在交通運輸、電力系統、工業生產等方面展開應用。
正是在以上自適應動態規劃算法理論研究的基礎上,基于自適應動態規劃的混合動力汽車能量管理方法得以發展。由于汽車動力系統已知,即非線性系統已知,則不需要用神經網絡來近似非線性系統,可以采用無模型網[6]的自適應動態方法進行能量管理控制。將神經網絡應用于混合動力汽車能量控制,提出一種基于長度比的神經網絡能量管理策略,用于插電式混合動力城市公交的在線控制。
目前各企業針對混合動力汽車能量控制策略,在應用層面上多采用基于規則的控制策略,近幾年隨著動態規劃和自適應動態算法的發展,部分公司已經針對基于動態規劃、自適應動態規劃的能量控制策略進行研究,實現油電配比的最優控制及在線優化控制,以使混合動力汽車滿足動力性要求的前提下,達到最佳燃油經濟性。