陳 勇,魏長銀,李曉宇,李彥林,劉彩霞,林霄喆
(1.河北工業大學機械工程學院,天津市新能源汽車動力傳動與安全技術重點實驗室,天津 300130;2.吉利汽車動力總成研究院,寧波 471002)
由于增程式電動貨用汽車在節能與環保方面的優勢,成為當前研究的熱點,其燃油經濟性和排放量很大程度上依賴于能量管理策略,引起眾多研究人員及學者的關注。
能量管理策略(EMS)通常是通過人為經驗設置合適的閾值,對多個動力源進行功率協調分配。然而由于閾值的設定只能是一組固定的參數,很難適應工作條件變化下的非線性車輛系統,控制性能往往無法達到最優,進而提出許多優化能量管理策略。具有代表性的EMS主要有基于規則能量管理策略(RB?EMS)和基于優化能量管理策略 EMS。在基于規則的能量管理策略中,精確邏輯規則或模糊規則中的參數值主要由經驗或應用優化方法確定。雖然RB?EMS可以實時快速運算,但其控制性能的提高有賴于工程師的經驗。在基于優化的能量管理系統中,混合動力系統的能量分配主要是為了使局部或全局的燃料消耗最小化。張幽彤等提出一種依據車輛定位信息和SOC下降值在線更新等效因子參數的自適應能量管理策略,結果表明SOC控制和經濟性均有較明顯提升。Serrao等分析了動態規劃、龐特里亞金最小原理(PMP)和等效消耗最小化策略(ECMS),發現PMP在技術上不能實時應用,需要離線采用打靶方法來調整協態變量。從計算的角度來看,ECMS和PMP的成本相同,因為要執行的唯一操作是最小化哈密頓量或等效成本函數。Di等提出了一種基于隨機模型學習預測的駕駛員感知EMS方法。結果表明,該策略的性能優于傳統的模型預測控制。Liu等基于道路信息預測上坡行駛條件,估計目標SOC,建立了全局優化的EMS模型。
基于全局優化的EMS具有較好的燃油經濟性和對行駛循環的適應性,但計算復雜,很多算法無法在整車上實現。而規則的閾值是固定不變的,很難適應車輛工作條件的變化或維持電池荷電狀態的穩定,因而控制往往無法達到最優。而模糊智能控制方法的應用不依賴高精度數學模型,具有良好的實時性和魯棒性。因此在多動力源系統能量管理策略的研發上具有廣泛的應用前景。但其性能優劣取決于模糊規則,而模糊規則的制定依賴于專家經驗,同時在設計時僅能對單一工況進行優化,而實際路況復雜多變,控制效果并不理想。
為了解決模糊控制器的設計優化難、突變工況難適應的問題,本文中提出基于改進遺傳算法的神經網絡工況識別自適應模糊能量管理策略,以符合實際道路的中國貨車行駛工況為訓練測試工況,通過硬件在環測試分析不同參數、不同算法對工況識別效果的影響,對比不同能量管理策略的控制效果,驗證該策略的有效性。
圖1顯示了本文中的增程式電動物流車結構,車輛參數如表1所示。通過對車輪受力分析,建立車輛動力學模型。

圖1 增程式電動物流車構型圖
路面提供的阻力轉矩與驅動轉矩的關系如下:

式中:為傳動系統效率;為主減速器傳動比;、和為發動機、驅動電機和制動轉矩;為空氣密度;為車速;其余參數含義如表1所示。

表1 車輛參數
利用不同轉速和不同轉矩下的燃油消耗量臺架試驗數據,通過三次多項式插值的方式得到發動機效率MAP圖如圖2所示。根據MAP圖由轉矩和轉速查表得到發動機當前的燃油消耗率。為了便于數據處理將測試循環時間范圍~等間隔Δt(本文取1 s)分隔成個離散時間點t(=1,2,…,),并假設在Δt時間內的平均油耗為t時刻對應的實際工況當成穩態工況時的燃油消耗率,則當測試工況運行完后,燃油消耗計算公式為

圖2 發動機效率MAP

式中:(t)和(t)為在測試時刻t對應的工況下的發動機角速度(rad/s)和轉矩(N·m);為發動機燃油消耗率。
為了簡便計算,忽略電機的動態特性,采用查表的方法獲取電機系統在驅動與制動能量回收狀態下的效率。如圖3所示,電機效率在0.7~0.95之間,而發動機效率在0.10~0.35之間。電機效率明顯大于發動機效率。因此,在設計能量管理策略時,盡量將發動機工作點置于高效率區,并用動力電池進行補償。同時,驅動電機應該滿足:

圖3 電機效率MAP

式中:為輸出功率;為轉矩;為轉速;下標mc表示電機;為效率。
動力電池通過逆變器分別與電動機和發電機相連,為電機供電或吸收電機產生的能量。建模一般采用內阻模型,其中電池內阻、開路電壓采用查表的形式獲取,充電內阻、與SOC的關系如圖4所示。

圖4 電池充放電內阻與開路電壓
動力電池的電流與SOC的計算方法為

同時應該滿足如下條件:

式中:是初始SOC;是電池開路電壓;是電池內阻;是電池功率;是電池容量;=0.3;=0.8;是電池放電內阻;是充電內阻。
為了降低增程式電動汽車的能量消耗,本文設計了一種雙輸入單輸出的模糊控制器,所采用的模糊控制器如圖5所示,以整車所需功率和電池荷電狀態為輸入,增程器功率為輸出。通過模糊控制器控制規則的設計優化發動機的工作曲線,并且保持電池SOC的穩定。該控制器主要由3部分組成:模糊化接口、模糊推理系統和解模糊接口。其中,模糊化接口用于將精確的輸入值轉換為模糊值,然后將其輸入到模糊推理系統中。這些模糊值在模糊推理系統中被劃分為不同的模糊子集,并根據所定義的規則庫用語言變量表示,這些語言值對應于隸屬函數的取值范圍。最后,經過模糊推理系統得到的結果輸入給解模糊接口,并將其轉換為精確的控制值輸入給執行機構。

圖5 模糊控制器基本結構
本文所采用的模糊控制規則如表2所示,輸入變量與需求功率分別劃分為3個模糊子集{L,M,H},輸出功率劃分為5個模糊子集{VL,L,M,H,VH}。

表2 模糊控制規則
模糊控制器輸入的隸屬度函數如圖6所示。

圖6 隸屬度函數
其中,梯形隸屬函數的計算公式如下:

式中:為隸屬度;、、、為轉折點橫坐標。采用去質心法解模糊,模糊輸出為


影響模糊控制器的性能主要為輸入輸出隸屬度函數的頂點坐標,因此本文以9個頂點坐標為優化變量,電量保持階段燃油經濟性為優化目標,所采用的遺傳算法為尋優方法。
2.2.1 優化變量
優化變量為輸入、輸出隸屬度函數的頂點坐標,頂點坐標如圖6所示,表達式為

2.2.2 優化目標
為了避免電量對燃油經濟性評估的影響,選擇在電量保持階段的燃油消耗量為優化目標,表達式為

式中:為目標函數;ω(t)和T(t)為在測試時刻t時的發動機角速度(rad/s)和轉矩(N·m);為發動機燃油消耗率。
2.2.3 改進遺傳算法
遺傳算法流程如圖7所示,包含初始化、選擇、交叉、變異4個關鍵步驟。遺傳算法(GA)的第一步是從種群中選擇個體,并將個體送到交配池進行遺傳重組。選擇過程有助于在子代產生池中選擇更好的個體。經典GA經常使用輪盤賭法進行選擇。這種選擇方法的結果誤差較大,對收斂速度影響較大。為了解決該問題,采用選擇概率在輪盤賭方法的基礎上結合迭代數進行自適應調整的方法。選擇概率隨著進化代數的增加而增加,這可以極大地促進種群中適應度較高個體的進化,提高算法的收斂性。因此本文提出了自適應選擇概率,其計算公式為

圖7 GA示意圖

式中:是進化次數;是最大進化次數。等式右側第1項為輪盤賭法選擇概率,第2項為隨進化次數變換的選擇概率。
傳統GA使用固定的交叉率和突變率。交叉率越高,產生新個體的速度越快,有利于加快進化速度。然而,較好的個體很快被破壞,使得算法難以實現全局收斂。如果交叉率很小,搜索過程將緩慢停滯。如果突變率很小,就不能有效地產生新的結構個體。如果突變率很大,則遺傳算法成為純隨機搜索算法,無法收斂。因此,本文提出了自適應交叉和變異,概率定義如下:

式中:和分別是最大和最小的交叉率;是變異率;是個體的最大適應度;是平均適應度。
以燃油經濟性為控制目標設計優化能量管理策略時,須在標準測試工況下進行。但車輛實際運行工況復雜,因此有必要對工況進行有效識別后對能量管理策略進行參數尋優。選取歷史車速作為特征輸入,使用BP神經網絡算法識別當前工況類別。識別模型如圖8所示,數據經過輸入層、隱含層和輸出層后輸出工況類別。從輸入層到隱含層的函數關系為

圖8 BP神經網絡工況識別模型

式中:ω為第個輸入節點到第個隱含節點的權重;ω為第個隱含層節點閾值。
第個節點輸出可以定義為

式中:ω為第個隱含節點到輸出節點的權重;ω為個輸出節點閾值。
各層的權值會在迭代過程不斷修正直至網絡計算誤差達到預期,誤差計算方法為

采用梯度下降的方法學習出使網絡計算誤差最小的權值,計算公式為

式中為學習率,取值范圍在0?1之間。
為了提高BP神經網絡工況識別性能,提出一種改進遺傳優化算法的BP神經網絡識別模型,如圖9所示。第一部分為優化初始權值和閾值,以歷史工況為數據輸入、初始化參數和種群;以訓練誤差為適應度函數進行遺傳算法操作;迭代出優化的初始權值和閾值后,進入第二部分BP神經網絡工況識別模型的訓練。

圖9 IGA?BP神經網絡工況識別模型
本文設計的神經網絡工況識別模糊能量管理策略框架如圖10所示,分為離線優化和在線模糊實時控制兩個部分。離線優化部分從中國貨車行駛工況中以100 s為滑動窗口大小,1 s為時間窗采樣時間間隔,提取維數為100的訓練樣本,以行駛工況類別(市區、市郊、高速)為訓練輸入,訓練識別模型。在包含3類工況的整個循環下,以電量保持階段的油耗為優化目標(如式(14)),改進遺傳算法為尋優方法,對3類工況下的模糊控制器參數(如式(13))進行離線尋優。將每類工況下的最優參數下載到實時控制器中,以需求功率、SOC、工況類別為輸入,同時滿足各類決策約束后,模糊控制器選擇最優控制參數輸出最佳決策。取3類行駛工況中部分數據進行測試,結果如圖11所示。從圖中可以看出該方法可以實時穩定的識別出工況類別。

圖10 工況識別結果

圖11 神經網絡工況識別的模糊能量管理策略框架
利用硬件在環測試技術,構建了增程式動力系統測試平臺,如圖12所示。該平臺主要由NI板卡實時機、顯示器、上位機、USB?CAN、整車控制器、直流電源等構成。在該測試平臺中,CAN通道與NI實時機相連,整車的動力學模型在NI實時機中運行,實際車輛的加載模型由除整車HCU和控制器模型外的所有原動機部件組成,加載的模型具有I/O接口,可以實現主機和NI實時系統之間的連接和同步處理。此外,該框架還建立了一個實時數據跟蹤平臺,不僅有利于發現和解決測試過程中的問題,以提高控制策略開發效率,而且有利于改進控制策略算法。

圖12 硬件在環測試系統
具體工作如下:利用自動代碼生成工具生成標準C文件,利用Visual Studio編譯成可被實時機軟件能識別調用的dll文件;將上位機與下位機連接到相同的局域網,并設置好同樣的IP;在實時機軟件程序中新建一個項目,在實時機軟件中運行程序進行實時仿真。
本小節對遺傳算法參數初始交叉率、初始變異率、BP神經網絡參數隱含層數對工況識別效果的影響進行分析。
為了探究不同初始交叉率與隱含層節點數對所提出控制策略的影響,以初始交叉率為0.3、0.4、0.5、0.6的條件下,設置隱含層數為3,4,…,9。通過圖13可以發現,初始交叉率取0.4、隱含層節點數為3、8、9時,相比于其它初始交叉率取值識別均方差最小,說明此時識別效果最佳。

圖13 不同初始交叉率在不同隱含層節點數下的識別均方差
初始變異率數值的選取對所提出的策略會有不同的影響,以初始交叉率為0.4,設置不同隱含層節點數,分析不同變異率下的識別效果。從圖14所示的結果中可以看出,當初始變異率為0.06,隱含層節點數為3和8時識別均方誤差最小分別為0.031和0.021,而隱含層節點數越高,計算量越大,故隱含層節點數取為3。在不同交叉率和變異率下,隨隱含層節點數均方差呈現非線性。不同的隱含層節點數下最優變異率與交叉率不同。

圖14 不同初始變異率在不同隱含層節點數下的識別均方差
為驗證所提出的IGA?BP工況識別方法的有效性,將其與基于BP工況識別方法進行對比,并在不同隱含層節點和隱含層數下進行驗證。
為了對比BP和IGA?BP的識別效果,設置不同節點數和不同隱含層數進行分析,結果如圖15所示。從圖15(a)可以看出,隱含層節點數為 3、4、5、6、8、9、10時,IGA?BP識別的均方差均大于BP,說明此時IGA?BP識別效果優于BP,僅在隱含層節點數為7時不同。而兩者均從最佳識別效果時的隱含層數進行比較時,BP在隱含層為4時最佳,識別均方差為0.314,而IGA?BP在隱含層為8時最佳,識別均方差為0.021。說明在最優參數下IGA?BP工況識別效果優于BP。由圖15(b)可以看出隨著隱含層數的增加,識別均方差先減小后增大,并在隱含層數為5時識別效果最佳。在不同的隱含層數下IGA?BP的識別效果均優于BP。

圖15 不同算法比較
在中國貨車(GVW大于5 500 kg)行駛工況(CHTC?HT)下,開展了基于神經網絡工況識別模糊(DPR?F)能量管理策略硬件在環測試,并與模糊(Fuzzy)能量管理策略、電量保持電量消耗(CD?CS)策略進行了對比分析。
為探究3種策略在SOC控制性能方面的不同,對比分析了整個工況時間內的SOC變化情況。從圖16可以看出,3種策略的SOC變化范圍均在29%?32%之內,其中CD?CS策略的SOC變化范圍最小(29.36%?30.91%),其次為模糊策略(29.00%?30.75%),最大的為自適應模糊策略,其SOC變化范圍為29.07%?32.06%。3種策略的終止SOC分別為30.70%、30.64%和30.46%。經過兩個循環1 h后與初始SOC相差最多的僅為0.7%,說明3種策略均能將SOC控制在合理的范圍之內。圖17說明所提出的策略能夠保證該車在整個工況內對車速良好的跟隨特性。

圖16 不同策略的SOC

圖17 跟隨車速
為了探究3種策略在影響整車舒適性的發動機啟停控制方面的不同,對比分析了3種策略的發動機轉速與轉速突變情況。對比圖18、圖19和圖20可以發現,自適應模糊策略發動機啟停頻次明顯低于模糊與規則策略,同時轉速瞬態變化幅度也較小。對啟停次數進行統計發現,規則策略為240次,模糊策略為51次,而自適應模糊策略僅為28次。發動機每啟停一次就需要完成從發電機到發動機的動態轉矩變化過程,這種頻次多的啟停會引起乘客因為抖動與噪聲感到不適。自適應模糊策略啟停次數相比規則策略約降低88%,相比模糊策略約降低45%,表明大幅降低了增程器的瞬態轉矩變化過程次數,提高了整車燃油經濟性和舒適性。

圖18 基于CD?CS策略下的發動機轉速與轉矩

圖19 基于模糊策略下的發動機轉速與轉矩

圖20 基于自適應模糊策略下的發動機轉速與轉矩
考慮到不同策略在發動機工作點分布情況各異,將發動機的工作散點分布到萬有特性曲線上進行分析。從圖21可以看出,3種策略均工作在增程器效率最佳的工作曲線上。由于增程器僅根據策略提供相應的功率即增程器轉速與車速解耦,因此,增程器工作點可取最佳工作曲線上。規則策略工作點范圍較廣,模糊策略工作點取值最窄,是因為該規則策略是采用功率跟隨的形式。自適應模糊策略的隸屬度函數頂點坐標會在不同工況下進行調整,因此功率范圍會比模糊策略廣。

圖21 3種策略的發動機工作點圖
為了探究所提出的能量管理策略對動力電池性能的影響,提取了具有代表性的0?500 s的電流數據進行分析。如圖22所示,自適應模糊策略的電流波動幅值最大,規則策略的電流波動幅值最小,說明自適應策略通過充分利用電池輸出功率調整增程器功率使整個儲能系統達到最優經濟性。

圖22 3種策略的動力電池電流
為了驗證所提出的控制策略的有效性,比較了在SOC保持均衡條件下的燃油消耗情況。結果如圖23所示,規則策略共消耗燃油3 301.8 g,折算百公里油耗為13.14 L/100 km;模糊能量管理策略消耗燃油3 235.5 g,折算百公里油耗為12.88 L/100 km;自適應模糊策略消耗燃油2 981.9 g,折算百公里油耗為11.87 L/100 km。因此自適應模糊策略相比于規則策略降低9.67%油耗,相比于模糊策略降低7.84%。

圖23 3種策略的燃油消耗量
為了探究所提出的能量管理策略對制動能量回收性能的影響,以制動能量回收效率為評價指標分析了3種策略的性能,結果如表3所示,CD?CS的能量回收效率為46.74%,模糊策略為46.14%,自適應模糊為46.73%。說明3種策略的制動能量回收性能基本相同。

表3 3種策略的制動能量回收效率
本文以增程式電動物流車為研究對象,提出了一種基于IGA?BP神經網絡工況識別的自適應模糊能量管理策略。采用在編碼方法、初始化方式、交叉和變異等方面進行改進的遺傳算法優化BP神經網絡初始權值與閾值,利用CHTC?HT工況數據訓練IGA?BP神經網絡構建工況識別模型;同時設計了以電池SOC和整車需求功率為輸入、發動機功率為輸出的依據工況類別實時調整隸屬度函數頂點坐標的自適應模糊能量管理策略;最后通過硬件在環測試驗證了所提出的神經網絡工況識別自適應模糊能量管理策略,結果表明該方法在燃油經濟性和舒適性上表現了良好的性能,主要結論如下:
(1)基于IGA?BP神經網絡工況識別方法的識別效果優于BP神經網絡。其中不同變異率和交叉率下的識別效果(均方差)隨隱含層數呈現非線性變化。
(2)自適應模糊策略啟停次數相比于規則策略降低了約88%,相比于模糊策略降低了約45%,表明大幅降低了增程器的瞬態轉矩變化次數;油耗相比于規則策略降低了約9.67%,相比于模糊策略降低約7.84%。說明該策略具有更好的整車舒適性和節能效果且不需要提前預知工況。