解少博,劉 通,李會靈,辛宗科
(1.長安大學汽車學院,西安 710064; 2.北京理工大學,電動車輛國家工程實驗室,北京 100081)
配置AMT的并聯插電式混合動力車輛,能夠在發動機、純電動和動力并聯等工作模式之間進行選擇,還可避免傳統變速器換擋操作帶給駕駛員的負擔,已成為公交領域廣受青睞的車型之一。與此同時,配置 AMT的并聯插電式混合動力城市客車(PHEB)的能量管理涉及功率分配和AMT擋位選擇兩個控制變量,為實現最優的能耗,需要對兩個控制變量進行協同優化。
針對插電式混合動力汽車,為選擇最優的工作模式從而實現最小的能耗,研究人員提出了多種能量管理策略,如基于規則的策略[1-2]、全局優化策略[3]、瞬時優化策略[4]和基于人工智能算法的策略等[5]。其中,以動態規劃(DDP)[6]、隨機動態規劃(SDP)[7]和龐特里亞金最小值原理(PMP)[8]為代表的全局優化算法應用最為廣泛,但DP和PMP的不足之處是只能進行離線優化而無法面向實時應用。等效能耗最小化策略(ECMS)雖然可以實時應用[4],但最優等效因子很難直接獲取,常常需要依賴于工況等信息。神經網絡等智能算法需要大樣本量的數據進行訓練來得到預測模型,樣本量對其性能有重要影響。
應用馬爾科夫鏈模型進行模型預測控制已有研究,如文獻[9]中將駕駛員功率需求看作馬爾科夫鏈,但基于馬爾科夫鏈得到預測車速尚需深入分析,在預測時域內針對并聯插電式混合動力客車的含擋位選擇與功率分配的二維狀態變量優化問題仍需研究;另外,預測時域的長短對能耗、計算時間的影響有待于優化選擇,與基于規則和動態規劃等策略的差異也需進一步對比。
基于上述考慮,本文中針對一款裝有AMT的插電式混合動力城市客車,首先應用馬爾科夫模型對車速進行預測,并基于預測車速在滾動時域內進行功率分配和擋位選擇的協同優化,同時分析了不同預測時域長度對預測精度和計算效率的影響;最后,與基于規則的策略、基于常規動態規劃的策略進行對比分析。
所研究的并聯PHEB其動力系統如圖1所示,驅動電機與5擋AMT連接驅動車輛行駛。柴油發動機與驅動電機之間連接有離合器,且通過離合器的開閉進行多種驅動模式的切換。整車和主要部件的參數如表1所示。

圖1 并聯PHEB動力系統結構

表1 整車與零部件參數
柴油發動機的燃油消耗率Map如圖2所示,表達為轉速和轉矩的函數。
主驅動電機為永磁同步電機,其系統效率如圖3所示,表達為轉速和轉矩的函數。
動力電池為磷酸鐵鋰電池,標稱容量為100A·h,額定電壓為537.6V。將電池組看作開路電壓和等效內阻串聯構成的等效電路[10],開路電壓和等效內阻均表示為電池SOC的函數,單體電池特性如圖4所示。

圖2 發動機燃油消耗特性圖

圖3 驅動電機效率特性圖

圖4 電池單體開路電壓和內阻隨SOC的變化
以中國典型城市客車運轉循環(CCBC)[11]的速度特征為例,進行基于馬爾科夫鏈的車速預測研究。考慮到研究對象為同軸并聯PHEB,發動機和電機以轉矩耦合的形式輸出動力,以驅動輪需求轉矩代替整車需求功率進行車速預測。假設第k時刻車速為vm,需求轉矩為Ti,經l步狀態轉移后,需求轉矩由Ti轉變為Tj的概率為

概括基于馬爾科夫鏈的車速預測過程,主要包含如下步驟:
(1)計算當前車速vk和需求轉矩Tk;
(2)根據轉移概率矩陣求得k+1,k+2,…,k+lmax時刻的需求轉矩轉移概率序列…,其中,每一步概率序列最大值對應轉矩值即為該步預測轉矩值,并用Tk+1,Tk+2,…,Tk+lmax表示;
(3)基于車輛動力學方程,由Tk+1求得k+1時刻的預測車速vk+1;
(4)根據vk+1和Tk+2進一步求得vk+2,以此類推求得預測速度序列。
圖5給出了車速為40km/h時不同預測時域(5,10,15和20s)的轉移概率矩陣。可以看出,隨著預測時域的增加,概率矩陣的對角線分布特征越來越不明顯,即需求轉矩轉移到其他轉矩的可能性越來越大。
基于馬爾科夫鏈得到的4種不同預測時域下的中國典型城市工況的速度預測結果如圖6所示。由圖可見:從整體上觀察,預測車速均較好地跟隨了實際的工況車速;而對比不同預測時域的結果可知,隨著預測時域的縮短,預測速度與實際工況測速偏差越小,預測效果越好。
由電池模型可得

式中:Uoc為開路電壓;Rb為電池的等效內阻;Qb為電池容量;Pb_out為電池輸出端功率。
升降擋模型可表示為

式中:shift(k)為擋位變化值;g(k)為第k時刻的擋位,-1表示降擋,0表示擋位不變,1表示升擋。
將SOC和AMT擋位作為狀態變量,發動機輸出轉矩作為控制變量,系統的狀態轉移方程為

圖5 車速為40km/h時不同時域的需求轉矩概率轉移矩陣

圖6 4種不同預測時域車速預測結果

式中:k為時間步;shift為擋位值。
本文中采用能耗成本作為指標衡量能量管理策略的性能,系統瞬時成本函數定義為第k步不同擋位和發動機輸出轉矩下燃油成本(元)和電耗成本(元)之和,該函數可表示為

式中:Lh,l,m為第h個SOC離散值、第l個擋位且第m個發動機轉矩離散值對應的瞬時能耗成本;Cfuel和Cele分別為瞬時油耗成本和電耗成本;nice和Tice分別為發動機的轉速和轉矩。
油耗成本計算公式為

式中:pfuel為柴油單價;Pice為發動機輸出功率;be為發動機油耗,通過發動機油耗Map查表得到;ρfuel為柴油密度。
電耗成本計算公式為

式中:pele為電價;I為電池電流。
根據貝爾曼最優性原理,以能耗成本最小為性能指標的離散形式動態規劃迭代格式為
當 k=kmax時,


式中:Jk為第k階段(第h個SOC離散值、第l個擋位且所有可能發動機輸出Tice)到終止階段的最小累計能耗成本值;Jk+1為k+1階段所有可能的離散狀態下的最小累計成本;i為發動機的指標量,其集合為I。
基于預測的車輛速度,在預測區間實施動態規劃從而得到最優的發動機轉矩輸出和AMT擋位選擇,同時不斷更新預測區間,從而實現滾動時域內的能量管理策略,即第k階段預測時域為lmax時動態規劃目標函數為

式中:l為預測步長,其最大值為lmax;φ()為懲罰函數。對SOC進行約束以避免SOC下限值低于參考值出現電量提前用完的情況,其表達式為

式中α為常數,計算過程中取值為105。
為與基于動態規劃以及預測型能量管理策略進行比較,還進行了基于規則的并聯PHEB能量管理策略的研究,其中的放電模式選擇CD-CS策略。考慮到動態規劃和預測型策略均為后向仿真,為使不同控制策略的比較更加公平,在換擋策略的設計過程中,選擇的雙參數換擋規則采用車速和驅動輪需求轉矩作為擋位變化條件。綜合協調動力性和經濟性兩方面,制定的換擋規則如圖7所示。
從圖7可以看出,該規則是由發散型和等延遲型換擋規則相結合而成。隨著車速的增大,擋位切換閾值逐漸增大。隨著需求轉矩的增大,換擋延遲逐漸增大,且當需求轉矩大到一定值時,換擋延遲保持不變。

圖7 雙參數換擋規則

圖8 不同預測時域長度的SOC曲線
為驗證所提出的基于馬爾科夫鏈的預測型能量管理策略的性能,選擇10個連續的中國典型城市客車運行循環(共計59km,3.65h)進行仿真分析。設定電池SOC的初值為0.7,SOC最小值為0.3。首先,分析預測時域分別為5,10,15和20s時的結果;在此基礎上,進一步與基于規則和常規動態規劃方法進行比較。
圖8為4種不同預測時域長度下的SOC曲線。可以看出,除預測時域為5s的情況,其它3條SOC曲線彼此較為接近,即反映出相似的放電規律;同時,隨著行程的增加,SOC曲線在下降過程中呈現周期性波動,這是由于選擇的仿真工況為10個連續工況,即工況不斷重復。相應的油耗曲線如圖9所示。可以看出,油耗增長曲線與SOC曲線有相似的對應關系,原因可歸結為在相同的需求功率下,相似的電池放電規律使燃油消耗也呈現出相似的增長規律。

圖9 不同預測時域長度的累計油耗
定量結果如表2所示。可以看出,4種預測時域下的電耗、油耗與綜合成本均較為接近,但運算時間卻隨著預測時長的增加劇烈增長,即隨著預測時域的增大,整車的能耗成本變化并不顯著,而計算時長卻顯著增大,主要原因為在較大的預測時域內,實施動態規劃算法的時間也較長,從而導致整個行程的計算時間隨著預測時域的增加不斷增長;且誤差效應會逐步疊加,使較長預測時段的結果沒有得到顯著提升。基于上述分析,選擇10s作為模型預測控制的預測時域長度。

表2 不同預測時域的仿真結果
基于CD-CS,DP和MPC 3種方法的仿真曲線如圖10和圖11所示。

圖10 不同策略SOC曲線

圖11 不同策略累計油耗曲線
由圖10可見,CD-CS策略的SOC曲線明顯地分為CD和CS兩個階段,基于DP策略得到的SOC曲線近似呈線性變化,MPC策略所得SOC曲線存在波動特征。在行程終點,SOC末值均達到0.3左右。由圖11可見:對基于規則的CD-CS策略而言,由于在CS階段的SOC維持在0.3~0.35的區間范圍內,累計油耗呈現增長—維持—增長的趨勢;DP和MPC的油耗隨著行程不斷增長,但在同一時刻后者要高于前者。
圖12為3種策略得到的電機和發動機工作點分布。可以看出,CD-CS策略下電機工作點多集中在轉速1 000~2 000r/min,轉矩±300N·m范圍內;DP算法得到的電機工作點呈現分塊集中特征,低、中和高速均有分布;而MPC策略的電機工作點覆蓋范圍更廣。至于發動機的工作點,CD-CS策略沿著最優能耗效率線工作,DP選擇的工作點數較少,MPC覆蓋了更多的區域,主要是由于MPC是在局部區域(預測區間)進行尋優,而DP是在整個行駛工況進行最低能耗點的尋找。3種方法工作點分布不同的原因除了與行駛工況的特征有關外,還與能量管理算法所確定的擋位有關,因為擋位選擇與能量分配兩者互相關聯,從而導致三者呈現不同的能耗特征和經濟性。
圖13為3種策略5個擋位的使用時間分布圖。由圖可知:CD-CS策略擋位使用頻數由大到小的順序為1-3-4-2-5;DP策略擋位使用順序為5-1-4-3-2;MPC策略的擋位使用順序為1-5-4-3-2。分析可知,CD-CS和MPC策略使用1擋最頻繁;而對比DP與MPC可知,DP使用5擋最頻繁,其次為1擋,而MPC使用1擋最頻繁,其次為5擋,其余3個擋位的使用頻率排序一致。
表3為3種能量管理策略的仿真結果。由表3可知:CD-CS策略產生了最大的油耗,其總能耗成本也最大;而DP策略作為全局最優策略,具有最小的能耗成本,相比CD-CS策略節省成本40.1%;MPC策略相比于 DP策略,其綜合成本增加了17.3%,但同為面向實際應用的策略,MPC策略比CD-CS節省成本約29.7%。

圖12 不同策略電機和發動機工作點分布

圖13 不同策略下各擋位工作時間分布

表3 不同策略的仿真結果
針對一款裝有AMT的并聯插電式混合動力公交車的能量管理展開研究,得到了基于馬爾科夫鏈的預測型能量管理策略。
(1)應用馬爾科夫鏈模型計算轉矩狀態轉移概率,以中國典型城市工況為例,得到不同預測時域下的預測車速;基于預測車速得到了預測型能量管理策略。
(2)針對帶AMT的并聯插電式混合動力客車,將擋位和電池SOC作為狀態變量,將發動機轉矩作為控制變量,得到基于二維動態規劃算法的能量管理策略。
(3)針對模型預測控制,分析了不同預測時域長度對整車能耗成本的影響。結果表明,隨著預測區間的增加,能耗成本并不會顯著降低,而計算耗時卻會迅速增加。
(4)同時將基于規則、基于動態規劃和基于模型預測控制的3種能量管理策略進行對比分析。結果表明,MPC策略能耗比DP策略增加了17.3%,與CD-CS策略相比,其能耗降低29.7%。