胡 杰,朱雪玲,何 陳,楊光宇
(1.武漢理工大學,現代汽車零部件技術湖北省重點實驗室,武漢430070;2.武漢理工大學,汽車零部件技術湖北省協同創新中心,武漢430070;3.新能源與智能網聯車湖北工程技術研究中心,武漢430070)
電動汽車是現代汽車發展的主要方向,其動力電池組健康狀態(state of health,SOH)是對當前電池性能的綜合評估,可直觀體現電池壽命變動[1]。因此,電動汽車動力電池SOH的準確預測是保證車輛可靠與安全的前提,具有十分重要的現實意義。目前,電池SOH預測方法大體可分3類:模型法、數據驅動法和融合法[1]。基于模型的電池SOH預測方法主要包括電化學模型法、經驗模型法和等效電路模型法,電化學模型法可了解電池內部狀態,預測精度較高,但無法確定電池內部衰減機理且設備昂貴[1-3];經驗模型法建模難度低,但模型穩定性差[1-3];等效電路模型法可實現電池SOH的實時預測,但模型參數識別誤差存在累積現象,預測精度受模型結構影響較大[1-3]。相較于模型法,數據驅動法無須考慮電池內部的復雜反應與老化機理,可利用電池狀態參數建立模型[1-4]。融合法是指將模型法與數據驅動法相混合,可明確模型參數,預測精度較高,但計算復雜且依賴于試驗數據[4]。
基于數據驅動的電動汽車電池SOH的估計多基于電流、電壓、容量和內阻等參數;王常虹等[5]在試驗數據基礎上提出了可反映電池SOH情況的容量衰退參數,實現電池剩余壽命的準確預測;Yu[6]通過擬合電池容量的全局退化趨勢實現電池SOH的準確預測;劉中財等[7]歸一化處理電池實驗測得的內阻值,利用內阻值表征電池SOH;梁培維等[8]分析不同放電倍率下電池內阻的變化特性,選用三次樣條插值法實現電池SOH準確預測;Jun等[9]采用小波分解處理電池電壓,提出了基于小波分解的電池SOH預測方法;徐文靜[10]在單體電池充放電循環試驗中測到多種條件下的電池充電電壓曲線,建立充電電壓歸一化擬合模型去預測電池SOH;Chang等[11]在實驗基礎上考慮電池內阻與放電瞬時壓降對電池SOH的影響,建立BP神經網絡預測電池SOH;郝雪玲[12]在實驗數據下分析構建電池SOH綜合指標,選擇容量、內阻和恒流充電時間3項指標用于電池SOH預測上。綜上,現有基于數據驅動的電池SOH預測較少采用多指標融合預測,且大多基于試驗數據,未能考慮實車運行的復雜情況。
本文中以電動汽車實車運行數據分析電池SOH預測問題,選擇構建容量、內阻和電池一致性3項指標,建立LightGBM模型,采用5-fold交叉驗證計算各項誤差,實現基于實車數據的電池SOH準確預測。針對實車數據存在的問題,提出自適應狀態估計法實現在不完整狀態下的容量計算,并考慮多目標優化問題,利用NSGA-II算法確定電壓區間,提高估計精度;考慮單體電池差異對電池整體壽命的影響,選擇單體溫度極差與電壓極差表征電池的溫度一致性與電壓一致性,構建電池一致性評分標準。
本文中使用的數據為京、滬兩地各5輛在運行電動營運車輛的實際行駛數據,時間為2018年至2020年,車輛日常數據是通過車載數據記錄儀進行采集,數據采樣周期為10 s,獲得數據集樣本總量為7 543萬,該樣本量可以確保本次采集數據具有一定的廣泛性和代表性,數據信息如表1所示。

表1 數據分類與說明
電池SOH是指電池當前性能狀態與原始性能狀態之比,表征電池健康程度[12]。將實車數據按編號進行預處理,清洗后劃分充放電片段進行SOH相關性分析,并隨機抽取1∕4的片段作為測試集。構建容量、內阻和一致性評分標準,選擇LightGBM模型進行電池SOH預測,并用測試集進行驗證,流程如圖1所示。

圖1 多指標預測電池SOH流程框圖
車載傳感器采集車輛行駛數據,其信號受多種因素影響,可能會出現信號不穩定等現象,造成部分數據呈現異常,因此需對異常數據進行處理,表2為部分異常的原始數據。

表2 部分異常數據
為了便于后續異常數據處理和SOH預測,選擇先對原始數據進行基于車輛狀態、時間維度和空間維度的片段劃分,片段劃分目標為行駛片段、停車充電片段和靜置片段,劃分流程如圖2所示。

圖2 實車數據片段劃分流程圖
本文中的數據異常類型主要包括采集滯后數據、狀態標記異常數據和缺失數據。采集滯后數據和狀態標記異常數據可通過其余特征來進行狀態平移或修正;缺失數據主要在里程、速度、最高最低單體電壓和最高溫度數據中,里程與速度缺失值選擇以片段為單位進行片段內填充,最高最低單體電壓和最高溫度的缺失值則通過機器學習模型隨機森林進行填補,該方法經過5-fold交叉驗證計算平均相對誤差如表3所示。

表3 隨機森林填補誤差
隨機森林是Bagging與決策樹結合的集成學習方法,可用于解決分類、回歸等問題。訓練樣本集合為S,經過隨機向量θk隨機化得到k個訓練樣本,訓練樣本和隨機向量生成每棵決策樹,決策樹的集合即為隨機森林h(S,θ)={h(Sk,θk),k=1,2,...,K},每棵決策樹模型都有一票投票權決定輸入變量di的輸出結果,再對每棵決策樹產生的結果H(di)=

式中:H(x)為隨機森林輸出結果;hi(x)為單個決策樹輸出結果;Y={Yk,k=1,2,...,K}為目標;I(x)為示性函數。
電池SOH隨著充放電循環次數的增多而衰減,二者之間相關性較強,經數據探索發現,充放電循環次數對電池的影響主要體現在充放電的荷電狀態(SOC)變化與充電電壓變化上。
2.3.1 充電過程的電壓變化電池在快充和慢充的情況下充電電流有明顯的差別,因此本文中分別明確定義了快充和慢充兩種模式。通過對數據的進一步探索發現,在兩種模式下充電電壓變化曲線都呈現以下趨勢:隨著循環充放電次數的增加,電壓變化越陡峭,即充電時間縮短,充入電量減少。
2.3.2 充放電SOC變化
圖3為不同循環周期充放電SOC變化曲線,可見無論在何種模式下電池循環充電次數越高,充電達到同樣SOC所耗時間越少。

圖3 不同循環周期充放電SOC變化曲線
出現上述現象的原因是隨著電池循環充放電次數的增加,電池內阻和電容會存在不同程度的增加或減少,電池的溫度一致性和電壓一致性也會變差。
電池容量是當前研究電池SOH中使用最多的特征,其值隨著電池循環放電次數的增加而降低,可體現電池SOH的整體衰減趨勢。本文中采用安時積分法計算當前容量值,計算方法[14]如下:

式中:CM為當前容量值;I為當前片段內的電流;ΔSOC為當前片段內的SOC差。
3.1.1 自適應狀態估計法
傳統容量估算法是采用當前電池最大容量和新電池最大容量的比值來計算電池SOH,電容法需要測算出電池SOC值從100%放電至0的放電量,電壓法須測算出電池電壓在固定變化區間內的充電量。可見,傳統容量估算法須獲得較為完整的充放電區間,要求電池進行完全的充放電,故傳統計算方法僅適合實驗室條件下完整充放電數據。
實車行駛狀況復雜多變,難以獲得完整的充放電區間,本文中針對傳統方法進行改進,提出自適應狀態的電池容量估算方法,該方法可有效解決實車數據區間不完整所帶來的問題,實現自適應狀態的電池容量估計。自適應狀態估計法選取較為完整的電壓片段作為標準片段,其余片段動態截取相同電壓與相同電壓降的對應區間,計算電容的比值進行SOH評估,并考慮快充和慢充的差異,分別對二者進行該過程,圖4為實車SOC分布,圖5為自適應變區間容量估計示意圖,圖中每條曲線表示該時間段電池充放電電壓變化情況。

圖4 實車SOC分布

圖5 自適應狀態估計法
3.1.2 容量值的修正
研究表明傳統的安時積分法計算容量存在誤差,溫度與放電電流在一定程度上影響著電池容量值,二者主要通過影響電池內部的化學反應,使電池容量快速衰減[14],本文中選擇依照溫度與放電電流對電池容量計算值進行修正。
溫度對容量值的修正依據文獻[15]中提出的修正公式,具體如下所示:

式中:C1(t)為溫度修正系數;e為自然指數;t為平均溫度,其計算如式(6)所示;Tmin為片段中單體最低溫度的平均值;Tmax為片段中單體最高溫度的平均值;Ci為未經修正的電池容量值;C(t)為經過溫度修正的容量值。
放電電流對容量的修正參照文獻[15]中修正的流程,通過擬合曲線得到放電電流的修正系數公式,再將電池容量修正到標準電流下,修正公式如下:

式中:C2(i)為修正系數;i為每個放電片段的平均放電電流;Ci為未經電流修正的電池容量值;C1(i)為經過電流修正后的電池容量值。
3.1.3 容量離群點處理與去噪
修正后的容量值仍存在部分樣本點遠離數據中心,該部分即為離群點,其產生主要是受傳輸過程中不穩定因素的影響,如當天氣候、采集設備狀態等,為提高電池SOH預測模型的精度,本文中采用箱型圖去除容量離群點,離群點指處于箱形圖上下邊緣之外的點,處理結果如圖6所示。

圖6 箱型圖
數據獲取過程中的隨機誤差或者環境影響都可能使數據產生噪聲,影響整體的均衡性,增加后續建模的難度。鑒于小波變換保留了特征提取的部分,性能上優于傳統的去噪方法,故本文中采用小波去噪的方法對容量值進行去噪處理。
電池內阻是影響電池SOH的重要因素之一,研究表明動力電池組內單體電池SOH與電池歐姆內阻之間有一定聯系,與極化內阻無明顯關聯[16]。受溫度、充放電電流等因素的影響,內阻值處于動態變化的狀態,這種變化可從側面表征電池SOH。一般,充放電循環次數越大,內阻值越大,關系如圖7所示,本文中通過一次循環內的充放電能量公式求出使用狀態下的電阻,公式如下。

圖7 內阻與充放電循環次數關系圖

式中:I1、I2分別為充電電流與放電電流;E為行車消耗的能量;RNOW為當前的內阻值。
電池組整體充放電時,環境與自身性能的差異使得各單體電池電流、放電深度和端電壓多有不同,各單體電池性能衰減程度不一,可能會導致電池組提前失效[17]。為多尺度預測電池SOH,本文中進行了電池一致性評價,受數據維度的限制,本文中僅分析電池組的溫度一致性與電壓一致性,綜合樣本數據特征,選擇使用單體溫度極差與單體電壓極差表征電池的溫度一致性與電壓一致性。
評價單體電池溫度一致性的公式如下:


評價單體電壓一致性的公式如下:

式中:Tempmax、Tempmin和Umax、Umin分別為該時刻數據中單體溫度最大值與最小值和單體電壓最大值與最小值;TempΔmin、UΔmin為該車歷史數據中單體溫度極差與單體電壓極差的最小值;f為歸一化函數為一 致性得分修正系數;εTemp、εu為最終的溫度一致性與電壓一致性得分。
本文中取KTemp與Ku為0.2,并計算最終的溫度一致性與電壓一致性得分,電壓極差與溫度極差分布Q-Q圖如圖8和圖9所示,其中μ、σ、skew、kurtosis分別代表數據分布的均值、方差、峰度和偏度,兩條分布曲線分別代表樣本實際分布與擬合標準正態分布。圖10為一致性得分,其中1為滿分。

圖8 電壓極差分布圖

圖9 溫度極差分布圖

圖10 溫度一致性和電壓一致性得分
基于電容法定義的電池SOH[15]為

式中:CM為當前容量;CN為初始容量。
基于電壓法定義的電池SOH[18]為

式中:CNOW(U1-U2)為電壓從U1降低到U2消耗的電量;CNEW(U1-U2)為新電池電壓由U1降低到U2消耗的電量。
基于內阻法定義的電池SOH[16]為

式中:RNEW為新電池,也即SOH為100%時的內阻值;RNOW為當前,也即電池在使用過程中測量的內阻值,本文中采用充放電能量公式(式(10)和式(11))對一次循環內的RNOW進行計算;REOL為電池壽命終了時的內阻值,一般取SOH為80%時的內阻值。本文中先構建基于自適應狀態估計法的容量法預測模型,并對前10個充電循環對應的電池健康狀態進行評分,結合能量公式計算該狀態下的內阻值。
基于電容法、電壓法、內阻法構建的電池SOH評估結果分別如圖11~圖13所示。

圖11 電容法

圖13 內阻法
自適應狀態估計法可有效針對實車數據不連續問題實現變區間容量值估計,其電壓片段的選擇是保證其估計精度的關鍵,本文中考慮基于最優部分充電電壓分布中估算電池容量。

圖12 電壓法
若選用單一電壓片段作為參考片段,可采用網格搜索法進行選擇,網格搜索是一種通過交叉所有候選解來優化代價函數的全局搜索方法,故采用該方法可找到一個最優電壓范圍,保證容量的估計精度,但該方法只優化估計精度,不考慮電壓范圍長度,且實際生活中充放電電壓區間不一定都能通過該范圍。本文中綜合考慮精度與效率的多目標優化問題,采用非支配排序遺傳算法(NSGA-II)自動選擇多個最優電壓范圍,找到最佳的折中方案。
NSGA-II能夠有效地找到多目標優化問題的Pareto最優,它使用一種帶有精英策略的快速非支配排序方法,降低計算復雜度,大幅提升排序速度,保留最優解,保證了個體多樣性。本文中采用圖14所示流程尋找兩個最優電壓范圍,采集電池退化過程中的充電電壓曲線,形成原始數據集,NSGA-II創建最初的親本種群,利用NSGA-II的代價函數來評估種群中每個個體的適應度,采用快速支配排序算法為每個個體分配一個非支配層,同時給出同一層中個體的擁擠距離,NSGA-II再從最優非支配集中選擇新種群,對同一非支配層個體利用擁擠距離進行評估,遺傳操作包括選擇、交叉和突變,主要用于從新種群中產生后代,滿足條件后停止。

圖14 NSGA-II選擇電壓范圍流程
NSGA-II中的雙電壓范圍的染色體狀結構如圖15所示,圖中的4個電壓值(Ua1,Ua2,Ub1,Ub2)構成了每個個體的結構,Ua1和Ua2與Ub1和Ub2分別為兩段電壓范圍的起始點和結束點,其中Ua1<Ua2,Ub1<Ub2。每個個體的適應度由NSGA-II的代價函數進行評價,考慮所提方法是為實現準確估算電池電容值并提高效率,提升SOH預測精度,故代價函數分別設計為容量估算誤差f1、電壓片段平均長度f2,代價函數f1與f2的值均為越小越好,具體公式如下:


圖15 類染色體狀結構

式中:Ci為計算容量;為參考容量;LUa1-Ua2、LUb1-Ub2分別為電壓Ua1與Ua2、Ub1與Ub2之間的平均長度值。
利用NSGA-II算法確定自適應狀態估計法中用于計算容量的電壓范圍,即圖5中選擇的電壓范圍,圖16為NSGA-II電壓片段選擇結果。

圖16 NSGA-II電壓選擇結果
綜上所述,多目標優化問題是效率與精度兩個目標的沖突問題,NSGA-II是解決多目標優化問題的算法,利用該算法可找到精度與效率的最優點,完成對自適應狀態估計法中電壓片段的選擇,提升容量的計算精度,考慮多目標優化問題的自適應狀態估計法計算流程如圖17所示。

圖17 考慮多目標優化問題的自適應狀態估計法計算流程
LightGBM算法是微軟的開源GBDT(gradient boosting decision tree)算法,該算法引入單邊梯度采樣算法和互斥特征捆綁算法,可減少計算量,提高效率,可有效打破傳統GBDT算法的局限性。
K折交叉驗證(K-fold cross validation)是指將樣本集分割成K份,取一份作為驗證集,其他K-1份作為訓練集,重復訓練K次,取K次結果的平均值作為最終誤差,可提高模型的泛化能力,圖18為5折交叉驗證示意圖。

圖18 5折交叉驗證示意圖
依據電壓片段的選擇是否考慮多目標優化問題分別構建前文所述特征,建立LightGBM模型,圖19為電池SOH兩種多指標預測與實際擬合的對比圖。采用5-fold交叉驗證計算各項誤差,其分布分別如圖20~圖22所示。表4對比了不同方案預測電池SOH的誤差,結果表明基于多目標優化的多指標融合預測方案可明顯提高電池SOH預測準確性。

表4 各方案預測誤差 %

圖19 電池SOH多指標預測對比圖

圖20 測試集絕對誤差圖

圖22 測試集平均絕對百分比誤差圖

圖21 測試集均方誤差圖
針對實車數據存在的問題,本文中將數據區間特征考慮到容量估計中,利用自適應狀態估計法計算當前容量值,并考慮單一電壓片段的局限性,利用NSGA-II算法解決精度與效率的多目標優化問題,在該算法中利用容量估算誤差和電壓片段長度確定個體適應度,最終選擇2個最優電壓范圍,有效提高變區間電池容量估計精度。以容量、內阻與電池一致性評分標準為3項指標,并結合LightGBM算法構建電池SOH預測模型,結果表明采用多目標優化的三指標融合預測方案的各項誤差均為最低,其中平均絕對誤差為1.535%,較未采用時降低了0.443個百分點,較采用后的單指標降低了0.194個百分點,即本文中提出的方案能有效處理情況復雜的實車數據,顯著提高基于實車數據的電池SOH預測精度。