羅 鵬,劉美俊,俞 輝,陳 霞,魏 憲
(1.廈門理工學院電氣工程與自動化學院,福建廈門 361024;2.中國福建光電信息科學與技術創新實驗室(閩都創新實驗室),福建福州 350108;3.中國科學院福建物質結構研究所,福建福州 350002)
車載鋰電池作為純電動汽車(BEV)最關鍵的動力來源,決定了BEV 的整體性能、生產成本和收益。近年來,不斷報道的有關BEV 電池系統故障所造成的事故讓消費者對BEV的安全感到擔憂。由于BEV 的鋰電池組性能衰退是不可逆的,對鋰電池性能衰退趨勢的預測工作可以幫助行車人員通過調整駕駛習慣延長電池組性能,并能有效地避免電池性能衰退造成的電池組故障,保障行車人員的生命和財產安全。
在早期,數據預測模型的構建通常使用線性回歸、自回歸移動平均模型等傳統回歸方法,但這類方法要求數據是穩定的,且對于存在非線性關系的數據預測效果較差。90 年代,深度學習這類模仿人腦神經的網絡框架被運用到了各個領域,在預測和識別方面取得了不少成果[1],相比傳統方法,深度學習對于網絡參數擬合能力有很大的提升,且對象越復雜,優勢越明顯。但單一的算法訓練過程容易出現梯度消失、爆炸的情況,且容易受到數據噪聲的影響,此類情況會降低網絡的預測精度。本文針對單一算法易出現的問題,提出了一種基于注意力機制的灰色關聯分析法(GRA)-經驗模態分解(EMD)-雙向長短期記憶網絡(BILSTM)預測模型,并在開源和非開源數據集上驗證了該模型的性能。
電池性能沒有具體的參數,傳統的方法是用電池容量[2]或電池內阻[3]表征電池性能,但電池容量無法在線獲取,是一種典型的實驗室測量方法,電池內阻通過傳感器采集,采樣精度受傳感器的限制,且采樣過程耗時耗力,因此這兩種參數不宜表征實車的電池性能。電池組性能的衰退受外界復雜環境和駕駛習慣的影響,所以對實際電動汽車在行駛過程的參數變化進行分析并選取合適的參數表征電池性能的工作非常重要。
BEV 電池組通過多個單體電池串并聯構成,各單體電池出廠時內部參數已出現細微差距,因此,充放電時間越長,各單體電池極值電壓差異越大,一致性也越差,從長里程下觀察電池包數據,單體電池壓差是一項重要的參數,且該參數容易在實際車輛中獲取。研究發現鋰電池壓差增大會加劇電池容量的衰減[4-5],而電池容量是表征電池壽命的參數,因此,鋰電池單體電池壓差的變化與電池壽命具有強相關性,此外,壓差過大帶來的不一致性極大地影響了電池組的性能,具體表現為整車充不滿電、行駛里程縮短等情況。
通過對獲取的實車電池包數據分析,隨著運行里程的增加,電池內阻和電池組壓差逐漸增大,呈正相關關系。內阻是電池健康狀態(SOH)的重要參數,通過公式計算發現內阻增大會導致SOH的降低,SOH越低,電池性能越低,因此,內阻與電池性能呈反相關,由壓差和內阻的關系推出壓差與電池性能呈反相關,壓差越大,電池性能越低。將單體電池壓差視為關鍵特征,用于表征鋰電池的性能,通過提前獲取鋰電池的終身運行數據,計算故障情況(電池容量小于80%)時的壓差并設定故障閾值,壓差的預測可在線幫助車主知曉車輛工況,提前給車主預警。綜上所述,預測未來壓差的增長趨勢等同于預測鋰電池性能衰退趨勢。
非開源數據采樣間隔短,變化幅度大,為了能夠準確捕捉數據前后特征的序列信息,采用BILSTM 作為基本網絡框架[6],此外,該網絡還可以避免長序列在訓練過程出現梯度消失或爆炸的情況,BILSTM 模型結構如圖1 所示。

圖1 BILSTM基本結構圖
BILSTM 的神經元內部與LSTM[7]相同,包含三個門控模塊,分別是遺忘門、記憶門和輸出門。X表示的是t時刻的輸入,C表示細胞狀態,H表示隱層狀態。網絡的輸入包括經過處理后得到的壓差分量和影響壓差變化的關聯特征,壓差分量依然保留了壓差的時序信息,且受前向關聯特征的影響。BILSTM 的神經元可以通過遺忘門、記憶門對細胞狀態選擇性地遺忘和記憶新信息,將這些有用的信息保存下來并傳遞給后續的神經元。信息的遺忘、記憶、輸出是由上個時刻H和當前X通過神經元的內部權重計算得到的遺忘權重、記憶權重、輸出權重控制。通過LSTM 神經元的三個門,能夠有效抓取隱藏在關聯特征與壓差分量中的特征信息和時序信息。相比LSTM,BILSTM 可以編碼從后到前的信息,提高獲取隱藏信息的能力。
輸入信息經BILSTM 神經元的處理后,得到的結果如式(1)~(2)所示,輸出y是將Ht進行Softmax 處理。
式中:W0為輸出權重;Wi為記憶權重;Wf為遺忘權重。
本文在BILSTM 網絡框架中添加了注意力機制,根據結果與該點的誤差大小合理分配權值,以此取代神經元隨機分配權值的方式。融合注意力機制的BILSTM 模型如圖2所示。

圖2 融合注意力機制的BILSTM結構圖
注意力機制可以通過合理分配權重的方式,對BILSTM提取的時序特征給予足夠的關注,忽略不重要的信息。具體地,計算神經元內部隱含層hi'和前面的隨機初始化的四個隱含層hi的相似度ei,如式(3)所示,下一步,使用Softmax 函數計算出注意力權重,得到注意力權重W后,與神經元的輸出加權整合,通過全連接層映射,得到預測值。Softmax 公式如式(4)所示。
開源/非開源數據中能反映車況信息的參數有總電流、總電壓、電荷狀態(SOC)、溫度等參數,這些特征反映了汽車的外界環境和駕駛行為,但無法判斷它們與壓差是否存在關聯,若關聯度較差被做為冗余特征輸入到網絡中,會降低模型的預測精度,因此,采用GRA 計算上述參數與壓差的關聯度,篩選出非冗余特征。表1 為關聯度分析表,選取關聯度大于0.6 的參數,并視為與壓差關聯度較高的關聯特征。

表1 關聯度分析
式中:ρ為分辨系數,取0.5。
盡管BILSTM 能夠捕捉壓差序列的非線性和時序性,但是對于這類變化頻率高的序列,非平穩部分會導致預測精度下降,因此,本文采用EMD 將壓差序列分解成多個平穩的、多尺度的分量[8],相比傅里葉變化和小波變化,EMD 具有更好的信噪比。壓差序列V(t)經EMD 分解,得到多個固有模態函數(IMF)和殘余信號Res,如式(6)所示:
融合注意力機制的GRA-EMD-BILSTM 模型流程圖如圖3 所示。壓差序列經過EMD 分解后得到多個分量,在構造特征工程中,將這些分量作為目標標簽,結合與之相對應的GRA 篩選后的關聯特征一同輸入到BILSTM 網絡中,在網絡的輸出部分引入注意力機制,經全連接層擬合后得到每個分量的預測值,將各分量的預測值疊加即為最終預測結果。

圖3 模型流程圖
本文使用了開源/非開源數據集驗證提出的算法的預測精度。開源數據為上海市新能源汽車公共數據采集與監測研究中心提供的完整電池包數據,因此數據預處理階段只需要進行歸一化處理,消除各參數量綱之間的差異,歸一化如式(7)所示:
式中:x表示樣本數據;xmax表示樣本數據的最大值;xmin表示樣本數據的最小值。
非開源數據源于某品牌投放至市場中的純電動汽車電池管理系統采集的電池實時數據。實際數據的多個參數與駕駛行為有很大的關系,駕駛行為的變化會導致參數產生突變,因此,收集的實際數據相比開源數據,變化頻率更高,幅度更大,這些非線性的變化更能考驗網絡的特征提取和時序分析能力。
實際數據會因電池管理系統的異常導致上傳的電池數據存在離散的空值,數據的不均衡會導致預測模型無法正常訓練。由于采樣間隔為10 s,相鄰值差異較小,本文采用均值插補法,取空值上下值的平均值進行空值插補。
本文實驗環境:操作系統Linux;顯卡型號NVIDIA GEFORCE RTX2080Ti;深度學習框架Tensorflow2.91;編程語言Python3.7。
為了驗證本文提出的方法的優勢,設置了5 組對比實驗,將提出的模型與GRA-EMD-BILSTM 模型、EMD-BILSTM模型、BILSTM 模型、LSTM 模型以及BP 模型做對比,評價模型的指標采用均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對百分誤差(MAPE),評價指標如式(8)~(10)所示:
式中:yi表示壓差預測值;xi表示壓差實際值;N表示樣本的數量。
為了保證實驗的公平性,各網絡的參數均統一:丟失層為0.5,傳遞的訓練參數為126,訓練次數為200,優化器為適應性矩估計(Adam),神經元個數為16,并且在訓練過程中,利用回調函數保存最好的模型,利用該模型進行后續的預測工作。將數據集的前80%作為訓練集,后20%作為測試集。
經GRA 分析,得到的各特征序列與壓差序列的關聯度如表2 所示。
由表2 可知,開源數據中,除速度、總電流外,關聯度均小于0.6,屬于失調狀態,因此將速度和總電流作為網絡的輸入;對于非開源數據,將總電流、行駛里程、速度這三類關聯度大于0.6 的參數作為網絡的輸入。
對初始信號V(t)進行EMD,分解結果如圖4 所示,從高頻到低頻,V(t)被分解成10 個IMF和一個Res,經EMD 分解的多個分量,由上到下,IMF逐漸從非平穩趨于平穩,且各IMF的變化較為一致。
利用不同模型預測壓差,各預測曲線和實際壓差可視化圖如圖5~6 所示,圖5 為開源數據集對比圖,圖6 為非開源數據集對比圖。由于數據較多,基于原始圖片,繪制了三個局部放大子模塊A、B、C。

圖5 開源數據預測結果

圖6 非開源數據預測結果
由圖5 可知,A 模塊震蕩較為劇烈,無法準確判斷各模型的預測效果,B 模塊中可以明顯發現,當壓差處于上升趨勢時,BP 神經網絡與真實值偏離幅度非常大;C 模塊中當震蕩幅度趨于平穩時,LSTM 網絡的預測值與真實值相比,向下偏離。由圖6 可知,A 模塊中,BILSTM 網絡的預測值相比實際值向上偏離;B 模塊中,除BILSTM 外,EMD-BILSTM 也略微向上偏離;C 模塊無法看出模型的差異。如上分析,BP 模型、BILSTM 模型和LSTM 模型,由于算法單一,無法準確提取變化特征,預測效果較差。在網絡中添加EMD 后,預測效果提高,但在圖6(c) B 模塊中,預測值與實際值仍存在一定的偏離,這是因為預測模型受到冗余信息的影響,相比之下,本文提出的方法與GRA-EMD-BILSTM 模型在開源數據集和非開源數據集都能跟蹤壓差的變化趨勢,可視化圖無法直觀判斷兩種模型的差異,需通過評價指標才能判斷最優算法。
通過模型評價指標計算各模型的預測誤差,如表3 所示。由表3 可知,BP 神經網絡、LSTM 神經網絡的誤差較大,與圖反映的一致,相對于LSTM,BILSTM 誤差有所降低,證明本案例雙向提取特征的方法優于單向提取特征,在BILSTM 中添加EMD 后,精度大幅度提升,說明EMD 可以通過分解關鍵特征,多分量預測的方法有效提高預測精度,通過GRA,去除冗余特征,預測精度也略微提升,最后在網絡的輸出階段添加注意力機制得到的誤差相比GRA-EMD-BILSTM 模型,誤差有所降低,RMSE、MAE和MAPE分別為1.423 2/0.971 9,0.920 6/0.628 0 和8.187 3/11.444 0。此外,本文還收集了各算法所消耗的時間,該時間包含預訓練模型的建立時間。

表3 不同模型直接的誤差比較
綜上所述,相比其它算法,本文提出的方法在開源和非開源數據集上有著較高的預測精度,從消耗的時間上分析,此方法消耗的時間并不長,如果應用于在線預測,在通過GRA 離線分析電池終身數據以確定關聯參數的前提下,加上預訓練模型的建立時間,僅需每五分鐘傳入數據,即可在下個階段傳入數據之前,得到預測結果,因此,此方法可在線應用于車輛工況預警。
本文考慮了單一算法的缺陷,融合了多個方法,建立了GRA-EMD-BILSTM 模型,并加入了注意力機制,進一步提高模型的預測精度,此外,除開源數據外,還收集了變化頻率更高的實際電動汽車的電池數據驗證本文提出模型的性能,最后通過實驗表明,使用BILSTM,并在網絡中添加EMD、GRA和注意力機制,模型性能有不同程度的提高,因此,本文提出的基于注意力機制的GRA-EMD-BILSTM 模型具有更優的性能。