周道亮
(中車青島四方車輛研究所有限公司,山東青島 266031)
隨著國家提出“雙碳”戰略,儲能技術得到迅速發展。電池儲能作為主要儲能方式之一,隨著電化學技術的發展,其在能量密度、壽命等方面有著顯著提升,配合成熟的儲能系統集成技術,在規模化儲能應用領域有明顯優勢。然而電池的材料損耗、電化學反應及運行工況等因素都會導致電池性能的退化,影響電池的壽命和安全性。
電池剩余使用壽命(remaining useful life,RUL)是電池管理系統(battery management system,BMS)的重要組成部分,指的是電池從當前容量到壽命終止時的剩余循環次數或者時間。RUL 預測能夠避免電池因退化引發嚴重后果,并且是制定電池維護策略的重要依據。
機器學習算法由于其強大的學習能力受到了研究人員的廣泛關注,逐漸成為RUL 預測的主要方式。本文對各類基于機器學習的RUL 預測算法進行綜述和討論,并對RUL 未來的研究方向給出建議。
支持向量機(support vector machine,SVM)是一種廣泛應用的監督學習方法,通過核函數將向量映射到高維空間,從而更好地處理非線性問題。SVM 具有所需樣本少、使用靈活等優點。Patil 等[1]在電壓和溫度分布中提取關鍵特征,利用SVM 建立了基于關鍵特征的RUL 分類和回歸模型。Wang等[2]利用人工蜂群算法對SVM 的核參數進行優化,該方法在預測RUL 時具有較高的精度和穩定性。舒等[3]使用Box-Cox變換來進行特征增強,并利用瑞利熵理論優化最小二乘SVM,從而建立電池容量和RUL 的協同估算模型。Wang 等[4]使用能量效率和電池溫度作為輸入特征,分別構建了基于柔性SVM 的非迭代和基于SVM 的迭代多步預測模型。實驗表明,非迭代預測模型適用于長期預測,而迭代多步預測模型適用于中短期預測和實時系統監測。
相關向量機(relevance vector machine,RVM)是建立在SVM 上的稀疏概率模型,通過引入貝葉斯方法將硬性劃分變為概率意義下的劃分。相比于SVM,RVM 的核函數不用滿足Mercer 條件,選擇范圍大,訓練所需相關向量少,且能產生概率分布,RVM 產生的定量分析結果如圖1 所示。Zhang 等[5]從充放電循環中提取6 個特征,基于加速粒子群算法優化自適應多核RVM 的各項參數,并表征了提取特征與電池容量的關系,分析了此方法用于RUL 的準確性、有效性和魯棒性。郭珮瑤[6]通過實驗結果表明基于RVM 的RUL 算法不僅提高了點預測精度,還能提供區間預測結果,為實際使用提供更全面有效的參考。

圖1 RVM定量分析結果
高斯過程回歸(Gaussian process regression,GPR)是借助高斯過程先驗對數據進行回歸分析的非參模型。假設訓練數據集D=(X,Y)={(xi,yi)|i=1,...,N},其中X 為輸入,Y 為對應的輸出。現有新的輸入X′,利用GPR 預測結果Y′的形式化推導如下:
式中:K為協方差函數。
GPR 模型還能給出概率區間估計,豐富決策信息。Li等[7]用多個GPR 模型去擬合不同的容量軌跡,該方法具有較高的預測精度和置信度。Liu 等[8]提出了一種將間接健康指標與多元GPR 模型相結合的RUL 預測方法,以解決電池運行容量不可測的問題。Kang 等[9]提出了一種基于模糊評價-GPR 的RUL 預測模型,該方法利用能結合專家知識和歷史數據的模糊評價對觀測數據進行歸一化,結合GPR 模型實現RUL 的區間預測,能有效表達預測結果的不確定性。
除了上述提到的SVM、RVM 及GPR 外,還有一些常見機器學習方法被用來進行RUL 預測,例如極限學習機(extreme learning machine,ELM)、梯度提升樹(gradient boosted trees,GBT)等[10-11]。ELM 算法不需要基于梯度的反向傳播來調整權重,可減少計算量,因而具有良好的泛化性能及快速學習能力。其計算公式可表示為:
式中:L為隱藏的神經元數量;N為參與訓練的樣本數量;βi為第i個隱藏層與輸出層之間的權重;ωi為第i個輸入和輸出之間的權重;g為激活函數。
GBT 是集成學習的一種,通過合并多個決策樹來構建一個更為強大的模型,采用連續的方式構造樹,每棵樹都試圖糾正前一棵樹的錯誤。默認情況下,梯度提升回歸樹沒有隨機化,在訓練過程中不需要對數據進行縮放處理就可以實現較好的性能,處理缺失的數據。這些模型在一般情況下也都表現出了較好的RUL 預測性能。
基于深度學習的RUL 預測方法又可以細分為基于神經網絡(neural networks,NN)的方法和基于時間序列的循環神經網絡(recurrent neural network,RNN)方法。
NN 是一種被廣泛應用于統計模型中的機器學習方法,具有易于實現、非線性建模能力強等特點。Wu 等[12]利用前饋神經網絡(FFNN)模擬了RUL 與電荷曲線之間的關系,實驗結果表明此在線方法對實際RUL 進行預測時誤差小于5%。劉泓成[13]提取了恒流充電模式的時間、一定時間內恒流充電模式的電壓以及恒壓充電模式下的電流等三個健康指標,訓練了兩個并行的優化BP 神經網絡,分別進行電池健康狀態(SOH)估計和RUL 預測。此優化模型解決了學習率選取、權值和閾值初始化等難題,并且提升了估計的準確性。Ansari等[14]評估了不同輸入配置下人工神經網絡(artificial neural network,ANN)的預測性能,并指出采用多通道配置可以獲得更好的RUL 預測結果。Khumprom 等[15]將所提出的NN 算法與SVM、ANN、KNN(K-nearest neighbor)和LR(logistic regression)等機器學習算法進行了比較,實驗結果表明,NN 算法的性能可以媲美或超過其他機器學習算法。
RNN 能對前序的信息進行記憶并傳播到當前輸出中,在學習序列特征方面具有一定優勢。Liu 等[16]將鋰電池阻抗譜數據作為自適應RNN 的輸入實現RUL 預測。但是RNN 在長時間的信息傳遞過程中會出現梯度消失和爆炸問題,這導致RNN 在解決RUL 預測問題時還存在一定缺陷。
長短期記憶(long short-term memory,LSTM)網絡是RNN的一種改進,通過門控機制在一定程度上解決了RNN 存在的梯度問題。LSTM 及其改進模型被廣泛用于RUL 預測中[17-18]。Zhang 等[19]利用LSTM 訓練了數據驅動的電池RUL預測器,并且采用彈性均方根傳遞技術對網絡進行訓練,結果表明LSTM 在RUL 預測方面的性能要優于簡單RNN。為了解決表征電池退化模型中的不穩定問題,Ren 等[20]提出了一種基于自動卷積-LSTM 的RUL 預測方法,通過CNN 和LSTM 并行的方式挖掘更深層的信息。Cheng 等[21]將經驗模態分解方法與LSTM 相結合,以減少容量再生等情況的影響,該模型具有較高的魯棒性、準確性和適用性。
門控循環單元(gated recurrent unit,GRU)是LSTM 的一個變種,參數少且更容易收斂,其模型框架如圖2 所示。Rouhi等[22]使用GRU 構建了一個面向容量的RUL 預測器,并且采用基于隨機森林的特征選擇來提高預測精度。Wang 等[23]利用軟測量方法實現特征提取,并且構建了一種基于自適應滑動窗的GRU 神經網絡來實現精確RUL 預測。

圖2 GRU算法框架
融合算法是指通過一定的方式將多種RUL 預測算法融合,將不同模型的優勢進行整合,彌補單一模型的不足,從而實現更好的預測結果。數據驅動下的機器學習融合方法主要包括濾波算法與機器學習算法的融合、多種機器學習算法的融合兩大類。
濾波方法的特點是能夠根據監測數據實時更新模型參數,常用來和機器學習模型結合,從而實現更精準的RUL 估計。Wu 等[24]引入NN 網絡來模擬電池在不同運行條件下的衰減趨勢,然后利用基于蝙蝠算法的粒子濾波器來更新模型參數,該方法能夠更好地模擬容量衰減趨勢,并獲得更高的RUL 預測精度。Sun 等[25]采用對偶指數函數來表示退化過程,首先得到無跡粒子濾波(unscented particle filter,UPF)初始估計與實際容量之間的誤差,然后利用互補集成經驗模態分解對殘差進行重構以減少干擾,再利用優化的多核RVM 對殘差進行預測,并通過實驗說明了此算法的精度和魯棒性。Li等[26]將UPF 和LSSVM(least squares support vector machine)進行融合,在有限的訓練數據集上進行多步迭代預測,提高了模型的精度和長期預測能力。
多種機器學習方法融合的RUL 預測框架旨在增強模型的泛化能力、提高預測準確率。Catelani 等[27]提出了一種基于深度信念網絡(deep belief network,DBN)和RVM 的融合RUL預測方法,即DBN 負責提取鋰離子電池容量的衰減特征,RVM 將提取的特征作為輸入提供RUL 預測。胡等[28]對影響RUL 的容量、內阻、環境等因素進行歸納,并借助隨機森林進行特征篩選,建立灰色預測模型和LSTM 結合的Stacking 模型,進一步降低了預測誤差。
深度模型和淺層模型融合、淺層模型融合、深度模型融合這幾種形式的融合模式為探索RUL 預測方式提供了新思路。
為了更加清晰地展現各種基于機器學習的RUL 預測方法的優缺點,表1 對各類方法進行了總結歸納。

表1 基于機器學習的RUL預測方法優缺點分析
針對目前機器學習方法在RUL 預測中存在的問題,對其未來發展方向提出一些建議:
(1)機器學習視角下的RUL 預測是以數據為驅動的,不需要考慮電池的內部機理特征,模型的可解釋性差,無法真正建立人和模型之間的信任。因此應該研究如何更好地解釋模型,實現可信任的模型構建。
(2)研究中往往忽略了容量再生和容量加速衰減問題,導致預測不準確性,選擇合適的方式處理這些問題是提高RUL預測精度的關鍵。
(3)GPR 和RVM 實現了RUL 的區間估計,然而數據量增大時,這兩種模型的表現能力不是十分理想。如何利用深度學習實現RUL 的區間預測值得探討。
(4)機器學習算法的復雜性導致更高的算力需求,但BMS通常部署在嵌入式平臺,算力有限。因此RUL 算法還需考慮如何降低算力需求。
RUL 預測是BMS 的重要組成部分,對于電池性能和安全保障至關重要。近年來,機器學習憑借其強大的建模能力在RUL 預測領域具有出色表現。本文梳理總結了基于淺層模型、深度學習和融合方法這三類機器學習模型的RUL 預測方法,并對其優缺點與未來發展方向做出分析討論。機器學習算法具有可靠性高與泛化能力強等特點,在RUL 預測領域中具有廣闊的應用前景。隨著對機器學習算法特別是深度學習的持續深度研究,RUL 預測會取得更大成功,并發揮更大的實際應用價值。