孫玉樹 ,李宏川 ,王波 ,賈東強 ,裴瑋 ,唐西勝 ?
(1.中國科學院電工研究所,北京 100190;2.中國科學院大學,北京 100049;3.國網北京市電力公司,北京 100031)
截至2022 年底,中國已投運的電力儲能累計裝機達59.4 GW,同比增長37%.其中,新型儲能累計裝機規模首次突破 10 GW,超過2021年同期的2倍,達到12.7 GW.電池儲能作為重要的靈活性調節資源,占據新型儲能的主導地位,在提高新能源消納、提升可靠供電等方面具有積極作用,是構建新型電力系統不可或缺的組成部分[1].
在電池市場規模日益擴大的背景下,荷電狀態(State of Charge,SOC)估計等相關研究越來越得到人們的重視.如果未對電池儲能系統SOC 進行精準估計,可能會導致起火、爆炸等事故的發生,危及儲能電站甚至電力系統的安全穩定運行.因此,高精度、快速實時的SOC 估計是保障電池運行安全、延長使用壽命的核心技術,對電池更大規模的應用,特別是電站級電池儲能系統安全經濟運維,具有重要的實用價值[2-3].
在電池實際應用中,其表現出非線性、時變性、影響因素復雜性和不確定性等特征,造成了SOC 估計難度大、精度不高和適應能力不足,由此產生了較多SOC估計算法及其改進策略.
1)基于經驗的估計算法:羅勇等[4]提出的帶容量修正的安時積分法,可用于SOC 的實時估計或作為評價其他SOC 估計策略的基準.Xing 等[5]將鋰電池進行長時間靜置,測量其開路電壓和SOC,擬合出兩者之間的函數關系,實現對鋰電池SOC 估計.上述開環估計算法原理簡單、容易實現且計算復雜度低,但常需要滿足許多前提條件,且因為缺少反饋環節,算法魯棒性較差.
2)基于模型的估計算法:Liu 等[6]基于電化學單粒子模型,設計了終端電壓反饋注入非線性觀測器來監測鋰離子電池的SOC.張宵洋等[7]提出了基于分數階模型自適應擴展卡爾曼粒子濾波的SOC 估計方法.Fu 等[8]建立了Thevenin 模型,采用線性卡爾曼濾波器進行參數在線辨識.杜常清等[9]基于戴維南電池模型,提出一種卡爾曼濾波與擴展卡爾曼濾波相結合的算法估算SOC.Bai 等[10]考慮到溫度變化對鋰離子電池荷電狀態估計的影響,提出了一種基于自適應雙擴展卡爾曼濾波的荷電狀態估計方法.上述電化學模型雖能較好地表征電池內外部特性,但其辨識較為復雜;等效電路模型結構清晰,參數易于辨識,但模型精度與復雜度難以兼顧,無法反映電化學微觀過程.
3)基于數據的估計算法:王語園等[11]提出了基于最小二乘支持向量機機器學習的鋰離子電池SOC估計模型.Fan等[12]提出了一種基于U-Net架構卷積神經網絡的SOC 估計方法,該方法可以處理變長輸入數據和輸出等長SOC 估計結果.Gong 等[13]提出了一種基于深度學習的新型深度神經網絡模型,該模型以10 s 采樣率的電池電壓、電流和溫度組成的數據單元為輸入,SOC 估算值為輸出.Chen 等[14]提出了一種基于擴展輸入和約束輸出的長短期記憶和循環神經網絡用于電池SOC 估計.上述基于數據驅動的SOC 估計方法僅依靠系統輸入與輸出間的映射關系即可建立SOC 估計模型,極大地簡化了電池建模過程,但需要大量數據集進行訓練來建立各變量之間的關系,精度依賴訓練數據集質量,且計算量大.
4)模型數據混合估計算法:單獨使用上述3 類方法可能會影響SOC 估計精度或估計速率,因此,多類方法融合估計方法也得到了快速發展,通過優勢互補取得更為準確的SOC 估算結果.楊帆等[15]基于二階Thevenin 等效模型,提出一種將無跡卡爾曼濾波與BP 神經網絡相結合的SOC 估計方法.Cui 等[16]提出了一種基于改進的雙向門控循環單元網絡和無跡卡爾曼濾波的混合方法來實現不同溫度下電池SOC的實時穩定估計.
上述研究主要側重電池單體的SOC 研究,對系統級的分析較少,電池儲能系統較電池單體數據量大,運行影響因素眾多,數據在線獲取難度大,SOC估計的映射關系更為復雜等,因此本文應用數據驅動的方式進行電池儲能系統的SOC 估計.首先,對比分析了不同神經網絡對電池儲能系統SOC 估計的結果;進而利用不同的相關性評價指標篩選對電池儲能系統SOC 估計影響較大的特征因素;最后,利用經驗模態分解和樣本熵對電池儲能系統進行分頻處理,并利用不同的神經網絡對不同頻段數據進行估計,從而提高電池儲能系統SOC估計的精度和速度.
由于遞歸神經網絡在訓練過程中容易發生梯度爆炸或消失,長短時記憶(Long Short-Term Memory,LSTM)神經網絡[17]應運而生,其優勢是在網絡中引入遺忘門,和傳統遞歸神經網絡相比,其更擅長處理長時間尺度歷史信息.所添加的遺忘門,會選擇性地遺忘和記憶某些歷史信息,當其輸出值接近0,則說明某些歷史信息被選擇忘記;當輸出值接近1,則傾向于保留記憶更多的歷史信息.故,LSTM 避免了部分信息的簡單重復覆蓋,能夠有效解決遞歸神經網絡容易梯度爆炸或消失的問題.LSTM 網絡結構如圖1所示.

圖1 LSTM神經網絡結構Fig.1 LSTM neural network structure
式中:式(1)為遺忘門的更新;式(2)為輸入門的更新;式(3)為狀態門的更新;式(4)為輸出門的更新;xt為輸入數據,如溫度、電壓、電流等;ft為遺忘門輸出;w、b為各層神經元的權系數,表示輸入層輸出;ct為卷積層輸出;ot為輸出層輸出;ht為最終輸出數據.
為了分析不同因素對電池儲能系統SOC 的影響,選取國內某儲能電站系統的總電壓、電流、絕緣電阻、平均電壓、平均溫度和累計充電電量6 個參量進行SOC 狀態估計(如圖2~圖7 所示),采樣間隔為1 min,時長為5 760 min.

圖2 總電壓Fig.2 Total voltage

圖3 電流Fig.3 Current

圖4 絕緣電阻Fig.4 Insulation resistance

圖5 平均電壓Fig.5 Average voltage

圖6 平均溫度Fig.6 Average temperature

圖7 累計充電電量Fig.7 Cumulative charge quantity
為了更好地利用神經網絡算法對SOC 進行估計,需對樣本數據進行預處理,以防止較大的梯度更新.本文采用離差標準化,將輸入和輸出數據進行線性變化,使其取值在[0,1]之間.
式中:s為某一輸入樣本;max(s)為輸入樣本的最大值;min(s)為輸入樣本的最小值;d為歸一化后數據值.
為了評價電池儲能系統SOC 的估計精度,采用均方根誤差(Root-Mean-Square Error,RMSE)進行表述,計算公式如下所示.
為了分析不同神經網絡算法對估計結果的影響,利用BP神經網絡、GRU神經網絡和LSTM神經網絡對電池儲能系統SOC 進行估計,采用前80%作為訓練數據,后20%作為測試數據.電池儲能系統的SOC 曲線如圖8 所示,利用6 個輸入參數估計的BP結果如圖9 所示,GRU 結果如圖10 所示,LSTM 結果如圖11所示.

圖8 電池儲能系統SOCFig.8 Battery energy storage system SOC

圖9 BP神經網絡估計結果Fig.9 BP neural network estimation results

圖10 GRU神經網絡估計結果Fig.10 GRU neural network estimation results

圖11 LSTM神經網絡估計結果Fig.11 LSTM neural network estimation results
表1 給出了3 種算法的RMSE 和計算時間,可以看出,LSTM 的RMSE 最小,為0.040 2;而BP 計算時間最短,僅需要2.12 s;GRU 的RMSE 和計算時間均處于中間值.因此,基于BP 和LSTM 各自的優勢,本文以兩者的融合方法進行電池儲能系統SOC 的估計.

表1 不同算法的估計結果Tab.1 Estimation results of different algorithms
為了分析不同因素對電池儲能系統SOC 估計的影響程度,本節分析總電壓、電流、絕緣電阻、平均電壓、平均溫度和累計充電電量6 個指標與SOC 的相關性.為了增強對比性,采用KL 散度、皮爾遜相關系數和灰色關聯度進行輸入指標與SOC 的相關性分析.
2.2.1 KL散度
KL(Kullback-Leibler)散度[18],也稱相對熵,能夠度量2個過程概率分布的差別.設p(x)、q(x)表示2個過程的概率,則KL距離為:
進而p(x)、q(x)之間的KL散度為:
KL 散度是對2 個過程概率分布夾角的度量,數值越大,說明差別越大;反之,越小;當2 類概率分布完全相同時,數值為0.
當求X={x1,x2,…,xn}和Y={y1,y2,…,yn}間的KL散度時,假定概率分布分別為p(x)、q(x).
首先,計算信號X的概率分布,本文采用非參數估計法求解概率分布:
式中:p(x)為核密度估計后的概率密度函數;h為給定的正數,稱為窗寬或平滑參數;K(·)為核函數,常用高斯核函數.
同理,可以得到Y的概率分布q(x).
將p(x)、q(x)代入式(7)求解X和Y的KL 距離(p,q)和(q,p),進一步利用式(8)計算出KL 散度值D(p,q).
利用KL 散度分析不同輸入(總電壓、電流、絕緣電阻、平均電壓、平均溫度、累計充電電量)和輸出SOC的關聯程度,如表2所示.總電壓的KL散度值最小,平均電壓的KL 散度值最大,即總電壓和SOC 的關聯程度最高,平均電壓和SOC 的關聯程度最低,關聯度重要性從高到低排序依次為總電壓->電流->累計充電電量->絕緣電阻->平均溫度->平均電壓.

表2 不同輸入參數和SOC的KL散度Tab.2 KL divergence for different input parameters and SOC
2.2.2 皮爾遜相關系數
皮爾遜相關系數[19]廣泛用于度量兩個變量之間的線性相關程度
當γ>0 時,表示兩變量正相關;γ<0 時,兩變量為負相關;當γ=0 時,表示兩變量無線性相關關系.當|γ|=1 時,表示兩變量為完全線性相關,即為函數關系;當0 <|γ|<1 時,表示兩變量存在一定程度的線性相關.且|γ|越接近1,兩變量線性關系越密切;|γ|越接近0,表示兩變量的線性相關越弱.
利用皮爾遜相關系數分析6 個輸入和輸出SOC的相關性,分析結果如表3 所示,其中平均電壓的皮爾遜相關系數絕對值最大,電流的最小,關聯度重要性從高到低依次為平均電壓->總電壓->平均溫度->累計充電電量->絕緣電阻->電流.

表3 不同輸入參數和SOC的皮爾遜相關系數Tab.3 Pearson correlation coefficients for different input parameters and SOC
2.2.3 灰色關聯度
灰色關聯度[20]通過分析不同曲線的幾何接近性評估它們之間的關系,接近性越高,說明相關性越緊密.
假定參考序列X0和比較序列Xk分別表示為:
式中:n為樣本數量;x0(n)和xk(n)均為樣本數據.
初始化X0和Xk,以減少參數在維度上的差異:
假定ξi(h) 為Y0和Yk在h時刻的灰色關聯系數,則:
式中:ρ為分辨系數,本文取0.5.故,Y0和Yk的灰色關聯度為:
式中:i=1,2,…,n;h=1,2,…,Q.
利用灰色關聯度分析6 個輸入和輸出SOC 的相關性,分析結果如表4 所示,其中總電壓和平均電壓的數值相同,且最大,電流的最小,關聯度重要性從高到低依次為平均電壓=總電壓->平均溫度->累計充電電量->絕緣電阻->電流.

表4 不同輸入參數和SOC的灰色關聯度Tab.4 Grey correlation for different input parameters and SOC
由于LSTM 對時序數據的估計精度較高,利用LSTM 進行電池儲能系統SOC 估計,在6 個輸入中,每次刪除一個輸入因素,分析不同因素缺失對電池儲能系統SOC 估計精度的影響,分析結果如表5 所示.在某一因素缺失的情況下,得到的RMSE 越大,說明該因素對SOC 估計精度影響越大,反之較小.由此可以獲得,不同因素的重要性從高到低排序依次為電流->總電壓->平均電壓->平均溫度->累計充電電量->絕緣電阻.

表5 LSTM估計結果Tab.5 LSTM estimation results
綜上所述,在進行影響因素重要性分析時,雖然KL 散度、皮爾遜相關系數和灰色關聯度均能夠一定程度上反映某個因素的重要程度,但還應以LSTM 等方法實際分析結果為主.本文數據中電流和總電壓刪除時,RMSE 相近且最大,而在電池儲能系統實際運行當中,電流和總電壓的變化也是系統電量變化的主要因素,所以兩者是電池儲能系統SOC 估計中的最關鍵因素.
目前,大多數神經網絡估計方法主要采用單一模型,在對不同研究主體進行分析時,很難一直保持良好的性能,為此,本文采用多種神經網絡融合方法進行電池儲能系統SOC 估計.首先,利用經驗模態分解算法將需要估計的數據進行多時間尺度分解,然后利用樣本熵進行復雜性分析,將復雜性相似的分量進行分類聚合,進而利用不同的神經網絡算法進行估計.
經驗模態分解(Empirical Mode Decomposition,EMD)算法[21]不需要預先定義基函數,只需根據信號自身的時間尺度特征進行分解,即可獲取局部化特征,非常適用于處理非線性非平穩隨機信號.
EMD將信號序列分解為一系列關于時間軸對稱的固有模態函數(Intrinsic Mode Function,IMF)ci(i=1,2,…,n)與剩余趨勢分量rn.IMF須滿足以下條件:1)在整個數據序列內,極值點與過零點個數相等或相差不超過1;2)在任一時間點上,局部均值為零.滿足以下要求之一即終止分解:1)ci或rn小于預定值;2)rn變為單調函數,不再能獲取固有模態函數.綜上,信號x(t)經EMD分解后的表達式為:
利用EMD 算法對圖8 中的SOC 曲線進行分解,分解后曲線如圖12 所示,共12 個IMF 分量和1 個殘余分量.從IMF1 到IMF12,頻率依次減小,殘余分量單調遞減.

圖12 IMF和殘余分量Fig.12 IMF and residual component
近似熵只需較少的數據就可以度量序列的復雜性,但由于存在固有的對自身數據段的比較,所以計算時會產生偏差,且其取值與數據長度有關,一致性較差.由此,精度更高的樣本熵[22]被提出,數據序列越復雜,樣本熵值就越大,反之,越小,原理如下:
假設時間序列{xi}為x(1),x(2),…,x(N)(N為數據量):
1)將序列{xi}按順序組成m維矢量,即X(i)=[x(i),x(i+1),…,x(i+m-1)],其中i=1,2,…,N-m+1.
2)定義X(i)與X(j)之間的距離dm(X(i),X(j))為兩者對應元素差值最大值:
對于每一個i值計算X(i)與其余矢量X(j)(j=1,2,…,N-m+1&j≠i)之間的dm(X(i),X(j)).
3)給定相似容限r(r>0),統計每一個i值dm(X(i),X(j)) <r的數量,然后計算其與距離總數N-m的比值,記為(r):
式中:j=1,2,…,N-m+1&j≠i;num為dm(X(i),X(j))<r數量.該過程定義為X(i)模板匹配過程;(r)表示任一個X(j)與模板的匹配概率.
5)增加維數為m+1,重復步驟1)~步驟3),則Bm+1(r)的平均值為:
由此可獲取樣本熵定義:
當N取有限值時,樣本熵估計值為:
樣本熵的取值與m、r有關,但其一致性較好,熵值的變化趨勢不受m和r的影響,本文取m=2,r=0.2SD(r一般為0.1~0.25SD,其中SD為時間序列的標準差).
利用樣本熵計算每一個IMF 分量的值,如圖13所示.隨著IMF 分量頻段頻率的降低,樣本熵數值大致呈逐漸降低趨勢,即隨著頻率的降低,數據的波動變小,復雜度降低,自相似度較好.IMF1~IMF5 具有較大的樣本熵值,在IMF5 與IMF6 之間樣本熵大幅度降低,IMF6~IMF12 具有較小的樣本熵值,且大致線性降低,數值均小于0.1;另外,求取樣本熵平均值為0.302 8,IMF1~IMF5的樣本熵值在平均值之上,而IMF6~IMF12 數值均在平均值之下.因此將SOC 曲線分為兩個頻段,高頻段由IMF1~IMF5 這5 個分量組成,低頻段由IMF6~IMF12 這7 個分量加殘余分量組成.高頻段如圖14所示,低頻段如圖15所示.

圖13 各IMF分量的樣本熵Fig.13 Sample entropy of each IMF component

圖14 高頻段Fig.14 High-frequency section

圖15 低頻段Fig.15 Low-frequency section
基于Thinkpad T14 的MatlabR2022a 軟件,利用BP 和LSTM 兩種策略分別對高、低頻段進行估計,估計結果如表6 所示.其中BP 的神經元數為5;LSTM最大輪數為1 500,最小批次為800,初始學習率為0.01,學習率折扣為0.8.BP 對高頻分量進行估計時,其精度大幅度提高,RMSE 僅為0.046 3;對低頻分量進行估計時,RMSE 為0.152 9;估計后的高頻分量和低頻分量進行重構,由于數據之間的互補性,重構后的RMSE 為0.144 2.由此可以看出分段估計的方式比直接估計的精度要高.基于LSTM 時,高低頻段的估計誤差和直接估計類似,但重構后,整體的估計精度有一定程度的提高.由此可見,SOC 分頻段后,每個頻段的規律性增強,采用相同神經網絡算法進行估計時,其精度會有一定程度的改善;再加上估計頻段重構后,其數據存在一定程度上的互補性,重構后的數據精度也會提高.

表6 不同算法的高低頻段估計結果Tab.6 High and low frequency band estimation results of different algorithms
為了進一步驗證分頻段估計的優勢,采用BP 對高頻分量進行估計,如圖16 所示;利用LSTM 對低頻分量進行估計,如圖17 所示;兩者組合估計后進行數據重構,如圖18 所示.從表7 可以看出,不同神經網絡相結合,也能夠提高SOC 估計的精度,因此,采用分頻段估計相比直接估計能夠提高SOC 的估計精確度;再者,從計算時間來看,BP 進行高頻估計耗時0.167 2 s,LSTM 進行低頻估計耗時235.18 s,兩者共耗時約為235.35 s,相比LSTM 不分頻估計時的373.75 s,節約37.03%的時間.

表7 組合算法估計結果Tab.7 Prediction results of combinatorial algorithm

圖17 基于LSTM的低頻分量估計結果Fig.17 Low frequency component estimation results based on LSTM

圖18 BP與LSTM組合估計結果Fig.18 Combined estimation results of BP and LSTM
針對電池儲能系統狀態精準估計問題,提出了基于深度學習融合的SOC 估計方法.首先,對比分析了BP、GRU 和LSTM 對電池儲能系統時序數據的估計效果;然后,利用KL 散度、皮爾遜相關系數和灰色關聯度分析不同輸入參數與SOC 的關系,三種相關性分析方法雖然各自能夠在一定程度上反映某個輸入參量的重要性,但在實際應用中還應以LSTM 估計的結果為準;再者,利用經驗模態分解算法將SOC 分解為多個IMF 分量,利用樣本熵將其分成高低兩個頻段,并應用BP 和LSTM 神經網絡算法對兩個頻段分別估計,融合算法比單一算法估計精度至少提升5%,比單一LSIM 算法計算時間節約37.03%,從而為電池儲能系統的規模化應用提供參考.