流形正則化框架下的極限學習機預測鋰電池SOC方法

2019-06-11 09:13:16談發明李秋燁趙俊杰

實驗室研究與探索 2019年5期

關鍵詞：模型

談發明，李秋燁，趙俊杰，王琪

(江蘇理工學院 a.信息中心；b.電氣信息工程學院，江蘇常州 213001)

0 引言

鋰電池管理系統優化控制的前提條件是要獲得電池荷電狀態(State of Charge,SOC)的精確值。根據當前的SOC值來估計鋰電池續航能力，以防鋰電池在使用過程中放電過度造成電池損害而導致危險情況發生。因此，如何精確預測鋰電池的SOC成為鋰電池管理系統的重點研究問題。

Huang等提出了基于單隱層前饋神經網絡的一種極限學習機(Extreme Learning Machine，ELM)學習算法，該算法隨機產生隱層輸入權值和偏置，整個過程一次完成，學習效率高，被廣泛應用于SOC預測所屬的回歸領域。文獻[1]中利用ELM針對磷酸鐵鋰電池建模預測SOC取得了較好的效果，并驗證了預測性能超越了神經網絡和支持向量機方法。文獻[2-4]中采用不同的啟發式搜索算法對ELM的輸入權值矩陣和隱層偏置量進行尋優，降低了隨機性給ELM帶來的影響，SOC預測精度較ELM直接建模有所提高。文獻[5-6]中為了提高ELM建立的SOC預測模型的擬合和泛化能力，采用貝葉斯方法優化ELM的輸出層權重，實驗結果驗證了其預測電池SOC方面應用的有效性。文獻[7]中提出基于核的ELM在線預測電池SOC，無需事先確定隱層網絡節點數量，使網絡輸出權值隨新樣本逐次加入遞推求解更新，提高了預測模型的泛化能力和在線學習效率。以上幾種方法中，ELM均基于經驗風險最小化原理，在鋰電池SOC建模預測實際應用時還是可能出現過度擬合問題。

本文提出了一種流形正則化框架下的極限學習機(Manifold Regularization Extreme Learning Machine，MRELM)建模預測鋰電池SOC的方法。首先，為了提高建立預測模型的泛化性能，克服ELM采用最小二乘法求解輸出層權值，隨機初始化隱層節點偏置與輸入層權值所導致的潛在過擬合問題，在流形正則化框架內針對極限學習機進行泛化性能方面的優化；其次，由于引入了流行正則化方法，導致存在正則化參數存在如何尋優的問題，通過差分進化(Differential Evolution，DE)優化算法尋優取得全局最優解。最后，通過采集的鋰電池的端電壓、電流、溫度、內阻以及SOC樣本數據進行實驗驗證，取得了很好的應用效果。

1 ELM建立預測鋰電池SOC模型

對于離線采集到的任意N組鋰電池訓練樣本數據集{(xi,yi)}i=1,2,…,N，其中:xi=[xi1,xi2,xi3,xi4]為輸入訓練樣本的端電壓、電流、溫度及內阻數據；yi為標簽樣本的SOC數據。對于含有l個隱層節點的ELM，回歸模型定義為：

(1)

式中：ωi=[ωi1,ωi2,ωi3,ωi4]T是連接輸入節點和第i個隱含層節點之間的權值；bi為第i個隱層節點偏移量；g(ωi,bi,xi)為激活函數；βi為第i個隱層節點輸出權值。

據此可得到根據ELM回歸模型建立的電池的預測模型結構如圖1所示。

將式(1)以矩陣形式表示為：

Hβ=Y

(2)

式中：Y為位置期望輸出矩陣；β為輸出權值矩陣；H為隱含層輸出矩陣,

圖1 ELM預測SOC模型結構

(3)

ELM學習過程關鍵在于計算輸出層的權值矩陣β，利用最小二乘法求解式(2)可得

β=H+Y

(4)

式中，H+是矩陣H的Moore-Penrose廣義逆。

使用ELM建立鋰電池SOC預測模型存在以下兩點問題：

(1)ELM沒有能權衡好經驗風險和結構風險[8]，未考慮結構化風險，因此容易導致過度擬合問題，泛化性能變差；

(2)輸入的鋰電池數據樣本在ELM特征空間中分布存在一定的隨機性，無法直接用最小二乘法求解和恢復這種非線性幾何結構[9]。

2 流形正則化框架分析

流形正則化使數據在新的決策空間中能夠保持數據在原有特征空間中的局部幾何結構，即如果某2個單樣本點在原特征空間中的相似度很大，則它們在新的投影空間中的距離應該很近[10-11]。假設2個點xi和xj在相同的局部鄰域，那么其條件概率P(y|xi)和P(y|xj)也應該相似。由于條件概率不便于計算，因此，本文采用數據樣本的預測誤差加權平方和近似，據此可定義流行正則化框架內提出的最小化成本函數：

(5)

式中：yi和yj分別是樣本xi和xj的輸出預測值；wij為相本點xi和xj之間的邊權值矩陣，表示2個點的相似程度。采用公知的K近鄰方法,即通過計算歐式距離方式找到與樣本點xi距離最近的k個樣本,將這k個樣本定義為xi的鄰居。本文引入高斯核函數計算各點與xi的相似度,該策略可以很好地反映樣本空間的流形，以提高預測精度[12]，具體如下式所示：

wij=

(6)

式中:ρ為寬度參數；e(xi，xj)=1表示xi和xj互為鄰居關系；C(xi)=C(xj)表示xi和xj屬于同一類別。通過上述方法，可得到相似度矩陣

(7)

根據流行正則化理論，最小化式(5)中的最小成本函數，即相當于最小化如下目標函數:

min:tr(YTLY)

(8)

3 流形正則化框架下優化ELM

流形正則化框架下優化ELM以特征空間作為出發點，通過流形學習挖掘高維空間的數據幾何結構，在ELM算法中引入流形正則化項，約束輸出模型的幾何形狀，能有效解決模型高復雜度引起的泛化性能下降問題[13]。將式(8)引入到ELM目標函數中,則構成了流形正則框下的極限學習機學習方法，MRELM的目標函數如下所示：

(9)

式中:L是由在ELM特征空間中的樣本求得；正則化參數C1用來平衡ELM的經驗風驗和結構風險；C2為流形正則化結構中的正則化參數，其對應目標函數中第3項的主要作用在于使ELM 特征空間中相似度較大的數據在決策空間中的距離較小，即在決策空間中保持數據在原 ELM 特征空間中的幾何結構性質。將約束項代入目標函數,上式可以表示為如下形式：

(10)

流形正則化框架下優化極限學習機不僅考慮了數據的結構特性，而且折中了經驗風險和結構風險[14]。進一步對矩陣β求導為零可得：

β=(HTH+C1I+C2HTLH)+HTT

(11)

此解不但可以達到最小訓練誤差，同時對野值有一定的抗干擾能力，具有相當高效的泛化能力。總結MRELM算法實現步驟具體描述如下：

輸入N個采集到的鋰電池訓練樣本數據集{(xi,yi)}。

輸出隱層節點的輸出矩陣β。① 使用K近鄰法計算單個樣本與相鄰相本距離，計算相似度，構建相似度矩陣W；② 計算圖拉普拉斯陣L；③ 設置ELM隱層節點數，激活函數形式、極值及偏置;④ 計算隱層輸出矩陣H;⑤ 計算隱層和輸出層之間的權值矩陣β。

4 利用DE算法尋優MRELM正則化參數

DE算法是一種高效的全局優化算法，它是基于群體的啟發式搜索算法，群中的每個個體對應一個相應的解向量[3]。利用DE算法優化MRELM模型正則化參數C1和C2，以采集的鋰電池樣本數據作為訓練樣本，具體迭代步驟如下：

步驟1初始化交叉概率CR、搜索維數D、縮放因子F以及種群數量，種群初值通過以下式子來進行初始化：

xi=xmin+rand (xmax-xmin)

(12)

式中：xmin、xmax是其某一維的取值邊界；rand為(0,1)之間的隨機數。

步驟2父代個體間選擇兩個個體進行向量做差生成差分矢量，然后，選擇另外一個個體與差分矢量求和生成實驗個體，完成變異操作。縮放因子F主要影響算法的全局尋優能力。F越小，算法對局部的搜索能力更好；F越大算法越能跳出局部極小點，但是收斂速度會變慢。

步驟3選擇好交叉概率CR，將變異向量與目標向量進行交叉操作得到最新的實驗向量ui。CR主要反映的是在交叉的過程中，子代與父代、中間變異體之間交換信息量的大小程度。CR的值越大，信息量交換的程度越大。

步驟4DE采用貪婪選擇的策略，選擇較優的個體作為新的個體，選擇過程分2種情況：

① 如果f(ui)

② 如果f(ui)>f(xi)，則xi+1=xi，

(13)

5 實驗與分析

5.1 樣本數據采集分析

實驗樣本數據的獲取采用多物理場仿真軟件COMSOL對石墨/LMO鋰電池采用電化學方程模型建模仿真得到。電池內部模型域構成主要為：負多孔電極采用石墨(MCMB LixC6)活性材料和電子導體；正多孔電極采用LMO(LiMn2O4)活性材料、電子導體及填料；電解質采用1.0 mol/L LiPF6 in EC:DEC(質量比為1∶1)。實驗鋰電池對象組件的電壓約4 V，模擬測試工況為油電混動汽車駕駛循環。

以1 Hz的頻率采集測試過程中鋰電池的端電壓、電流、溫度、極化內阻及SOC數據，共獲取601組樣本數據，采集數據建模輸入樣本信息如圖2所示。

(a) 電壓樣本(b) 電流樣本

圖2 鋰電池樣本數據

圖2(a)為鋰電池端電壓；圖2(b)為鋰電池在測試工況條件下的樣本電流數據，設定負載放電倍率為20C(1C=12 A)。由于模擬測試工況存在再生制動過程，會導致圖3中的SOC變化時而呈現出增加趨勢波動，對應電池電流的負值部分，符合實際應用情況；圖2(c)表示電池表面溫度隨著電池的使用緩慢上升狀態，溫度的變化對鋰電池內阻的影響也較大。圖2(d)中的電池極化內阻變化劇烈，說明電池內部極化和濃差反應較強。由圖3可知，鋰電池在使用過程中SOC整體趨勢呈緩慢下降態勢。

圖3 鋰電池SOC變化曲線

5.2 建模性能測試分析

從驗證有效性的角度出發檢驗算法建立預測模型的泛化性能。在實驗獲得樣本數據中選取奇數項數據用于訓練建模;偶數項數據用于對所建預測模型的測試。系統運行軟件條件為Matlab 2016b，硬件條件為Core i3二代處理器和8GB DDR3內存的臺式電腦。

由于鋰電池電壓、電流、溫度及內阻在采集時使用不同的單位，表示含義不一，在數量級上存在很大的差別，影響算法收斂速度和精度。在訓練模型之前，本文采用0均值標準化方法將這些數據處理為歸一化為[0,1]范圍內的新數據，去掉量綱，使指標之間更具可比性[15]。

DE-MRELM算法中除正則化參數外的其他參數設置如下：

(1)MRELM部分。隱層節點個數l=30，激活函數采用Sigmod函數形式，K近鄰法最近鄰數k=12，高斯核函數寬度參數ρ=1；

(2)DE部分。種群規模N=30，搜索維數D=2，迭代次數tmax=200、交叉概率CR=0.2，縮放因子F=0.5，待尋優的正則化參數C1和C2的取值范圍為[0.01,1 500]。圖4進化曲線說明利用DE算法優化MRELM的正則化參數，不僅收斂速度快，而且精度高。采用這種方式尋優正則化參數的最終結果為C1=767.4及C2=1 024。

圖4 目標函數值進化曲線

為了說明MRELM建立預測模型的性能優勢，利用MRELM、ELM以及最小二乘支持向量機(Least Squares Support Vector Machine，LSSVM)3種方法在相同樣本數據條件下建立預測模型進行測試效果比較。ELM和MRELM公共部分參數設置相同；LSSVM的核函數形式選擇RBF，采用DE算法尋優LSSVM正則化參數和核函數參數，其對應值分別為0.1和99.76；3種方法的測試結果如圖5所示。

圖5中3種方法預測值和真實值的咬合度都比較緊密，收斂精度較高。但ELM建立的預測模型在多個測試點出現過擬合的現象，泛化性能不足。LSSVM建立的預測模型在精度方面和MRELM對比還是有所欠缺，MRELM方法在鋰電池能量回饋較多的區域，仍然能夠保持較強的跟蹤響應速度和精度，總體性能最優。由圖6可見，應用MRELM算法預測準確度最高，誤差小，誤差分布均勻密集。

圖5 建模預測結果比較

圖6 預測結果誤差比較

為了進一步評價3種算法的優劣，利用訓練時間和預測結果的絕對誤差及相對誤差作為衡量標準，絕對誤差EA和相對誤差ER的定義如下：

(13)

誤差結果如表1所示。

表1 不同方法的性能比較

從表1的性能比較結果可以看出，MRELM建立的預測模型精度最高，但訓練時間稍長，其主要原因就是在于訓練前需要對樣本數據進行特征空間映射，建立圖拉普拉斯矩陣花費了較多的時間。總體而言，應用MRELM方法建立鋰電池SOC預測模型性能更加優越。

6 結論

(1)分析了ELM算法建立鋰電池SOC預測模型的方法，并指出其建立模型存在的缺陷。

(2)引入流形正則化框架結構優化ELM構成MRELM，并用DE算法尋優MRELM的正則化參數，能有效提高所建模型預測鋰電池SOC的精度和泛化能力，給出了方法具體的實現步驟。

(3)采集鋰電池的實驗樣本數據，利用MRELM、ELM以及LSSVM 3種方法建立預測模型進行測試比較，實驗結果表示MRELM算法建立的模型性能占優，有很好的推廣應用價值。