宋汶秦,王海亮,趙春娟,王興貴
(1.國網甘肅省電力公司經濟技術研究院,甘肅蘭州 730000;2.蘭州理工大學電氣工程與信息工程學院,甘肅蘭州 730050)
隨著能源緊張與環境惡化,研究并利用電動汽車相關技術,推進該產業發展已成為全國汽車行業互相競爭的新焦點[1]。電動汽車的動力電池在使用一段時間后需要進行退役處理,并更換新電池以保證電動汽車的運行安全性與續航能力[2]。《節能與新能源汽車產業發展規劃(2012—2020 年)》中指出:電動汽車的供應量仍將保持增加趨勢,由此產生的能源缺乏和環境污染問題將更加嚴峻[3]。如果退役動力電池處理不當,將會對環境造成嚴重污染。國務院辦公廳印發的《新能源汽車產業發展規劃(2021—2035 年)》專欄3《建設動力電池高效循環利用體系》中明確指出:支持電動汽車動力電池梯次產品在儲能、備能等領域創新應用,加強余能檢測、殘值評估、重組利用、安全管理等技術的研發[4]。
退役的動力電池仍有80%的儲能價值可以利用[5]。綠色和平、中華環保聯合會共同發布《為資源續航:2030 年新能源汽車電池循環經濟潛力研究報告》中指出:在國內,若80%的退役動力電池被梯次利用市場所吸納,到2030 年退役電池總價值將接近430 億人民幣,這可以給動力電池回收再利用產業鏈帶來更多的機遇[6]。因此,若將其直接進行報廢處理,必然會造成極大的能量浪費。為充分利用電動汽車退役動力電池的剩余價值,可將其應用于電網儲能電站、新能源發電、低速電動汽車、光伏路燈等不同領域,實現梯次利用[7]。動力電池在電動汽車中使用一定時間后,其外觀、容量、內阻等方面會表現出較大的不一致性。如果在梯次利用前對其不進行分類,勢必會造成能源的浪費、電池的過充及過放甚至爆炸等危險。因此,對退役動力電池在梯次利用前進行等級篩選具有重要的意義。目前,傳統的篩選技術主要采用充滿-放空(full charge-discharge,FCD)方法,該方法篩選效率較低。有學者通過對比單體電池充放電曲線的緊密程度來判斷其性能的近似程度,以提高電池篩選的一致性[8]。為改善分選的不一致性,常用的方法還包括支持向量機、神經網絡、模糊C均值及改進k-means 聚類等方法[9]。
以智能算法為基礎的等級篩選方法可以解決大范圍退役動力電池的分類。本文研究一種基于改進C4.5 算法的退役動力電池等級篩選方法。首先,根據退役動力電池的梯次應用場合確定等級類型并將其作為篩選決策樹的葉子節點;然后,結合對數函數的麥克勞林展開式對特征屬性的信息增益率計算過程進行簡化;最后,構建退役電池等級篩選決策樹,并通過實例仿真對傳統C4.5 算法及其改進算法在退役電池等級篩選中應用的精確性與執行效率進行對比分析。
決策樹(decision tree)是通過一組或多組無規則、無順序的實例數據來推理、歸納出分類規則的一種機器學習分類算法模型[10]。決策樹中包含根節點、葉子節點和非葉節點。根節點是樹最頂層的節點;葉子節點代表類別;非葉子節點代表一個或多個特征屬性,用于確定數據樣本的分支[11]。
ID3 算法是決策樹中較為常用的算法,該算法以信息增益為準則對最優屬性進行劃分[12]。但是,該算法存在對可取值數據較多的屬性有所偏好的問題。為解決該問題,有學者以ID3 算法為基礎,提出了C4.5 算法[13]。該算法在確定決策樹內部分支特征屬性時用信息增益率取代傳統的信息增益,在等級分揀過程中,具有規則通俗易懂,精確率較高的優點[14]。C4.5 算法流程如圖1 所示。

圖1 算法流程圖
在建立基于C4.5 決策樹算法的退役動力電池等級篩選模型時,需要通過大量對數運算得到各屬性的信息增益率以判斷最優的分支。這很大程度上削減了算法的運行速度,降低了執行效率。
針對該問題,在計算過程中引入對數函數的Maclaurin 展開式對其進行簡化。ln(x+1)的麥克勞林展開式如式(1):

以改進C4.5 決策樹算法在電動汽車退役動力電池等級篩選中的應用研究為例進行概述。假設退役動力電池數據樣本集S的容量大小為D。等級類型用Ck(1 ≤k≤n)表示,n為類型的個數,則該數據樣本分類的信息熵為:

式中:D(Ck)為數據集S中屬于類型Ck的容量大小;pk(Ck)為第k個類別Ck在數據集S中出現的概率。
令pk(Ck) -1=P,結合式(1),數據集S的信息熵為:

設退役動力電池特征屬性Ai(1 ≤i≤M)有M個不同的取值,根據屬性Ai將S進行狀態劃分Ai_j(j=1,2,...,N)。特征屬性Ai的狀態子集信息熵為:
由式(4)減去式(5),可以獲得各特征屬性Ai的信息增益量:

特征屬性Ai的固有值,即分類信息為:

從式(8)可以得出,特征屬性Ai劃分的狀態越多,其固有值越大。由式(7)和(8)可得到特征屬性Ai的信息增益率:

各屬性Ai的重要程度用信息增益率GR(S,Ai)來衡量,而且Ai的重要程度與“信息增益率”成正比,并選擇GR(S,Ai)大的Ai作為決策樹的分裂屬性。
以退役動力電池訓練數據集S作為樣本集,在該樣本集不斷分裂形成退役動力電池等級分類決策樹的同時,計算各特征屬性的信息增益率,并選擇信息增益率大的退役電池屬性作為分枝節點。如此重復,可將退役動力電池樣本集S分成n個樣本子集。若樣本子集的退役動力電池類別相同時,當前節點作為等級篩選決策樹的葉子節點,分裂結束;若退役動力電池的樣本子集中還存在不同的類別,則再次使用上述方法依次遞歸生成等級篩選決策樹,直到所有退役動力電池的樣本子集中包含的元素均屬于同一個類別為止。算法的具體步驟如下:
輸入:退役動力電池數據訓練樣本集S,退役動力電池特征屬性集合Ai_list,決策特征屬性Ai。
輸出:退役動力電池分類決策樹。
(1)以退役動力電池分類決策樹樣本集合S作為根節點N,創建等級分類決策樹。
(2)若退役動力電池屬性集S中所有的樣本屬于同一等級,則N為葉子節點,并標記等級Ck;否則,轉步驟(3)。
(3)判斷退役動力電池特征屬性集合A_list 是否為空;如果A_list 為空,記節點N為退役動力電池訓練樣本S中含樣本數量最多的類別Ck;若A_list 不為空,則轉步驟(4)。
(4)采用改進C4.5 信息增益率方法計算屬性列表A_list 中各特征屬性Ai的信息增益率GR(S,Ai)。將GR(S,Ai)最大的Ai作為分割特征屬性,并標記節點。根據該分割屬性的狀態劃分Ai_j,確定訓練子集Ai_list,然后建立分支。
(5)重復步驟(2)~(4),對所劃分的樣本子集生成新的退役動力電池特征屬性決策分支,直到所有子集劃分完為止。具體流程如圖2 所示。

圖2 退役動力電池等級篩選流程圖
為得到一個合適的等級篩選模型,在具體訓練過程中,采用K折交叉驗證法(K-fold cross validation,K-CV)對所建篩選模型進行優化。將S中(K-1)個子集作為訓練集,剩余1個作為測試集。該方法可使每個樣本有均等的概率被用于訓練和驗證,在一定程度上能提升模型的泛化能力。
以電動汽車退役鋰電池為研究對象進行分析。根據退役動力電池的性能指標,本文選擇外觀特性A1、電池容量A2、電池內阻A3作為決策樹的特征屬性,即M=3。各特征屬性的狀態劃分如表1 所示。

表1 各特征屬性Ai 及狀態劃分Ai_j
根據退役動力電池的梯次利用范圍將其等級劃分為4類,如表2 所示。使屬于等級1 的退役動力電池應用于電網儲能電站或新能源發電;屬于等級2 的退役電池應用于家庭能源、路燈等場合;對屬于等級3、等級4 的退役電池修復后再次利用或者進行回收處理。

表2 等級劃分Ck及梯次使用范圍
采用改進的C4.5 算法訓練退役動力電池篩選決策樹時,典型數據集S中有240 個樣本,隨機選取其中200 個作為訓練樣本,40 個作為測試樣本。采用改進的C4.5 算法訓練退役動力電池篩選決策樹。在訓練過程中,采用K-CV 分析葉子節點Ck含有最小樣本數對篩選決策樹性能的影響,以對其進行優化,仿真結果如圖3 所示。

圖3 葉子節點含最小樣本數對其性能的影響
由圖可知,葉子節點含有最小樣本數為12 時,交叉驗證誤差最小,故選擇minleaf 為12。通過優化得到的退役電池等級篩選決策樹如圖4 所示。由測試集對圖4 中等級篩選決策樹進行驗證,得到等級1、等級2、等級3、等級4 的準確率分別為91.11%、100%、96.92%、90.625%。由此可知,其準確率較高。

圖4 退役動力電池等級篩選決策樹
為進一步驗證其準確性,在退役動力電池數據集S相同的情況下,分別對傳統C4.5 算法與其改進算法的精確性和執行效率進行了對比分析,結果如圖5 所示。
由圖5 可知,相較于傳統的C4.5 算法,采用改進的C4.5算法進行退役動力電池等級篩選時,算法執行效率較高。而且,改進C4.5 算法在提高算法執行時間的同時對篩選決策樹等級分類的準確性影響較小。

圖5 傳統C4.5與其改進算法對比示意圖
為實現退役動力電池的梯次合理利用,本文研究了基于改進C4.5 決策樹算法的退役動力電池等級篩選方法。以退役動力鋰電池的數據集對該方法的精確性和有效性進行了驗證。主要有以下特點:
(1)在訓練退役動力電池決策樹過程中,采用K-CV 法分析了退役動力電池決策樹葉子節點Ck含有的最小樣本數對其性能的影響,選取交叉驗證誤差最小時minleaf 的值對等級篩選決策樹進行了優化。
(2)針對退役動力電池特征屬性的信息增益率GR(D,Ai)計算中涉及到較多對數運算的問題,采用對數函數的麥克勞林展開式對GR(D,Ai)進行了化簡,降低了算法執行時間。仿真結果表明,該方法在提高等級篩選決策樹運行效率的同時對其分類結果的精確性影響較小。
(3)本文可作為后續退役動力電池重組的研究基礎。