黃彧,王占國,張言茹 ,王瑞,張維戈
(1.北京交通大學 電氣工程學院,北京 100044; 2.國家能源主動配電網技術研發中心,北京 100044)
產生動力電池不一致性的主要原因有兩方面[1-3],首先是在生產過程中,由于生產條件和工藝等因素,通過配料、涂膜、裝配、化成等步驟,成批次生產的單體電池本身在尺寸、微孔率等方面具有不一致性;其次在單體電池成組后,由于其在成組中位置分布不同導致散熱率等環境因素不同,會在運行使用過程中對單體電池的性能變化產生不同的影響,從而進一步加速成組電池不一致性的發展[4]。
電池不一致性受多方面因素影響,包括容量、內阻、自放電率等。電池包的容量變化服從木桶效應,由容量最低的單體決定,容量不一致性越大對成組影響越嚴重。在車輛行駛過程中,需定時對車輛一致性進行檢測,便于發現危險單體及早排除,改善一致性以實現機動車使用價值最大化[5-7]。
關于電池組一致性的衡量和辨識方式,現有研究較為豐富。按照研究內容分類,主要分為對內特性參數和外特性參數的研究。其中內特性參數包括內阻、容量、電化學阻抗譜、極化電壓;外特性參數包括充放電電壓分布、充放電電壓序列、SOC(State of Charge;電池可用容量和額定容量的百分比)、OCV(Open-circuit Voltage)曲線等。在基于不同參數的一致性辨識方法中,使用內特性參數的方法涉及測量過程一般較復雜,耗時與計算量相對較多,更能代表電池內部特性;使用外特性參數的方法,一般參數測量較簡單,可在一定程度上描述電池組一致性狀態[8-13]。
按照研究方法分類,對一致性的評估辨識方法包括測量分析方法、統計分析方法、數據聚類分簇方法、神經網絡法等等。基于測量、統計的一致性辨識方法結果與參數測量精度、參與辨識參數類型、分類標準與閾值緊密相關,評選標準確定后,辨識結果是固定的;在使用聚類、神經網絡的辨識方法中,選用模型與訓練參數輸入會對辨識結果造成較大影響,辨識能力會隨著訓練數據的變化和學習模型的自我修正而不斷變化[14-20]。
容量偏低單體在放電過程中比其他單體電壓降低更快,在充電過程中電壓上升更快,即電量更易耗盡和更易充滿。容量偏低單體電壓在充電過程的表現為:充電前期在整組中偏低,在充電過程中其電壓快速提升,在充電后期其電壓在整組中偏高。充電過程中容量偏低單體相較整組的變化趨勢可參考圖1,其中黑色粗曲線為容量偏低單體。

圖1 容量異常單體在電池組表現
電池的極化電阻在充電過程中不易直接得出,但其歐姆電阻可通過電池上電過程中的電壓差值近似計算得到。在電池組上電的短時間內電壓差變化較大的單體,其對應內阻較大。內阻偏大單體在上電期間電壓的變化趨勢如圖2所示,其中黑色粗曲線為內阻偏大單體。

圖2 內阻異常單體在上電區間表現
鋰電池放電曲線為非線性,SOC會受駕駛習慣,環境溫度等多種復雜條件影響,其測量也必須經過一些其他物理量的測量,基于相關電路模型或數學工具借助復雜算法得到。但SOC偏移單體在整組電池中的表現是可直觀觀察到的,如圖3,其中黑色粗曲線為SOC偏高單體。

圖3 SOC異常單體在電池組表現
離群點檢測發展至今,已廣泛運用于多個社會領域,例如:數據庫異常分析、生產監測、故障診斷等;其算法理論研究也相當豐富,較為主流的檢測方法包括:基于統計的離群點檢測、基于距離的離群點檢測、基于聚類的離群點檢測、基于分類的離群點檢測、基于密度的離群點檢測[21-22]。
(1)基于統計的離群點檢測
離群點檢測最早出現在統計領域。基于分布的方法是由已知數據特性假設給定的數據集符合某種概率分布模型,或從已知的數據集中尋找其符合的概率分布模型, 然后使用這個模型來對數據進行匹配,與分布模型不匹配的數據點被識別成為離群點。
其經典檢測方法為基于正態分布的離群點檢測方法。

(2)基于距離的離群點檢測
E.Knorr和R.Ng在眾多研究成果的基礎上最先給出了基于距離的離群點檢測的定義:如果對象O在數據集N中有大于P部分的對象與它的距離都大于D,那么就將對象O稱為數據集N上的DB(P,D)離群點。該定義中參數P代表的是與數據點O的距離大于D的所有數據點占數據集總數的比例的最小值。
基于k鄰居距離來判斷是否離群還有幾種經典算法:
Top-n-Outlier:如果一個數據集具有N個對象,給定對象離群程度的計算公式,計算每個對象的離群得分,離群得分最高的n個對象就是所求離群點。
Top-n Dk-Outlier:數據集O中那些到其第k個最近鄰居的距離Dk最大的n個對象就是離群點。
Top-n wk-Outlier: 數據集O中那些與其k個最近鄰居的距離之和wk最大的n個對象就是離群點。
這些基于距離的離群點方法比較簡單,但對參數選取比較敏感,算法時間復雜度較高。由于高維空間數據的高度稀疏性使得數據點之間幾乎是等距離的,其不適用于高維數據集。
(3)基于聚類的離群點檢測
其核心思想為:如果一個對象不屬于任何簇,則該對象是基于聚類的離群點。
基于聚類離群點挖掘的主要優點是:
1)由于對聚類的研究成果比對離群點的研究成果更多,而且有些聚類技術(如k均值)的時間和空間復雜度是線性或接近線性的,因而基于這種算法的離群點檢測技術是可行和高度有效的;
2)簇的定義通常是離群點的補集,因此可同時發現簇和離群點。
其主要缺點是:
1)聚類算法的主要目標是發現簇,而不是發現離群點,因此對離群點的挖掘效率較低;
2)在聚類過程中,為了避免離群點對聚類的影響,不同算法采用了適合特定數據類型的方法,因此算法的針對性很強,必須小心地選擇聚類算法;
3)基于聚類的離群點挖掘算法依賴于所有簇的個數和數據中離群點的存在性。
現有的動力電池故障預警研究中已使用了離群點相關的概念,在搭建的動力電池狀態參數檢測系統中,借由容量增量分析法中得到的代表電池特性的特征參數進行離群點檢測,篩選有異常離群現象的單體電池[23-24]。
在動力電池性能研究中,容量增量分析法(Incremental Capacity Analysis,ICA)為現行使用較為廣泛的一種研究方法。其借助電池容量增量曲線(IC曲線),如圖4所示,將電池平臺區內的細微變化反映出來。在圖4(a)中可觀察到,鋰電池平臺期變化緩慢且占據容量增加過程的主要區間,該過程是富鋰相和貧鋰相兩相共存狀態的反映,是鋰電池內部特性的主要體現;具體地,在三元鋰離子電池的整個充電過程中,正極的反應過程主要為鎳離子(Ni+)由二價離子(Ni2+)轉化為三價離子(Ni3+),和三價離子(Ni3+)轉化為四價離子(Ni4+)這兩個反應;而負極反應過程為石墨(碳)的五個狀態(C6、C12、C18、C36、C72)之間的四次相變。

圖4 鋰離子電池電壓曲線和容量增量曲線
從圖4(b)可得到,在平臺期對應的電壓區間,通過容量增量處理,可明顯觀察到兩個IC峰的形成,IC峰的峰值、位置、寬度、包含面積等都與鋰電池內部特性相關聯,可對應相關鋰電池的容量、內阻等重要性能參數。
現有的電池故障預警模型在已知IC曲線中的特征參數中選取相關系數不大的主峰峰值、主峰位置作為特征信息,基于正常電池衰退過程的特征信息分布軌跡散點圖,劃定鋰電池帶狀安全區域,在動力電池特征信息位置超出安全區域時提出故障預警。其中電池安全區域位置的確定和區域面積的劃分,使用的便是基于正態分布的離群點檢測原理。此方法可在一定程度上有效預警電池故障,但其需要大量的電池充電實驗得到電池的安全運行區間帶,在檢測時為得到電池的IC曲線需要經過大量濾波工作,會耗費大量計算資源及一定的計算等待時間。
現有電池一致性辨識多為單項性能參數測量,需要實驗室或電池廠測試條件,且測試時間較長。
例如電池容量以安時數衡量,目前較為準確的電池容量測試需要采用小倍率充放電測試,一輛70 A·h的電動汽車以5 A的小電流充電要耗時14 h才能完成一次測試,耗時較長。
鋰電池電阻主要包括歐姆電阻和極化電阻,歐姆內阻對于具體某個電池來講,是個相對固定值,而極化內阻與正負極材料和電解液的濃度、電池充放電電流大小和環境溫度等有關。其準確值需要通過HPPC測試實驗,實驗需對電池進行多次大電流放電,其中需要數小時的靜置時間。
評價一組電池的SOC偏移情況,可在首支單體充電達到電壓上限后(即100%SOC),計算其余單體所在的SOC狀態。涉及單體容量和已充電量,一般借助復雜數學工具計算完成,同樣需要大量測試時間與較高的儀器測量精度。
故上述方式不適用于在役車輛電池組,不能滿足日常一致性辨識需求,下文提出的動力電池一致性快速辨識方法,基于動力電池1 C充電倍率下的的充電數據,僅需一小時左右的時間,對電池組進行充電操作,即可完成對數項電池參數一致性的辨識,測試流程簡單,計算量小,測試時間與計算時間都相對較少。
基于上文對離群點檢測算法的研究,本文選用基于統計分析的離群點檢測算法,在使用算法前,對動力電池電壓數據分布的正態性進行驗證。
動力電池成組采用同一批次的電池,生產條件統一,電池性能表現近似正態分布,推測電池組在某一時刻的單體電壓服從正態分布。其正態性可從電壓分布圖大致觀察得出,圖5為某組電池在充電過程中某時刻對應的單體電壓分布圖,從圖中觀察各時間點的單體電壓分布近似于正態分布的鐘型,數據分布對稱性較好。為了更加科學地確定電池組單體電壓分布的正態性,文中選用經典的偏度-峰度檢驗法對其進行檢驗。

圖5 瞬時單體電壓分布
峰度(kurtosis)又稱峰態系數。表征概率密度分布曲線在平均值處峰值高低的特征數。直觀看來,峰度反映了峰部的尖度。隨機變量的峰度計算方法為:隨機變量的四階中心矩與方差平方的比值,如式(1)所示:
(1)
峰度包括正態分布(峰度值=3),厚尾(峰度值>3),瘦尾(峰度值<3)。
偏度(Skewness),是統計數據分布偏斜方向和程度的度量,是統計數據分布非對稱程度的數字特征。定義上偏度是樣本的三階標準化矩,見式(2):
(2)
偏度定義中包括正態分布(偏度=0),右偏分布(也叫正偏分布,其偏度>0)和左偏分布(也叫負偏分布,其偏度<0)。
一般峰度絕對值小于10并且偏度絕對值小于3,則說明數據雖然不是絕對正態,但基本可接受為正態分布。
文中使用SPSSAU在線數據分析軟件實現偏度-峰度檢驗。將某組電池充電時長五等分,將均分后對應的5個時間點所在的85支單體的電壓數據進行計算,計算結果如表1所示。從表中數據可得,充電過程中某一時刻對應的單體電壓分布可近似服從正態分布。

表1 正態性檢驗結果
動力電池組一致性快速辨識方法主要分為兩步,第一步:基于統計分布的離群點檢測方法,分辨出電池組內存在離群現象的電池單體;第二步:結合上文對各類問題單體在整組中電壓表現的分析,對離群單體存在性能極端表現的原因進行識別。
(1)基于正態分布的電池極端情況標記
由于在車輛充電過程中,整組電池單體電壓的分布情況是一個動態變化的過程,故經對電壓變化快慢和計算量的綜合考慮,選定時間間隔5 s,對整組單體的電壓分布情況進行周期性正態擬合。
對于擬合結果中處于整體兩端的單體,根據分布概率將其極端程度量化。如圖6所示,當單體的電壓值處于整體的80%區間內時,認為該單體此時刻處于較為正常的狀態內,賦予其極端值為0;當某單體處于正態分布概率小于10%的區間時,賦予其極端值m1;當某單體處于正態分布概率小于5%的區間時,賦予其極端值m2。

圖6 正態分布統計
為了給下文具體性能辨識做準備,從時間(充電前、充電中、充電后)和正態分布(高端、低端)兩個維度劃分6個區間,如圖7所示,分區間記錄單體極端偏移情況,其中上電時刻為t1,下電時刻為t2。

圖7 二維區間劃分
隨著充電過程中每次擬合,每個單體由擬合得到的極端值也被隨之累加。對于每支單體而言,其極端程度的分區間積分過程可聯系式(3)理解。
(3)
式中T1為充電前時間序列[1,1,…,1],設充電開始前共進行了n1次擬合(n1=t1/5),其為1×n1的全1矩陣;T2為充電中時間序 [1,1,…,1],設充電開始至充電結束共進行了n2次擬合(n2=(t2-t1)/5),其為1×n2的全1矩陣;T3為充電后時間序列[1,1,…,1],設充電結束后共進行了n3次擬合,其為1×n3的全1矩陣;L為低端極端值序列[l1,l2,…,ln]T,n為n1、n2、n3之和,l的取值為0,m1或m2;H為高端極端值序列[h1,h2,…,hn]T,n為n1、n2、n3之和,h的取值為0,m1或m2。
每次擬合并更新其區間累積分值矩陣后,都會對每區間分值是否超過閾值進行判斷,若超過則對該單體進行相應的區間標記。用“A+”、“A-”、“B+”、“B-”、“C+”、“C-”符號,按照時間發生順序,對單體在全充電過程中存在的電壓分布極端情況進行標記。各區間閾值范設定如表2所示。由于容量偏低單體在充電前期電壓偏低時間較短,故此情況下可適當降低閾值要求。
將極端分布情況賦值、累計、并設閾值,可排除單體的電壓出現偶然分布極端情況,將電壓長期處于極端位置的單體篩選出來。
(2)單體性能識別
結合第1節討論的單體電壓在充電過程中分布情況對應的性能表現得到表3。根據單體電池的標記對照該表,即可得到每支單體當前的性能情況。

表3 單體電壓表現辨識表
例如被標記為“A-B-B+C+”的單體,即存在單體容量較小的情況,需將其篩出后期針對性關注其容量發展變化。若一支單體無任何標記,則說明其在充電過程中單體電壓一直處于中等水平,是電池組中性能參數較均衡的單體。
篩選出不利于電池一致性發展的單體,以供測試者重點關注,例如容量小、內阻大的單體,容量大或內阻小的單體無需篩出。
(3)單體極端程度評價
整組電池的標記辨識完成,對選出的單體進行極端程度評價,提出極端值計算方法如式(4)所示:
(4)

(4)電池組一致性評價
上文已對電池組全充電過程進行了周期性正態擬合,可從中得到其若干次擬合標準差σ的平均值,該數值可在一定程度上表現電池組一致性情況。
經分析數據發現,一致性較好與較差的電池組的標準差平均值數值范圍在百分位至千分位間波動,兩者之間一般差距一個數量級。故將其電池組一致性參數定義如式(5)所示,以更簡易直觀地表達一致性差別。
(5)
將同型號多種不同狀態的動力電池組一致性參數進行比較,可得到一致性較好、一致性中等、一致性較差的電池組對應參數范圍如表4所示。

表4 一致性參數劃分范圍
由此可劃定一致性初步評價標準,對電池組一致性進行評價。
利用3.3節所研究的一致性快速辨識方法,對實際車輛電池組性能進行評估,本文選用長安新能源汽車進行性能測試,選取測試算例中具有代表性的三個算例,對其計算結果進行分析研究。
測試車型為長安逸動160,整組共85支單體,額定容量為80 A·h。對車輛電池組進行快充測試,將測試數據進行一致性快速辨識計算。針對計算結果,將被辨識出的單體按照極端值進行排序,并對照這些單體實際性能參數在整組的排序位置,驗證辨識結果的參考價值,如表5所示。

表5 算例一測試結果
該車輛為性能較差的返廠問題車輛,未能測得單體容量數據,但根據車廠反饋#69、#9、#76、#83均為問題單體,存在容量偏低問題。根據測試結果可看出,車輛電池組一致性參數確實較低,辨識出的內阻偏大單體的歐姆阻值在整組中處于頂端的位置,且極端值排序與阻值排序對應關系較好,證明極端值有描述單體在整組極端程度的參考作用,辨識結果具有參考價值。一致性較差的電池組,辨識出的極端單體危險程度較高,在車輛檢修或維修時需要引起重視重點關注。
測試車型是長安奔奔,整組共86支單體,額定容量為80 A·h。對車輛電池組進行快充測試,將測試數據進行一致性快速辨識計算。針對計算結果,將被辨識出的單體按照極端值進行排序,并對照這些單體實際性能參數在整組的排序位置,驗證辨識結果的參考價值,如表6所示。

表6 算例二測試結果
測試結果中,內阻偏大的單體對應的歐姆內阻在整組范圍內排名第一,說明辨識出的這兩只單體內阻在內阻一致性中屬于較極端的單體;辨識出的SOC偏低的單體,在整組中的狀態排序也處于較低的水平。實驗結果表明一致性辨識算法選出的性能極端單體與實際情況基本吻合,具有一定的性能描述作用。
測試車型是長安逸動200,整組85支單體,額定容量為100 A·h。對車輛電池組進行快充測試,將測試數據進行一致性快速辨識計算。針對計算結果,將被辨識出的單體按照極端值進行排序,并對照這些單體實際性能參數在整組的排序位置,驗證辨識結果的參考價值,如表7所示。
由計算結果可得,該組車輛電池的一致性狀態較好,不存在容量偏低或內阻偏大的內部性能問題單體,僅部分單體電池的SOC存在偏置狀況。其中辨識出的SOC偏高和偏低的單體,其性能偏置情況在整組中的SOC排名結果中得到了驗證。基于整組一致性較好的情況,可認為此類電池組被辨識出的單體偏離群體的情況較輕微,可在后續車輛運行中繼續保持關注。
文章發現并總結了性能問題單體在整組中存在的離群現象,提出基于離群點檢測進行一致性快速辨識的研究方向。學習各類離群點檢測原理后,從中選擇使用基于統計分布的離群檢測方法。基于正態分布離群點檢測和性能異常單體的差異化表現,確定動力電池組一致性快速辨識的核心算法,對單體的極端程度和電池組一致性狀態進行評估。方法測試流程簡單計算量小,較傳統方法具有明顯速度優勢。
最終通過算例分析驗證,算法可辨識出具有離群現象的單體,有效描述電池組一致性情況。算法辨識出的單體在日后車輛運行和檢修時可重點關注;車輛使用者可根據多次得到的辨識結果對車輛狀態變化進行持續性地了解。