于 鵬,楊仁剛(1.中國農業大學信息與電氣工程學院,北京100083;2.渤海大學工學院,錦州 121013)
?
基于歐氏距離最佳K均值聚類的超級電容組故障在線鑒別方法
于鵬1,2,楊仁剛1※
(1.中國農業大學信息與電氣工程學院,北京100083;2.渤海大學工學院,錦州 121013)
摘要:為了提高超級電容組運行可靠性需要對故障電容進行在線鑒別,針對現有超級電容故障鑒別方法參數識別難度高和采集數據量大的問題,該文采用最佳K均值聚類方法在線檢測故障超級電容器,并提出了最佳聚類的歐氏距離指標。該方法首先對在線電壓信號數據進行預處理,采用奇異值分解提取特征值進行K-Means動態聚類并計算相應的歐氏距離指標,由最佳聚類結果鑒別出故障單體。針對該文提出方法設計了超級電容組充放電仿真試驗進行驗證。試驗結果表明基于歐氏距離指標最佳K均值動態聚類的超級電容組故障在線鑒別方法可以根據串聯單體電壓信號進行故障檢測。該文可為超級電容在線故障檢測系統的開發與研制提供參考。
關鍵詞:故障檢測;信號分析;模型;超級電容;動態聚類;有效性指標
于鵬,楊仁剛. 基于歐氏距離最佳K均值聚類的超級電容組故障在線鑒別方法[J]. 農業工程學報,2016,32(2):186-192. doi:10.11975/j.issn.1002-6819.2016.02.027http://www.tcsae.org
Yu Peng, Yang Rengang. Online fault identification method for supercapacitor group of optimal K-means cluster based on Euclidean distance[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(2): 186-192. (in Chinese with English abstract)doi:10.11975/j.issn.1002-6819.2016.02.027http://www.tcsae.org
超級電容規模化使用是一種具有前景的電能規模化存儲技術,對于清潔能源的使用和增加可再生能源在電網能源構成中的比例具有重要作用。超級電容具有總儲能成本低和功率密度大的優點。由于超級電容單體耐壓水平低,在規模化使用時需多組單體串聯構成模組[1]。實時檢測模組中故障電容器,適時安排檢修是提高超級電容規模化串聯模組整體可靠性的重要手段,也是影響目前超級電容規模化集成應用的瓶頸問題之一。
電路故障分為硬故障和軟故障,超級電容的緩變故障屬于軟故障,主要包括電熱擊穿、容量衰減和外殼軟化等劣化失效或損傷累積失效模式[2]。從故障檢測的目的來看,對超級電容的故障檢測研究[3]可分為對超級電容生命周期預測和健康狀態檢測兩大類,對超級電容生命周期的預測主要目的是評估超級電容的實際壽命,而健康狀態檢測主要目的是在線檢測出故障電容器,本文主要涉及后者。從檢測方法來看,主要有直接測量法和參數估計法。直接法[4]是通過實時測量超級電容電壓電流以及環境溫度,然后根據端電壓與壽命經驗曲線或比較電容能量儲存變化來診斷超級電容的健康狀況。優點在于有可能在線應用,其缺點在于需要與初始狀態進行比較才能做出判斷。實際應用中,模組單體初始狀態的測量會增加生產的難度與成本。
較為普遍的研究方法是采用參數估計法,利用在線測量信息估計超級電容單體的容值和串并聯電阻。參數估計法又分為頻域參數估計和時域參數估計。頻域參數估計優點為可分辨參數在頻率域的更多細節;缺點為測量較為復雜在線實施難度大[5]。時域參數估計則是通過測量信號與超級電容容值、串聯和并聯電阻參數的數學模型,采用數學估計的方法獲得參數進而判斷超級電容健康狀況。Akram Eddahech[6]提出了一種基于遺忘因子的最小二乘回歸計算超級電容內阻參數的方法,其優點為可以在線估計內阻參數,其缺點為選用模型不同將影響結果且其原理存在建模簡化與最小二乘法所造成的誤差。Shi Zhihao[7]設計了擴展卡爾曼觀測器,通過觀測器計算超級電容參數的估計值,包括電容值和串并聯電阻,主要缺點是需要在充電電流中疊加信號,增加了系統成本。
現有方法大多側重于超級電容參數的在線辨識,辨識的基礎是超級電容數學模型,但超級電容精確建模以及對失效模式的量化分析難度較大;基于對單體電容器特性的分析,需對電容單體逐個參數識別,識別工作量較大。基于聚類法的非線性系統故障檢測已有研究[8],具有無需建立精確數學模型的優點。因此,本文提出了基于歐氏距離指標最佳K均值動態聚類的超級電容組故障在線鑒別新方法。該方法無需建立每個超級電容單體數學模型,通過對單體電容電壓測量信息中提取樣本特征向量進行最佳K均值聚類,可同時檢出多個失效電容器。
本文首先介紹樣本特征向量計算方法并簡要介紹K均值聚類數學模型,然后介紹本文提出的判定最佳聚類數的歐氏距離指標和超級電容串聯組故障在線鑒別的動態聚類方法,最后通過仿真試驗驗證動態聚類方法與歐氏距離指標的正確性,以期為超級電容在線故障檢測系統的開發與研制提供參考。
采用聚類方法鑒別串聯超級電容模組中的故障組,需解決2個問題:1)提取表征模組狀態的特征作為聚類樣本[9-11];2)確定最佳聚類數目和判斷失效模組。
1.1電容模組狀態聚類數學模型
單體超級電容等值電路由電容、串聯電阻和并聯電阻構成,由此形成的串聯模組經典電路模型如圖1所示。

圖1 串聯電容器等值電路Fig.1 Equivalent circuit of series capacitors
設ui(t-Δt)和ui(t)分別為2個相鄰時刻(t-Δt)和t,第i個電容器端電壓在線測量值。則有

式中uci(t)為電容電壓,V;角標i為電容編號,A;i(t)為電容器電流,A;rsi為第i個電容器的等效串聯內阻,?;ui(t)為測量電壓,V;Δt為采樣時間間隔,s;t為采樣時刻,s。
忽略電容器漏電流,相鄰時刻電容器端電壓差值與電容器電流有以下關系成立

式中ci為第i個電容器的電容,F。
值得指出的是,忽略電容器漏電流后,串聯各單體的電流近似相等,在采樣間隔Δt內電容模組串聯電路中的電流不會因某個單體電容值的變化而變化。即在Δt內,對任意第i個電容器而言,電容值ci與該采樣間隔相鄰時刻電容電壓差成反比。
由此可見,相鄰時刻電容器端電壓測量值之差[ui( t)- ui( t-Δ t )]可以反映超級電容的電容量與內阻特征,即可作為檢測第i個超級電容單體的狀態變量。這里將檢測第i個超級電容單體的狀態變量定義為

設總采樣時間為T=m·Δt,其中m為采樣總數。對n個串聯單體端電壓采樣結果可以得到系統的狀態矩陣

式(4)矩陣A的行向量表征了相應單體電容值的狀態,為了提取其特征值對矩陣An× m進行奇異值分解(singular value decomposition, SVD),有

式中Rn× n、Qm× m分別為正交陣,其列向量分別稱為A陣的左、右奇異向量;Λn× m為A陣的奇異值對角陣。
奇異值對角陣Λn× m=diag,…,0… 0),其中,...為從大到小排列的矩陣特征值。,...為前n列對角元奇異值,滿足≥≥ ...≥。
等式(5)兩邊右乘正交陣Qm× m,有

Rn× nΛn×m稱為矩陣A在Qm× m上的投影,選取較大奇異值對應投影方向得到的投影變換,可以較好地保留原向量表示的信息[12]。因此,本文提取Rn× nΛn×m中對應的第1列向量作為n個超級電容串聯模組端電壓狀態特征值,即模組狀態樣本特征向量

式中[x1, x2,..., xn]T為模組狀態樣本特征向量。
針對式(7)所提取的特征向量進行K均值聚類就可以獲得模組狀態的分類。設給定聚類數為k,則K均值聚類目標函數為

式中k為聚類數;Γi為第i個聚類子集,xj為Γi中的樣本,mi為Γi中樣本的平均值,即

式中Ni為子集Γi中的樣本點數。
1.2最佳聚類數判定指標
所謂最佳K均值(K-Means)聚類算法是通過不斷給定聚類的聚類數k進行聚類計算,然后用最佳聚類數判定指標來確定其中最佳聚類結果K。以下介紹K-Means聚類方法和聚類數判定指標。
大部分聚類算法需要預先給定聚類數,因而如何得到最佳聚類數,一直是聚類有效性研究的重要課題。現有方法通常是通過聚類有效性指標對給定不同聚類數k的聚類結果進行評價以確定樣本集最佳聚類數和最合適的聚類結果[13-15]。研究表明[16-17],沒有一種有效性指標能夠在任何情況下都具有普遍適用性。較為常用的4種有效性指標有Hartigan(Ht)指標[18]、Homogeneity-Separation(HS)指標[19]、Calinski-Harabasz(CH)指標[20]、Krzanowski-Lai(KL)指標[21]。
采用聚類方法檢測失效超級電容器,首先應當將參數異常電容與參數正常電容區分開;其次要求參數能夠區分異常電容與正常電容分入同組的情況。分組數不可過多,否則無法區分正常電容與異常電容。指標應在一定范圍內可以調節以適應不同具體情況。根據這一概念,本文提出一種新的最佳K值聚類判定指標,稱為歐氏距離(euclid distance,ED)指標。
歐氏距離指標是基于類內樣本點距離和聚類中心點距離的判定指標,即

式中VEDk為聚類數等于k時歐氏距離聚類有效性指標;Dgroup為類內樣本距離,等于全部類內點之間歐氏距離之和;DCmax和DCmin分別為最大中心距離和最小中心距離;p為分子試驗校正參數、q為分母試驗校正參數。
歐氏距離指標定義式(10)中選取試驗校正參數p、q時應使該定義式的分子分母數量級一致,滿足

本文采用的經驗值為p=1,q=1。類內樣本距離為

式中Γl為第l個分類子集。
最大中心距離和最小中心距離DCmax和DCmin為

顯然,最佳聚類是希望同類子集內的樣本點越集中越好,即Dgroup越小越好;聚類數不要太多則希望最大中心距離DCmax越小越好;同時,希望各類之間區分度越大越好,即DCmin越大越好。因此,最佳聚類的歐氏距離指標越小越好,即最佳聚類的歐氏距離指標為

式中VED為歐氏距離指標,k*為最佳聚類數。
基于最佳K均值聚類的超級電容模組故障狀態在線鑒別需要在每一個采樣周期獲得樣本后,首先對模組總體狀態進行評估,判斷是否存在失效單體,進而對存在失效電容的樣本特征向量進行聚類分析,鑒別出參數劣化單體電容。
在每一個采樣周期通過式(1)~式(6)獲得模組狀態樣本特征向量X=[ x1, x2... xn]T,計算特征向量的方差σ2[22]。若方差σ2大于給定閾值ε,則特征向量中包含故障電容狀態特征樣本;反之則說明特征向量結果合格。
在特征向量的方差大于給定閾值的情況下,求解式(8)聚類問題,得到不同聚類數k對應的分類子集;然后對不同k值的聚類結果按照式(10)計算歐氏距離指標VEDk;由式(14)判定最佳聚類結果;在最佳聚類子集中,樣本點數目最多子集所對應的單體電容集合確定為正常電容子集,剩余子集判定為非正常子集。故障狀態在線鑒別方法計算流程如圖2所示。

圖2 故障狀態在線鑒別方法流程Fig.2 Workflow of online fault state identification method
為了驗證提出的超級電容模組故障狀態在線鑒別方法的有效性,本文設計了一個9單體電容器串聯的超級電容儲能試驗系統,并基于MATLAB-simulink環境設計了2組試驗。其中,試驗一為最佳聚類指標效果對比試驗,在相同工況和相同采樣值的條件下,采用本文提出的最佳聚類指標和目前常用Hartigan(Ht)、Homogeneity-Separation(HS)、Calinski-Harabasz(CH)和Krzanowski-Lai(KL)指標進行故障狀態檢測并對結果進行對比,以驗證本文歐氏距離指標(式(13))的有效性;試驗二為多工況條件下聚類指標有效性試驗,為了驗證本文的故障檢測方法在不同情況下都能有效地檢出故障電容器,對超級電容儲能仿真系統在不同工況條件下進行了檢測驗證。
3.1系統及參數
本文設計的超級電容模組試驗系統為9個單體超級電容串聯形成的儲能系統,模組系統采用如圖1所示經典模型,超級電容額定參數:電容c=10 F,串聯電阻rs=0.1 ?,并聯電阻rp=27 k?。仿真試驗按照隨機誤差生成電容數據,設計其中電容器c1、c3和c5為非健康狀態的故障電容器,相應電容值的偏差大于20%,系統參數表1所示。

表1 系統參數Table 1 Dataset of experiment system
3.2試驗及結果
3.2.1最佳聚類指標效果對比試驗
聚類指標對比試驗是在儲能系統隨機充放電工況下進行的,隨機充放電工況通過隨機事件發生器控制充電電源和放電電阻來實現,電容器端電壓采樣周期10 s、采樣間隔1 s。
在隨機充放電工況下,各電容器端電壓的變化曲線如圖3。任選儲能仿真系統的一個周期樣本方差大于闋值ε=0.01的采樣值,由式(4)~式(7)得到樣本特征向量為


圖3 電容器端電壓Fig.3 Curves of capacitor’s voltage
1)本文歐氏距離指標計算結果
對式(15)樣本進行動態聚類計算,得到歐氏距離指標關于聚類數k的變化曲線VED(k)如圖4所示,由式(14)得最佳聚類數k*=2。
最佳聚類數k*=2對應的2個聚類子集分別為


圖4 歐氏距離指標VED(k)曲線Fig.4 Curves of Euclidean distance Index
根據樣本點多的聚類子集為正常子集的判據,樣本點少的Γ2為故障電容子集。對比給定參數表1可知,故障集Γ2中3個故障電容與給定一致。上述結果表明,在隨機充放電運行工況下本文的方法能夠有效地檢出故障電容器。
2)常用的4種聚類指標計算結果
對相同的特征向量式(15)采用4種常用最佳聚類Ht、HS、CH和KL指標得到各指標關于聚類數k的變化曲線如圖5所示。

圖5 現有有效性指標曲線Fig.5 Curves of existing efficient index
HS、CH和KL指標都是取值最大的聚類數為最佳聚類數k*,Hartigan指標是取指標小于等于10的最小類數為最佳聚類數k*。由圖5可見,KL指標得到的最佳聚類數k*=6,CH指標得到的最佳聚類數k*=8,HS指標得到的最佳聚類數k*=5,顯然對電容器故障狀態聚類問題失效;Hartigan指標得到最佳聚類數與本文歐氏距離指標一致k*=2,但是其計算方法相對復雜、評估性能和通用性不強[23-25]。
3.2.2多工況條件下聚類指標有效性試驗
為了進一步驗證本文故障電容器鑒別方法的有效性和合理性,對超級電容儲能試驗系統進行了多工況運行條件下故障電容器檢測仿真試驗。在儲能系統充電、放電和隨機充放電運行工況下完成了8組試驗,其中第1組和第2組試驗為不同電壓初值的放電試驗,其中第1組試驗超級電容單體初始電壓設置為1.8 V,第2組試驗超級電容單體初始電壓設置為2.5 V。第3和第4組為不同充電電流的充電試驗,其中第3組試驗充電電流設置為1 A,第4組試驗充電電流設置為0.5 A。第5到第8組為隨機充放電試驗,為滿足其隨機充放電條件,設置其充電電流為0.1 A,放電電阻為10 ?。
采用與3.2.1所述試驗相同的方法采樣并獲得特征向量,對特征向量應用本文方法進行動態聚類得到各運行工況下最佳的聚類結果列于表2。

表2 電容序號與聚類表Table2 Dataset of capacitor numbers and clusters
由試驗結果表2可見,第1組~第4組試驗樣本的最佳聚類數都是3,各組試驗對應的3個聚類子集元素完全相同,將其元素重新整理為3組

根據樣本點多的子集為正常子集判據,式(17)中1為正常電容器集,而Γ2和Γ3為非正常集,即檢出c1、c3和c5為故障電容器與預設結果一致。
試驗結果表2中第5組~第8組試驗樣本的最佳聚類數都是2,各組試驗對應的2個聚類子集與試驗一式(16)完全相同,均正確地檢出了故障電容器。
由此可見,本文提出的最佳K均值聚類檢測故障電容器的方法能夠在各種運行工況下正確地檢出故障電容器。
1)本文提出的基于歐氏距離最佳K均值聚類的超級電容模組故障狀態在線檢測方法是根據在線測量超級電容單體電壓信息來判斷串聯模組內的故障電容器,與以往方法相比避免了超級電容容值參數的計算,因此對傳感器數據要求低,便于工程實現。
2)建立了電容模組狀態K均值聚類數學模型,提出了電容模組狀態樣本特征向量的計算方法和最佳聚類數判定的歐氏距離指標。
3)設計了超級電容串聯模組系統的充放電仿真試驗,并采用本文的模型和算法對試驗采樣數據進行故障電容器檢測計算,計算結果區分了超級電容單體健康狀態,驗證了方法和模型的有效性。
[參考文獻]
[1] 于鵬,楊仁剛. 超級電容串聯儲能系統的并聯電容均壓方法[J]. 農業工程學報,2014,30(24):133-140. Yu Peng, Yang Rengang. Voltage equalizing method of energy storage system based on series connected supercapacitros[J]. Transactions of the Chinese Society of Agricultural Engineering(Transactions of the CSAE), 2014,30(24): 133-140.
[2] 李忠學,陳杰. 碳基超級電容器的快速充放電性能及失效模式[J]. 蘭州交通大學學報:自然科學版,2006,25(6):8-11. Li Zhongxue, Chen Jie. Failure modes and rapid charging/ discharging characteristics of carbon-based supercapacitors[J]. Journal of Lanzhou Jiaotong University: Natural Sciences,2006, 25(6): 8-11. (in Chinese with English abstract)
[3] Lystianingrum V. State of health and life estimation methods for supercapacitors[C]//Australasian Universities Power Engineering Conference, Hobart: IEEE, 2013: 1-7.
[4] Amrane O, Boubekeur T. Calendar ageing and health diagnosis of supercapacitor[J]. Electric Power Systems Research, 2013, 95(2): 330-338.
[5] Wei Tongzhen. Deterioration diagnosis of ultracapacitor for power electronics applications[C]//International Conference on Sustainable Power Generation and Supply, Nanjing: IEEE,2009: 1-6.
[6] Akram E. Online parameter identification for real-time supercapacitor performance estimation in automotive applications[J]. International Journal of Electrical Power &Energy Systems, 2013, 51(10): 162-167.
[7] Shi Zhihao. Interconnected observers for online supercapacitor ageing monitoring[C]// Annual Conference of Industrial Electronics Society, Vienna: IEEE, 2013: 6746-6751.
[8] 趙琦,周東華. 一種非線性動態系統的故障檢測與分類方法[J]. 電工技術學報,2001,16(4):65-70. Zhao Qi, Zhou Donghua. Fault detection and classification of a class of nonlinear dynamic systems[J].Transactions of China Electrotechnical Society, 2001, 16(4): 65-70. (in Chinese with English abstract)
[9] 張菁,楊明皓. 基于模糊聚類的電力系統載荷能力安全預警方法[J]. 電力系統自動化,2007,31(22):31-33. Zhang Jing. Yang Minghao. Security forewarning method of maximum load capacity based on fuzzy clutering[J]. Automation of Electric Power Systems, 2007, 31(22): 31-33. (in Chinese with English abstract)
[10] 張紅斌,賀仁睦,劉應梅. 基于KOHONEN 神經網絡的電力系統負荷動特性聚類與綜合[J]. 中國電機工程學報,2003,23(5):2-3. Zhang Hongbin, He Renmu, Liu Yingmei. The characteristice clustering and synthesis of electric dynamic loads based on KOHONEN neural network[J]. Proceedings of the CSEE,2003, 23(5): 2-3. (in Chinese with English abstract)
[11] 方正文,王年,江晉劍. 一種基于低維足底壓力特征的靜態步態聚類算法術[J]. 計算機應用研究,2015,32(7):2177-2178. Fang Zhengwen, Wang Nian, Jiang Jinjian. Clustering algorithm for static gait recognition based on low-dimensional plantar pressure features[J]. Application Research of Computers, 2015, 32(7): 2177-2178. (in Chinese with English abstract)
[12] 尹芳黎,楊雁瑩,王傳棟. 矩陣奇異值分解及其在高維數據處理中的應用[J]. 數學的實踐與認識,2011,41(15):171-176. Yin Fangli, Yang Yanying, Wang Chuandong. Research on the advances of singular value decomposition and its application in the high dimensional data mining[J]. Mathematics in Practice and Theory, 2011, 41(15): 171-176. (in Chinese with English abstract)
[13] Macqueen J. Some methods for classification and analysis of multivariate observations[C]//Proceedings of 5th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley: University of California Press,1967: 281-297.
[14] 王莉. 數據挖掘中聚類方法的研究[D]. 天津:天津大學,2004:5-8. Wang Li. Study on Clustering Algorithm in Data Mining[D]. Tianjin: Tiajin University, 2004: 5-8. (in Chinese with English abstract)
[15] 楊小兵. 聚類分析中若干關鍵技術的研究[D]. 杭州:浙江大學,2005:24-25. Yang Xiaobing. Research of Key Techniques in Cluster Analysis[D]. Hangzhou: Zhejiang University, 2005: 24-25. (in Chinese with English abstract)
[16] 周世兵. 聚類分析中的最佳聚類數確定方法研究及應用[D].無錫:江南大學,2011. Zhou Shibing. Research and Application on Determining Optimal Number of Cluster in Cluster Analysis[D].Wuxi: Jiangnan University, 2011. (in Chinese with English abstract)
[17] 王開軍,李健. 聚類分析中類數估計方法的實驗比較[J].計算機工程,2008,34(9):198-202. Wang Kaijun, Li Jian. Experimental comparison of clusters number estimation for cluster analysis[J]. Computer Engineering, 2008, 34(9): 198-202. (in Chinese with English abstract)
[18] Hartigan J A, Wong M A. A K-Means clustering algorithm[J]. Applied Statistics,1979, 28(1): 100-108.
[19] Chen Gengxin. Evaluation and comparison of clustering algorithms in analyzing ES cell gene expression data[J]. Statistica Sinica, 2002, 12(1): 241-262.
[20] Calinski R B, Harabasz J. A dendrite method for cluster analysis[J]. Communications in Statistics, 1974, 3(1): 1-27.
[21] Krzanowski W, Lai Y. A criterion for determining the number of groups in a data set using sum-of-squares clustering[J]. Biometrics, 1988, 44(1): 23-34.
[22] 莊楚強,何春雄. 應用數理統計基礎[M]. 廣州:華南理工大學出版社,2009:34-35.
[23] Peterson A R. Visual Data Mining: Using Parallel Coordinate Plots with K-Means Clustering and Color to Find Correlations in a Multidimensional Dataset[D]. Kutztown: Kutztown University of Pennsylvania, 2009: 27-29.
[24] 周世兵,徐振源,唐旭清. 基于近鄰傳播算法的最佳聚類數確定方法比較研究[J]. 計算機科學,2011,38(2):225-228. Zhou Shibin, Xu Zhenyuanl, Tang Xuqing. Comparative study on method for determining optimal number of clusters based on affinity propagation clustering[J]. Computer Science,2011, 38(2): 225-228. (in Chinese with English abstract)
[25] Albalate A, Suendermann D. A combination approach to cluster validation based on statistical quantiles[C]// International Joint Conference on Bioinformatics, Systems Biology and Intelligent Computing, Shanghai: IEEE, 2009: 549-555.
·農業生物環境與能源工程·
Online fault identification method for supercapacitor group of optimal K-means cluster based on Euclidean distance
Yu Peng1,2, Yang Rengang1※
(1. College of Informɑtion ɑnd Electricɑl Engineering, Chinɑ Agriculruɑl University, Beijing 100083, Chinɑ; 2. College of Engineering, Bohɑi University, Jinzhou 121013, Chinɑ)
Abstract:In order to keep the energy storage system which is based on supercapacitor group with series connection work reliably, the fault groups of supercapacitors are necessary to be identified. A fault state identification method of K-means cluster was presented in this paper. A Euclidean distance index was proposed to choose K value automatically. In this method,the voltage signal data are preprocessed to form the sample array. The singular value decomposition is applied to project out a shadow subset of the sample array. The K-means method is used to cluster the shadow subset for fault state identification. The fault subsets are detected in the cluster result. The largest cluster is identified as normal state and the others are abnormal state. The Euclidean distance index was proposed to decide the optimal K value automatically after enumeration of all possible K. This index is based on the Euclidean distance of pairwise data points and pairwise cluster centers. The minimize value of index is bonded to the optimal K value. Adjustable coefficients are used to improve the adaptability of this index. Based on the principle of K-means cluster method and Euclidean distance index, the fault state identification process was introduced. In this process, after sampling the voltage of supercapacitor cells, the difference voltage array is established to form the feature space. The singular value decomposition is used on the difference voltage array to form the sample subset. The variance of sample subset is compared to set limitation. If the variance overrides the limitation, K-means algorithm will be used to cluster the sample subset, and the Euclidean distance index will be used to decide the optimal K value. By counting the group amount of sample subset, the fault state capacitors can be distinguished. An experiment system was designed to verify the efficiency and validity of the method and index. The experiment environment was MATLAB-Simulink. Two experiments were carried out based on the experiment system. The first experiment was for the comparison of different indices. This experiment was set in randomly charging and discharging situation to approach the actual situations. The optimal K value was picked out from the enumerated values by searching the minimum value of Euclidean distance index. The result collections distinguished the normal and abnormal sets. As this result was the same with the given situation, the effective of Euclidean distance index was proved. The result showed that the proposed character vector exacting method correctly reflected the characteristics of supercapacitor state. Other existing indices were computed out. The comparison of efficiencies among different indices was made. The homogeneity-separation (HS), Calinski-Harabasz (CH) and Krzanowski-Lai (KL) index failed to identify the right group of this case. Hartigan index got the right result. But the Hartigan index also had its drawback in utilities, efficiency and complexity. The second experiment was designed to prove the correctness of the method and index in different working scenarios. In this experiment, 3 groups were set. The 1stgroup included 2 subsets of samples in which the capacitors were charged with different current, the 2ndgroup included 2 subsets of samples in which the capacitors were discharged with different starting voltage, and the 3rdgroup of data included 4 subset of samples in which the capacitors were charged and discharged randomly. The Euclidean distance index indicated that the 1stand the 2ndgroup got the results of 3 subsets. The largest subset was the normal set and the other 2 subsets were abnormal set. The Euclidean distance index showed that the 3rdgroup got the correct results of 2 subsets. All of the experiment groups got the expected result. The results showed that the fault state could be identified correctly through the dynamic cluster method according to the voltage signal of supercapacitor cell. The validity of Euclidean distance index to select the optimal K value of clusters for fault identification was proved. Two main conclusions were drawn in this paper. The first is that the fault state identification method based on K-means cluster can distinguish the normal and abnormal set of serial connected supercapacitors. The second is that the Euclidean distance index can select the optimal K value automatically. The fault identification method proposed in this paper has 2 advantages. The first advantage is that identification of capacitor parameters is avoided. The second advantage is that this method has low dependency on precise of acquisition data.
Keywords:fault detection; signal analysis; models; supercapacitor; dynamic cluster; validity index
通信作者:※楊仁剛,男,遼寧省大連市人,教授,博導。研究方向為供配電技術。北京中國農業大學信電學院,100083。Email:yrg@cau.edu.cn
作者簡介:于鵬,男,遼寧省錦州市人,講師,博士,研究方向為電力電子。錦州渤海大學工學院,121013。Email:22419705@qq.com
基金項目:國家863高技術基金項目(2012AA050217)。
收稿日期:2015-03-06
修訂日期:2015-12-25
中圖分類號:TM53
文獻標志碼:A
文章編號:1002-6819(2016)-02-0186-07
doi:10.11975/j.issn.1002-6819.2016.02.027