侯林濤 閻俏 張桂青 金東毅 劉業春 張公飛



摘? 要: 針對鄉村光伏路燈存在維修維護成本高、維護不及時等問題,在分析蓄電池故障數據特征的基礎上,提出一種基于K-means算法的蓄電池故障識別方法。給出算法流程以及參數K的循環尋優選取方式,在故障聚類基礎上分析并設計了故障類型的識別方法。通過對210盞太陽能路燈18個月的電流、電壓等實時數據進行驗證,該故障識別算法具有較高的故障識別精度。在光伏路燈實現物聯網管控的基礎上,該算法具有成本低、操作性強的特點。
關鍵詞: 光伏路燈; 故障識別; K-means聚類算法; 異常數據檢測
中圖分類號:TP311.1? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2023)06-114-05
Research on fault identification for photovoltaic street light
battery based on K-means algorithm
Hou Lintao1, Yan Qiao1,2, Zhang Guiqing1,2, Jin Dongyi1, Liu Yechun1, Zhang Gongfei1
(1. School of Information and Electrical Engineering, Shandong Jianzhu University, Jinan, Shandong 250101, China;
2. Shandong Key Laboratory of Intelligent Buildings Technology)
Abstract: There are problems such as high maintenance cost and untimely maintenance of rural photovoltaic street lights. On the basis of analyzing the data characteristics of battery fault, an identification method of battery fault based on K-means clustering algorithm is proposed. The algorithm process and the cyclic optimization selection method for parameter K are given in detail, and the identification method of fault types is analyzed and designed on the basis of fault clustering. The fault identification algorithm is verified with the real-time data such as current and voltage of 210 solar street lights over 18 months, which shows that the algorithm has high fault identification accuracy. With IoT control for photovoltaic street lights, this algorithm has the advantages of low cost and high operability.
Key words: photovoltaic street light; fault identification; K-means clustering algorithm; abnormal data detection
0 引言
我國“雙碳”戰略和農村基礎設施的建設需求,促使鄉村光伏路燈的推廣成為必然趨勢。但鄉村光伏路燈存在維修/維護成本高、維護不及時等問題。
光伏路燈通常由LED燈具、蓄電池、光伏板三部分構成,據統計,蓄電池故障是影響路燈壽命的主要因素[1,2]。蓄電池故障類型多樣、表現特征不一,傳統電池故障診斷方法普遍存在成本高、參數獲取難等問題[3],在光伏路燈實現物聯網管控的基礎上,通過各類數據驅動方法實現對蓄電池的故障診斷成為可能。文獻[4]提出了一種利用支持向量機(SVM)對變電站用蓄電池進行故障診斷的方法,文獻[5]以光伏電站為研究對象提出了一種基于DBSCAN 密度聚類算法的故障檢測算法,文獻[6]對有軌電車的燃料電池系統設計了一種基于K-means聚類的故障診斷策略。以上方法在解決輕量級工程上具有優秀表現,但是尚未對路燈蓄電池故障診斷展開研究。
本文提出一種基于K-means聚類算法的光伏路燈蓄電池故障識別方法,該方法僅依賴物聯網系統采集的蓄電池基本參數,通過聚類得到故障數據集合,在此基礎上,根據蓄電池故障的數據特征進行故障類別的判定。
1 蓄電池故障類型及特征數據
1.1 蓄電池故障類型及參數特征
因鉛酸蓄電池具有性能穩定、價格低廉、回收效益高等優點,在鄉村亮化工程中的應用最為廣泛,因此本文將鉛酸蓄電池作為主要研究對象。蓄電池故障可分為由環境和使用問題引起的長期慢性故障和由意外因素引起的短期急性故障兩大類,長期慢性故障又分為:極板硫酸鹽化、極板活性物質脫落和內部短路三種[7]。
蓄電池發生急性故障時運行參數劇烈變化,通過檢測蓄電池放電電壓和電流即可完成故障判斷。而慢性故障蓄電池性能通常隨著使用時間的延長逐漸下降,且初期的數據特征變化不明顯,難以通過短期單一數據對其進行故障識別。針對此類問題,很多學者提出通過提取多組蓄電池運行參數對其性能進行綜合判斷的思路[8-10],表1給出了蓄電池常見故障的類型、原因和特征參數的分析結果。
1.2 特征數據提取
通過分析蓄電池充放電期間的電壓電流變化的特性,可以得出蓄電池在正常和各種故障情況下電氣參數的變化規律。
圖1給出了蓄電池的開路電壓、充放電電壓變化率和電流變化率在正常、急性故障和三種慢性故障狀態下兩天時間的典型參數曲線。相較正常運行狀態,故障狀態下的開路電壓數值偏低,且放電電壓下降速度均快于正常蓄電池的壓降速度。在極板硫酸鹽化和極板活性物質脫落這兩種故障狀態下的充電電壓增長速度,明顯快于正常蓄電池的充電速度,而內部短路的充電電壓增長速度相較正常蓄電池更慢。
基于以上分析,本文將蓄電池開路電壓、充電電壓變化率和放電電壓變化率這三類數據作為故障識別方法主要的特征數據,將蓄電池充電時間和充電電流作為補充特征數據。
2 基于K-means算法的蓄電池故障識別方法
選擇K-Means算法完成蓄電池故障檢測的主要原因在于蓄電池特征數據集具有較為明顯的分布特點:正常值的數量多、分布范圍小且重疊度高、密度大;異常數據的數量明顯少于正常值、分布較為離散。本文提出的故障識別方法主要分為三個階段,即數據預處理階段、故障數據聚類階段和故障分類階段,基本流程如圖2所示。
2.1 數據預處理
蓄電池慢性故障的數據特征呈現出隨時間累積緩慢變化的規律,因此本文采用當天物聯網設備采集的實時數據與目標近兩周的歷史數據作為算法的初始數據集。首先對初始數據集進行格式檢查和數值判斷,對明顯異常值和缺失值采取求其臨近數據均值的方式進行重新賦值,然后計算特征數據,并在[0,1]區間內作歸一化處理。
2.2 故障數據聚類
故障數據聚類階段的核心是采用K-means算法找出數量占比最多的正常數據進而分離異常值。K-means算法是一種逐步求精的聚類算法,其原理為:對于數據集D,算法首先隨機選擇K個初始聚類中心,在計算各個點與聚類中心之間的歐氏距離后將每個空間對象分配給距離它最近的聚類中心以形成初始聚類,如圖3所示。得到K個簇集后再次計算各個簇類中心均值,將其作為新的聚類中心。隨后循環上述步驟直至各聚類中心不再變化。
在對數據進行聚類之前首先需要確定聚類中心的個數K,參數K的選取對聚類結果具有較大的影響。較為常見的K值自動選取方法有手肘法[11]、抽樣法[12]等,但蓄電池數據集有別于一般的數據點分布模式:數據集中的正常樣本數量占比始終較大。體現在算法中則表現為:隨著K值增大,數據量最多簇集(以下稱主簇集)的占比隨之下降或不變;當K遞增至最優時,所有數據將被合理劃分給K個簇;一旦參數K過大,那原本隸屬主簇集的一部分數據將被強制劃分到其他簇中,主簇集的數量占比急劇下降。
針對上述情況,設計了一種循環尋優的方法來確定參數K值。參數K從2開始,逐一遞增,這樣對數據集循環聚類,并統計聚類結果中各個簇的數量。當聚類結果中某簇集(主簇集)的數量遠大于其余簇集數量,則表示K取值未超過最優值;一旦某次聚類的結果中主簇集數量的占比快速下降,則表示K值過大,參數K取上一輪循環的值。
為驗證循環尋優方法的合理性,圖4給出了兩組對照實驗中參數K從2開始逐次遞增至9所得出的歷次聚類結果。兩次實驗中的最優K值分別為6、5。
由圖4可見,在K未達到最優值前,聚類結果中始終存在主簇集數量占比極大的情況;一旦K大于最優值,大量正常數據將被強行分離出正常簇集,聚類結果嚴重偏離實際情況,因此上述K值選取方法在蓄電池數據集中的應用是合理的。
根據最優K值進行聚類后,統計各簇集的樣本數量。數量最多的簇集歸類為正常數據集,其余簇集即為故障簇集。
2.3 故障分類算法
故障分類算法需要尋找各類故障特征的差異作為分類條件。算法將異常蓄電池近兩周的日均開路電壓Un、充電電流In、充電電壓變化率ΔUn1和放電電壓變化率ΔUn2以及充電時長Tcha等歷史數據作為輸入,在對表1和實驗結論總結后設計區分各類故障的判斷方法及其各項閾值,其中充電時長將作為區分極板硫酸鹽化和極板活性物質脫落這兩種故障的判定條件,故障分類算法流程如圖5所示。
圖5中,Uoc為開路電壓閾值,表示能夠支持路燈工作的最低電壓;I為充電電流閾值,表示能夠對蓄電池進行有效充電的最低電流;ΔUcharge為充電電壓變化率閾值;ΔUdisch為放電電壓變化率閾值;Tcha-thr為充電時間閾值。
對異常數據每日均值進行判斷后可得到蓄電池每日的故障狀態的“標簽”,統計15日的故障標簽:若某一蓄電池被標記某種故障類型的次數超過十次,同時此故障在近三日內標記次數不小于二次,則該蓄電池最終被判定為該類故障。
3 實驗驗證
3.1 實驗數據
本實驗采用某物聯網智慧路燈運維系統采集的210盞光伏路燈的運行數據,其中包括蓄電池電壓、電流、功率、充放電狀態等。其中蓄電池額定電壓12V,額定容量20ah。數據記錄時間為2021年1月1日至2022年6月7日,采樣間隔5min,共約3266萬條數據記錄。
3.2 實驗結果分析
為驗證1.2節確定的三維故障特征數據的合理性,進行了四組特征數據的空間分布實驗,四組數據分別為:(a)開路電壓Uoc、充電電壓變化率ΔUcharge和放電壓變化率ΔUdisch;(b)充電電壓Ucharge、充電電流Icharge和充電電流變化率ΔIcharge;(c)放電電壓Udisch、放電電流Idisch和放電電流變化率ΔIcharge;(d)放電電壓Udisch、充電電流變化率ΔIcharge和充電電壓變化率ΔUcharge。其分布情況如圖6所示。
由圖6可知,只有a組實驗中蓄電池開路電壓值、充電電壓變化率和放電電壓變化率組成的特征數據符合分布范圍小且密度大、異常數據數量少且分布離散的特點,而b、c、d組實驗中組合的特征數據無法在K-Means算法中明顯體現異常點的特征。
圖7(a)給出了某次實驗中故障數據聚類算法運行后的各簇集在空間中的分布情況。可以看出算法能夠自動選取適當參數K并較好的完成蓄電池各個特征數據的聚類。圖7(b)為各最終故障數據在空間中的分布圖。實驗中Uoc取蓄電池額定電壓的80%;Ithr取蓄電池額定容量的5%;ΔUcharge取同時段正常蓄電池的充電電壓變化率均值;ΔUdisch取同時段正常蓄電池的放電電壓變化率的最大值;Tcha-thr取同時段正常蓄電池的日均有效充電時長。
在觀察實驗后各類故障數據發現:急性故障蓄電池的平均開路電壓為2.9V,遠低于蓄電池12V額定電壓;內部短路的充電電壓增長速度分布在0.134~0.186V/h之間;極板硫酸鹽化和極板活性物質脫落故障的充電電壓增長速度分布在0.279V/h與0.432V/h之間,均與0.233V/h的平均值有較大差距,圖中故障數據點位置分布情況均符合其特征表現。
圖8給出了本文的故障數據聚類算法與基于DBSCAN的算法在50~5000個數據規模下的故障識別率對比結果。
K-Means聚類算法以數據點之間的歐式距離作為簇集劃分的指標,數據點的數量對識別率有著較大影響。由圖8可以看出,本文算法在數據數量較少的情況下識別率偏低,但隨著數據總量的增加,識別率也隨之上升并逐漸穩定。而DBSCAN是基于密度的聚類算法,雖然其性能受數據點數量影響較小,但參數MinPts、Eps的調參過程復雜,且參數組合會直接影響聚類效果,所以識別率難以穩定。實驗結果表明本文采用的故障識別方法的識別準確率在數據規模較大的情況下達到94%左右,具有良好的識別效果。
4 結束語
本文分析并總結了光伏路燈蓄電池常見的故障原因、類型以及故障數據的特征表現,在此基礎上設計了蓄電池故障識別算法并對其運行結果進行分析。實驗表明本文算法可以實現蓄電池故障的無監督自識別,在面對常見的蓄電池故障識別中都有較高的準確度。
參考文獻(References):
[1] 劉奇.太陽能LED路燈智能控制系統設計與研究[D].碩士,
湖北工業大學,2020.6
[2] 隋婉婉.基于物聯網技術的太陽能路燈測控系統[D].碩士,
聊城大學,2015.6
[3] 劉國平.軌道交通中的鉛酸蓄電池故障分析[J].電子技術,
2022,51(1):152-153
[4]李洪江,太濤見.基于支持向量機的變電站蓄電池故障診斷
方法[J].云南電力技術,2020
[5] 左世強.光伏電站設備運維平臺的設計與實現[D].碩士,
四川:電子科技大學,2020
[6] Algorithms; Investigators at Southwest Jiaotong University
Discuss Findings in Algorithms (A discrete hidden Markov model fault diagnosis strategy based on K-means clustering dedicated to PEM fuel cell systems of tramways)[J]. Energy Weekly News,2018
[7] 王利杰.鉛酸蓄電池故障在線診斷及修復技術研究[D].
碩士,遼寧:東北大學,2015
[8] 關健生.蓄電池組監控與故障診斷管理系統[D].碩士,福建:
廈門大學,2007
[9] 付騰,姚志成,彭建軍.基于模糊數學的鋰電池組故障診斷[J].
電子設計工程,2012
[10] Pritam Kumar Gayen,Rajib Majumdar,Subhradip Mondal;
Development and implementation of adaptive solar module-and battery characteristics-based real-time power management for solar battery system under grid-connected and‐islanded conditions[J].International Transactions on Electrical Energy Systems,2020
[11] Sammouda Rachid,El Zaart Ali. An Optimized Approach
for Prostate Image Segmentation Using K-Means Clustering Algorithm with Elbow Method[J]. Computational Intelligence and Neuroscience,2021
[12] 田森平,吳文亮.自動獲取k-means聚類參數k值的算法[J].
計算機工程與設計,2011