馬洪斌,楊 飛,楊蕾娜,張 冉
(國網山東省電力公司棗莊供電公司,山東 棗莊 277000)
變壓器作為電力系統的重要組成部分,其運行狀態決定了整個系統的安全穩定。一旦變壓器發生故障,將帶來巨大的經濟損失。因此,變壓器故障的有效診斷對保證變壓器的安全可靠運行具有非常重要的意義。隨著機器學習的興起,越來越多的研究人員將機器學習應用到變壓器故障診斷中,取得較好的效果。文獻[1]提出了基于加權K近鄰算法的變壓器故障診斷,根據待分類樣本在特征空間中K個最近鄰樣本中的多數樣本的類別進行分類,因此具有直觀、無需先驗統計知識、無師學習等特點。文獻[2]提出了基于油中溶解氣體的支持向量機變壓器故障診斷,有效解決了傳統學習方法的“維數災難”和“過學習”等問題。文獻[3]提出了基于知識粗糙度的多變量決策樹在變壓器故障診斷系統中的應用,有效地簡化了決策樹,減少診斷信息的冗余性,診斷效率高,結果易于理解。
機器學習通過對外部環境的信息和知識進行加工改造,使其成為有效的信息內容,學習是機器學習的核心,包括對信息的采集、接受監督和指導,同時還包括對學習的推理以及修改學習系統的知識庫。
機器學習具有目的性、結構性、有效性和開放性。機器學習可以了解學習的內容,學習的行為具有一定的目的性。結構性中,可以系統地將知識的結構和組織形式進行修改和完善。針對有效性,機器學習系統學習的知識能夠適應實踐的需要,不斷改善機器學習系統。開放性表現在機器學習能夠與外部環境進行信息的交互和自身的進化。
支持向量機(Support Vector Machine,SVM)是在統計學習理論的基礎上發展出的一種模式識別方法,是一種全局最優求解算法而不是求得局部極小值,該方法“以結構風險最小化原則”,根據實際需求對子集中的判別函數以及函數子集進行恰當選擇。既可以保障學習的效果不會存在異常的狀況,又可以保障樣本的誤差,且其獨立測試集的測試誤差仍然較小,具有很好的泛化能力。SVM具有堅定的理論基礎,在人臉識別、文本自動分類等眾多領域獲得廣泛的應用[4]。
集成學習方法主要是由個體的學習器進行組合生成,通過對樣本數據集的學習可以獲得多個分類器,這些分類器具有多樣性和準確性。根據個體的學習器之間是否是同一類型的學習算法,又可以將分類器分為“同質”和“異質”。對于個體的學習器的合并,是按照某種策略將個體學習器對新樣本分類的預測結果綜合考慮,從而得到一個最終的預測結果,見圖1。集成策略主要有“平均值法”和“多數投票法”等[5]。

圖1 集成學習
對于大型電力變壓器,目前幾乎都是用油來絕緣和散熱,電力變壓器油與油中的固體有機絕緣材料在運行電壓下因電、熱、氧化和局部電弧等多種因素作用會逐漸老化、裂解,產生少量的甲烷、乙烯、乙烷、乙炔等低分子烴類,以及一氧化碳、二氧化碳和氫氣等氣體,并多數溶解在油中。油中溶解氣體的組分和含量在一定程度上反映出電力變壓器絕緣老化或故障的程度,可以作為反映電力設備異常的特征量。通過對運行中的電力變壓器定期分析溶解于油中的氣體組分、含量和產氣速率,能夠及早發現電力變壓器內部存在的潛伏性故障[6]。
變壓器內部故障主要為過熱式和異常放電式,其中過熱式主要包括低溫過熱(<300℃),中溫過熱(300~700℃)和高溫過熱(>700℃),異常放電式主要包括低能量放電和高能量放電。
根據試驗和變壓器故障處理案例分析,油浸式變壓器發生故障時產生的氣體成分見表1。

表1 油浸式變壓器不同故障類型時產生的氣體組分
通過分析,將變壓器的故障類型分為中低溫過熱、高溫過熱、低能量放電和高能量放電。本文將變壓器的4種故障類型與正常情況,共5種狀態類型作為識別結果進行模式識別。
將機器學習與變壓器故障診斷相結合,提出了故障診斷流程,見圖2。

圖2 基于機器學習的變壓器故障診斷流程
對采集得到的變壓器油中氣體數據115組,分成訓練數據(75組)和測試數據(40組),通過對訓練數據進行學習得到故障診斷模型,以測試數據對得到的模型進行驗證,判斷模型的準確率。同時采用vote集成學習進一步對各個分類器進行組合,提升故障識別的準確率。
將甲烷、乙烯、乙烷、乙炔、氫氣作為特征向量進行變壓器故障模式識別,考慮到分類問題主要是針對數值型結構,氣體組分為數值型不需轉換,因此將變壓器的狀態正常、中低溫過熱、高溫過熱、低能量放電和高能量放電由字符型轉換為數值型,分別標注為0、1、2、3、4,訓練數據和測試數據見表2-3。

表2 訓練數據

表3 測試數據
分別采用支持向量機、邏輯回歸、最近鄰分類、貝葉斯分類、決策樹和隨機森林對訓練數據進行學習,得到故障診斷模型。利用測試數據對各個故障診斷模型進行模型驗證,得到各個模型的識別結果見圖3-8,藍色圓圈表示的是實際的故障類型,紅色圓圈表示的是預測的故障類型。

圖3 決策樹分類結果

圖4 支持向量機分類結果

圖5 最近鄰分類結果

圖6 隨機森林分類結果

圖7 邏輯回歸分類結果

圖8 貝葉斯分類結果
由40組測試數據對以上6個分類器的識別驗證結果,可以得到各分類器的識別準確率,同時得到各分類器對每一種故障的識別準確率如表4-5所示。

表4 不同分類器的模式識別結果

表5 不同分類器對不同故障的識別結果 %
將決策樹、支持向量機和隨機森林作為基分類器采用vote集成學習形成新的集合分類器,采用多數投票法的方式輸出故障識別結果見圖9和表6-7。

圖9 vote集成學習識別結果

表6 vote集成學習故障識別結果

表7 vote集成學習對各故障類型識別結果 %
vote集成學習相對于單一的分類器,將同質分類器和異質分類器進行合并,其故障識別準確率得到提升,故障識別準確率為92.5%。
通過實際現場中油色譜在線監測裝置采集的5種特征氣體進行變壓器故障診斷,診斷結果見表8。

表8 220 kV主變壓器故障診斷結果
第1組變壓器的預測結果為中低溫過熱,通過實際的現場紅外測溫檢測,發現主變壓器本體下方連接處存在過熱現場。第2組變壓器的預測結果為低能量放電,通過對現場的變壓器進行巡視檢查,發現裸引線對套管導電管之間有放電的痕跡。
基于機器學習搭建變壓器故障診斷模型對變壓器的故障類型進行識別,故障準確率由原來氣體分析IEC三比值法的80%提高至90%,通過vote集成學習進一步組合單一分類器形成新的故障分類器,故障識別的準確率進一步提高為92.5%。采用機器學習方法對變壓器進行故障診斷相比于傳統的油中氣體分析可以實現實時、隨地的故障診斷,不需要進行現場油樣采集和油化試驗,大大提高了工作效率,減少了勞動時間。在實際變壓器故障診斷中,具有實用性和可靠性,同時具有廣泛的推廣應用價值和實際意義。但目前只是通過簡單的機器學習對故障進行診斷,存在一定的局限性,下一步將繼續優化模型,增加訓練數據量,增強模型的學習能力和適應能力,進一步提高故障識別的準確率。