王磊, 陳長征
(沈陽工業大學 機械工程學院,沈陽110870)
電力變壓器是電力系統的重要組成部分,長期以來,對變壓器運行穩定性的判斷是通過定期檢修來實現的,由此產生的維修過剩和維修不足給社會帶來了巨大的經濟損失。因此,為了降低變壓器運行風險,準確判斷變壓器健康狀態,保證變壓器安全可靠地運行,變壓器檢修模式由定期檢修向狀態檢修過渡已成必然趨勢。
變壓器健康狀態評估是狀態檢修的基礎,只有通過準確預測變壓器健康狀態,做出合理的檢修方案,才能保證變壓器安全穩定地運行。目前,國內外學者已經提出了很多有成效的變壓器健康狀態評估方法,文獻[1]通過主觀賦予權重的方法,中和油中溶解氣體因子和油特性試驗因子得到變壓器健康指數,利用健康指數判斷變壓器健康狀態,但由于主觀性較大,變壓器健康狀態預測準確度較低;文獻[2]根據油中溶解氣體所測特征量,基于BP神經網絡算法來判斷變壓器健康狀態,當網絡隱藏層較多時,BP神經網絡出現局部最優解的現象,導致變壓器健康狀態預測準確率較低;文獻[3]研究了模糊評估算法在變壓器狀態評估中的應用,但該方法對變壓器數據樣本要求較高,且不適合單個數據樣本預測;文獻[4]探討了支持向量機對變壓器健康狀態的評估,但該方法在大樣本多分類的情況下預測準確率較低。
隨著大數據時代的到來,深度學習被證明對原數據有強大的表征能力。因此,本文以變壓器絕緣油中的CH4、C2H6、C2H4、CO2、C2H2、CO、H2濃度值和油中的糠醛含量、酸值、油擊穿電壓、介質損耗、水含量作為反映變壓器健康狀態的特征參量,利用變壓器特征參量的歷史數據,通過主觀賦予權重法和模糊C均值算法得到訓練樣本集和測試樣本集,根據歷史數據樣本構建基于深度自編碼網絡的變壓器健康狀態評估模型。分析了不同網絡結構的診斷效果。
根據國內變壓器多年來運行試驗及事故等數據表明,70%左右變壓器故障是由絕緣故障引起的。油中溶解氣體和油特性試驗在不需停電的情況下,就可以得到變壓器絕緣油的數據,判斷變壓器的故障程度和老化程度。油中溶解氣體分析法是通過監測變壓器運行過程中產生的故障氣體的濃度來判斷變壓器故障的程度,變壓器故障氣體為CH4、C2H6、C2H4、CO2、C2H2、CO、H2。
油特性試驗法是通過監測變壓器絕緣油的狀態量來判斷變壓器絕緣老化狀態。變壓器的狀態量為酸值、糠醛含量、油擊穿電壓、介質損耗、水含量。因此,變壓器通過油中溶解氣體分析檢測的故障氣體濃度及油特性實驗分析檢測的狀態量能夠較好地反映變壓器的健康狀態。
如圖1所示,自編碼網絡分為編碼過程和解碼過程,輸入層到隱藏層為編碼過程,隱藏層到輸出層為解碼過程。從輸入層到隱藏層的編碼過程為:


圖1 自編碼神經網絡模型示意圖
式中:W為m×n的權值矩陣;b為輸入層的偏置向量;f (·)為sigmoid函數。
從隱藏層到輸出層的解碼過程為

式中:W1為k×m的權值矩陣;b1為隱藏層的偏置向量。
自編碼網絡的目標是利用誤差函數使輸入和輸出盡量相近:

式中:c為數據樣本個數。
通過反向傳播最小化誤差函數,得到自編碼網絡最優的權值和偏置,為建立深度自編碼網絡模型做準備,權值和偏置的優化原理為式(5)和式(6):

降噪自編碼網絡是通過在輸入數據中加入噪聲數據來訓練稀疏自編碼網絡,由于噪聲數據的作用使自編碼網絡學習的數據特征更具有魯棒性,其網絡原理如圖2所示。首先,使用隨機概率將原始數據x中某些值置為0得到含有噪聲數據的x1,根據自編碼網絡編碼解碼原理,利用含有噪聲數據的x1,得到編碼數據h和解碼數據y,最后通過解碼數據y和原始數據x構造誤差函數,通過反向傳播最小化誤差函數,得到最優的網絡權值和偏置。

圖2 降噪自編碼網絡原理示意圖
SoftMax分類器是解決多分類問題的,其網絡結構如圖3所示。第一層網絡是SoftMax分類器的輸入層,第二層網絡是SoftMax分類器的輸出層。其原理為:

圖3 SoftMax網絡結構圖


式中:x為輸入數據向量;W為輸入層到輸出層神經網絡的權值矩陣;b為輸入層神經網絡偏置向量;Z為模型參數;n為分類數;x為訓練數據樣本;yi為訓練樣本數據x被識別為第i類的概率。
SoftMax分類器的目標函數:

式中:m為訓練數據樣本數;n為分類數;x(i)為第i個數據的樣本類別;l{·}為示性函數,當括號中的條件為真時,示性函數值為l,當括號中的條件為假時,示性函數為0。通過使目標函數極小化得到網絡最優的權值和偏置。根據最優的權值和偏置向深度網絡模型中輸入新的數據,若輸出層第i個神經元條件概率最大,則數據屬于第i類。
如圖4所示,深度自編碼網絡是由多個自編碼網絡堆疊和SoftMax分類器組成;是通過預訓練得到自編碼網絡的初始權值和偏置,然后利用微調來確定網絡最優的權值和偏置。預訓練是通過無標簽數據樣本對多個自編碼網絡進行無監督訓練,首先將原始數據輸入第一個自編碼網絡,利用誤差函數確定網絡的最優權值和偏置;然后將第一個自編碼網絡的隱藏層作為第二個自編碼網絡的輸入層,采取同樣的方式得到第二個自編碼網絡的最優權值和偏置;反復進行可以得到所有自編碼網絡的最優權值和偏置,最終提取最后一個自編碼網絡的隱藏層作為深度特征。預訓練完成后,深度自編碼網絡的權值和偏置被初步初始化。

圖4 深度自編碼網絡結構示意圖
微調是通過有標簽數據樣本對整個深度自編碼網絡進行有監督訓練,應用反向傳播算法,通過極小化SoftMax分類器的損失函數,得到整個網絡最優的權值和偏置,強化自編碼網絡的特征提取能力。
本文搜集了800個不同健康狀態的變壓器數據樣本,每個數據樣本包括CH4、C2H6、C2H4、CO2、C2H2、CO、H2、酸值、油擊穿電壓、介質損耗、水、糠醛等12個特征參量的值,取300個數據樣本作為深度自編碼網絡的無標簽訓練樣本,將剩余的500個數據樣本采用主觀賦予權重法和模糊C均值法制作有標簽數據樣本。數據樣本訓練集如表1所示。

表1 有標簽數據樣本集
在有標簽數據樣本每個狀態類別中選取40個作為深度神經網絡的微調數據集,以300個無標簽樣本作為深度網絡的預訓練集,網絡層數設定為1~8,根據不同的網絡層數得到不同的訓練誤差,結果如圖5所示。由圖5可知,當網絡層數超過5時,出現過擬合現象,因此網絡層數的最優值為5。

圖5 自編碼網絡層數與訓練誤差的關系
深度自編碼網絡的輸入層和輸出層節點個數是確定的,中間隱藏層節點個數是不確定的,為了確定隱藏層節點個數,對不同網絡結構進行分析,結果如圖6所示。由圖6可知,網絡性能最好的結構是12-9-8-7-5。

圖6 隱藏層節點與訓練誤差的關系
降噪編碼器由于噪聲數據的作用使自編碼網絡學習的數據特征更具魯棒性,因此,基于上述的網絡層數和網絡節點數在網絡輸入層數據中加入噪聲數據,觀察加入噪聲數據后的網絡性能,結果如圖7所示。由圖7可知,當噪聲數據為輸入層數據的一半時,網絡性能最好。

圖7 噪聲數據個數與訓練誤差的關系
綜合以上分析,采取5層神經網絡,其網絡節點個數分別為12、9、8、7、5,每組輸入數據隨機加入6個噪聲數據,對深度自編碼網絡進行訓練。在500個有標簽數據樣本中隨機選取200個數據樣本作為網絡性能評估的數據樣本集,評估結果如圖8所示,結果表明網絡性能良好。

圖8 變壓器健康狀態預測效果示意圖
在500個有標簽數據樣本中,隨機選取200個數據樣本作為測試樣本,采用本文所建立的網絡算法、BP神經網絡 算 法、SVM 三 種方法進行測試對比。結果如表2所示。

表2 不同方法預測變壓器健康狀態的準確率
本文基于CH4、C2H6、C2H4、CO2、C2H2、CO、H2、油擊穿電壓、酸值、介質損耗、水、糠醛等12種特征參量,根據建立好的數據訓練樣本集建立了最優的變壓器健康狀態評估模型。通過相同的變壓器數據樣本,分別應用本文所述方法、BP神經網絡算法、SVM等3種方法對變壓器健康狀態進行預測,結果表明,本文所述方法預測精度遠高于其他兩種方法,具有更好的預測功能。