龍玉江,姜超穎,鐘 掖,田月煒
(1.貴州電網有限責任公司信息中心,貴州 貴陽 550003;2.西安電子科技大學,陜西 西安 710126;3.貴陽供電局,貴州 貴陽 550001)
輸變電變壓器作為重要的電器設備,是實現電能輸送、穩定和安全的關鍵設備,其正常運作對于保證人們生活質量具有重要意義。隨著人們生活水平的提高,對電的需求也在不斷提高,使得輸變電變壓器常處于負荷狀態,成為整個供電系統中最不穩定的一個部分。因此,對輸變電變壓器進行故障分析與預測有著極為重要的作用。
在發生故障時,電力變壓器內部會產生一定量的溶解氣體,現有的對于正常天氣狀態下的變壓器故障預測模型多是對油溶解氣體進行分析,進而實現對變壓器故障的診斷[1]。近年來,以深度學習為基礎,基于油氣分析的變壓器故障診斷已有較多研究成果,如采用BP 神經網絡[2?3]、CNN[4?5]、PNN[6?7]、DBN[8?9]等實現了高精度故障預測。其中,趙文清等人在傳統的BP 神經網絡基礎上,提出一種基于殘差BP 神經網絡的變壓器故障診斷方法,將傳統網絡中的恒等映射學習轉化為殘差學習,使得在小樣本數據下仍然能夠獲得較好的診斷性能[10]。夏洪剛等人提出一種基于卷積神經網絡(CNN)的電力變壓器故障診斷方法,對變壓器油中溶解氣體進行了二進制編碼,并對其進行降維與重構,相比于傳統機器學習方法在效率與精度方面都有著顯著優勢[11]。董理科等人以知識圖譜技術為基礎,結合梯度提升決策樹,提出一種結合變壓器故障各影響因素以及歷史運行數據的知識圖譜少樣本訓練及故障預測方法[12]。
為了提高變壓器故障診斷模型的預測精確度,對于分類器的設計和選擇也至關重要,其中樸素貝葉斯(NB)[13]、支持向量機(SVM)[14?15]是較為常見的兩種分類器。樸素貝葉斯通過計算條件概率來預測給定特征向量屬于每個類別的概率,并選擇具有最高概率的類別作為預測結果;支持向量機是一種基于最大邊際的分類算法。
對于上述討論,以下文獻在DGA 的基礎上對分類器進行了不同的研究:張朝龍等人提出了一種可用于海量數據監測的智能故障診斷方法,設計無源射頻識別傳感器標簽并采用加權貝葉斯分類模型進行故障診斷,具有較高的故障診斷準確率[16];李朕玥在SVM 的電力變壓器故障診斷方法與分析中,提出一種立足于支持向量機的變壓器工作方式判斷方法,將非線性問題轉化為高維空間問題,從而對非線性問題予以較為準確的分類識別[17]。
在深度學習領域,對數據的多維度特征提取已經成為一個提高識別準確率的重要方法,通過神經網絡將從各個維度提取的特征合并成一個比輸入特征更具有判別能力的特征。余登武等人提出一種基于深度學習分位數回歸的電力負荷區間預測方法,該方法將輸入數據劃分成負荷特征部分和時間天氣特征部分,分別傳入卷積神經網絡和反向傳播神經網絡進行訓練,再拼接輸出后傳入全連接層構成深度學習模型[18]。該方法可以獲得高精度。
對于正常天氣狀態下的變壓器故障預測已有多種預測與分析模型;而在極端氣象條件下,已有的故障預測模型會出現一定的偏差,其故障預測準確性會受到極端氣象的影響,在這種情況下已有故障預測模型不再適用。針對上述問題,本文提出了一種極端氣象條件下基于深度學習網絡特征的變壓器故障預測模型。該模型引入了極端氣象條件下的氣象參數,并分別對油中溶解氣體含量與氣象條件進行時因分析,從而提取特征;其次,將融合后的聯合特征導入提出的新型神經網絡,得到故障預測結果,提高了故障預測的準確率。
卷積神經網絡(Convolutional Neural Network,CNN)是人工智能研究領域的重要部分,近年來,其在許多領域都發揮了巨大作用,如語音識別、圖像識別等。CNN 由不同數量的神經元按照不同的方式搭建,從而構成不同結構的網絡模型。圖1 所示為一個簡單的前饋卷積神經網絡模型。

圖1 前饋卷積神經網絡模型
圖1 中,最左側為前饋卷積神經網絡的輸入層,最右側為輸出層,其余為中間層。在中間層,每層神經元將上層神經元的輸出作為當前層的輸入。前饋卷積神經網絡單向逐層向后傳遞信息,具體表達式如下:
式中:j∈{2,3,…,J},J代表神經網絡的總層數;W(j)代表第j-1 層到第j層的權重矩陣;y(j-1)是第j-1 層輸出;b(j)代表第j-1 層到第j層偏置;網絡最后輸出yJ;fj(·)代表第j層神經元的激活函數。
為了從輸入樣本中學習復雜的特征,激活函數均采用非線性函數。選擇合適的激活函數可以幫助神經網絡更好地學習數據的特征,從而提高模型的準確性和泛化能力。激活函數需要連續并且可導,這樣可以采用數值優化的方法學習網絡參數;同時激活函數及其導數需要盡可能簡單,這樣能夠降低復雜度,提升計算效率。
卷積神經網絡一般由三個部分組成,分別為卷積層、池化層、全連接層。其中,卷積層是CNN 的核心部分,它由若干卷積單元組成,每個卷積單元的參數都可經過反向傳播算法進行優化。卷積層可以包含多個卷積核,每個卷積核提取一種特定的特征。卷積層的輸出作為下一層的輸入,同時卷積層的參數也需要進行訓練,以使得它能夠提取出對于任務有用的特征。卷積運算用于提取輸入的不同特征,隨著卷積層數量的增加,提取的信息也更加復雜。
1980-1995年,由于巴西政府在農業方面的信貸總額逐漸降低,民間私人銀行農業信貸的比率上升,使得農業貸款利率提高,給許多農民造成較大的償債負擔。1995年后巴西政府針對這一不良現象,采取了相應的處理措施,主要有兩點:第一,在法律上允許不具有償債能力的農戶適當延長償債期限;第二,以其他方式進行債務償還,如農業生產者可以用農產品償還購買農業機具的債務,這種方式不僅可以讓農戶的生產壓力降低,還能夠刺激國內農業機具的銷售量,對促進農業的整體發展有著較大的幫助。
由于卷積計算后的數據仍然龐大,因此采用池化層對數據進行降采樣,從而降低訓練復雜度。常見的池化方式有最大池化(Max Pooling)和平均池化(Average Pooling),它們分別選擇一個區域內的最大值或平均值作為輸出,平均池化能夠減小鄰域大小受限而造成的誤差,最大池化能夠減小卷積層參數造成的誤差。全連接層起到“分類器”的作用,將網絡學習到的特征映射到樣本標記空間。在全連接層中,常采用Dropout 的方法來隨機使部分神經元失活,既避免過擬合,又提高模型的泛化能力,其隨機性也可以使每次訓練的網絡不同,使得將每次訓練的子網絡組合起來能夠獲得更好的預測效果。
卷積層用于提取輸入特征,其中一維卷積和二維卷積是常用的兩種卷積方式,它們的卷積核都是二維的,但滑動方向有所不同。一維卷積操作通常應用于時間序列數據的處理,如音頻信號、文本等,它的作用是將輸入數據與卷積核進行卷積運算,得到一系列的特征圖。這些特征圖能夠捕捉到輸入數據中的不同模式,從而可以用來進行分類、回歸等任務。其卷積核在輸入數據上單方向窗口滑動,常用于提取信號序列的時序特征以及其他高維特征。二維卷積常用于圖像處理領域,其卷積核在輸入數據的水平與豎直兩個方向上滑動,能夠獲取特征的位置信息,也可用于多目標分類。在卷積核滑動過程中,數據的邊緣會被裁剪掉,采用邊緣填零的方式可以使得輸入數據的邊緣特性得以保存。
卷積可看作對某個局部的加權求和,卷積核作為權重矩陣,連接輸入數據與權重參數。卷積核對于當前層的所有神經元都是相同的,通過在不同數據層上滑動來提取不同特征,同時卷積核的滑動也可避免全連接前饋神經網絡中,由于權重矩陣參數過多而導致訓練效率低的問題。
本文主要采用油溶解氣體分析(Dissolved Gas Analysis,DGA)方法,同時結合極端氣象條件下的氣象參數,對變壓器故障進行分析。變壓器的絕緣材料會因為電氣和熱老化而產生氣體,這些氣體會被油吸收并溶解在油中。監測變壓器油中的氣體含量可以幫助診斷變壓器的絕緣狀況。在輸變電變壓器發生故障時,這些特征氣體主要包括氫氣、甲烷、乙烷、乙烯、乙炔五種,不同故障類型會導致變壓器內氣體含量也不同。
除了變壓器內部氣體環境,在極端氣象環境中,一些天氣參數如外界溫度、濕度、氣壓等也會對變壓器運行狀態有一定影響。因此,本文在傳統DGA 分析的基礎上,結合了氣象參數對變壓器進行故障分析,以提高模型故障預測的泛化能力。
故障診斷基本流程如圖2 所示,具體診斷步驟為:

圖2 故障診斷基本流程
1)采集各種極端氣象條件下輸變電變壓器故障數據,預置故障類型;
2)數據參數預處理;
3)創建深度學習網絡;
4)更新網絡權重;
5)輸入驗證集數據,輸出故障類型。
輸變電變壓器故障的類型較多,本文以DGA 方法為基礎,主要研究較為常見的7 種變壓器狀態,分別為:低溫過熱(低于150 ℃)、中低溫過熱(低于300 ℃且高于150 ℃)、中溫過熱(低于700 ℃且高于300 ℃)、高溫過熱(高于700 ℃)、低能放電、高能放電以及正常狀態。為了便于特征提取,對以上變壓器狀態類型進行獨熱編碼(One?Hot),此種編碼類型將一個分類變量轉換為多個二元變量,能夠處理非連續的數值特征,也可配合特征選擇來節省空間,防止模型對分類變量的值進行不必要的排序。變壓器狀態編碼如表1 所示。

表1 變壓器狀態編碼
在數據集方面,共選取512 組故障數據。由于變壓器類型和等級不同,其氣體含量也會存在較大的差異。采集多組正常運作的變壓器數據,根據正常情況下的各種參數劃定正常標準,將氣體以及各種氣象參數根據正常值的范圍進行轉化,并將絕對值轉化為相對值,消除不同參數之間的差異,同時減小誤差。對油氣含量與氣象參數進行數據預處理,處理公式如下:
式中:xi表示預處理后的油氣含量與氣象參數;表示正常狀態時參數值;分別表示數據樣本中的參數最大值與最小值。對采集的數據(每組數據包含變壓器內5 種氣體含量與3 種外界氣象參數共8 個參數)添加故障類型標簽,從而形成帶故障標簽的原始信號數據集。將5 種氣體含量作為數據集Ⅰ,其大小為5×512;將外界氣象參數數據作為數據集Ⅱ,其大小為3×512。從原始數據集中隨機抽出75%的數據作為訓練集,其余25%的數據作為驗證集。
將訓練數據集Ⅰ通過序列輸入層導入深度學習網絡Ⅰ,提取變壓器內5 種氣體含量隨著時間變化的高維特征;將數據集Ⅱ通過序列輸入層導入深度學習網絡Ⅱ,提取外界氣象參數隨著時間變化的高維特征。將數據集Ⅰ與數據集Ⅱ提取的特征融合并導入深度學習網絡Ⅲ。數據導入與訓練過程如圖3 所示。

圖3 數據導入與訓練過程
深度學習網絡Ⅰ(Ⅱ)和深度學習網絡Ⅲ結構分別如圖4 與圖5 所示。

圖4 深度學習網絡Ⅰ(Ⅱ)結構

圖5 深度學習網絡Ⅲ結構
深度學習網絡Ⅰ(Ⅱ)由8 層網絡組成:第1 層為卷積層Ⅰ,防止原輸入信息掉到卷積核邊界之外;第2 層為一個池化層對數據進行降采樣,簡化網絡復雜度,降低計算量;第3 層為一個卷積層Ⅱ;第4 層為一個池化層;第5層為一個卷積層Ⅲ,第6層為一個池化層;第7 層為一個卷積層Ⅳ;第8 層為一個池化層。其中,深度學習網絡Ⅰ(Ⅱ)卷積核大小不同,其余參數相同。深度學習網絡Ⅰ(Ⅱ)參數如表2 所示。

表2 深度學習網絡Ⅰ(Ⅱ)參數
深度學習網絡Ⅲ由4 層網絡組成,因為在融合之前支路上均已經包含了多層卷積。對于融合后的特征,不設計過深的卷積神經網絡對其進行訓練,其結構參數如表3 所示。第1 層為卷積層Ⅰ;第2 層為一個池化層;第3 層為一個全連接層,并使用ReLU 激活函數,解決了梯度消失問題,同時防止梯度彌散。ReLU 激活函數會使一部分的神經元輸出變為0,減少了參數的數量,同時也解決了過擬合的問題。相比于Sigmoid 等激活函數,ReLU 激活函數計算量小。第4 層為一個Softmax層,通過Softmax 多分類器計算每個故障類型的概率值,傳輸到分類層達到分類目的。

表3 深度學習網絡Ⅲ參數
在訓練過程中使用誤差反向傳播算法更新網絡權重,優化神經網絡。該算法利用鏈式法則對網絡中的誤差進行反向傳播,并根據誤差調整每個神經元的權重。具體步驟為:初始化神經網絡訓練參數,設置最大訓練迭代數為1 000,設置初始學習率為0.01,將預處理后的數據導入網絡進行訓練,并使用誤差反向傳播算法更新網絡權重,以此得到最優的網絡結構,同時不斷更新迭代次數與學習率等。
本文采用的變壓器數據集共512 條,在DGA 方法的基礎上加入極端氣象參數,每條數據包含5 種油氣含量與3 種極端氣象參數共8 個特征,選取其中75%作為訓練集,25%作為測試集。
為了對本文提出的極端氣象條件下基于深度學習網絡特征的變壓器故障預測方法進行性能評估,將其與概率神經網絡(PNN)方法以及基于傳統算法的BP 神經網絡進行對比。圖6 為本文提出的基于特征融合的神經網絡的測試集預測效果圖,圖7 為三種方法對測試集的預測效果。

圖6 基于特征融合的神經網絡預測效果圖

圖7 三種方法預測準確率
由圖6、圖7 可知,本文提出的基于特征融合的深度學習網絡對于極端氣象條件下的故障預測準確率遠高于傳統BP 神經網絡方法與概率神經網絡(PNN)方法。本文方法準確率達到了90.625%,表明該方法對于極端氣象條件下的故障預測具有一定的優勢。表4 為變壓器7 種故障類型以及相應的測試集樣本數與正確率。

表4 基于特征融合的神經網絡故障診斷結果
由表4 可知,本文提出的神經網絡結構對于低溫過熱、中低溫過熱、中溫過熱、高溫過熱故障類型的預測準確率均達到了90%以上,尤其對于中低溫過熱與高溫過熱這兩種故障類型的預測表現出了良好的預測性能;但對于故障類型7(高能放電)與故障類型6(低能放電),三種方法預測準確率均有所下降。通過對數據集分析,高能放電故障樣本數量相對于其他6 種故障類型較少,在訓練過程中可能會存在過擬合現象。為了得到較高的預測準確率,在之后的實驗中可選取更多的訓練樣本。
本文提出一種極端氣象條件下基于深度學習網絡的變壓器故障預測方法。實驗結果表明,相比于其他傳統故障預測方法,本文方法的準確率有了明顯提高,同時也彌補了傳統變壓器故障預測方法中泛化能力弱、時效性低、精度低的缺點。