崔佳嘉, 馬宏忠
(河海大學 能源與電氣學院,江蘇 南京 211100)
變壓器是電力系統中最重要的電力設備之一,其運行安全影響著整個電力系統[1]。基于聲紋信號的變壓器故障診斷技術是目前的研究熱點之一。
目前針對電力變壓器的鐵心松動故障的診斷方法主要集中在對振動信號的分析上,振動信號的獲取是通過將振動傳感器附著在器壁上而采集得到的。與變電站普遍采用巡檢的方式進行故障診斷相比,基于聲紋信號的診斷方法具有非接觸性、測量方便及聲傳感器價格便宜等優勢。因此,依據變壓器發生鐵心松動故障時發出可聽聲信號(20 Hz~20 kHz),提出采用聲紋信號對變壓器鐵心松動故障進行診斷[2-5]。
目前對基于聲紋信號的變壓器鐵心松動故障診斷的研究較少。文獻[6]建立了Mel時頻譜-二維卷積神經網絡(2D-CNN)的鐵心松動故障識別模型,采用的是2D-CNN,其識別率較低。文獻[7]通過改進Mel頻率倒譜系數(MFCC),優化聲音信號特征提取算法,并通過支持向量機分類算法對特征量進行識別。該文獻明確提出只適用于試驗室條件下,對處于室外環境含有各種噪聲源的大容量變壓器并不適用。除此之外,MFCC是基于人耳對聲音的感知確定的,而變壓器運行發出的噪聲與人聲差異是巨大的,因此采用該特征量對故障識別恐有不妥[8-13]。國內外的學者對變壓器的聲紋信號做了很多的研究,但大多未考慮到實際變壓器噪聲信號的測試結果會受多種環境因素及干擾的影響[14-15],現場采集到變壓器運行時的噪聲信號不能直接用于故障診斷模型中進行識別,而應將復雜環境中的其他噪聲源從信號中濾除,再進行特征提取與識別。目前對于降噪的研究中,普遍采用的是小波分析和經驗模態分解(EMD),但這二者具有不適應性和模態混疊等缺陷。而完全自適應噪聲集合經驗模態分解(CEEMDAN)能夠在分解的每個階段自適應地添加白噪聲,分解過程具有完整性且幾乎沒有重構誤差,解決了EMD重構不完整的問題。在利用卷積神經網絡進行聲信號識別時,三維卷積神經網絡(3D-CNN)比2D-CNN更適合提取時空特征,在網絡訓練過程中能使用更少的樣本、更簡單的網絡結構,卻能得到更好的訓練效果。
因此,結合CEEMDAN和小波閾值的濾波方法,及3D-CNN的特點,本文提出了基于CEEMDAN-小波閾值及3D-CNN的變壓器鐵心松動故障診斷模型。
CEEMDAN是在EMD的基礎上,在原信號中加入高斯噪聲并通過多次疊加求取平均值的方式抵消噪聲的方法。通過自適應地添加高斯白噪聲來削弱模態混疊問題,且分解過程具有完整性、幾乎無重構性誤差的特點。
CEEMDAN的算法具體描述為[16]
(1) 在原始信號的基礎上加入高斯白噪聲分量ε0ωk(t),其中εi-1表示求解IMFi(t)時的自適應系數,K為在原始信號上添加白噪聲的數量。對分別增加了白噪聲的K個信號進行EMD分解,得到各個信號的一階模態分量IMF1(t),定義第k次加入噪聲得到的一階模態分量為imfk1(t)。則CEEMDAN分解得到的一階模態分量為

(1)
(2) 計算分解出IMF1(t)后的第一個余量信號r1(t),即為
r1(t)=x(t)-IMF1(t)
(2)
(3) 在余量信號r1(t)的基礎上加入噪聲分量ε1E1[ωj(t)],E1(·)表示經過EMD分解產生的第1階模態分量算子。則CEEMDAN分解得到的二階模態分量為

(3)
(4) 重復步驟(2)和步驟(3),就可以計算出第i個余量信號和第i+1階模態分量:
ri(t)=ri-1(t)-IMFi(t)
(4)

(5)
(5) CEEMDAN分解的終止條件是求解出的余量信號無法再進行EMD分解。若最終分解出I階模態分量,則最終的余量信號R(t)為
R(t)=x(t)-IMFI(t)
(6)
在CEEMDAN分解后得到的IMF分量中,選擇適當的分量進行小波閾值去噪,再對去噪后的信號重構能進一步降低信號中的噪聲成分。其降噪的步驟為[17]
(1) 對選擇的信號進行小波分解并求取小波系數;
(2) 設置閾值,高于閾值的系數保留,低于閾值的系數當作噪聲去除;
(3) 使用步驟(2)中處理過的小波系數和近似系數對信號進行重構。
語譜圖是聲音信號分析處理的重要特征頻率譜圖,能夠反映信號在不同時間下的頻率能量分布。完整地建立聲音信號在時域與頻域之間的聯系,實現聲音特征信息的最大化,有助于后期聲紋特征的提取與學習。
將采集到的變壓器各種工況下的聲紋信號,用上述CEEMDAN-小波閾值濾波法得到純凈的變壓器運行的聲音信號。利用濾波后的信號繪制聲紋語譜圖,語譜圖的繪制包括分幀、加窗和離散傅里葉變換過程。由于變壓器噪聲較人聲更加平穩,可以適當增加幀長以保證語音信號特征的完整性,本文中取每幀N=1 250為25 ms(采集頻率fs=50 kHz),為了使幀與幀之間能平滑過渡,取重疊率為50%。其次,若是直接對分幀后的數據進行離散傅里葉變換,會出現頻譜泄漏的情況,因此需要對每一幀先作加窗處理,本文選擇加漢明窗,使信號兩端變得平滑以減少信號的失真。
繪制的語譜圖的橫坐標表示分幀后的幀數(時間),縱坐標表示頻率,其中的顏色深淺表示該時刻和頻率下的大小,該大小為功率譜密度。通過短時傅里葉變換生成的語譜圖如圖1所示。
通過上述預處理得到的語譜圖可以描述變壓器運行過程中時域與頻域之間的關系,雖然在時間上將維度壓縮到159列,但是在頻率維度上卻有2 049行,對后續卷積神經網絡的訓練識別速度有很大的影響。因此必須對頻率維度進行壓縮,考慮使用Mel濾波器對時頻矩陣降維。
Mel濾波器是根據人耳結構特征,對線性的頻段做非線性處理,將低頻部分的權重加大,對高頻部分的權重降低,突出有效頻段的作用。Mel頻率與實際頻率的轉化關系為[11]

(7)
式中:fMel(f)為Mel刻度下的頻率;f為實際頻率。
Mel濾波器為一個由M個三角形濾波器組成的濾波器組(取M=40),中心頻率為f(m)。在Mel頻率刻度上,濾波器之間的距離是等寬的。該濾波器組的傳遞函數為

(8)
其中,f(m)定義為[7]

(9)
式中:fh與fl為濾波器濾波頻率的上限與下限;fs為變壓器聲紋采樣的采樣頻率(fs=50 kHz);N為進行短時傅里葉變化時的幀長。
通過使用Mel濾波器對數據進行降維后,時頻矩陣從159×2 048被壓縮至159×40,大大縮減了數據的尺寸,方便后續的模型訓練與識別。由此生成的Mel-語譜圖如圖2所示。
傳統的2D-CNN只能提取二維圖像的特征信息,而3D-CNN適用于更高維度的圖像數據,在處理過程中增加了時間維度的信息(連續幀),神經網絡可以同時提取出時間與空間的信息。因此,與二維卷積相比,三維卷積更能捕捉到時序上的特征。3D-CNN的卷積公式為

(10)

Mel-語譜圖生成的圖像的尺寸為41×40×3,其中41表示時間分量,40表示Mel標度下的頻率分量,3表示生成圖片的RGB 3個通道,而單張圖片只可以作為二維卷積神經網絡的輸入。由于三維卷積神經網絡在二維卷積的基礎上增加了時間的維度,因此在數據集的制作上不同于二維卷積。將采集的2 s原始數據分為4幀數據,用上述方法生成4張Mel語譜圖,并將這4張圖片堆疊成立體數據如圖3所示,其數據尺寸為4×41×40×3,4表示數據深度,41表示時間分量,40表示Mel標度下的頻率分量,3表示生成圖片的RGB 3個通道。將2 s的數據樣本分成4段信號,每段信號0.5 s;按照前文所提方法,將每段0.5 s信號按每幀N=1 250為25 ms的長度分幀,每段信號生成的Mel語譜圖的尺寸為41×40×3;將4段信號分別生成的Mel語譜圖堆疊后,數據尺寸為41×40×3。
本文使用的3D-CNN是由2層卷積層、2層池化層及2層全連接層組成,均采用SAME補零方式。其中,卷積層后接有激活層,激活層選擇的是線性整流函數(ReLu)。dropout是一種非常有效的提高泛化能力、降低過擬合的方法,因此選擇在每一個全連接層后設置dropout層,速率均設置為0.5。由于本文作4分類問題,將最后一層設置為4節點,用softmax函數激活作分類。網絡的詳細結構如表1所示。

表1 3D-CNN網絡結構
對于大容量變壓器而言,由于其位置處于室外,在聲紋信號采集過程中,不可避免地會受到環境中各種噪聲的干擾,比如鳥鳴、汽笛聲、特殊天氣的雷電聲,這些噪聲會直接影響后續變壓器聲紋故障診斷的準確性。峭度是信號時域特征中反應隨機變量的分布特征,可以用來描述信號概率密度函數的陡峭程度。變壓器本體噪聲是較為平穩的信號,其峭度值較小,概率密度分布一般呈現高斯分布或亞高斯分布,而其他的噪聲是沖擊性信號,其峭度值很大,概率分布呈現超高斯分布。利用這一特性能有效地將采集的變壓器聲紋信號中其他噪聲源的含量去除,提高信噪比。
采集一段變壓器運行時純凈的信號(不含有噪聲),其時域和頻域信號如圖4所示。將其進行CEEMDAN分解后,得到20個本征模態函數(IMF),再計算出各個IMF分量的峭度值,發現各個分量的峭度值在2.6左右。
再將一段雷聲的噪音用加性噪聲的處理方法線性疊加在原始信號中。變壓器運行時帶噪信號的時域和頻域波形如圖5所示。
再將帶噪信號進行CEEMDAN分解,共分解出19階IMF和1個余量,計算各分量的峭度值如表2所示。

表2 各階分量的峭度值
選擇帶噪信號分解的分量中峭度值偏離3較大的分量IMF13 、IMF15和 IMF18進行小波閾值去噪。最后將經過小波閾值去噪后的分量及未處理的分量一同進行信號的重構,得到去噪后的信號的時域和頻域分布,如圖6所示。去噪的信號與原始信號在幅值上相差的數量級為10-6,信噪比從-15.01升至136.13,去噪效果非常好。
為了驗證3D-CNN對變壓器鐵心松動故障識別效果,搭建了變壓器鐵心松動故障試驗平臺,采集鐵心在不同松動程度下的噪聲信號。
試驗對象為一臺S13-M-200/10變壓器,根據GB/T 1094.10—2003對該變壓器噪聲測量的標準和要求,采用電容式麥克風作為聲傳感器對變壓器鐵心不同松動情況下的噪聲進行測量,采樣頻率為50 kHz,頻率響應為20 Hz~20 kHz。試驗在變壓器廠廠房中進行,廠房空間較為空曠,幾乎不存在聲波反射的情況,試驗環境如圖7所示。
在設置鐵心不同松緊程度時,將變壓器油抽出后吊芯,鐵心的壓緊程度是通過改變螺栓的預緊力來確定的, 先使用扭力扳手確定被測試的變壓器的額定預緊力FN,再分別改變螺栓預緊力使扭力扳手的值分別達到FN(未松動)、0.6FN(松動40%)、0.2FN(松動80%)、0(松動100%)。模擬過程如圖8所示。在低壓側加400 V電壓,變壓器空載運行,分別采集變壓器鐵心未松動、松動40%、松動80%、松動100%時的若干個聲紋信號。
分別采集鐵心在未松動情況下的樣本82個,松動40%時的樣本129個,松動80%時的樣本129個,松動100%時的樣本140個。其中,將80%的數據作為訓練樣本,剩余20%作為測試樣本,驗證模型的有效性。
設置3D-CNN訓練的epoch=100,批處理量batch_size=60,優化器選擇的是Adam算法,學習率設置為0.001,損失函數選擇的是傳統的交叉熵函數。
將采集到的數據經過CEEMDAN和小波閾值濾波后,將每一段音頻生成Mel-語譜圖,且按照上述方法將每一段語音最終制作成三維的數據塊送入模型中訓練。用準確率acc和損失值loss來評判模型的優劣。損失值loss表示預測值與實際值的差距,準確率acc表示正確分類的數量與總樣本之間的比值。損失值越小,準確率越高,說明該模型越適用于變壓器鐵心松動的故障識別。
圖9所示為3D-CNN模型訓練過程中準確率acc隨epoch變化的曲線圖。從圖9中可以看出,當epoch未達到60時,準確率的浮動較大,但是當epoch達到60次后,準確率穩定在0.983 333~1,因此模型在訓練達到60次以后,模型趨于穩定。
圖10所示為3D-CNN模型訓練過程中損失值loss隨epoch變化的曲線圖。從圖10中可以看出loss值隨著epoch的增加整體上呈現出下降的趨勢。當epoch達到63以后,loss值穩定在1以下;當epoch達到85以后,loss值穩定在0.4以下并趨于穩定。因此,判斷該模型已經收斂并完成訓練。
在訓練好的模型上對測試集測試,測試結果顯示準確率為0.933 333,綜合訓練集上的準確率acc和損失值loss的結果及測試集上的準確率,確定該3D-CNN適用于變壓器鐵心松動故障的診斷。
本文構建了基于CEEMDAN-小波閾值的環境噪聲去除方法和基于聲紋的3D-CNN的變壓器鐵心松動故障診斷方法。所提方法考慮到大容量變壓器所處的復雜環境噪聲的影響,并搭建3D-CNN網絡對鐵心松動故障進行診斷,具體優勢體現在:
(1) 能去除信號中含有的復雜環境中其他噪聲成分,使得所提出的方法不局限于試驗室環境,更適用于實際變電站環境;
(2) 提取聲信號中連續幀之間的信息,利用3D-CNN網絡對變壓器鐵心松動故障識別,使用最簡單的3D-CNN結構,就可以達到90%以上的識別率。