杜京義,楊寧,榮相
(1.西安科技大學電氣與控制工程學院,陜西西安 710054;2.天地(常州)自動化股份有限公司,江蘇常州 213015)
異步電機在煤礦行業應用廣泛,是起重機、掘進機、采煤機、給水泵、空壓機、皮帶輸送機等旋轉機械的主要動力供應設備,電機的正常工作是確保安全連續生產的前提。研究電機故障診斷在生產生活與學術研究方面都具有積極意義。
聲音是人類獲取信息的重要來源,機器設備聲學研究有重大意義。異步電機正常運行時發出的聲音具有一定規律性,當出現故障時,其聲音特征也會隨之改變。因此,可以利用聲信號,將提取的音頻特征與某一類型的故障聯系起來,對異步電機進行故障識別與診斷。文獻[7]利用支持向量機的方法檢測電機異常聲音,但前期聲音信號缺乏進一步處理。文獻[8]利用音頻特征對電氣設備進行監測,驗證了方法的可行性,但是識別模型泛化能力較弱。文獻[9]利用BP算法對機車牽引電機進行了故障診斷,取得了一定結果。文獻[10]采用小波包分析法提取微型電機聲音信號進行故障診斷,提取信號中的沖擊成分,對故障電機進行了判別。隨著人工智能的進一步發展,以深度神經網絡為代表的智能算法對聲音信號的分類已經不斷地被引入設備故障監測與維護。目前,對于電氣設備領域,深度學習在聲信號模式識別領域的研究多集中于變壓器,尚未見到將深度學習方法應用于異步電機異常聲音檢測。
基于此,本文作者搭建3種狀態異步電機的檢測平臺并采集每一種狀態的聲音,分別提取每一個聲音片段的Log-Mel特征、MFCC特征、GFCC特征。建立卷積神經網絡(Convolutional Neural Networks,CNN)模型,通過對輸入的音頻特征進行卷積、池化等操作處理,實現對異步電機的故障分類。
針對異步電機聲音信號能量主要分布在低頻段的特點,預加重處理可以提升高頻分量,使信號頻譜變得平坦:
()=()-α(-1)
(1)
其中:0.9≤≤1.0是預加重系數;()為輸入的信號;()為預加重后的信號。
考慮到聲音信號的時變特性,需要對信號進行短時分析。首先進行預處理,它通常包含分幀與加窗2個步驟。分幀時確保幀長略大于幀間隔。文中取幀長為25 ms、幀間隔為10 ms,保證分幀后的信號不會缺失。
分幀后的信號在幀起點和幀終點處具有高度不連續性,直接進行傅里葉變換,會導致頻譜出現局部峰值。因此,采用漢明窗(Hamming)對每個分幀后的信號進行處理以減小失真現象。漢明窗公式如下:

(2)
式中:()為窗函數對應的權重。
加窗后的信號()為
()=()×()
(3)
預處理后,利用離散傅里葉變換算法得到每一幀的頻譜,取模平方得信號的功率譜:

(4)

(5)
其中:()為幀信號的頻譜;()為幀信號的功率譜。
將()信號通過梅爾濾波器組,梅爾濾波器組由一組等高三角形濾波器組成,如圖1所示。濾波器組對得到的功率譜進行濾波處理,放大中低頻分量,減小高頻分量,實現樣本數據的降維和準確的特征提取。其函數()表示為

圖1 梅爾濾波器組

(6)
其中:為濾波器組編號;()為三角濾波器的中心頻率。

(7)
式中:為信號的總幀數。
對式(6)中的()進行對數運算,得到對數功率譜′()作為Log-Mel特征:
′()=log()
(8)
該方法與Log-Mel特征方法大致相同,在Log-Mel特征參數的基礎上進行離散余弦變換(DCT)得到MFCC特征參數:

(9)
式中:為MFCC的階數;為濾波器的個數。
所得到的MFCC特征僅反映聲音信號靜態特性,需要求其1階差分系數和2階差分系數描述聲音信號的動態特性:

(10)

(11)
將MFCC參數、1階差分系數()和2階差分系數′()組合成特征向量,提高系統識別的準確性。
MFCC特征提取的主要流程如圖2所示。

圖2 MFCC特征提取流程
輸入信號需要執行相同的預加重和分幀加窗操作,使用離散傅里葉變換后信號()。因異步電機聲音信號采集環境存在背景噪聲,選用非線性Gammatone濾波器組代替梅爾濾波器組。Gammatone濾波系數計算公式為
()=-1exp(-2π)cos(2π+)()
(12)
式中:為濾波器衰減因子;為中心頻率;為濾波器相位;()為階躍函數。
如圖3所示,Gammatone濾波器組的優點是能夠模擬人耳的頻譜分析,具有很強的抗噪性,在有背景干擾的情況下同樣表現良好。

圖3 Gammatone濾波器組
結合公式(12),用冪函數=代替log函數校正信號,之后利用DCT,得到GFCC特征參數:
()=

(13)
得到GFCC特征參數,并按公式(10)(11)求其1階差分和2階差分系數,組成GFCC特征向量。
GFCC特征提取的主要流程如圖4所示。

圖4 GFCC特征提取流程
基于3-100L2-4三相異步電機,通過改造正常異步電機轉子與外殼口徑,使它出現轉子斷條與氣隙偏心2種故障類型。根據GB3806-81的標準和要求對電機進行聲學測量,測試模型如圖5所示。聲傳感器距離電機最外側30 cm,垂直指向電機的軸向,采樣頻率為48 000 Hz,采樣位數為24位,傳感器頻率響應范圍為20~20 000 Hz。數據采集實物如圖6所示。

圖5 測試模型

圖6 數據采集實物
采集后的聲音首先劃分成1 s的長度并保存為音頻文件(.wav),后續作為輸入數據進行特征處理。樣本包含3種狀態異步電機:正常、轉子斷條和氣隙偏心,每種狀態異步電機各有2臺,樣本數如表1所示。

表1 異步電機聲音信號信息
圖7所示為采集到的音頻信號的時域波形圖和頻譜圖。可見:3種狀態異步電機的頻率成分主要分布在2 000 Hz以內,不同狀態的頻譜差別較明顯。正常異步電機頻譜分布集中在0~500 Hz;轉子斷條異步電機頻譜分布在0~1 000 Hz,且有突出的800、900 Hz分量;氣隙偏心異步電機頻譜集中,突出800 Hz的分量。上述分析表明,聲音信號能夠作為區分異步電機類型的特征量。

圖7 不同異步電機的時域圖和頻譜圖
文中對采集的聲音數據分別提取3種特征:Log-Mel特征、MFCC特征、GFCC特征,特征參數的可視化結果按8∶2的比例分為訓練集和測試集,訓練集輸入卷積神經網絡進行訓練,測試集用來驗證訓練結果是否過擬合。
按照第1節的方法對采集的數據進行特征提取,特征提取結果尺寸為[39×99],前者代表特征參數的個數,MFCC特征提取和GFCC特征提取過程中分別選取13個特征參數,與其1階差分系數和2階差分系數共同組成39個特征參數,為保持維度一致,提取Log-Mel特征時選擇39個特征參數;后者代表幀信號劃分后的個數,由輸入信號決定。3種特征提取方法都有明顯的數據降維效果,解決了聲音數據量大且復雜的問題。將特征提取的參數可視化作為CNN網絡的數據集,特征提取部分結果如圖8所示。

圖8 特征提取可視化結果
卷積神經網絡是一類包含卷積計算且具有深度結構的前饋神經網絡,在圖像識別領域具有獨特的優勢。一個完整的卷積神經網絡(CNN)一般包含輸入層、卷積層、激勵層、池化層、全連接層等結構。
輸入層的主要作用是對原始數據進行預處理,包括:取平均和歸一化。卷積層的作用是對數據進行卷積,提取輸入圖像的特征。池化層的作用是降低由卷積操作得到的特征圖的維數,常見的操作有最大值池化和平均值池化。激活函數是多層神經網絡中上層節點的輸出與下層節點的輸入之間的函數關系。常用的激活函數有sigmoid、tanh和ReLU函數。全連接層的功能是將網絡學習到的特征映射到樣本的標簽空間,將卷積輸出的二維特征映射轉化為一維向量,并輸出分類結果。
根據輸入數據的特點,提出一種三層卷積神經網絡結構,如表2所示。網絡由13層組成,共有11個隱藏層,包括3個卷積層、3個rule層、3個池化層和2個全連接層。卷積層使用的卷積核大小[3×3],卷積后進行批規范化。池化層采用最大池化模式,步長為[2×2]。Dropout函數被添加到全連接層,并根據設置的概率丟棄,以防止過度擬合。輸出層由3個神經元組成,代表3種狀態的異步電機輸入。

表2 異步電機故障識別網絡結構
網絡迭代100次,每次迭代所有數據被模型學習1次。其中,模型的學習率設定為0.000 1,Dropout為0.5,批尺寸設定為32,選用ADAM優化器與多分類交叉熵損失函數。該模型在Pytorch上建立,在配有GTX 1660 GPU的計算機上運行,網絡訓練結果如圖9所示。

圖9 網絡訓練準確率結果
當訓練完成后,保存訓練好的模型,計算測試集分類精度,結果如表3所示。其中,Log-Mel-CNN、MFCC-CNN、GFCC-CNN分別表示采用Log-Mel特征、MFCC特征以及GFCC特征的基于CNN的識別系統。

表3 CNN模型的識別精度 單位:%
由表3可知:文中所搭建的神經網絡能夠很好地識別3種特征參數,對于異步電機的測試樣本,采用MFCC和GFCC特征參數的識別系統都具有較高的識別準確率;采用GFCC來表征聲音信號并進行訓練,平均識別精度最高,達到了95.4%,分別比Log-Mel、MFCC高了7.6%和4.9%。斷條故障電機會在構造以及實驗采集過程中受到偏心信號的影響,因此Mel濾波器的2種特征識別都不太理想。結果表明:在復雜環境下,GFCC特征提取的魯棒性能更強。
分別采集了3類異步電機的聲音,分析3種狀態異步電機聲音信號頻率分布特點。參考當前區分環境聲音的分類方法,將聲學特征提取運用到異步電機的故障分類中。分別采用Log-Mel、MFCC、GFCC 3種方法對信號進行特征提取,最后利用卷積神經網絡對數據進行了分類識別與比較。結果表明:3種特征提取方法能夠有效降低聲音樣本數據量和復雜程度,其中GFCC特征提取方法更適合于深度卷積神經網絡的識別模型,平均識別準確率達到95.4%。