高 原, 鄧艾東,, 范永勝, 梁志宏, 傅行軍
(1.東南大學 大型發電裝備安全運行與智能測控國家工程研究中心,南京 210096;2.東南大學 能源與環境學院,南京 210096; 3.國家能源集團江蘇電力有限公司,南京 215433)
旋轉機械設備對于制造業的發展十分重要,風電機組滾動軸承是大型旋轉機械中的關鍵部件,在運行過程中承受巨大的負載,易發生故障,導致整個系統停機,從而對生產過程的安全運行造成巨大影響。同時在正常工業生產中,設備長期處于正常運行狀態,正常樣本數據豐富而各類故障工況的異常樣本數據獲取困難,因此對滾動軸承進行早期故障診斷和異常狀態監測具有重要意義。
馬天霆等[1]提出一種基于有理樣條插值的局部均值分解算法,并將其應用于滾動軸承早期微弱故障的診斷。張西寧等[2]采用改進隨機森林實現了針對單類軸承樣本的異常檢測。馮輔周等[3]提取排列熵等特征參數,通過神經網絡完成對異常模式的分類。尹愛軍等[4]提出了一種基于變分自編碼器的軸承狀態評估方法,通過變分推斷的方式,從振動信號頻域中學習潛在的狀態概率分布,并將其應用于軸承的運行狀態評估。單龍飛等[5]針對系統的動態特性,使用軟閾值和自編碼器(AutoEncoder,AE)結合的方法進行特征提取。
基于信號處理的方法需要人為提取傳統特征,不同工況下的故障需要提取不同的特征,而神經網絡又面臨著無法提取軸承運行深層特征,模型診斷效率不高的問題。支持向量機(SVM)作為一種解決小樣本、非線性和高維模式的代表性機器學習方法,已被廣泛應用于滾動軸承故障診斷[6]。支持向量數據描述(SVDD)[7]是一種有效的單值SVM,該方法僅需正常樣本進行模型訓練,這為實際生產中的異常數據匱乏問題提供了解決途徑。王斐等[8]提出了一種基于變分模態分解提取分量奇異值特征,結合SVDD模型的滾動軸承性能退化評估方法。
然而SVDD只考慮了數據點與超球體之間的核距離,未考慮數據的密度分布情況,使得到的超球體忽略那些高密度區域,一些受到噪聲影響的邊緣樣本在模型訓練時受到同等對待[9],使模型的準確性和抗噪性能下降。滾動軸承工作過程中,傳動系統的零部件以及外界會存在嚴重噪聲干擾現象,這對該情況下實現滾動軸承故障的準確識別提出了嚴峻的挑戰。同時,SVDD在大樣本下計算性能較差,需要人為提取特征,因此其與新的特征提取方法的結合有待深入研究。
大型旋轉設備一般處于長期工作的狀態,啟停不易,傳統的振動信號故障診斷技術因為接觸式測量、傳感器不易安裝等缺點,在某些場景下使用不便。而聲音傳感器具有設備簡單、安裝靈活、信號易獲取等優點,可以實現非接觸測量。同時聲紋特征,例如線性預測編碼(Linear Predictive Codes, LPC)、梅爾倒譜系數(Mel-Frequency Cepstral Coefficients, MFCC)等由于提取簡單、預測精度高等優點,在語音識別領域有著廣泛應用[10]。在工業領域,基于聲紋特征的故障診斷也有所使用,周宴宇等[11]研究了梅爾倒譜系數和線性預測倒譜系數在滾動軸承不同類型故障下的診斷效果。但使用音頻信號進行軸承異常檢測的研究仍有較大空白。
綜上所述,考慮到滾動軸承運行數據易受噪聲干擾導致密度分布不均勻的問題,筆者提出一種基于MFCC和馬氏距離加權支持向量數據描述(MDE-SVDD)的滾動軸承音頻信號異常檢測方法,將基于馬氏距離的加權系數引入SVDD優化問題的松弛變量中,僅使用軸承正常運行狀態下的音頻信號樣本數據作為模型的輸入,提取其梅爾倒譜系數作為特征向量,使用MDE-SVDD對不同噪聲背景、運行狀態下的滾動軸承音頻信號進行二分類的異常檢測,并將結果與傳統SVDD和AE 2種模型進行比較。
MFCC利用人類對聲音頻率非線性變化的感知能力,將聲音頻譜轉換為梅爾頻率尺度,與正常的對數倒頻譜中線性間隔的頻帶相比,更接近人類的聽覺系統,使聲音信號有更好的表示。逐條計算濾波頻譜的能量,得到的參數反映了各頻帶的頻譜能量分布。MFCC提取流程如圖1所示。

圖1 MFCC提取流程圖
步驟1,對輸入的連續聲音信號進行預處理,包括預加重、分幀和加窗等步驟。預加重可以對聲音信號的高頻分量衰減進行彌補,其公式如下:
(1)

分幀是將音頻樣本分為長度相等的片段的過程,其目的是使每一幀內的信號具有短時穩定性。兩相鄰幀之間有一段重疊區域,稱為幀間隔或者幀移。
為了增加信號兩段的連續性,對每個分幀信號施加漢明窗變換,其函數h(n)如下:
(2)
假設分幀后的信號為s(n),n=0,1,…,N-1,其中N為幀的大小,乘以漢明窗之后:
S(n)=s(n)·h(n)
(3)
步驟2,預處理后的信號S(n)經過快速傅里葉變換(FFT)得到頻譜X(k),計算式為
(4)
步驟3,求X(k)的平方獲得能量譜,之后使用M個MEL帶通濾波器進行濾波,第p個濾波器的傳遞函數為
Hp(k)=
(5)

步驟4,計算濾波器組的對數能量,第p個濾波器組的對數能量C(p)為
(6)
步驟5,計算得到的對數能量經過離散余弦變換(DCT)可得到梅爾倒譜系數:

0≤i (7) 式中:M也表示MFCC特征的維數。 SVDD是一種異常檢測算法,主要思想是求解一個包圍盡可能多正常樣本的最小超球體。 對于m個樣本點x(1),x(2),…,x(m),假定這些樣本點分布在一個球心為a、半徑為R的球中。那么樣本x(i)滿足: (x(i)-a)T(x(i)-a)≤R2 (8) 而樣本訓練集中難免存在一些噪聲或者異常值,為了提高超球體對異常數據的魯棒性,引入松弛變量ξ,允許部分樣本不在這個超球體之內,于是優化問題的目標函數轉化為 (9) 其中C>0由人為設置,是一個懲罰因子,也就是正則化參數,代表著以多大程度拒絕目標樣本或者以多大程度接受異常點樣本。 傳統的SVDD使用訓練集樣本訓練模型時,模型對所有的樣本采取相同設置,沒有考慮樣本數據自身的密度分布。在訓練集的正常樣本數據中,存在一些密度稀疏的離群樣本會對模型的構建產生負面效果。因此,筆者決定對樣本賦予不同的權重,聚集程度高的樣本應具有較大的權重,同時削弱離群點對超球體的影響。 馬氏距離[12]表示數據的協方差距離,能夠有效計算2個未知樣本的相似度,可以看作是歐氏距離的一種修正,其考慮了各個維度特性之間的關聯性,修正了歐式距離中各個維度尺度不一致且相關的問題。 對于一個均值為μ=(μ1,μ2,μ3,…,μm)T,協方差矩陣的逆矩陣為Σ-1的多變量向量x=(x1,x2,x3,…,xm)T,其中樣本向量到均值的馬氏距離DM(xi)為 (10) 本文距離權重系數λi計算方法如下: (11) 式中:DM,avr為所有樣本到均值馬氏距離的平均值;DM,max、DM,min為DM(xi)中的最大值和最小值,考慮到其中距離最大值的點也不應完全排除這類偏差點對模型訓練的影響,故添加修正系數ε=0.01。 使用距離權重系數λi乘以式(9)中的松弛變量ξi,將馬氏距離加權引入SVDD,則目標函數變為 (12) 使用拉格朗日乘子法,將原問題轉化為對偶問題,并引入核函數,將這一問題變形為 (13) 從而該問題的決策函數f表示為 (14) 式中:L(α)為拉格朗日函數;αi、αj為優化參數;z為決策變量,代表待測樣本點的坐標。 核函數表征了樣本從低維到高維的特征映射,影響模型的表達性能。目前,常用的核函數包括線性核函數、多項式核函數、高斯核函數(也稱徑向基函數(RBF))。 利用實驗室的傳動系統實驗臺搭建音頻信號采集系統,實驗臺驅動電機功率為3 kW,音頻信號采集系統由電容式麥克風、話筒放大器、聲卡和電腦組成,其中麥克風的頻率響應為20~2×104Hz;聲卡采樣率為44.1 kHz,量化位數24位。考慮到安全性和信號采集準確性的平衡,將聲音傳感器的麥克風放置于正對滾動軸承約25 cm處。滾動軸承音頻信號采集系統如圖2所示。 (a) 滾動軸承音頻信號采集示意圖 本實驗對滾動軸承在正常運行以及在外圈裂紋、內圈裂紋、內外圈裂紋和滾動體故障共5種運行狀態下的音頻信號進行采集。滾動軸承型號為NSK-uc210,各狀態軸承如圖3所示。 (a) 正常 傳動鏈系統的驅動電機轉速為900 r/min,采樣頻率為22 050 Hz,考慮到每個信號樣本應至少經歷軸承運行一圈的時長,每種類型的軸承運行聲音信號以25 ms即5 120個點為一組樣本進行采集,對正常運行軸承連續采集350 s的數據,對各類異常樣本連續采集200 s的數據。 由于工業現場環境復雜,對音頻信號采集時,通常有噪聲干擾存在。為了進一步驗證模型性能,將高斯白噪聲添加到采集到的聲音信號中,構建信噪比分別為10 dB、0 dB和-5 dB的加噪信號。 繪制樣本時頻圖,之后對采集的連續音頻信號進行預加重、分幀、加窗,再提取其梅爾倒譜系數。按幀長25 ms(5 120),幀移2 048處理,對于正常樣本獲得13維的梅爾倒譜系數共3 769組,對于4類異常樣本各獲得2 154組樣本。 將正常樣本的13維數據劃分出2 000組訓練樣本送入馬氏距離加權SVDD進行模型訓練,之后將剩下的1 769組正常樣本和8 616組異常樣本送入僅使用正常樣本訓練的模型進行測試。 本文模型的核函數取高斯徑向基核函數,懲罰因子C=0.5,映射參數γ=0.01。 采用正確率(TPR)、真陰率(FPR)和準確率(Acc)對異常檢測算法進行性能評估。TPR表示正常樣本被識別為正常的概率;TNR為異常樣本被識別為異常的概率。具體計算公式如下: (15) 其中,TP代表正常數據被檢測為正常的數量;FP代表異常數據被檢測為正常的樣本數量;TN代表異常數據被檢測為異常的數量;FN代表正常數據被檢測為異常的數量。 圖4為一組軸承處于正常狀態和故障狀態(外圈裂紋)下采集的運行音頻信號時頻圖。圖4(a)、圖4(b)為時域波形圖,可以觀察到軸承正常運行狀態下的波形更加平穩,而異常運行狀態下的軸承在波峰、波谷時具有更突出的峰值。 (a) 正常運行時域圖 圖4(c)、圖4(d)為音頻信號頻域圖。可以看出,軸承運行時幅值較大的音頻信號集中在低頻區,且正常軸承和故障軸承的頻域圖出現了3處相同的峰;而在479 Hz附近,故障軸承出現了正常軸承運行沒有的顯著峰值。這種差異表明了使用音頻信號進行軸承狀態異常檢測的可行性。 將音頻信號從時域映射到頻域,獲得13維的梅爾倒譜系數,其可視化效果如圖5所示,其中縱坐標為映射后的梅爾頻率,圖中同樣可以看出正常和異常狀態下音頻信號在低頻區的差異。 (a) 正常運行 圖6為使用正常樣本構建的SVDD超球體結果。其中距離為模型的決策函數計算樣本到超球體球心的距離。 圖6 SVDD超球體構建 不同信噪比下各異常狀態的檢測結果如表1和圖7所示,對正常(異常)測試樣本分別以TPR(TNR)表示模型識別正確率。在無噪聲/輕微噪聲(10 dB)情況下,MDE-SVDD模型都取得了接近100%的識別正確率,甚至在強噪聲背景(-5 dB)下仍有接近90%的檢測精度。 表1 不同信噪比下各運行狀態的識別正確率 圖7 不同噪聲下軸承運行狀態識別結果 從表1和圖7可以看出,對于不同類別的異常樣本,模型表現出相近的檢測效果,沒有出現針對某一類特定異常狀態的偏好。此外,在同一信噪比下,模型對正常樣本的識別率(TPR)總是低于對各類異常樣本的識別率(TNR),這表明該模型以相對更大的概率選擇拒絕所有樣本,這使模型更易識別出異常狀態,但同時也拒絕了一些正常樣本,造成虛警率的增大。 選取普通SVDD、AE進行異常檢測性能對比研究,將4種異常狀態和正常狀態數據混入測試集中,比較3種分類算法的平均準確率,結果見表2。其中普通SVDD的參數與MDE-SVDD相同;AE輸入層單元數為5 120,隱藏層單元數為25,以重構信號與原信號的相關系數取固定閾值進行判別。 表2 不同信噪比下各模型的平均準確率 從表2可以看出,MDE-SVDD模型的平均準確率均高于90%,而隨著噪聲強度的增大,MDE-SVDD與普通SVDD模型的平均準確率差距在增大。在強噪聲(-5 dB)背景下,MDE-SVDD的平均準確率為91.99%,比普通SVDD時提升了7.73百分比,這表明MDE-SVDD具有更好的抗噪性能。 (1) 本文針對滾動軸承運行異常檢測問題,將基于音頻信號的MFCC特征應用到模型中,提出了一種基于馬氏距離加權的支持向量數據描述方法,解決了傳統SVDD沒有考慮數據密度分布、軸承運行信息易受噪聲干擾的缺點。 對于不同的故障類型聲信號數據進行異常檢測,MDE-SVDD均達到了優秀的檢測效果,驗證了使用音頻信號以及MFCC特征進行異常檢測的有效性。 (2) 在低信噪比(-5 dB)背景下,MDE-SVDD的異常檢測平均準確率達到91.99%,顯著高于傳統SVDD模型,表明其具有良好的抗噪性能,可以更好地運用于復雜的工業場景。1.2 SVDD
1.3 MDE-SVDD
2 滾動軸承音頻信號采集與分析
2.1 實驗臺介紹

2.2 實驗方案

3 結果與分析






4 結論