井露茜, 文傳博
(上海電機學院 電氣學院, 上海 201306)
風能作為可再生的綠色能源之一[1-2],對減輕能源污染發揮著重要作用[3],然而由于設備的不穩定、風電機組的意外故障,占據了整個風電費用的很大部分[4]。在風電機組的運行中,變槳控制系統是其中的關鍵環節,能夠提高效率,確定平穩運轉[5]。因為變槳系統的控制比較復雜,運動器件比較多,工作條件比較苛刻,故障率相對較高,作為包含較多運動器件的變槳齒輪箱的健康成為該系統的關鍵。
目前,故障診斷方法被劃分為兩種類型,一種是基于模型驅動;另一種是數據驅動[6]。近幾年,數據驅動方法得到了相當大的關注。文獻[7]提出了采用改進灰狼算法進行優化極限隨機森林算法,解決故障模型參數難以優化的問題。文獻[8]結合時移多尺度樣本熵和基于麻雀搜索算法的支持向量機,提出了一種基于改進變分模態分解的風機齒輪箱故障診斷方法。文獻[9]提出了一種新的正態行為建模方法,利用監控和數據采集(SCADA)信息,預測風力渦輪機電動變槳系統故障,降低維護成本并防止級聯故障。文獻[10]提出了一種基于風電機組三相電流數據的多分量故障診斷方法,通過深度自編碼器從三相電流數據中提取特征向量,并利用支持向量機進行故障分類,能夠準確識別和診斷變負荷變速環境下轉子驅動器的故障類別。文獻[11]提出了使用長短期記憶和混合密度網絡的集成框架,其具有實時系統識別功能,可用于診斷早期和細微的故障。文獻[12]提出了基于模糊系統和神經網絡的故障診斷方法,用于過程的輸入和輸出測量值與故障之間的非線性動態關系,可以直接進行故障診斷。
盡管上述方法取得了不錯的故障診斷效果,但許多診斷方法在數據處理時會占用較大內存,導致速度緩慢;同時,風機故障診斷的數據處理中普遍存在著故障數據比例較少,數據不平衡的問題,對于故障診斷模型的建立和故障診斷結果的準確性造成了很大的困難。對此,本文提出了一種新的簡單的學習框架,將局部均值方法(Local Mean Decomposition, LMD)及卷積神經網絡相結合,增加通道注意力機制,可以直接作用于原始時間信號,并能提高故障診斷精度和可靠性。
LMD把原信號分解成一組PF 成分加殘余項,各PF成分可視為一個包絡函數與一個調頻函數之積,其詳細運算過程為:
(1) 在原始信號中尋找所有的極值點,并尋找鄰近兩個極值點間的局域平均數,以及極值點間的局域包絡函數。鄰近兩個極值點間的局域平均數為
式中:ni為原始信號中第i個極值點;ni+1為原始信號中第i+1個極值點。
鄰近兩個極值點間的局域包絡函數為
(2) 從原信號中剝離局部均值函數,并獲得零均值函數為
式中:x(t)為原始信號;m11(t)為局域平均值函數。
(3) 對零均值函數進行解調,得到解調后函數為
式中:a11(t)為局域包絡估計函數。
局域包絡估計函數由全部ai的局域包絡函數線段連接,并利用滑動平均法對其進行光滑化獲得。
(4) 反復進行以上第(1)至第(2)過程,即可獲得相關的s11(t)包絡線估算函數a12(t)。如果a12(t)=1,則s11(t)為純調頻函數;如果不滿足上述純調頻函數的條件,則將此時的s11(t)作為原始信號重復進行式(3)、式(4)過程,迭代計算出s12(t),s13(t),…,s1n(t),直到s1n(t)是一個純調頻函數。
(5) 在以上步驟的迭代基礎上,通過對所有的局部包絡估計函數進行乘積,獲得所求包絡信號函數為
式中:a1q為第q個局域包絡估計函數。
(6) 在原始信號中,其首個PF分量為
式中:a1(t)為原始信號的包絡信號函數。
將PF1與原信號進行分離可得出u1(t)信號;此時以u1(t)作為原始信號,并不斷重復上述第(1)~第(6)過程,被反復循環k次,等u1(t)變為單調函數便可得以結束。將原信號x(t)分解成k個PF分量與單調信號uk的總和,則
式中:MPFp為第p個分量。
卷積神經網絡(Convolutional Neural Networks, CNN)作為一種與人工神經網絡相似的多層感知網絡,其主要涵蓋3層,分別是卷積層、池化層和全連接層,在圖像以及自然語言處理等方面被廣泛運用。卷積層的操作原理為:
池化層主要用于降低模型的數據維度,改善模型的運行速度,常用的池化方法包括最大和平均池化兩種。其中,全連接層主要用于對已有的局部特性展開處理,以完成數據的回歸和類別劃分。
注意力機制(Squeeze-and-Excitation, SE)主要是以通道維度為基礎,采用卷積特征通道互依賴的建模方法,進一步完善網絡提取特征,有效地挖掘具有重要意義的特征,并能有效地去除無用的特征?;谠摍C制,神經網絡能夠實現特征重新校正。
SE塊作為計算單元,能夠對于已經給與的變換展開卷積運算
式中:*為表示卷積運算;vc為單獨的通道;為二維空間核。
在卷積運算中,使V=[V1,V2,…,VC]表明對于卷積核的集合已經得以學習,同時VC為卷積核第C個所持有的具體參數值。vc=[,,…,],X=[X1,X2,…,XC′]將其中的偏差項進行忽略。
因為該模型的結果是對各信道進行累加得到的,所以模型中隱藏著信道的相依,而這種相依又被濾波器捕捉到。
由于在工程的實際應用中,風機一般處于常態運行中,難以得到充分的故障信息來訓練診斷模型,導致故障的有關數據遠遠小于常態信息。在這樣的非均衡條件下,僅利用少量的故障數據對智能診斷模型進行訓練,將會造成系統精度和模型泛化的性能下降。此外,風機變槳系統齒輪箱故障時振動信號比較復雜,直接利用神經網絡進行學習會影響特征的提取,從而造成風機故障診斷結果的不準確。為解決這個問題,本文提出了一種在利用LMD進行數據處理的基礎上引入注意力機制的卷積神經網絡故障診斷方法,稱為LMD-SECNN 模型,模型結構如圖1所示。

圖1 LMD-SECNN模型結構
利用HFXZ-Ⅱ實驗平臺對所提出的理論和算法進行驗證。采用Windows11進行模擬試驗,采用11th Gen Intel(R)核心i5-11320H@3.20GHz-2.50GHz、內置內存16GB,64 位系統,以及PyTorch作為深度神經網絡的基本架構。
HFXZ-Ⅱ試驗臺由耦合器、電機、制動、行星齒輪箱等構成。試驗所用傳感器共4個測點,垂直方向2個,其他方向各1個。故障類型包括齒輪缺齒、齒面磨損、齒根缺陷、齒輪軸承外圈故障及綜合故障等。數據是在負荷條件下進行獲取,旋轉速度為2700r/min,采樣頻率是12kHz。本文中只選取了垂直方向的傳感器數據作為試驗的樣本數據,使用隨機采樣方法獲取原始數據,作為試驗樣本,每個類別的樣本數量為1000個,測試集300,訓練集為700,每個樣本2048數據點。
為了提取原始輸入信號中明顯的故障特征,將LMD-SECNN模型的神經網絡部分設置很深,而且第一層設置很寬。在計算機視覺中,數據擴充經常用于增加訓練樣本的數量,以提高CNN 的泛化性能[14]。但是,由于缺乏充分的數據集,該方法極易造成模型的過擬合,本文通過對具有重疊的訓練樣本進行切片來獲得大量數據。
實驗中使用的所提出的LMD-SECNN 模型的架構包含4個block塊,以及池化層、Flatten層、全連接層和softmax層,如圖1所示。在配置參數時,隨著卷積核數量、核寬度、層深度的增加和步長的減小,神經元數量會增加,這提高了模型的容積,但也更容易過度擬合。因此,需要擴大訓練信號之間的重疊大小,以增加訓練樣本的數量。LMD-SECNN網絡的輸入量為2048×1的切片后的初始時間域數據。LMD-SECNN模型的參數如表1所示。
為了驗證本文所提模型的有效性,選取了風機齒輪箱的7個故障數據進行故障診斷實驗,故障分別為行星齒輪軸承外圈故障、行星齒輪脫落、行星齒輪缺齒、行星齒輪復合故障、行星齒輪齒根缺陷、太陽輪齒面磨損、太陽輪齒根缺陷。原始信號數據輸入LMD-SECNN模型后,經過LMD模塊處理,生成PF分量作為神經網絡的輸入。
以10個反復試驗的平均數為最終結果,每個試驗進行100次反復訓練。利用t-SNE方法實現了對該方法的注意力層上所抽取的特征的可視化。圖2(a)中t-SNE可視化的結果顯示在block1的過程中,各種類型的數據互相混合,分類效率低;但經過模型各模塊處理后數據開始初步呈現聚類效果,并在全連接層處理后全部樣本基本上進行了歸類,最終的t-SNE可視化的結果由圖2(b)所示,全部樣本都被完整地劃分成了8個類別,且聚類效應顯著。
為更準確表現本文所提模型的故障診斷效果,圖3(a)和圖3(b)給出了模型的訓練曲線及其Loss曲線。顯而易見,無論是訓練集還是測試集都在第20次左右的時候開始收斂,在第40次左右的時候達到收斂,顯示出了本模型的計算速度及對于風機變槳系統齒輪箱故障的診斷能力。
圖4(a)和圖4(b)顯示了Block3和Block4中的SEnet處理后的不同特征在通道維度上的注意權重分布。由圖可知,SEnet對于不同的特征,根據其重要程度給予相應的權值,使模型能更好地將注意力集中在顯著特性上。
為精煉該算法中的錯誤類別條件,將其歸類結果以模糊矩陣表達,其中水平坐標是預計標簽,垂直坐標是實際標簽。從圖5可以看出,行星齒輪復合故障、行星齒輪齒根缺齒、行星齒輪脫落和正常數據中各有2個樣本被預測錯誤,太陽輪齒根缺齒和太陽輪齒面磨損各有1個樣本被預測錯誤,行星齒輪缺齒數據中有4個樣本被預測錯誤,這主要由于個別故障被誤診為別的類型。行星齒輪軸承外圈故障的故障分類準確率100%。因此,本文模型可以從風機變槳齒輪箱的振動信號中正確地提取到與故障相關的特征,并展開高效識別和分類。
為證實本文所提模型的優越性,然后將該試驗與CNN、CNN-LSTM[15]作比較。CNN-LSTM 為文獻[15]提出的故障診斷方法,其模型主要由1個卷積層、1個池化層、2個LSTM 層和Softmax層組成。算法所用的數據都是未經過任何處理的原數據。為進一步證實本文模型的有效性,與不進行LMD預處理的同模型方法及未增加注意力機制SEnet的同模型方法進行實驗比較。5種模型的故障診斷結果如圖6所示,LMD-SECNN 模型的準確率為99.42%,為其中最高,所以它的故障診斷與檢測能力最好。
針對風機變槳系統變槳齒輪箱的機械故障,提出了一個新的故障診斷模型,即LMD-SECNN 模型。本模型在利用LMD 處理原始數據的基礎上引入有注意力機制的卷積神經網絡,首先利用局部均值分解法對數據進行預處理,最大限度的保存了原始信號里的故障特征,分解形成的諸多PF 分量,也在一定程度上解決了故障數據不平衡的問題。然后將各PF分量作為神經網絡模型的輸入,該神經網絡以inception v1架構為基礎,并增加了通道注意力SEnet模塊,既減少了參數量,又避免了模型計算量過大的問題使得故障特征更加明顯。經過實驗驗證,LMD-SECNN 模型的準確率達到99.42%,遠高于對比模型的準確率,驗證了所提方法的有效性和優越性。