王正奇,谷艷玲,2*,陳長征,2,田 淼,孫鮮明
(1.沈陽工業大學 機械工程學院,遼寧 沈陽 110870;2.遼寧省振動噪聲控制工程技術研究中心,遼寧 沈陽 110870;3.寧波坤博測控科技有限公司,浙江 寧波 315200)
風能作為重要的清潔能源之一,近幾十年來在全球范圍內得到了快速發展。截止2021年底,全球范圍內風電機組裝機總量達837 GW。預計未來五年內全球裝機量將新增557 GW[1,2]。
軸承作為風電機組中的關鍵零部件,其健康狀況直接影響風電機組的正常運行。因此,進行風電機組軸承的故障診斷研究對于降低機組維護成本和延長機組服役時間具有重要意義。
傳統的軸承故障診斷流程主要分為故障特征提取和故障分類2部分。近年來,國內外學者對故障特征提取提出了新方法,如增強組合差分形態濾波[3]、基于頻域稀疏性的分層算法[4]、時變濾波方法[5]和增強帶熵方法[6]等。故障分類則是利用機器學習模型進行診斷[7],如支持向量機(support vector machines, SVM)[8]、隨機森林[9]等。
隨著深度學習的迅速發展以及注意力機制的提出,該方法因具有快速準確的診斷性能而被廣泛應用于軸承故障診斷領域。YU J B等人[10]采用通道注意力機制方法,改善了模型對齒輪箱故障脈沖段的學習能力;但是在強背景噪聲下,僅采用通道注意力機制的網絡結構不能充分利用注意力機制的性能。陳仁祥等人[11]采用小波變換和注意力機制卷積神經網絡模型,對不同轉速下滾動軸承的深度特征進行了遷移適配,充分體現了注意機制在深度學習故障診斷中的優勢;但在風電機組實際運行過程中,各部件振動信號會發生耦合,且信號存在強背景噪聲,使得傳統的單傳感器數據無法用于精確診斷故障[12]。
楊潔等人[13]采用一維卷積神經網絡模型,對航空發動機原始振動信號進行了特征提取,實現了多源信息的特征級融合目的;但其未體現出特征融合相對其他類型融合的優勢。CHEN Z Y等人[14]通過對比試驗,證實了特征級融合效果優于其他兩種,并發現了特征級融合階段信息的有效性是該類診斷模型的關鍵;但特征的有效性在深層神經網絡中難以得到保證。
普通卷積核難以用于提取更多的有效信息,在特征融合中可能造成信息冗余或者不足[15],不利于提高故障診斷準確性;其次,通過加深網絡結構獲得深層特征將導致信息量變大,增加模型訓練和診斷的時間[16],嚴重影響診斷效率。
針對上述問題,筆者提出一種基于多源信息融合注意力機制神經網絡的風電機組軸承故障診斷模型(MSIF-ACNN)。
首先,筆者采用融合卷積模塊,提取輸入原始信號的多尺度特征,以保證故障信息的有效性和完整性;其次,采用通道注意力和空間注意力機制方法,用少量數據保留有效信息,提高信息融合的效率及有效性,進行快速、準確的軸承故障診斷。
卷積神經網絡(convolutional neural network,CNN)處理二維圖像具有出色表現,因此其被廣泛應用于圖像識別[17]、語音識別[18]等領域。
常規故障診斷模型為適應CNN的二維輸入,通常將時序信號轉化為時頻圖或灰度圖,再利用卷積操作進行特征提取。然而信號的轉換過程會導致部分特征丟失。因此,筆者基于一維CNN對原始時序信號進行特征提取,避免了數據預處理的繁瑣操作,最大程度地保留了信號的特征。
一維CNN表達式如下:
(1)

通常卷積神經網絡還包括最大池化層(max pooling layer, Maxp)和全連接層(fully connected layer, FC),最大池化層能減少參數和計算量,全連接層對提取的特征進行整合。
其中,最大池化層表達式如下:
(2)

普通卷積的卷積核長度固定,難以提取更多信息,而空洞卷積[19]采用增大擴張率的方法,可以擴大神經網絡感受野,獲得更加豐富的全局信息。
空洞卷積表達式如下:
(3)
式中:d為空洞卷積擴張率。
由式(1)和式(3)可以得到對原始時序信號的密集提取特征和稀疏提取特征,隨后對其進行拼接,可以得到融合特征,并對融合特征結果進行最大池化和批量歸一化(batch normalization, BN)降維處理,使每層網絡輸入保持相同的分布。
具體過程如下:
n=Maxp(BN(y))
(4)
式中:y為融合特征;n為批量歸一化和最大池化結果。
融合卷積模塊如圖1所示。

圖1 融合卷積模塊
通過結合以上2種卷積,筆者構建了融合卷積模塊。融合卷積不僅可以提升模型提取特征的能力,獲得輸入信號的多尺度特征,而且可以避免空洞卷積隨擴張率增大出現的信息丟失問題,保證了全局信息的完整性。
注意力機制最早被應用于自然語言處理,其目的是實現目標檢測[20]。隨著研究的深入,注意力機制在軸承故障診斷領域的應用也越來越廣泛。因此,筆者提出了一種應用于多源信息融合的注意力機制CNN模塊。
注意力機制CNN模塊如圖2所示。

圖2 注意力機制CNN模塊
由于融合卷積模塊可能導致全局信息過載,同時考慮到特征融合中信息的規模和有效性問題,筆者利用通道注意力機制和空間注意力機制為有效特征,賦予較高權重,以提高網絡對有效特征的敏感性,同時避免了深度特征提取造成的數據量激增問題,進而提升了對風電機組發電機滾動軸承的故障診斷能力。
在通道特征注意力機制中,首先,筆者將尺寸為W×1×C的X經過1個全局平均池化層(global average pooling layer, GAvgp)及2個分別以ReLU和SoftMax作為激活函數的全連接層,生成通道特征權重的評估向量。
其表達式如下:
z=FC(FC(GAvgp(X),C/r),C)
(5)
式中:z為特征權重的評估向量;X為注意力機制CNN模塊輸入;r為降維比。
筆者利用特征權重評估向量z對X的權重進行自適應的調整校準和分配。其表達式如下:
Y1=X×z
(6)
式中:Y1為通道權重校準后特征。
為了進一步提升模型對有效特征的敏感性,筆者設置空間特征注意力機制,對X進行卷積核為1,步長為1的卷積運算,并且對其進行最大池化和歸一化處理,得到注意力機制空間權重特征y2,最后與通道注意力權重校準后的特征連接。
其表達式如下:
Y=Y1⊕y2
(7)
式中:⊕為拼接操作;Y為注意力機制CNN模塊輸出;y2為空間權重校準后特征。
最終,對于單個輸入信號,筆者利用注意力機制,分別對特征賦予通道權重和空間權重,提高模型有效特征的提取能力。
針對單個傳感器在風電機組滾動軸承故障診斷中提供信息有限的問題,筆者提出了一種基于多源信息融合注意力機制卷積神經網絡(MSIF-ACNN)的風電機組滾動軸承故障診斷方法。
該軸承故障診斷模型主要分為4個模塊:1)融合卷積多尺度特征提取模塊;2)注意力機制權重分配模塊;3)特征融合模塊;4)故障診斷模塊。
MSIF-ACNN網絡機結構如圖3所示。
此外,融合卷積模塊中,空洞卷積擴張率為3;在注意力機制中,通道注意力全連接層降維比為3;兩層注意力機制除通道數外,結構及參數完全相同;在特征融合中,采用同一Flatten壓平層將2個信號的深層特征進行融合;在故障分類中,采用2個全連接層和1個SoftMax的分類層進行分類。
MSIF-ACNN模型故障診斷流程如圖4所示。

圖4 MSIF-ACNN模型故障診斷流程圖
MSIF-ACNN模型故障診斷具體步驟如下:
1)數據集預處理。將原始信號通過切片、歸一化、標簽化處理,構建一維數據集,并劃分出訓練集和測試集;
2)MSIF-ACNN模型訓練。初始化MSIF-ACNN網絡參數,利用預處理后的訓練集對模型進行訓練,得到風電機組軸承故障診斷模型;
3)故障診斷。利用訓練好的MSIF-ACNN模型對測試集進行故障診斷,并輸出測試集的軸承故障診斷分類結果。
為了驗證該多源信息融合方法的有效性,筆者采用實際風電機組軸承數據進行試驗驗證。
風電機組滾動故障軸承振動數據來自河北某風場。該發電機型號為湘潭電機DFWG1500/4,軸承型號為SKF6330 M/C3 H。
筆者采用VIB6.140型ICP壓電加速度傳感器采集發電機驅動端徑向和軸向振動信號,采樣頻率為16 384 Hz,采樣時間為20 s。
數據采集過程如圖5所示。

圖5 數據采集過程
根據風場30臺風電機組采集到的發電機驅動端徑向和軸向數據,筆者將其劃分為4類軸承狀態:1)正常狀態(normal state,NS);2)外圈故障(outer ring fault, OF);3)內圈故障(inner ring fault, IF);4)保持架故障(cage fault, CF)。
筆者又根據故障特征頻率并采用起點隨機方式,截取4 096個點作為數據樣本,隨機選取2 000組作為訓練集,500組作為測試集。
故障標簽及數據集如表1所示。

表1 故障標簽及數據集
不同狀態軸承樣本振動信號如圖6所示。

圖6 不同方向和狀態的軸承振動信號
該MSIF-ACNN模型超參數如下:Batch Size=36,epoch=200,學習率為0.005。
筆者在全連接層中加入Dropout,以防止過擬合(Dropout=0.5),最終得到了訓練集和測試集的準確率、損失值隨迭代次數變化關系。
模型準確率和損失曲線分別如圖7所示。

圖7 模型準確率和損失曲線
圖7中的準確率和損失變化直觀展示了MSIF-ACNN模型的學習性能。
圖7中,在收斂過程中,準確率上升及損失下降趨勢明顯,收斂速度較快;在分別經歷60次和90次迭代后,訓練集和測試集的準確率和損失均趨于穩定,準確率分別達到了99.5%和96.7%。
以上結果表明,MSIF-ACNN模型結構及參數設計合理,在風電機組滾動軸承故障診斷中具有良好的效果。
另外,故障分類混淆矩陣如圖8所示。

圖8 故障分類混淆矩陣
在圖8所示的混淆矩陣中,橫、縱坐標分別代表預測標簽和實際標簽。可以看出,MSIF-ACNN對于軸承4類狀態的分類準確率分別達到了100%、96.4%、95.4%、95.0%,證明MSIF-ACNN模型能夠準確識別4類軸承狀態,滿足風電機組軸承故障診斷需求。
為驗證多源信息融合的有效性,筆者分別以徑向振動信號、軸向振動信號和多源信號作為MSIF-ACNN的輸入并對比試驗結果。每次試驗進行10次,將4類軸承狀態識別率和整體模型準確率的平均值用于評估模型的有效性。另外,筆者以10次試驗準確率的方差作為評估診斷模型不同數據源輸入下的穩定性指標。
單信號與多源信號試驗結果如表2所示。

表2 單信號與多源信號試驗結果
由表2可知:基于軸向振動信號的故障診斷平均準確率為90.55%,方差為1.358,徑向振動信號平均準確率為92.00%,方差為0.642,說明了徑向信號整體故障診斷效果相對較好。基于軸向信號的外圈和內圈故障的診斷準確率較低,分別為86.80%和82.80%;而徑向振動信號在保持架故障診斷準確率較低,為86.00%,證明了傳感器在不同位置和方向對不同故障的敏感性存在差異[15]。多源信息融合對4類故障的診斷準確率均達到95.00%以上,平均準確率達到96.70%,方差為0.241,平均準確率相對于徑向信號和軸向信號分別提高了4.7%和6.15%,并且穩定性得到了提高,說明MSIF-ACNN能夠實現徑向信號和軸向信號之間的特征互補,證明了通過合理有效利用多傳感器信息,能夠提高故障診斷準確性。
為了驗證MSIF-ACNN在多源信息融合上的優越性,筆者將該方法與常用于風電機組滾動軸承故障診斷的5種方法進行對比。這5種方法為:SVM、Alex net、基于寬內核的神經網絡(wavelet decomposition convolutional neural network, WDCNN)[21]、長短時記憶卷積神經網絡(long short-term memory convolutional neural network, LSTM-CNN)和注意力機制CNN(attention mechanism convolutional neural network, ACNN)。
筆者利用上述5種方法并結合該特征融合方法對多源信號進行融合,將其作為對比故障診斷模型。
對比試驗結果如圖9所示。

圖9 對比試驗結果
由圖9可知:MSIF-ACNN模型的平均準確率為96.7%,效果最好;SVM的平均準確率為76.1%,效果最差,這是由于機器學習對特征極度依賴所導致的;ACNN和LSTM-CNN的平均準確率分別為93.2%和91.7%,明顯高于平均準確率為84.9%、88.2%的Alex net和WDCNN,說明了注意力機制和長短時記憶模塊能夠有效篩選重要信息,且注意力機制效果更好。
另外,從10次試驗結果曲線來看,MSIF-ACNN的方差較小、穩定性好。
為了更加直觀地分析不同模型的多源信息融合效果,筆者利用t-SNE算法對6種模型的分類情況進行分析。
對比試驗聚類圖如圖10所示。
由圖10可以看出:MSIF-ACNN邊界區分明顯,軸承狀態分類效果明顯優于其他5種;SVM中4類數據之間相互混雜,不能準確地區分故障類型;Alex net雖然相對機器學習SVM有了較好的改善,但各類故障間仍有重疊;同樣,即使WDCNN在增大了普通卷積神經網絡感受野情況下,仍無法實現多源信息的有效融合;LSTM-CNN和ACNN的內圈故障和正常狀態邊界模糊,均出現了內圈故障的誤判,但實現了相對較好的分類效果[22-24]。
綜上所述,在多源信息融合中,MSIF-ACNN的性能優于其他5種方法。
針對單個傳感器在風電機組滾動軸承故障診斷中提供信息有限的問題,筆者提出了MSIF-ACNN結構,通過風電機組滾動軸承徑向和軸向振動信號的融合,實現了多源信息特征互補目的,提高了故障診斷的準確性。
主要結論如下:
1)提出了MSIF-ACNN風電機組滾動軸承故障診斷模型,采用融合卷積和注意力機制CNN模塊,實現了多源信息的特征級融合目的。單傳感器信息和多源信息對比試驗結果表明,不同位置和方向傳感器對不同故障敏感性存在差異,證明了多源信息融合的必要性,MSIF-ACNN有效實現了多源信息的融合,滿足風電機組滾動軸承故障診斷的需求;
2)通過試驗對比其他滾動軸承故障診斷模型在信息融合上的效果,結果表明MSIF-ACNN能夠更好地利用多源信息的互補特征,診斷結果優于其他機器學習和深度學習模型,證明該方法克服了多源信息特征級融合中特征信息有效性不足的問題,促進了多源信息融合在軸承故障診斷領域的應用。
在后續的研究中,筆者將對異源信息融合進行深入研究,如基于聲振融合的故障診斷模型,并提出相應的多源信息融合方案,以進一步提高故障診斷效率和準確率。