程 凱
(航空工業哈爾濱飛機工業集團有限責任公司,黑龍江 哈爾濱 150066)
由于現今的故障識別模型中存在識別速率不足,新增故障無法識別等問題,不能滿足化工旋轉機械故障識別的要求,因此,迫切需要對故障識別模型進行改進。本文基于一維卷積神經網絡,通過選取多種特征提取算法和降維優化算法,經過仿真測試,選出最優算法,構建適用性更強且具有可持續發展的故障識別模型,提高了模型生成速率、故障檢測速率和準確率,且能夠分辨出故障種類,基本滿足化工旋轉機械的故障識別要求。
卷積神經網絡(CNN)是一種基于深度學習的前饋神經網絡,具有出色的特征對比能力,因此廣泛應用于各類數據信息處理。卷積神經網絡一般由輸入層、卷積層、池化層、輸出層4部分組成,其中,輸入層主要利用權值共享將二維信息轉換為一維信息,通過信息網絡對一維信息進行整合處理,得到完整的感知特征集。該部分在保留特征數據的完整性的前提下,對不必要或多余參數進行過濾,使CNN的特征識別量減少,以提高識別速度。卷積層主要利用可學習的卷積核,通過尺寸轉換和卷積計算,對特征信息進行集結整理,構建目標特征集。池化層主要利用池化降維公式降低特征維度,減少過擬合現象的出現,增加CNN識別的穩定性。
傳統二維卷積神經網絡結構如圖1所示。

圖1 傳統二維卷積神經網絡結構Fig.1 Traditional two-dimensional convolutional neural network
一維卷積神經網絡即在二維卷積神經網絡的基礎上,增加1層卷積層和池化層,去除了二維卷積神經網絡中信號維度轉換操作,使特征信息更為完整,特征處理速度也得以加快。一維卷積神經網絡的結構如圖2所示。

圖2 一維卷積神經網絡結構Fig.2 One-dimensional convolutional neural network structure
由于CNN模型中的非線性能力較低,為實現對非線性特征的處理,還需在模型中額外加入可求導、輸出值有限等性質的非線性函數,這里選用Sigmoid激活函數,表達式如下:

一維原始振動信號能夠極大地保留了現場的特征,其中包含趨于完整的故障特征,大量的無關信息和環境噪聲,因此需要進行特征提取和處理。
通過統離心泵的故障理論分析,選用脈沖指標和峭度指標來排除環境干擾,提取設備本身產生的振動沖擊;選用振動頻率的均值、方差、幅值來反映振動的能量分布情況、收斂情況和頻率波段,判別設備故障的位置和類型;選用峰值和峰峰值來反映軸承故障;選用穩定性差均方根值(振動有效值)來診斷緩變故障。
故障特征是一個隨時間變化而變化的訊息,通過小波時頻變換的分析方法即可將其完整地提取出來,基于小波變換的特征生成過程如下:
設函數() ∈(),若其傅里葉變換滿足:

則可以稱()為小波基。
引入尺度因子和平移因子,將式(2)進行伸縮及平移,得到小波函數簇:

定義()為信號連續的小波變換,則:

選用Morlet小波基:

根據式(4)和式(5),對旋轉機械的振動數據進行分析,即可得到小波時頻圖,能夠得到振動頻率與時間的對應關系。
由于旋轉機械運作時,會產生沖擊波,因此還可以通過頻譜分量提取沖擊波頻率的峰值和能量變化,進而實現對設備的故障診斷。基于頻譜分量的特征生成過程流程如下:
引入傅里葉變換公式:

式(6)中,()為頻域波形;()為時域波形;為頻率;e為自然對數的底;j為虛數單位。


式(7)中,為分析頻率;(·)表示計算數值向上取整;為頻率分量個數。
頻譜峰值(())的求解公式為:

式(8)中,為頻段序號;為單個頻段內頻譜成分的序號;f為第個頻段第j個信號分量的幅值。
頻譜能量(())的求解公式為:



式(10)即可作為一維卷積神經網絡的輸入數據。由于式(10)中的構建過程中,充分考慮了故障診斷中的多重特征,得到的有效信息趨于完整,因此,能夠準確表達旋轉機械的運行狀態,實現對故障的精準定位和種類判別;由于式(10)過程中,設定的矩陣元素數遠小于原始振動波形點數,因此,將式(10)作為故障識別模型的輸入數據,可以極大地減少模型的計算量,同時還能提高模型的前反饋構造速度。
為去除特征集中不必要的環境噪音等冗余特征,可以通過補償距罔評估技術(CDET)選取發生故障時變化最敏感的信號特征,該方法能有效診斷集中且穩定的故障;也能通過主分量分析法(PCA),將相關指標整合成高代表性的綜合指標,能夠有效除去重復信息,使特征識別趨于簡單直觀。
2.4 故障識別模型構建
基于特征處理改進和一維神經網絡模型,將旋轉機械的故障識別流程分為以下5步:
①提取故障信息顯著特征集。查閱相關資料,得到離心泵的故障種類和相關數據信息,再通過時域分析得到16維時域特征;通過頻域分析和特征構造算法,得到13維頻域特征;通過小波變換,得到信號的72維能量信號及其熵特征。最后將3種特征整合,得到一維混合全域特征集,以該特征集對故障識別模型進行訓練,即可實現利用一維神經網絡對故障信息的挖掘操作;②特征降維優化。選取n組不同故障的訓練樣本和一組正常的訓練樣本構成訓練集,利用補償距離評估方法或主分量分析法,對訓練集樣本進行計算分析降維,得到對組不同故障都識別敏感的c維特征集(<101);③建立故障識別模型。構建一維卷積神經網絡模型,設置初始化網絡參數,再使用訓練集對模型進行故障識別訓練,若達到最大步數&Loss曲線收斂,則保存模型數據,輸出故障識別模型;若不滿足最大步數&Loss曲線收斂,則調整網絡參數,不斷訓練優化。最終構建的模型對訓練集中包含的故障進行識別,并標明故障類型;④故障識別測試。首先構建測試樣本集,通過步驟②的降維優化,輸入步驟③構建的模型中,即可得到測試樣本集的故障識別結果,和實際故障結果比對,得出結論;⑤后續模型優化。當出現新的故障類型時,只需要重新構建該故障的訓練集進行訓練,留存新的模型數據,即可實現對新故障的識別判斷。
上述①~④的步驟可用圖3示意。

圖3 故障識別模型Fig.3 Fault recognition model
在對一維卷積神經網絡故障識別模型的構建中,運用了多種算法來保證識別精度和準確率,而實際應用中,并非所有算法的優化都具有參考意義,那些不必要的算法在故障識別過程中只會降低識別速率、增加許多不必要的工作量,以下將通過仿真實驗除去那些不必要的算法,并對得到最終的一維卷積神經網絡故障識別模型。
為進行仿真模擬,還需要獲取旋轉機械的各種故障類型及其出現故障時和正常運行時的相關樣本,此處選擇離心泵作為測試旋轉機械,選用試驗轉速為600、900、1 200 r/min三擋,選取無故障、葉輪偏心、不平衡、軸承內圈故障、軸承外圈故障等5種設備狀態,選擇樣本長度為4 120字節,分別對每個設備狀態設置600個訓練樣本和60個檢測樣本,選擇特征圖維度為32×32×1像素,采樣頻率24.43 kHz。
在卷積神經網絡中,該選擇卷積神經網絡一批次可以處理90個樣本數據,最大迭代次數為400次,機器學習效率為0.55。
分別用小波變換和頻譜分量的算法進行特征提取,其余部分的處理過程完全相同,得到兩者的模型測試結果,如表1所示。
從表1中可得,基于頻譜分量的快速特征構造算法在模型的各處理階段都具有更高的優勢,因此,最終故障識別模型的特征提取算法選擇快速特征構造算法。

表1 小波變換和頻譜分量的算法的故障預測模型測試結果Tab.1 Test results of fault prediction model for wavelet transform and spectral components
分別用CDET和PCA進行特征降維,其余部分的處理過程完全相同,得到兩種算法的降維后特征集指標,如表2所示。


表2 降維后特征集指標Tab.2 The feature set metrics after dimension reduction
為直觀顯現降維算法的整體優勢,引入未降維的特征集,通過模型仿真,得到CDET降維前后的模型測試結果,如表3所示。
從表3中則可以看出,降維算法在模型的在各類工況下的各處理階段都具有明顯優勢,具有極高的普適性、模型生成速率、模型檢測速率、準確率。

表3 CDET降維前后的故障預測模型測試結果Tab.3 Test results of the failure prediction model before and after the CDET dimension reduction
本文基于一維卷積神經網絡,構建了一個故障的自動識別系統,通過對特征提取優化和降維優化,獲得了模型生成迅速、故障檢測迅速、準確率高且具有故障種類分析的故障識別模型,并且具有極高的普適性,能夠適應多數工況,且可以隨著故障樣本的增加而不斷進行優化,具有可持續發展性能,滿足大多數旋轉機械的故障識別要求。