王靖岳,高 天,王浩天,王軍年
1沈陽理工大學汽車與交通學院 遼寧沈陽 110159 2吉林大學汽車仿真與控制國家重點實驗室 吉林長春 130025 3沈陽航空航天大學自動化學院 遼寧沈陽 110136
齒 輪箱作為核心傳動裝置,廣泛應用在汽車、軌道車輛、風電機組等各大領域。隨著大量齒輪箱被投入使用,其在工作中發生故障的情況也越來越多,齒輪箱的狀態監測技術也因此發展起來。由于監測儀器逐漸趨向于智能化,因此振動信號分析監測方法成為當前研究的重點。目前機械設備的監測是通過對設備運行狀態進行數據采集,經人工或智能對比相關運行參數的閾值指標,來判斷設備的運行情況。
目前國內在這方面的應用技術已相對成熟,深度學習等智能算法在此領域得到了廣泛的應用[1-7]。馬蕓婷等人提出主成分分析結合 SAE 深度學習方法的齒輪故障診斷,準確率達到 96% 以上[8];李亞鑫采用深度對抗卷積神經網絡構建了遷移學習故障診斷方法[9];許超設計了齒輪箱的狀態監測軟件,能通過監測齒輪箱的溫度、主軸轉速等物理參數和振動參數來實現齒輪箱的狀態監測,并配備有振動信號分析的離線分析系統[10];竇春紅采用奇異譜增強故障特征,并將多尺度符號動力學熵引入狀態監測中,量化地揭示了數據的時空間狀態[11];魯統超等人將 CNN-LSTM 組合網絡結合高斯混合模型構建了一個航空發動機故障識別網絡[12],識別準確率較高。
齒輪傳動系統出現復合故障時,傳感器采集到的復合故障信號,是各單一故障信號從各自的故障部位經過復雜的傳遞路徑耦合在一起的混合信號,其中較弱的周期性特征會被其他成分淹沒?;旌夏P妥R別網絡能改進單一模型的缺點,樣本輸入 CNN 網絡,通過卷積池化等操作提取數據之間的高級特征,并將特征輸送到 LSTM 網絡中。
卷積神經網絡 (Convolutional Neural Network,CNN) 這一概念最早由 Yann Lecun 于 20 世紀 80 年代提出,是受到生物神經學中感受野的啟發而發展起來的一種前饋神經網絡結構模型。其作為一種有監督深度學習算法,端到端的數據處理模式,由于特征提取階段不需要人工選擇,而被廣泛應用在各個領域的設備狀態監測中[13-14]。
長短期記憶神經網絡 (Long Short Term Memory Network,LSTM) 是一種變型式的循環神經網絡[13]。其特點是增加了遺忘門、輸入門和輸出門結構,從而決定記憶權值,選擇控制單元的狀態,因此不會發生普通循環網絡可能出現的梯度消失現象。LSTM 是當前發展較為穩定有效的循環神經網絡架構,在處理時間序列上擁有更高的精度。其網絡基本單元如圖 1 所示。

圖1 LSTM 結構示意Fig.1 Structural sketch of LSTM
單獨神經網絡在機械設備故障診斷中的應用局限在于處理復雜問題時的運算速度普遍較慢,難以適應工業需求,準確率未能達到預期,網絡的穩定性較差。針對上述問題,學者們開始研究將多種神經網絡組合成為新的深度學習算法,將 CNN 結合 LSTM 的網絡結構提出來,并廣泛應用于工業設備故障特征的研究。
筆者構建了一個 12 層神經網絡,其網絡體系結構組成如圖 2 所示,將折疊層和卷積核合并為卷積層。其工作原理如下:一維時間序列經第 1 層輸入層輸入后到達第 1 個卷積層,卷積核為 2×1;然后連接 ReLU 激活層,再經過第 2 個卷積層,卷積核為 2×1;再經過第 2 個 ReLU 激活層,此時數據為 32 個特征圖;隨后接序列反折疊層,其作用是將目前多維的數據一維化,即將特征圖轉換為一維序列,以便輸入 LSTM 網絡層;經過 LSTM 后連接全連接層,然后連接 Softmax 激活層;最后輸出網絡對測試集狀態監測的準確率。

圖2 網絡的層數及結構圖Fig.2 Number of layers and structure of network
筆者的研究數據來自于 HFXZ-I 型齒輪箱復合故障試驗臺,如圖 3 所示,該試驗臺主要由驅動電動機、平行齒輪箱、磁粉制動器等組成。

圖3 齒輪箱試驗臺Fig.3 Gearbox test bench
選擇齒輪箱試驗臺正常狀態和 3 種故障狀態的振動信號作為分析對象。3 種故障狀態分別是齒輪輪齒磨損故障、軸承外圈故障以及 2 個故障同時存在的復合故障。因此共可以分為 4 種工作狀態:即正常工作狀態、齒輪故障狀態,軸承故障狀態以及復合故障狀態,狀態代碼分別設為 1、2、3、4。齒輪箱振動信號的時域波形如圖 4 所示。


圖4 齒輪箱振動信號時域波形圖Fig.4 Time domain waveform of vibration signal of gearbox
首先對數據進行預處理。一維振動信號經過預處理后的 4 種工作狀態共劃分成 3 960 個樣本,并隨機打亂。每個樣本的形式為 [10,1,1],按 7∶3 的比例分成訓練集和測試集。設置最大訓練次數為 100,初始學習率為 0.01,正則化參數為 0.000 1,學習下降因子為 0.1,并設置為每經過 60 次訓練進行一次迭代,學習率變為 0.1 倍。最后,輸出 CNN-LSTM 網絡對齒輪箱 4 種工作狀態的狀態識別準確度,將測試集中正常工況設為 1,單故障分別設為 2 和 3,復合故障狀態設為 4,測試網絡的檢測準確率。為確保減少偶然性,將同樣數據狀態檢測流程進行 3 次,取其平均值。
其中任意一次的 CNN-LSTM 網絡運行的監測準確率變化圖、損失函數變化圖和測試集的監測準確率如圖 5 所示。


圖5 CNN-LSTM 網絡運行結果Fig.5 Operation results of CNN-LSTM
由圖 5 可以看出,運行的工作狀態監測準確率達到 86.1%。分析測試集的監測結果發現,只有監測系統對于正常工作狀態的判別非常精確,復合故障狀態的判別結果較為精準,只有少許誤差,而另外 2 次的運行準確率分別為 87.1% 和 86.3%。3 次運行的平均準確率為 86.4%。一般來說,對于不同類別復合故障工作狀態的識別正確率達到 85.0% 以上就足以證明該模型的實用性和穩定性。
為證明 CNN-LSTM 方法的有效性,分別用同樣的數據進行 CNN 模型分析和 LSTM 模型分析。同樣的數據進行 3 次測試,取準確率的平均值,其中 1 次訓練過程如圖 6 所示。分析測試集的檢測結果發現,LSTM 網絡對于軸承單故障形式的判別誤差較大,對于復雜調制信號的特征不能有效學習,其他狀態的監測則相對精確。其余 2 次的 LSTM 網絡監測準確率分別為 81.0% 和 78.0%,可以看出僅靠 LSTM 網絡達成監測功能穩定性較差,平均準確率為 80.3%。

圖6 LSTM 網絡監測結果Fig.6 Monitoring results of LSTM
僅使用 CNN 網絡同樣運行 3 次,其中 1 組訓練過程和結果如圖 7 所示。其余 2 次的 CNN 網絡監測準確率分別為 0.78% 和 0.83%,平均準確率只有 0.76%,學習率曲線與損失率曲線都不理想,訓練成果較差,可能由于輸入的數據導致梯度問題,穩定性遠低于組合網絡。


圖7 CNN 構建的網絡監測結果Fig.7 Monitoring results of network built by CNN
通過在 CNN 和 LSTM 兩種網絡模型理論基礎上建立 CNN-LSTM 齒輪箱狀態監測模型,對齒輪箱試驗臺采集的復合故障數據進行訓練與測試,平均準確率達到 86.4%,證明了該模型的有效性與穩定性。而僅用 LSTM 構建的檢測模型和僅用 CNN 構建的監測模型準確率均低于組合網絡。