陳湯 崔玉蓮 馮輔周 吳春志


摘 要:針對于汽車變速箱故障特征信號微弱,且難以對故障類型識別問題,提出了基于多組合分類器的故障診斷方法。首先該方法將原始振動信號采用經驗模態分解(Empirical Mode Decomposition,EMD)、變分模態分解(Variational Mode Decomposition,VMD)以及提升小波變換(Lifting Wavelet Transform,LWT) 進行分解得到多個分量信號,再在對每個分量信號求取特征參量組成特征向量集,輸入到K近鄰分類器(k-Nearest Neighbor,kNN)、邏輯回歸分類器(Logical Regression Multi-Classification,LRMC)以及隨機森林分類器(Random Forest,RF)中,以此判斷故障類型。最后經過汽車變速箱故障模擬試驗臺的數據驗證,經過分類器性能評價指標驗證,基于LWT-RF模型的故障診斷方法具有最高的準確率、精確率、F1-score。
關鍵詞:汽車變速箱;特征參量集;故障診斷
1 引言
汽車變速箱作為汽車傳動裝置的核心部件,其主要由行星齒輪系組成。由于其工作環境多變、結構復雜等特點,往往導致在使用過程中出現齒輪嚴重磨損、裂紋、斷齒等機械故障,導致設備無法正常運轉,將嚴重影響汽車的機動性能。目前對行星變速箱的故障診斷技術方法的研究中,基于振動信號的故障監測和診斷技術應用比較廣泛,相關理論和實踐也都比較成熟,主要通過對行星變速箱運行過程中產生的振動信號進行采集和收集,并通過一定的信號分析處理技術對行星變速箱的狀態進行監測和診斷。
汽車變速箱的故障診斷難度較大,主要原因是其振動信號的傳遞途徑復雜,信號提取困難,信號分析過程難以提取特征,使得設備的故障診斷很難準確快速地進行。在信號分析處理中,用于行星變速箱故障識別的特征參量很多,國內外學者尋找不同的特征參量并采用不同的故障識別方法均取得了一定的成果[1-6],但針對汽車行星變速箱故障診斷的研究相對缺乏。
本文提出基于基于多組合分類器的故障EMD、VMD以及LWT進行分解得到多個分量信號,再在對每個分量信號求取特征參量組成特征向量集,輸入到kNN、LRMC以及RF分類器模型中,以此實現汽車變速箱的故障診斷。
2 特征參量集的生成
依據傳感器測得的振動信號進行分析處理,提取能夠反映變速箱工作狀態的一些特征參量,用于故障的識別[7]。通過總結文獻資料[8],本文選取了18個用于行星變速箱故障診斷的統計特征參量組成特征參量集對于給定的振動信號而言,其對應的34個特征參量的定義及表達式如表1所示。
3 研究方法
3.1 基于EMD、VMD、LWT的信號預處理方法
采集得到的原始信號中常常混有噪聲信號以及非監測部位振動的干擾信號,而故障振動信號一般比較微弱,特征信息容易被淹沒。為了有效的獲取信號中的特征信息,需要對原始信號進行預處理,獲取與原始信號相關性較強的信號分量,這些分量可以包含更多的故障特征信息。其中,采用EMD預處理,由相關性分析,選取分量IMF1、IMF2 、IMF3 、IMF4,采用VMD預處理,分解層數為8層,由相關性分析,選取分量IMF1、IMF2 、IMF3 、IMF4,采用LWT預處理進行三層分解,得到三個高頻分量信號、、和三個低頻分量信號。由相關性分析,選取分量。
3.2 基于kNN、LRMC、RF的分類器模型
隨機森林算法通過對訓練集生成多個決策樹,在決策時,每個樹都會預測一個結果,通過對所有結果進行表決以避免過擬合。隨機森林中的任意兩棵決策樹是相對獨立的,通過隨機森林算法,保證了過程隨機性,也避免了過度擬合,對高維的數據處理也有更多的優勢。
k近鄰算法的核心思想是如果一個樣本在特征空間中的k個最相鄰的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。該方法在確定分類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。k近鄰算法在類別決策時,只與極少量的相鄰樣本有關。
邏輯回歸是一種廣義的線性模型,它是一種分類模型。邏輯回歸有多個變種,最常用的是用于二分類,當然對于多分類也是適用的。對于多分類實際上他會分成K-1個二分類任務。
當汽車變速箱出現齒輪、軸承、軸系等故障時,會在每個旋轉周期產生較強的振動信號,從而在振動信號中引入奇異點,這些奇異點中包含了比較豐富的故障信息。通過選取得到多個分量信號,再在對每個分量信號求取特征參量組成特征向量集,輸入到kNN、LRMC、RF分類器中,以此判斷復合故障類型。
4 實驗與結果
本文選用某汽車變速箱復合故障模擬實驗臺,由轉速控制臺、三相異步電動機、測試平臺和電磁測功機組成。實驗臺共模擬設置了5類斷齒故障,分別位于行星變速箱不同行星排的不同位置。振動數據由5個測點采集得到,這里選用內置測點5在三檔運行時1振動數據為測試數據,測定工況為轉速1200r/min,負載900N·m,采樣頻率20kHz。
選取采樣點數5000為一段振動信號分段,每個工作周期為0.25s。由于總采樣點數為700416,對于每一個故障類別,根據分段,取140組樣本數據。以樣本數據為基礎,采用EMD、VMD、LWT對原始數據預處理,得到組樣本數據,劃分其中的80%用于訓練集,20%用于測試集。使用kNN、LRMC、RF分類器模型分別對原始信號以及EMD、VMD、LWT預處理過后的信號提取得到的特征參量集進行分類,以此實現對汽車變速箱的故障診斷。選取準確率、精確率、F1-score這三個指標,通過多次訓練和預測后取平均值,得到汽車變速箱故障分類的結果如表2所示。
通過以上結果表明,以LWT預處理的信號提取得到的特征參量集為例分析,數據輸入到kNN、LRMC、RF分類器中,得到的準確率均大于98%。其中K近鄰分類器得到的準確率較高,但精確率和F1-score較低,通過分析混淆矩陣以及統計信息,有部分特征參量的FP(False Postive)和FN(False Negative)數量較多,影響了數據的精確率和F1-score,而在大量樣本下掩蓋了這些信息,使得準確率還是達到較高水平。由此可得,LWT-KNN模型對綜合傳動裝置實現故障診斷效果要稍差一些,而LWT-RF模型和LWT-LRMC模型均可以較好的識別故障類別,尤其以LWT-RF模型的分類器性能評價指標最優,具有最高的準確率、精確率、F1-score。
5 總結
本文提出了一種基于多組合分類器的故障診斷方法。以原始信號以及EMD、VMD、LWT預處理過后的信號提取得到的特征參量集為輸入數據集,輸入到kNN、LRMC以及RF分類器模型中,以此實現汽車變速箱的故障診斷。結果表明,經過多組合分類器都可以較好的實現對汽車變速箱故障診斷,其中LWT-RF模型的分類器性能評價指標最優,準確率準確率可達99.95%。
參考文獻:
[1]李聰.變速箱嵌入式故障診斷關鍵技術研究[D]. 國防科學技術大學,2009.
[2]Norden E.Huang,Zheng Shen,Steven R.Long,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proc R Soc Lond A, 1998, 454: 903-995.
[3]B Liu,S Riemenschneider,Y Xu.Gearbox fault diagnosis using empirical mode decomposition and Hilbert spectrum[J].Mechanical Systems & Signal Processing,2006,20(3):718-734.
[4]Huang N E, Shen S P. Hilbert-Huang transform and its applications [M].World Scientific Publishing,2005.
[5]丁闖,張兵志,馮輔周,等.局部均值分解和排列熵在行星變速箱故障診斷中的應用[J].振動與沖擊,2017,36(17):55-60.
[6]丁闖.基于排列熵的行星變速箱故障診斷研究[A]. 中國振動工程學會、中國振動工程學會動態測試專業委員會.Proceedings of 2016 13th International Conference on Ubiquitous Robots and Ambient Intelligence (URAI)[C].中國振動工程學會、中國振動工程學會動態測試專業委員會:中國振動工程學會,2016:6.
[7] 時建峰. 基于時、頻域-小波分析和神經網絡方法的變速箱故障診斷研究[D] .太原理工大學,2008.
[8] 程曉涵,汪愛明,花如祥,孟國營.24種特征參量對軸承狀態識別的性能研究[J].振動、測試與診斷,2016,36(2).