胡 超,沈寶國,楊 妍,謝中敏
(江蘇航空職業技術學院航空工程學院,江蘇 鎮江212134)
旋轉機械中,滾動軸承是運用最為廣泛同時也是損壞率最高的部件之一。在以往的故障診斷中,通常采用油液分析法進行故障部件識別[1]。但由于油液分析存在人為因素干擾,導致其應用受到限制。隨著轉子動力學的深入研究,諸多學者采用提取振動信號的故障頻率進行診斷,如:快速傅里葉變換[2]、小波分析[3]、經驗模態分解[4]等。但這些方法均存在部分缺陷,如:快速傅里葉屬于整體變換,利用全部時域信號,不適宜于處理故障信號等非性問題;小波分析受制于窗口函數選擇;經驗模態分解容易產生模態混疊現象。
近年來,奇異譜分析能夠有效地將時間序列中信號和噪聲剝離[5],因此被用于軸承故障診斷中。但奇異譜在構造時,由于子矩陣選擇的不同,導致重構信號差異較為明顯。考慮到高維信號中包含著部分有用信息,因此張量分解被運用到奇異譜分析中[6]。由于張量分析能夠有效的將信息從一維映射到高維中,能夠通過標準張量分解將純譜信號從高維中還原。因此,張量奇異譜被運用到機械故障診斷[6]、軸承故障診斷[7]、發動機故障診斷[8]中。
雖然張量奇異譜能夠很好的對信號進行分離,但頻譜分析時如果方法不當亦會導致倍頻混雜難以快速找到。因此,近來諸多故障診斷采用信號處理和人工智能結合的方法,如:支持向量[9-11]、人工神經網絡[12,13]、Elman[14]和RBF網絡[15]對軸承故障進行有效地診斷。諸如BP這些部分前饋神經網絡易陷于局部極值等問題,導致在故障診斷中效果較差,因此文獻[16]提出極限學習避免傳統網絡對學習速率、終止條件、易陷于局部極優等缺陷,因而得到廣泛運用,如:皮駿[17]等用改進遺傳算法優化極限學習機并用于軸承故障診斷中。為了更好實現滾動軸承故障診斷,結合張量奇異譜和極限學習機對滾動軸承故障樣本實施診斷。
張量奇異譜分析(Tensor singular spectrum analysis,TSSA)是一種能夠將數據從低維映射到高維并挖掘信號高維特征的一種方式[18]。其主要思想是:先將一維時間序列利用不重疊的時間窗口將其轉換為一個矩陣;其次,使用相空間重構將每行矩陣表示為一個重構的吸引子矩陣,吸引子矩陣形成對應的張量切片,從而得到一個分解的三維張量[19];最后,使用標準張量分解法將純譜從高維數據中進行還原。TSSA主要包括時域信號數據的嵌入和分解重構兩部分。
假設長度為n的一維時間序列x(t),t=1,2,...,n,被嵌入一個長度為l的不重疊時間窗口中形成矩陣T如式(1)所示。

張量X能夠矩陣T得到,將矩陣T視為一個張量多維矩陣,而T的每一行表示張量切片所形成的一個吸引子矩陣。在此分割過程中,在同一個方向執行,其示意圖如圖1所示。
圖1 中,張量X的切片Xi::是由矩陣T的第i行經過相空間變換重構得到的。設J表示重構窗口長度、K表示重構嵌入維度、τ表示延遲時間、I表示矩陣T的維度I=n/l,則l=(K-1)×τ+J,張量X的切片Xi::中Xijk可由式(2)計算的得到:

圖1 張量X的切片構造過程Fig.1 The Construction Process of the Slices of Tensor X

式中:i=1,2,...,I;j=1,2,...,J;k=1,2,...,K。則張量X的切片Xi::可表示為式(3):

對獲得的I×J×K維張量X進行CANDECOMP/PARAFAC張量分解[7],將其分解為分秩為1的張量和,CANDECOMP/PARAFAC張量分解與張量分解相似[20],其分解模型可表示為式(4)所示[21,22],其示意圖如圖2所示。

圖2 CANDECOMP/PARAFAC張量分解示意圖Fig.2 The Illustration of CANDECOMP/PARAFAC Decompose

式中:R-對應張量X的秩;ar∈RI×1、br∈RJ×1、cr∈RK×1分別為矢量因子矩陣A∈RI×R、B∈RJ×R、C∈RK×R的元素;e-∈RI×J×R表示殘差項。則式(4)可表示為式(5)。

TSSA算法采用最小二乘法求解A、B、C因子矩陣,定義重構信號和原信號的誤差函數如式(6)所示。

在求解A、B、C因子矩陣時,先改變B和C求A,再改變A和C求B,再改變A和B求C,直到收斂位置。
為驗證TSSA在信號分解中的有效性,將奇異譜分析(SSA)作為對比方法,驗證TSSA的性能。為了更好的驗證TSSA在軸承故障診斷中的性能,采用文獻[23]中的仿真信號,其信號可以表示為式(7)所示。

式中:A0-共振振幅;fm-調制頻率;φA、φw和CA-常量;B-衰減系數;T=1/fp,fp-故障特征頻率;τi-滑動周期產生的平均值時滯;fn-軸承系統的共振頻率;n(t)-噪聲信號。對于軸承外環故障、內環故障、滾動體故障仿真時,fm-0、fr、fre,其中fr表示旋轉頻率、fre表示保持架頻率。三種故障特征頻率如表1所示,對于三種故障類型仿真參數取值如表2所示。

表1 三種類型的故障特征頻率Tab.1 The Fault Character Frequency of Three Common Types

表2 三種故障類型的仿真參數Tab.2 Simulation Parameters of Three Common Types
仿真實驗中,TSSA算法中的l取值200、J取值50、I=n/l=2000/200=10、τi=1。此處仿真實驗以內環故障為例,主要分析內環故障在噪聲下、TSSA和SSA處理的頻譜變換是否能反映出故障特征頻率。仿真實驗中用到的仿真信號及噪聲如圖3所示,頻譜變換方法采用快速傅里葉變換。含噪聲信號的頻譜圖如圖4所示,TSSA去噪后的頻譜圖如圖5所示,SSA去噪后的頻譜圖如圖6所示。

圖3 仿真信號Fig.3 Simulation Signal

圖4 含噪聲信號的頻域分析Fig.4 Simulation Signal with Noise in Frequency Domain

圖5 基于TSSA的頻域分析Fig.5 Frequency Domain Analysis with TSSA

圖6 基于SSA的頻域分析Fig.6 Frequency Domain Analysis with SSA
從圖4到圖6的頻域圖可以看出,含噪聲信號的頻譜圖難以找到內環故障特征頻率,而經過TSSA和SSA去噪后的頻譜圖能夠找到對應的倍頻;比較圖5和圖6的頻域圖,雖然均能在頻域圖中找到對應的倍頻,但是TSSA處理后的信號比SSA效果好些,SSA中的一倍和二倍頻難以找到,TSSA相比SSA其一倍頻較為明顯。但總體而言,經過頻譜變換后的信號,雖然能夠找到倍頻,但由于噪聲清洗效果不夠明顯,導致其倍頻尋找難度較大,不利于軸承故障的批量診斷,因此后續軸承診斷過程采用特征參數與極限學習結合的方式進行。
文獻[16]提出極限學習機(Extreme Learning Machine,ELM)算法,能夠克服部分單隱層前饋神經網絡的缺陷,且能夠逼近任意非線性分段函數[24]。
極限學習機理論在文獻[17]中已經詳細敘述,此處不再累述,僅簡單介紹。ELM網絡表示如式(8)所示。

式中:H-ELM網絡輸出矩陣,其值與輸入矩陣、權值、激活函數和閾值有關,具體計算方法參看文獻[17];T′-ELM網絡輸出矩陣T的轉置;β-ELM網絡輸出權值。輸出權值β可由最小二乘求得:

式中:H+-輸出矩陣H的Moore-Penrose廣義逆。由于最小二乘法能求得唯一解,因此ELM網絡使用Moore-Penrose廣義逆能夠極大的提高學習效率。常用隱含層激活函數如下:
(1)Sigmoid()函數:

(2)Sin()函數:

(3)RBF()函數:

(4)Hardlim()函數:

所采用的滾動軸承故障振動數據源自美國西儲大學的軸承數據中心[25]。軸承故障模擬試驗臺如圖7所示;軸承類型為6205-2RS-JEM-SKF,其基本尺寸參數如表3所示;試驗中,電機轉動頻率1772rpm,采用頻率48kHz。

圖7 軸承振動分析實驗臺和采集裝置Fig.7 Bearing Vibration Analysis Test Stand and Experimental Instrument

表3 6205-2RS-JEM-SKF型軸承參數Tab.3 6205-2RS-JEM-SKF Type Bearing Parameters
診斷實驗中選用的故障類型:內環故障、滾動體故障、外環故障;每類故障樣本數據為60組,故障類型標簽分別為:1、2、3;三種故障類型的時域波形圖如圖8所示,圖8中僅呈現4000組樣本數據點。

圖8 三種類的時域波形圖Fig.8 Time Domain Waveforms of Three Type
對實驗室采集到的三類軸承故障振動信號采用張量奇異譜進行分解降噪處理,由于數據量較大,因此此處僅呈現振動信號中某一個整周期的時域波形圖。三種故障類型經過TSSA處理后的源振動信號、時域波形圖、噪聲信號分別如圖9~圖11所示。

圖9 內環故障Fig.9 Fault of Inner Ring
由圖9到圖11所示,TSSA將部分噪聲信號從原始振動信號中剝離,使得有效振動信號變化趨勢更為明顯,且降噪后的振動信號振動幅值明顯減小。在2.3節中的仿真實驗表明,對降噪后的時域信號進行頻域變換能夠實現軸承故障的診斷,但此方法效果不太顯著,因此提取時域統計特征參數實施診斷。

圖11 外環故障Fig.11 Fault of Outer Ring
根據文獻[17],部分時域特征能夠有效反映振動信號的原始特征、減小對信號的扭曲作用,且無需對特征數據進行歸一化操作,因此文中提取時域特征參數如下:平均值、峰峰值、均方根值、標準差、偏度、峭度、波峰因子和變異系數。由于每組數據60組,共計180組數據,因此文中數據部分呈現,如表4所示。

表4 時域特征參量Tab.4 Time-Domain Characteristic Parameters

圖10 滾動體故障Fig.10 Fault of Ball
極限學習機采用三層網絡結構,輸入層神經元由輸入變量決定,由于時域特征變量8個,因此輸入層神經元數量為8;由于隱含層激活函數和神經元數量影響ELM診斷效果,因此隱含層的設置在后續進行討論選擇;輸出層為1,直接輸出故障類型標簽。
如文獻[17]中所述,極限學習機雖然優勢較強,但其診斷效果受到隱含層的參數設置。合理選擇有效激活函數和神經元數量能夠對診斷效果產生積極作用,因此為了后續診斷效果較佳,此處分析激活函數和神經元數量給網絡診斷結果帶來的影響。Sigmoid()函數、Sin()函數、RBF()函數、Hardlim()函數隨神經元數量變化給診斷結果帶的影響,如圖12、圖13所示。
圖12 和圖13的診斷結果均在訓練集樣與測試集樣本比例為2:1時的結果,由圖可知,ELM網絡選擇不同神經元時其診斷準確率存在差異。由圖12可知,當激活函數選擇Sin()、Sigmoid()函數時,隱含層神經元數量超過40時,其二者對訓練集診斷準確率達到100%;但如圖13所示在測試集診斷中,當神經元數量超過60時,二者差異較小,但診斷準確率略有下降;當激活函數采用Sigmoid()且神經元數量較少時,診斷準確率較高。綜上所述,后續滾動軸承故障診斷隱含層激活函數采用Sigmoid(),神經元數量設置在(20~30)之間。

圖12 訓練集診斷準確率Fig.12 Diagnostic Accuracy of Training Set

圖13 測試集診斷準確率Fig.13 Diagnostic Accuracy of Test Set
為驗證ELM網絡在滾動軸承故障診斷中的有效性,將BP、SVM作為對算法。BP神經網絡采用三層網絡結構,輸入層神經元數為8、隱含層為17、輸出層為1,即8-17-1的結構;BP中權值、閾值隨機產生,隱含層神經元采用S型正切函數tansig,輸出層神經元采用S型對數函數logsig,網絡訓練函數為trainlm。SVM中罰參數和核參數采用隨機賦值方式,核函數采用RBF核函數。
使用ELM、SVM、BP網絡對滾動軸承故障實施診斷,其中ELM、BP呈現結果均為10次診斷平均值,SVM為重復執行4次中最佳值。診斷測試過程中,樣本比例分別為:2:1、1:1、1:2,其診斷結果,如表5所示。

表5 診斷結果Tab.5 Diagnostic Results
由表5可知,ELM、SVM對滾動軸承故障的振動效果較佳;BP由于隨機初始權值和閾值問題,導致結果較差;SVM由于是重復執行選擇最佳結果,因此其效果較為理想;ELM網絡能夠逼近任意非線性函數,因此其診斷結果較佳。隨著樣本比例的遞減,其診斷結果也逐漸變差;ELM和BP的平均診斷時間比SVM要低。綜合診斷準確率和診斷時間,ELM網絡相比其他對比方法效果明顯,因此更適宜于軸承故障診斷。
為解決滾動軸承故障診斷難度較大問題,提出基于張量奇異譜分解和極限學習機相結合的故障診斷方法。
(1)通過軸承信號仿真結果表明,TSSA相比SSA的去噪效果明顯,其頻域分析能夠找到故障特征的倍頻;
(2)由于頻譜分析需要尋找倍頻,如果去噪效果不明顯,將增加難度,因此提出TSSA與ELM結合的診斷方式,先用TSSA對軸承故障振動信號進行降噪處理并提取時域特征參量,再用ELM進行診斷;
(3)ELM網絡的隱含層神經元數量、激活函數以及訓練集和測試集數據樣本比例會對診斷結果造成影響,因此使用時需要進行適當選擇;將BP、SVM作為比算法,其診斷結果表明:ELM網絡在診斷準確率和診斷時間上均占據優勢。