毛文濤 田思雨 竇 智 張 迪 丁 玲
隨著科技發展,各類工程設備的工作和運行環境變得越來越復雜.作為機械設備的關鍵零部件,滾動軸承在長期大載荷、強沖擊等復雜工況下,極易產生各種故障,導致機械工作狀況惡化.針對軸承的故障預測與健康管理(Prognostics and health management,PHM)技術應運而生.若能在故障發生初期即進行準確、可靠的檢測和診斷,則有助于進行及時維修,避免嚴重事故的發生.早期故障檢測已成為PHM 的關鍵技術環節之一[1].近年來,隨著傳感技術和機器學習技術的快速發展,數據驅動的智能化故障檢測和診斷技術受到廣泛關注.如何利用歷史采集的狀態監控數據、提高目標軸承早期故障檢測結果的準確性和穩定性成為研究熱點和難點,具有明確的學術價值和應用需求.
本文關注的是不停機情況下的早期故障在線檢測問題.這種方式有助于實時評估軸承工作狀態,避免因等待停機檢查而產生延誤、造成經濟損失,因此對早期故障的在線檢測越來越受到工業界的重視.由于在線應用場景的制約,與一般故障檢測相比,早期故障在線檢測具有如下需求:1)檢測結果應具有較好的實時性,能盡可能快速準確地識別出早期故障;2)檢測結果應具有較好的魯棒性,能盡可能避免正常狀態下輕微異常波動的影響,相比于漏報警(現有方法對成熟故障檢測已較成熟),更需避免誤報警;3)檢測模型應具有較高的可靠性,在線檢測過程中無需反復進行閾值設定和模型優化.上述需求對檢測方法提出了新的挑戰.
目前,在線場景下的早期故障檢測基本是采用現有的早期故障檢測方法、直接用于在線環境,其通常做法包括:從振動信號等監測數據中提取時頻特征[2]、小波特征[3]、包絡譜特征[4]等早期故障特征,進而構建支持向量機(Support vector machine,SVM)[2]、樸素Bayes 分類器[5]、Fisher 判別分析[6]、人工神經網絡[7],單類(One-class) SVM[8]等機器學習模型進行異常檢測,取得了一定結果.但是,上述方法通常無法自適應提取特征,同時需要一定的離線數據訓練得到檢測模型,但目標對象在線場景下采集到的數據有限,且其數據分布與訓練數據的分布可能因隨機噪聲、變工況等原因而存在差異,導致離線訓練的模型并不完全適合于在線數據,容易降低檢測結果的準確性;其次,上述方法通常采用基于異常點的檢測算法,未充分考慮樣本前后的時序關系,容易因數據微小波動而產生誤報警,降低檢測結果的魯棒性;再次,為降低誤報警,這類方法需要反復調整報警閾值.此外,基于系統分析的故障診斷方法[9]利用狀態空間描述建立機理模型,可獲得理想的診斷和檢測結果,但這類方法通常需要提前知道系統運動方程等信息,對于軸承運行過程來說,這類信息通常不易獲知.近年來,深度神經網絡已被成功應用于早期故障特征的自動提取和識別[10?11],可自適應地提取信息豐富和判別能力強的深度特征,因此具有較好的普適性.但是,這類方法一方面需要大量的輔助數據進行模型訓練,而歷史采集的輔助數據與目標對象數據可能存在較大不同,直接訓練并不能有效提升在線檢測的特征表示效果;另一方面,在訓練過程中未能針對早期故障引發的狀態變化而有目的地強化相應特征表示.因此,深度學習方法在早期故障在線檢測中的應用仍存在較大的提升空間.
綜合上述分析,提升早期故障在線檢測效果的關鍵在于:1)提高早期故障特征的表示能力,尤其是增強正常狀態特征與早期故障特征的區分度;2)合理利用不同工況、甚至不同來源的輔助數據進行模型訓練;3)構建簡單有效的報警策略,降低正常狀態中的誤報警率.考慮上述需求特點,本文擬從時序異常檢測的角度出發,引入深度遷移學習方法,為早期故障在線檢測問題提供一個有效的解決方案.作為機器學習領域的研究熱點之一,遷移學習是一類運用已有知識對不同但相關領域問題求解的機器學習方法.通過利用一個領域數據(稱為源域)所蘊含的先驗信息、提升另一個相關但不同的領域(稱為目標域)中預測模型的性能,遷移學習已被證明可有效解決可用訓練樣本不足的學習問題[12].其中,領域自適應方法[13]是遷移學習方法的一種,通過學習源域和目標域的公共特征映射,從而實現領域知識的跨域傳遞,實現不同來源輔助數據的跨領域信息傳遞.尤其是近年來深度學習技術快速發展,構建在深度神經網絡之上的遷移學習方法開始受到國內外學者的重點關注.借助于深度模型自適應的特征提取能力和端到端的訓練方法,深度遷移學習已經成功用于解決物體識別[14]、電池壽命預測[15]、疾病檢測[16]等問題,證明利用深度模型提取不同領域數據的公共特征、提高目標域數據量較少情況下建模效果的做法是可行的.有學者采用深度自編碼網絡、深度卷積網絡等構建遷移學習模型,并在故障診斷[17?20]領域取得了初步應用.這表明深度遷移學習方法可以在不同工況、不同噪聲環境之間有效傳遞故障信息,彌補不同工況下軸承可用數據不足的限制,提高診斷精度.這類工作的關鍵在于利用深度模型自動學習跨領域狀態監測數據的可遷移故障特征[17],并形成對故障發生模式的抽象描述信息.這一思路同樣適合于早期故障的在線檢測問題,即利用不同工況下輔助數據所蘊含的故障發生模式信息,提高在線環境下的時序異常檢測精度.而從時序角度構建異常檢測模型,以序列片段(而非樣本點)作為檢測對象,有助于提高異常狀態的識別準確率,也利于提升故障報警的穩定性.
基于此,本文提出了一種基于深度遷移學習的早期故障在線檢測方法.具體來說,本文通過在多層自編碼器的目標函數中添加域間差異正則項與權重系數的Laplace 正則項,獲得更具有表示能力的早期故障特征,并在此基礎上,利用離線數據正常狀態的排列熵值構建報警閾值,通過異常序列匹配,實現在線數據中時序故障模式的快速檢測.最后,在滾動軸承實驗上驗證了本文方法的有效性.本文貢獻可概括為:
1)提出了一種多域遷移深度自編碼網絡模型.與現有絕大多數深度遷移學習模型不同,該模型所提取特征可在有效減少多個源域數據分布差異的同時,放大時序數據的變化趨勢,從而提高早期故障特征與正常狀態特征的區分度,因此更適用于故障檢測問題.根據作者文獻調研,目前尚未發現深度遷移學習方法在早期故障檢測問題上的應用.
2)提出了一種基于深度遷移學習的故障在線檢測模型.該模型依托于不同工況數據提取的公共特征,將故障報警策略與在線檢測相融合,直接通過異常序列的自適應匹配,完成故障報警.與現有研究主要依賴異常點識別的做法相比,這一做法可有效提高在線環境下故障檢測的準確率和魯棒性,同時降低誤報警率.
設在不同工況下對同一型號的軸承進行重復實驗,可得多工況下的狀態監測數據集每個工況下包含nk個樣例.樣本屬于樣本空間χk,數據生成服從邊緣概率分布.由于受測量環境多樣、操作條件存在差異等復雜因素的影響,不同工況下采集的數據分布有很大的差異.從統計分析角度可認為,不同工況的監測數據服從不同的邊緣概率分布.
參考遷移學習相關概念和故障診斷領域相關術語[17],本文涉及的在線早期故障檢測問題應滿足以下條件:
1)所有數據都包括從正常狀態到故障狀態的退化過程,不同工況下的實驗數據從正常狀態到早期故障狀態的演變具有內在的一致性.
2)監測數據集中,只有運行的初期階段被認為是正常狀態數據,其余數據不存在健康標記;同時,正常狀態數據與早期故障數據變化幅度較小,相對較難以區分.
3)目標域Dt由在線檢測的目標對象數據的樣本空間χt及其服從的數據分布P(χt) 組成,即Dt={χt,P(χt)},由于在線場景限制,目標域數據量通常較少,同時需要實現快速、準確的檢測.
4)源域Ds由與在線檢測環境不同的工況下軸承數據樣本空間χs及其服從的數據分布P(χs) 組成,即Ds={χs,P(χs)},為目標對象的在線檢測提供所需的正常狀態到早期故障狀態的演化知識.
與故障診斷不同,在線故障檢測本質為異常檢測問題,即只有開始運行階段的數據為正常狀態標記,根據異常數據與正常狀態數據的偏差實現檢測.通過源域監測數據進行訓練,可以建立其樣本空間χs至正常狀態標記空間γs的非線性映射關系f:χsγs,即為軸承的異常檢測知識.由于目標域數據量通常較少,所建立的異常檢測模型f:χtγt檢測相對較難區分的早期故障數據存在一定困難,因此,本文旨在利用源域的異常檢測知識,提高目標域的檢測準確度.上述過程中,遷移學習的作用體現在:1)適配源域與目標域的監測數據分布,建立正常狀態公共特征表示;2)借助源域中正常狀態數據與早期故障數據之間的區分度信息,促進目標域檢測模型的有效性和魯棒性.
整體而言,本文所提方法包括離線訓練和在線檢測兩個階段.其中,離線階段的主要任務是深度遷移學習模型的構建和異常檢測模型的構建,在線階段則直接利用公共特征表示提取目標對象的特征并進行異常識別.為了表述方便,表1 給出了本文常用的符號總結.

表1 本文所用符號與對應描述Table 1 Symbols and corresponding descriptions used in this paper
不失一般性,本文首先選取多層自編碼器作為基礎的深度網絡模型.自編碼器由編碼器和解碼器組成.編碼器用于從輸入數據中提取特征,表示為:H=f(WX+b);其中W為輸入層與隱層的權重矩陣.解碼器用于從提取的特征中重構輸入數據,表示為:Z=g(W′H+b′):激活函數通常可使用sigmoid函數sigmoid(x)=1/(1+e?x).自動編碼器的目標是使下列重構誤差最小化:

其中,∥·∥F表示Frobenius范數.
其次,為了消除源域和目標域數據分布的差異,本文在損失函數中引入最大均值差異(Maximum mean discrepancy,MMD)正則項.MMD 是估計分布差異的一個準則,與KL 散度等參數化準則不同,MMD 基于再生核希爾伯特空間來度量誤差,適合估計不同分布之間的非參數化距離,從而避免計算中間密度,減少計算工作量[18].以Ds,Dt為例,MMD 距離定義為[12]:

其中,H表示再生核希爾伯特空間,Xs和Xt分別表示源域和目標域中的輸入樣本集,ns和nt分別表示源域和目標域的樣本個數.式(2)表示兩個域的原始樣本在非線性映射φ(·) 上的均值差異.尋找一個φ(·) 使得式(2)最小化,即可誘導得到兩個域之間的公共特征空間.
需要注意的是,式(2)度量的是兩個域之間的分布差異.而在故障檢測問題中,由于主要采用正常狀態數據構建檢測模型,因此便于引入多種工況下的監測數據來訓練遷移學習模型.若利用式(2)進行域間差異最小化,則需要兩兩操作,計算過于復雜;若將多種工況的數據統一作為源域Xs,又忽略了不同工況數據之間的分布差異.因此,本文對式(2)進行改進,以適配多個域的數據分布,得到具有普適性的公共特征表示,以便目標域中新采集的在線數據直接提取特征.首先,計算源域和目標域Xt中每組監測數據在φ(·) 上的函數值均值其中nj表示第j個軸承的樣本數,sc表示工況數量;然后計算所有監測數據的均值其中m表示所有源域與目標域的軸承數;最后,計算上述兩個均值的差,作為整體分布偏離程度的度量.考慮到異常檢測的特點,故此處計算僅使用正常狀態數據,其目的是解決不同工況下正常狀態數據的分布差異.具體表達如下:

再次,由于最小化式(3)會迫使權重W下降至接近于零,從而導致信息丟失,為了使權值不為零并加強正常狀態數據與早期故障數據的區分度,本文參考文獻[21]中圖像平滑的原理,構建權值矩陣的拉普拉斯(Laplace)正則項,如下所示:

其中,K表示多層自編碼器中的權重矩陣的個數,σ表示懲罰因子,?=D1?I2+I1?D2,I1和I2是單位矩陣,D1和D2是Laplace算子.此處D1和D2采用修正Neuman 離散化算子[21],其作用是對權重矩陣W進行二階差分,使得W中相鄰權重差異性變小,因此,最小化Lweight即可放大相鄰權重的變化.此處計算使用從正常狀態到故障狀態的全部數據,雖然相鄰權重差距變大會導致所有樣本對應的隱層特征差異性變大,但對于早期故障樣本,其數據幅值波動要大于正常狀態樣本,因此,對應權重的放大作用也要高于正常狀態樣本.由此,最小化Lweight可突出信號波動趨勢,得到對早期故障更為敏感的特征表示.
將這三部分集成到一起,最終得到多域遷移深度自編碼器的目標函數:

其中,λ,μ>0 為正則化參數.λ值越大,意味著對多域公共特征的提取能力要求越高,反之對不同域之間數據分布差異的容忍度越高;μ值越大,可更加突出相鄰權重的差距,反之將減弱對信號波動的突出效果.最小化式(5)可采用小批量梯度下降法[20].多域遷移的深度自編碼網絡結構如圖1 所示:

圖1 多域遷移深度自編碼網絡結構圖Fig.1 Architecture of deep auto-encoder network with multi-domain transferring
對于式(5)所給出的目標函數,優化步驟如下:
2) 前向傳播:a)從訓練集中選取小批量數據執行式(1),計算重構誤差;b)取訓練集中全壽命數據的初始部分的正常數據,通過公式H=f(W0X+b0)計算該正常期數據的隱藏層特征表示,并根據式(3)計算不同域之間的MMD 值;c)取訓練集中全壽命數據,執行式(4),計算訓練參數W的波動情況;d)執行式(5)計算該網絡的目標函數值,然后進行迭代,若迭代次數小于設定值κ則執行步驟3),反之執行步驟4).
3) 反向傳播:a)采用GradientDescent 優化算法,反向逐層更新帶訓練參數W,b;b)返回步驟2).
4) 特征提取:保存訓練參數W,b,輸入訓練數據集頻譜數據以及目標檢測軸承的頻譜數據,根據公式H=f(W0X+b0) 提取兩者的隱藏層特征,進而進行異常檢測模型的構建.
在線場景下,故障檢測模型應具有較好的準確性和實時性,同時應盡可能簡單.本節擬采用異常序列檢測的方式,利用排列熵構建魯棒的檢測模型.排列熵是一種動力學突變檢測方法,對信號的微小變化有放大作用,具體原理參考文獻[19].這里以第3 節實驗數據中軸承1 為例進行簡要說明.首先,對于第2.1 節提取的深度特征,劃分成長度為100個樣本的序列,對每一段序列計算其排列熵的值,其中滑動窗口為10 個樣本,嵌入維數為3,延遲時間為3,對應排列熵值的變化如圖2 所示,為便于觀察,對圖2 局部放大如圖3 所示.

圖3 圖2 的局部放大圖Fig.3 Partial enlarged view of Fig.2
圖2 中可以看出,雖然排列熵可以放大數據的局部變化趨勢,但需要設置一個合理的閾值進行在線異常檢測.采用深度遷移學習方法,不同工況下的監測數據可以提取到公共特征,在此基礎上,本文借助這些離線數據,計算更為合理的報警閾值.檢測過程如下.

圖2 本文方法所提取的公共特征及其對應的排列熵值Fig.2 The extracted common features and their corresponding permutation values
首先,利用第2.1 節中H=f(WX+b) 所提取的公共特征,計算不同工況軸承數據正常狀態的排列熵值.具體步驟為[22]:1)對序列片段L={L(k),k=1,2,···,n}進行相空間重構,得到矩陣Kij;2)對Kij的每行進行升序排列,構建相應的索引矩陣Sij;3)計算序列L的排列熵:lnPi,其中Pi為Sij中每種排列出現的概率.本文中,為了便于計算,對HP E進行歸一化處理,即0≤=HP E/ln(j!)≤1,其中j!為Sij中j列數據的總排列數.其次,確定上述排列熵的最小值作為閾值標準.最后,對在線檢測數據,采用滑動窗口生成在線序列片段,并利用多域遷移深度自編碼網絡直接提取深度特征,再計算對應的排列熵值,將其與閾值標準進行匹配,匹配不上則意味異常發生.具體流程如圖4 所示.

圖4 所提方法流程圖Fig.4 Flow chart of the proposed method
為了驗證本文所提方法的效果,本節在XJTUSY 數據集上進行對比實驗.實驗基本流程如下:用XJTU-SY 數據集[23]中的兩個工況作為源域,另一個工況作為目標域,構建深度遷移學習模型,提取得到公共特征表示;在此基礎上,將源域中兩種工況下的10 個軸承加上目標域的4 個軸承作為離線數據,計算其排列熵值,確定異常檢測閾值;最后,將剩余的一個軸承作為目標對象進行在線檢測,利用訓練好的公共特征表示直接提取特征,并按滑動窗口的方式逐序列計算排列熵值,與閾值進行比較,判斷軸承是否異常.
本文所使用的算法環境是Python 3.6,實驗電腦配置為Intel i5 7 300 處理器,8 GB 內存.所有數據在處理之前均線性歸一化到[?1,+1].軸承振動信號均采用FFT 轉換為頻譜數據,作為各深度學習模型的輸入.
本實驗選取的數據集是XJTU-SY 數據集[23].采集該數據集的實驗平臺如圖5 所示,該平臺能夠對軸承進行加速退化實驗,提供15 個型號為LDK UER204 的滾動軸承在整個使用壽命內的實際退化數據,如表2 所示.兩個PCB 352C33 加速度計分別放置在垂直軸和水平軸上,用來測試振軸承動信號.采樣頻率為25.6 kHz,每分鐘采樣32 768 個樣本點(相當于1.28 秒).由于加載方向為水平方向,因此放置在水平方向的加速度計能夠捕捉到更多被測軸承的退化信息.本文選擇水平振動信號來完成本實驗的異常檢測.

表2 XJTU-SY 數據集中三種工況描述Table 2 Description of three working conditions in XJTU-SY dataset

圖5 實驗平臺[23]Fig.5 Experiment platform[23]
本節主要給出所提深度遷移學習模型的效果.考慮到訓練樣本較多,為保證模型的可靠性,本實驗中訓練次數設為10 000 次,或訓練損失小于0.01時終止訓練.首先,以所有三種工況中的15 個軸承的正常狀態信號為例,圖6 和圖7 分別給出了采用多層深度自編碼器[24]和采用第2.1 節所提方法所得深度特征的概率密度分布圖及特征分布圖.如圖6(a)可以看出,不同工況下軸承正常狀態數據的分布存在較大差別,即使是相同工況下,軸承數據分布也有一些波動.而采用本文方法,如圖7(a)所示,所有工況下的數據分布趨于一致.同時,對比圖6(c)和圖7(c),本文方法所提特征明顯有聚合現象.這表明本文方法可有效提取不同工況下軸承正常狀態數據的公共特征.

圖6 采用多層深度自編碼器提取的三種工況下軸承正常狀態數據的特征分布Fig.6 Feature distribution of bearing normal state data extracted by multi-layer deep auto-encoder under three working conditions

圖7 采用本文方法提取的三種工況下軸承正常狀態數據的特征分布Fig.7 Feature distribution of bearing normal state data extracted by the proposed method under three working conditions
為驗證本文方法的收斂效果,圖8 給出了上述訓練過程中訓練誤差的變化圖.為了提高顯示效果,圖8 僅截取前1 000 訓練輪次進行展示.可以看到,在訓練次數100 左右,訓練誤差已經明顯收斂,此后的訓練輪次中,訓練誤差雖仍繼續下降,但下降速度逐漸放緩,整體趨于收斂.

圖8 本文方法訓練損失變化趨勢圖Fig.8 Changing trend of training loss of the proposed method
為進一步驗證深度遷移學習對于故障檢測結果的效果,我們分別采用圖6 和圖7 所提特征,計算正常狀態數據的排列熵,如圖9 所示.
限于篇幅,此處不再提供每個軸承的特征序列和對應的排列熵值.由圖9(a)可知,未采用遷移學習之前,由于正常狀態數據存在一定的分布差異,導致其排列熵值幾乎跨越從0 到1 的全部范圍.而采用深度遷移學習提取公共特征之后,如圖9(b)所示,正常狀態數據的排列熵值保持在較小范圍內波動,這意味著可根據波動范圍設置一個合理的閾值作為異常檢測的標準,為構建簡單快速的在線異常檢測模型提供了基礎.
其次,為驗證式(4)所示Laplace 正則項對于提取早期故障特征的作用,本文隨機選取工況1 下軸承5 和工況2 下軸承4 為對象,分別計算本文方法加入Laplace 正則項前后所提特征及對應的排列熵值,如圖10 和圖11 所示.可以看出,對于兩個目標軸承,采用Laplace 正則項后所提的公共特征(紅線)在狀態發生變化時波動幅度更大,其所對應的排列熵值更具有明顯的階躍現象.這表明式(4)所示Laplace 正則項可以有效增強正常狀態與早期故障狀態的區分度,提取的特征更為敏感,同時也表明,排列熵具有更好的判別效果.

圖11 工況2 下軸承4 的特征走勢及對應的排列熵值 (其中紅線與藍線分別為加入和未加入Laplace 正則項的本文方法所對應效果)Fig.11 Feature trend and the corresponding permutation entropy value of bearing 4 under working condition 2(where the red and blue curves show the effect with or without Laplace regularizer,respectively)
本節分別選擇兩個軸承作為目標檢測軸承,剩余14 個軸承用作離線訓練,目標軸承所屬工況即為目標域,另兩個工況為源域.
實驗1.Bearing1-5 為目標檢測軸承
對工況1 下軸承5 的檢測結果如圖12 所示.可以看出,14 個離線訓練軸承正常狀態數據的排列熵值基本處于同一范圍,這表明深度遷移學習有助于得到正常狀態數據的公共特征表示.根據圖12(a)所示離線軸承正常狀態數據的排列熵值,得到報警閾值為0.7199,進而檢測第1 090 個樣本出現早期故障.這一結果與圖12(b)中特征走勢的變動也是吻合的.
實驗2.Bearing2-4 為目標檢測軸承
對工況2 下軸承4 的檢測結果如圖13 所示.與圖12 相似,即使調整了源域和目標域的設定,本文方法依然可以得到14 個離線訓練軸承在較小范圍內的排列熵值,這再次驗證了深度遷移學習在提取公共特征方面的效果.根據圖13(a),得到報警閾值為0.6824,第960 個樣本被檢測為發生早期故障.

圖12 Bearing1-5 軸承的檢測結果Fig.12 Detection results of bearing 1-5

圖13 Bearing2-4 軸承的檢測結果Fig.13 Detection results of bearing 2-4
為了進一步驗證所提方法的優勢,表3 給出了所提方法與6 種代表性早期故障檢測方法的對比結果.這6 種方法既包括了兩個最新的弱信號分析方法和兩個代表性的異常檢測算法,同時還包括了一種基于深度遷移學習的故障診斷方法和一種深度特征匹配的故障檢測方法.下面首先給出這6 種方法的原理和實現細節.

1) BEMD-AMMA[25]:該方法利用弱信號分析來檢測早期故障.該方法先用帶寬經驗模態分解(BEMD)重構原始振動信號,再用自適應多尺度形態分析(AMMA)對重構信號解調得到時域信號,經FFT 變換得到頻譜信號,通過觀察故障特征頻率來判斷是否發生早期故障.
2) LOF[26]:該方法是一種典型的基于距離的異常檢測算法.本實驗中,采用目標軸承初始階段500 個樣本作為正常狀態數據,計算每個樣本的LOF 值,并選擇最大值作為異常檢測的閾值,其中K 值設為10.采用多層自編碼器提取特征,網絡結構為[500,100,30],即最終提取的特征維度為30.
3) iFOREST[27]:該方法是一種基于數據切割的集成算法,通常被認為是最具有代表性的異常檢測算法.該方法基本思路是根據每個數據被分割開需要的次數來判斷異常程度,次數越少則越可能是異常數據.樹的數目設為100,每棵樹隨機選擇256個樣本進行訓練.采用多層自編碼提取特征,網絡結構為[500,100,30],即最終特征維度為30.
4) SDFM[28]:該方法是一種基于深度學習和異常序列匹配的早期故障在線檢測方法.該方法通過滑動窗口的方式,對貫序采集的樣本塊采用深度自編碼提取特征,并根據匹配精度的變化確定故障發生位置.本實驗中,所采用自編碼器的網絡結構為[800,512,10],輸出維度為10.滑動窗口大小設為100.
5) DAFD[18]:該方法是一種基于深度遷移學習的軸承故障診斷方法,通過在多層自編碼器中添加MMD 正則項,提高不同工況下故障數據的診斷準確度.該方法適合解決源域中正常狀態樣本和故障樣本已知、目標域只知道正常狀態樣本的故障診斷問題,因此也適用于在線檢測問題.在本實驗中,利用源域數據和目標域初始階段少量正常狀態樣本訓練診斷模型,此后貫序輸入目標軸承的100 個樣本識別是否發生故障.自編碼器的網絡結構為[500,100,50],MMD 正則項參數設為1,權重正則項參數設為10.
6) SRD[29]:該方法適合進行多工況下的故障檢測,采用稀疏字典編碼的方式,重構數據近似值與測量值的殘差,并構建K 近鄰距離統計量實現檢測.由于該方法流程已包含對多工況數據的混合建模,因此本實驗中,直接將源域和目標域共三種工況的數據輸入模型,得到置信水平為95%的控制限,由此實現對目標軸承的早期故障檢測.原始信號通過多層自編碼器提取30 維特征.
由于上述方法2,3,5 和6 是針對樣本進行故障檢測,本實驗中將連續出現3 個異常樣本認定為故障發生,在該樣本前出現的異常點即為誤報警.方法1 和4 分別采用信號分析和故障模式匹配的方式,首次出現異常即認定為故障,不存在誤報警.對比結果分析如下:
1) BEMD-AMMA:表3 中,該方法對于Bearings2-4 的檢測結果不存在,故取最后一個樣本為檢測結果.出現該結果的原因有兩個:1)軸承故障頻率的計算值與實際值存在一定的差別;2)該方法本質上是一種去噪算法,若去噪效果不好則檢測結果也會受影響,因此應用于在線檢測時結果存在一定限制.
2) LOF:該方法的檢測結果雖與本文方法基本一致,沒有延后,但是誤報警的情況卻很嚴重.究其原因,異常檢測結果受正常狀態數據波動影響較大.圖14 給出了與本文方法的對比效果圖,可以看出,正常數據的輕微波動都會被LOF 檢測為異常而觸發誤報警,而本文方法采用異常序列(而非異常點)檢測的策略,可以很好地解決該問題.

圖14 本文方法與LOF 算法的檢測結果對比圖 (其中,本文方法橫坐標為序列編號(即樣本號除以100),標簽值大于0 表示樣本識別為正常樣本,小于0 表示識別為異常樣本)Fig.14 Comparative detection results between the proposed method and LOF algorithm (while x-coordinate of the proposed method denotes sequence number (equal to the sample number divided by 100),the label value greater than 0 means the corresponding sample is recognized as normal sample,else as anomaly)
3) iFOREST:由表3 可以看到,該方法不僅檢測結果略靠后,誤報警也相對嚴重.這是因為對于在線檢測問題,隨著樣本數的增多,iFOREST 切割次數隨之增大,因此無法提供穩定的在線檢測結果.由于iFOREST 方法被認為不適用于高維數據,本實驗中分別在5 至50 維特征上進行實驗,發現檢測結果區別并不大,最終選擇30 維特征的結果進行對比.
4) SDFM:從表3 可以看出,該方法檢測結果較為理想,同時沒有誤報警,這驗證了時序異常檢測策略的有效性.但相比本文方法,在Bearing1-5的檢測結果略有延遲.分析原因,這是因為該方法直接將所有離線訓練軸承數據直接輸入深度神經網絡提取特征,并未考慮數據分布不一致的問題.由此表明,對于分布存在差異的不同來源數據,直接輸入深度學習模型存在一定限制,經過領域適配則有助于進一步提高深度特征的表示能力.
5) DAFD:該方法的診斷結果相對靠后.雖然該方法同樣采用深度遷移學習技術,但其出發點是對正常狀態與故障狀態數據進行診斷,所采用的MMD 距離也是對正常狀態數據尋找公共特征子空間.如果數據區分度較大,該方法效果較好,但對于早期故障數據,故障發生界限并不明顯,此時該方法無法有效地識別數據的緩慢變化.相反,本文方法在深度遷移模型中構建Laplace 正則項,在尋找不同工況正常狀態數據公共特征表示的同時,增大正常狀態與早期故障狀態特征的區分度,因此檢測結果對于早期故障更為敏感.
6) SRD:該方法采用概率密度估計計算異常檢測閾值,檢測結果與置信區間的設定密切相關,置信區間增大,誤報警數降低,但檢測結果后移.該方法檢測結果與其他對比方法結果相近,同時誤報警數較低,尤其與DAFD 相比,其檢測結果明顯提前.這表明該方法對多工況下的監測數據實現了有效融合,所采用的稀疏字典編碼的方式可以起到類似于遷移學習的效果.但與本文方法相比,其檢測結果仍相對靠后,這是因為該方法并未采用序列檢測的方式、也沒有充分考慮增強早期故障特征的區分度.
本文針對軸承早期故障的在線檢測問題,提出了一種基于深度遷移學習的異常序列檢測方法.該方法可有效適配多工況下的軸承監測數據,同時也利用Laplace 正則項生成更為敏感的早期故障特征,不僅有助于進行基于排列熵的時序異常檢測,同時增強了檢測模型的魯棒性,降低誤報警率.該方法模型簡單、結果可靠,因此更適用于早期故障的在線檢測.
在下一步工作中,擬計劃引入時序深度學習模型,有針對性提取時序特征并進行異常序列檢測;此外,在線檢測本質是一種半監督分類問題,如何實現跨工況、多來源數據上的在線半監督分類,是需要理論上重點考慮的問題.