高 晗,毛 闐,韋榮陽,張建中,黃立榮,楊 健
(1.浙江大學 化工機械研究所,浙江 杭州 310027;2.浙江大學 平衡建筑研究中心,浙江 杭州 310028;3.浙江大學 建筑設計研究院有限公司,浙江 杭州 310028;4.杭州元創新型材料科技有限公司,浙江 杭州311500)
軸承是高速旋轉機械的核心工作部件,設備出現的故障有很大比例來源于軸承的磨損[1]。
目前,高速旋轉機械被應用于各行各業,例如在建筑材料制造行業中用于板材定厚加工的雙輥式砂光機。
建筑節能裝飾一體化板的關鍵加工裝備—雙輥式砂光機通過定厚輥的高速旋轉,帶動砂帶加工出厚度均勻的板材。定厚輥的深溝球軸承在高速旋轉下容易磨損,使定厚輥振幅逐漸加劇,造成砂帶與工作臺的相對距離不斷變化,導致板材加工不均勻,嚴重影響板材質量。因此,在軸承損傷出現的早期對其進行故障診斷具有重要意義。
雖然故障發生時會伴隨較為明顯的數據異常,但在故障早期,無法直接通過觀察數據變化來判斷設備健康狀態,需要對數據進行處理分析,然后才能得出結果。
2006年“深度學習”的概念被提出后[2],得益于硬件計算能力的提升,針對深度學習的研究得到了高速發展;因其對數據的分析處理能力,深度學習逐漸在軸承故障診斷領域取得了許多成果[3]。
袁建虎等人[4]將振動信號變換后得到的時頻灰度圖作為二維卷積神經網絡的輸入,利用卷積神經網絡的圖像處理能力,識別出了對應的軸承健康狀態,從而實現了對故障進行診斷的目的。QIAN Wei-wei等人[5]提出了一種自適應堆疊卷積神經網絡,建立了小樣本訓練集下的軸承故障分類模型。PAN Hong-hu等人[6]將一維卷積神經網絡和長短期記憶網絡(long short-term memory,LSTM)結合在一起,提出了一種新的軸承故障診斷方法,通過卷積神經網絡進行了特征處理,再由LSTM作為分類器,輸出故障類型。
以上方法取得了一定效果,但為滿足客戶的需求,設備需切換多種工作模式,雙輥式砂光機為了加工不同表面要求的板材,需要更換不同粗糙度的砂帶。加工時,不同砂帶對軸作用的扭矩發生了變化,軸的負載功率也隨之變化,而軸承在不同工況中運行時的振動信號存在數據分布差異,模型的變工況診斷準確率并不理想。
遷移學習[7]是深度學習中提升模型泛化性的重要研究分支,其原理是將源領域或任務(即源工況)上學到的知識或模型,通過某種遷移方法應用到不同但相關的領域或問題中,以提升目標領域或任務(即目標工況)的模型性能。
遷移方法通常分為樣本、模型、特征、關系遷移等方法[8],這些方法都需要使用目標工況的樣本。其中,特征遷移學習僅需要無故障標簽的樣本,數據獲取成本更低,也更容易應用實現。
特征遷移法適用于源工況和目標工況任務一致而振動信號數據分布不一致的情況;其研究內容是:將目標工況與源工況的數據映射到一個共同的特征空間中,使兩個工況的數據在新的特征空間中近似為同一分布,以消除工況間的差異,之后利用有故障標簽的源工況樣本訓練出模型,并對無標簽的目標工況樣本進行更準確地診斷分類。
尋找相似分布特征空間,本質上是減少兩個分布之間的差異,例如:將兩個分布的多核最大平均差異(multikerner-maximum mean discrepancy, MK-MMD)[9]引入模型損失函數中進行訓練;使用領域對抗神經網絡(domain-adversarial neural network, DANN),并借鑒了生成對抗網絡(generative adversarial networks, GAN)[10]的生成器和判別器的對抗訓練博弈策略,把生成器替換為特征提取器,在博弈中逐漸消除兩個分布之間的差異。
在深度學習模型訓練過程中,故障類別不均衡的訓練樣本會嚴重影響模型的表現效果,難以學習到少數類的特征表示[11]。為了確保遷移模型的訓練效果,選擇的訓練樣本數量應該遵循故障類別同等比例的原則。因此,針對源工況和目標工況的采樣方法至關重要。因為工程應用中無法直接判斷目標工況下無故障標簽樣本的故障類別,所以對遷移學習方法在工程中的應用提出了新的挑戰。許多研究軸承故障診斷的遷移學習方法的論文[9,12,13]在進行實驗驗證時,直接采用了故障類別等比例數量的目標工況樣本,但并未對采樣方法做出說明。
針對以上變工況軸承故障診斷的特征遷移學習方法在工程應用中的不足,筆者提出一種能在無標簽樣本條件下實現均衡采樣的方法,并結合DANN框架設計神經網絡結構以建立診斷模型,最后在故障模擬實驗數據的基礎上設置對照方法,對比驗證所提出方法的有效性和優越性。
筆者提出的基于模型采樣(MBS)的采樣方法流程如圖1所示。

圖1 MBS采樣法流程
MBS方法用于在特征遷移前對目標工況的無故障標簽樣本進行采樣,以采集與故障類別等比例數量的樣本。
在采樣前,需要先建立預訓練模型,預訓練模型不考慮目標工況樣本,僅使用帶故障標簽的源工況樣本進行訓練,但目標工況的采樣效果依賴于模型在目標工況的泛化性能,因此,對預訓練模型的網絡結構設計十分重要,輸出層必須為SoftMax層,以滿足輸出為各類別故障概率分布的要求,概率最高的類別即為模型診斷類別。
當通過類別數量和訓練樣本總數量確認了每一類別故障的樣本理想數量后,MBS采樣法可從大量無故障標簽的目標工況樣本中進行采樣,具體可概括為3個環節:
(1)將所有樣本輸入到預訓練模型中,記錄每個樣本由SoftMax層輸出的概率分布,并為其打上最高概率對應的類別標簽;
(2)根據每個類別在對應標簽樣本中的平均概率過濾低概率樣本,以排除可能混淆在該類別的其他類別樣本;設置的0.95閾值是為了在過濾過程中,防止某些在預訓練模型中表現很好的類別故障樣本被過濾,保留每個類別樣本的多樣性;
(3)重采樣環節是為了在某些類別樣本采樣數量達不到理想數量時仍實現數據類別均衡,保障最終診斷模型的表現效果。
筆者設計的DANN由3個網絡構成,分別是特征提取網絡F、工況判別網絡D、故障判別網絡C。
特征提取網絡F可將源工況和目標工況映射到相似分布的特征空間,工況判別網絡D可判別經特征映射后的樣本來自哪一個工況,故障判別網絡C可判別經特征映射后的樣本來自哪一類別故障。
DANN網絡的框架及訓練過程如圖2所示。

圖2 DANN結構及訓練過程示意圖
從圖2中可以看到:3個網絡同時進行訓練,使F和D同時不斷增強,直到D的精度穩定在50%左右,即認為F映射的特征空間不再含有不同工況間的差異,目標工況和源工況在特征空間中屬于同一分布;此外,F在訓練過程中也需要考慮到診斷效果。
DANN在訓練過程中分為兩個完整的網絡:F與C構成源工況的故障診斷網絡,輸入帶標簽的源工況樣本,反向傳播時對F和C都進行參數調整;F與D構成了源工況和目標工況的工況判別對抗網絡,輸入無標簽的目標工況和源工況樣本,反向傳播調整D的參數以提高工況的判別準確率,值得一提的是,在調整F的參數時需要引入梯度翻轉層(gradient reversal layer,GRL)[14],反向強化F的特征提取能力,以騙過D的工況判別能力,從而實現對抗訓練。
C、D、F這3個神經網絡的參數更新過程分別如下:
(1)
(2)
(3)
式(1~3)中:θC,θD,θF—C,D,F的網絡參數;LC,LD—C,D的損失函數;μ—學習率;-λ—梯度翻轉因子。
由于定厚輥軸承上并未布置振動信號采集及通信等設備,短期內難以獲得故障類別豐富的振動數據。同時,因少量類別故障診斷的任務過于簡單,而無法體現出MBS-DANN方法的優越性(相較于其他深度學習方法)。
軸承作為旋轉機械的通用部件,在實驗條件下,改變軸承所受負載,以此來模擬雙輥式砂光機的不同工況,仍能達到對筆者所提出的方法進行驗證的目的。
筆者選用故障類別豐富,且軸承類型同為深溝球軸承的美國凱斯西儲大學軸承數據中心的電機驅動端測試軸承[15],以此來研究所提出的基于MBS-DANN的軸承故障診斷方法。
筆者以負載1 hp(馬力)工況作為源工況,以負載0 hp、2 hp、3 hp作為目標工況,并分別用各工況(包含正常狀態在內)的14個不同故障類型、程度及位置的故障振動信號數據作為診斷模型的實驗樣本,來驗證該方法的有效性和優越性。
筆者對各類別故障的定義及標簽如表1所示。

表1 軸承故障類別的定義及標簽
在軸承故障模擬實驗中,筆者通過對軸承進行電火花加工,人為制造深度0.279 4 mm但直徑不同(例:0.177 8 mm、0.355 6 mm、0.533 4 mm)的滾珠、內圈、外圈損傷。作為不同故障類別,對于在運行中相對于基座屬于靜止的外圈,其故障中還包含3點鐘、6點鐘、12點鐘方向的位置信息。
筆者將每個工況下每個故障類別的樣本切割為長度1 024個數據點、混疊512個點的200個樣本,即每個工況下含有2 800個樣本。
為了消除不同樣本初始相位的不同,以及信號混疊的影響,筆者使用快速傅里葉變換,將原始的時域振動信號轉換為頻域振動信號的512個數據點,作為模型輸入。
該研究設計的驗證實驗步驟流程如圖3所示。

圖3 實驗步驟
圖3中,實線表示步驟流轉,兩種不同的虛線分別表示源工況和目標工況樣本的數據流。MBS的預訓練模型選擇卷積神經網絡(convolutional neural networks,CNN)。
首先,筆者使用帶故障標簽的源工況樣本訓練CNN模型;之后,通過MBS對無故障標簽的目標工況樣本進行采樣,并將采樣樣本與源工況樣本用于訓練DANN模型;最后,使用模型對目標工況樣本進行診斷,以驗證方法的有效性和優越性。
CNN的網絡結構及超參數配置如表2所示。

表2 CNN網絡結構及超參數配置
DANN的網絡結構及超參數配置如表3所示。

表3 DANN網絡結構及超參數配置
在CNN模型中,筆者用交叉熵作為損失函數,用Adam作為優化器,以64個樣本為一個batch,進行模型的批訓練,共訓練迭代100次;
筆者在DANN模型中,用交叉熵作為C和D的損失函數,用SGDM作為優化器,以128個樣本為一個batch,進行模型的批訓練,共訓練迭代500次。
CNN模型表現出了較為不錯的泛化能力,平均準確率達到96.9%,這為后續的MBS采樣奠定了良好的基礎。其中,在2 hp工況下泛化性最佳,準確率達到了99.5%;在0 hp工況下的準確率為94.39%,主要存在將不同程度的滾珠故障混淆的問題;在3 hp工況下的準確率為96.82%,主要存在將不同程度的內圈故障混淆的問題,說明CNN模型在不同程度故障識別上的泛化性仍存在不足。
由于0 hp和3 hp工況還存在一定的上升空間,因此,筆者選擇0 hp和3 hp工況的樣本數據,驗證MBS-DANN模型的有效性和優越性。
此處以0 hp工況為例說明MBS的采樣結果。MBS方法在重采樣前采集到的各診斷類別樣本數量,如圖4所示。

圖4 0 hp-MBS重采樣前的各診斷類別樣本數量
圖4中,出現類別不均衡情況的原因是:0 hp工況下使用的樣本為每個類別同等數量200個樣本,共2 800個樣本,正好滿足故障類別等比例的樣本數量要求(在工程應用中幾乎不可能出現同等數量的樣本情況,此處是為了便于對比),最為理想的情況下無需重采樣,MBS即可采樣得到每個類別200個樣本,也就說明CNN模型對0 hp工況下的故障診斷準確率已經達到了100%,無需再進行遷移學習。
但如前文所述,CNN模型在0 hp的表現效果還有進一步優化空間,因此該現象是正常的。
繼續完成重采樣,MBS方法最終采樣到的樣本的實際類別樣本數量,如圖5所示。

圖5 0 hp-MBS采樣樣本的實際類別樣本數量
MBS方法最后的重采樣是為了彌補基于模型采樣的不足。經過重采樣后,每個類別理論上(即CNN模型診斷的類別)都達到了200個樣本。
從圖5中可看出:僅在9號故障中有4個6號故障樣本混入,采樣的準確率達到99.86%,保障了類別均衡。其在一定程度上驗證了MBS采樣法的有效性。
同樣,筆者以0 hp工況為例說明DANN的訓練過程。工況判別準確率變化曲線如圖6所示。

圖6 0 hp-工況判別準確率變化曲線
從圖6可以看到:工況的判別準確率經過500次迭代后,逐漸穩定在50%振蕩,D已經無法分辨出經F映射后的特征來自于哪一工況,從而實現了從目標工況到源工況的特征遷移。
0 hp工況在DANN模型上表現的故障診斷混淆矩陣,如圖7所示。

圖7 0 hp-DANN模型故障診斷混淆矩陣
由圖7可知:不同程度故障混淆的情況得到了較大改善,整體準確率提升到98.43%。此外,3 hp工況下的整體準確率也提升到98.39%,驗證了MBS-DANN方法的有效性。
為了驗證MBS-DANN模型在變工況軸承故障早期診斷問題中的有效性和優越性,筆者設了4個對照方法:(1)未遷移的模型(即CNN模型);(2)同樣使用無標簽目標工況樣本進行深度學習的卷積自編碼器(convolution auto-encoder,CAE)[16]與MBS采樣法結合;(3)基于理想采樣法的DANN模型;(4)基于隨機采樣法的DANN模型[17]。
其中,理想采樣是指采樣的最理想情況,即每個類別同等數量采樣200個樣本;隨機采樣是指不對目標工況下的無標簽樣本進行任何先驗判斷,而直接采樣。
隨機采樣的各類別樣本數量如圖8所示。

圖8 隨機采樣的各類別樣本數量
筆者采用的隨機采樣模擬方法是先隨機生成各故障類別的采樣比例,之后根據樣本總數量(共計2 800個),從對應類別樣本中隨機采樣相應數量的樣本。由于在該實驗中,每個類別樣本只有200個,因此,超過200個的類別采用隨機重采樣的方式補齊樣本數量。
不同對照方法與MBS-DANN的模型跨工況軸承故障早期診斷準確率對比結果,如表4所示。

表4 不同對照方法與MBS-DANN的診斷準確率對比
由表4可知:
相較于MBS-CAE模型,實驗結果驗證了DANN模型的優越性;相較于隨機采樣和理想采樣的DANN模型,理想采樣法表現效果最佳,說明了采樣對特征遷移法的重要性,隨機采樣法與MBS采用法的準確率差距也驗證了MBS采樣法的有效性;相較于未遷移的CNN模型,平均準確率提升了2.8%,驗證了MBS-DANN模型的有效性和優越性。
針對傳統深度學習方法在變工況下的軸承故障診斷準確率較低,以及特征遷移學習方法在工程應用中無標簽樣本采樣方法缺失的問題,筆者提出了一種基于MBS-DANN的軸承故障診斷方法,即采用基于預訓練CNN模型的MBS方法,保障了采樣樣本數量的類別均衡,將DANN作為神經網絡框架,并在軸承故障模擬實驗數據上,進行了多種方法的實驗對比分析。
研究結果表明:
(1)在理想采樣法和隨機采樣法下,實驗數據分別達到99.4%、87.98%的平均準確率,證明了建模前無標簽樣本類別均衡采樣方法的重要性;
(2)MBS方法克服了在無標簽目標工況下,實現類別均衡采樣的困難;相比隨機采樣法,MBS方法平均準確率提高了超過10%,而僅比理想采樣法低不到1%,充分驗證了MBS方法的有效性;
(3)MBS方法與DANN網絡結合,達到了98.41%的診斷平均準確率,在對比實驗中,僅次于理論采樣-DANN,充分驗證了MBS-DANN方法的優越性。
由于時間和條件有限,仍有工作可在后續的研究中進行開展:筆者僅在模擬實驗條件下進行了該方法的驗證,后續可針對實際應用場景對該方法進行驗證和進一步優化;除了工況會影響振動信號數據分布,軸承的潤滑、溫升等情況也會導致數據分布差異,后續筆者擬將該方法在更多場景中進行驗證及應用。