陳世紅 陳榮軍
1(廣東生態工程職業學院信息工程學院 廣東 廣州 510520) 2(廣東技術師范大學計算機科學學院 廣東 廣州 510665)
旋轉機械的預測與健康管理在提高機械可靠性、降低維修成本和提高運行安全性等方面具有重要的意義[1-2]。在過去的幾年里,機械設備的監控管理(Prognostics Health Management,PHM)受到了越來越多的重視,特別是在先進制造產業,如汽車制造、航空航天工業等領域[3-4]。作為旋轉機械中的關鍵部件之一,滾動軸承的剩余使用壽命(Remaining Useful Life,RUL)預測更是研究的重中之重[5]。
在過去的幾年中,軸承剩余壽命預測方法包括神經網絡、支持向量機和神經模糊系統等數據驅動方法,因其易于實現、響應速度快和預測前景好等優點得到了廣泛的發展,并取得了一系列研究成果[6-8]。梁昱等[9]提出了一種多方位預測的集成深度學習方法,利用TIR和頻域特征來構建軸承的健康指標。Pan等[10]提出了一種有效的機器健康狀態估計方法,采用在線動態模糊神經網絡,對軸承健康狀況進行預測。另外,還有一種基于卷積神經網絡的多尺度特征提取方法[11],利用從振動數據中學習到的特征實現了軸承剩余壽命預測。
盡管在數據驅動的預測方面取得了進展,但仍舊存在兩個問題未被很好地解決:(1) 首次預測時間(First Predicting Time, FPT)的確定。傳統方法中將所收集的數據與剩余壽命值之間進行直接建模,其對應規則往往是時變的,因此失效初始時刻即首次預測時間的確定將對預測精度影響較大,但是該時間的確定仍主要依賴于峰度等常規特征,限制了預測精度的提升。(2) 實體間的數據分布差異數據驅動方法的成功主要依賴于訓練和測試數據來自同一分布的假設。由于在軸承RUL預測問題中,訓練和測試數據是在不同條件下收集的。當機器的轉速等工作條件相同時,軸承的故障往往是不同的。因此,不同軸承的退化行為不盡相同,導致實體間存在顯著的數據分布差異。因此,限制了數據驅動模型的泛化能力。
針對上述問題,本文研究并提出一種生成性對抗神經網絡模型,用于數據驅動旋轉機械軸承的RUL預測。在兩個旋轉機械數據集進行了實驗驗證,數值結果表明,該方法相對于傳統的數據驅動方法能夠有效解決上述問題,并且實現精度較高的預測。


其次,由于可以獲得訓練實體的FPT,因此可以將每個軸承的運行到故障數據分為健康狀態和退化狀態。退化期間的剩余使用壽命百分比可計算為:


本文引入對抗神經網絡進行預測,該模型首先用于生成對抗網絡(Generative Adversarial Networks,GAN)[14]。GAN的目標是從隨機噪聲中生成現實的數據樣本,生成器模塊G用于將噪聲z映射到樣本x。為了評估生成的數據G(z)的質量,采用了判別模塊D,該模塊經過優化以區分真實樣本和偽樣本。然而,生成器參數的更新影響了判別器的工作,即生成不能被判別器區分的樣本。因此通過兩個模塊之間的對抗訓練,生成器逐漸學習噪聲和真實樣本之間的基礎映射函數G。網絡模型優化的損失函數可以表示為:
(2)
式中:pdata和pz分別表示實際數據和噪聲的分布。
近年來,對抗訓練從不同領域提取共享特征方面得到了進一步的發展[15-16]。與GAN方案類似,多個域的數據樣本首先經過特征提取器模塊以獲得高級特征,這些特征通常攜帶有域偏向信息。隨后采用域判別器模塊,以高級特征為輸入,并輸出域分類結果。判別器旨在分離不同域的數據,而特征提取器則試圖獲得不容易分類的特征。通過對抗訓練,特征提取器可以將不同域的數據投影到同一區域,從而獲得共享特征。
圖1給出了本文方法的思路。首先,通過傳感器測量機器的瞬時振動加速度數據。具體而言,假設將軸承整個生命周期的振動數據收集為訓練數據集。在提出的框架中使用了兩個訓練階段,即FPT確定和RUL估計。

圖1 本文預測方法概述
通常,可以將處于早期的軸承視為處于健康狀態,并使用深度神經網絡模型來學習相應的數據分布。提出性能退化評估指標來顯示機器的退化程度,從而可以在階段1中確定第一個預測時間。然后,獲得所有訓練軸承的FPT,將生命周期數據分為機器健康狀態和退化狀態。可以計算出退化狀態下軸承的剩余使用壽命,從而可以獲取數據樣本的RUL標簽。
第1階段的深度神經網絡針對RUL預測的回歸問題進一步擴展,并使用帶有RUL標簽的有監督數據進行訓練。此外,為了增強模型泛化能力,通過對抗訓練將來自不同軸承的數據分布差異最小化。來自不同訓練和測試軸承的健康狀態數據被投影到學習的子空間中的同一區域中,并且各種訓練軸承的退化數據也被映射到相同的區域。這樣,可以提取不同軸承實體之間的共享特征,并可以大大提高測試數據的預測性能。
在階段1中,確定軸承的FPT,這對預測的準確性至關重要。如圖2所示,在整個機器生命周期中收集數據之后,通常可以認為處于早期運行狀態的軸承處于健康狀態。假設在時間t1和t2的健康狀況相似。但是,如果將tFPT1不合適地設置為第一個預測時間,則會對它們進行不同的處理,從而導致無效的預測。相反,在這種情況下,tFPT2更適合作為FPT。

圖2 機械振動數據中首次預測時間的圖示
采用深度生成對抗網絡模型來學習所有訓練軸承的健康狀態數據的分布。通常,該網絡旨在學習噪聲向量z∈RDz與實際數據樣本x∈RDinput之間的映射函數。這被表示為參數化為神經網絡的生成器G。Dz和Dinput分別是噪聲向量和數據樣本的維數。具體來說,在生成器中使用具有64、32和16個濾波器的三個卷積層。展平后,采用具有512個和Dinput個神經元的兩個完全連接的層(Fully Connected layer, FC),因此最后一層中獲得的向量就是生成的數據樣本。
偽樣本表示為G(z;θg),其中θg表示G中的參數。為了測量生成器的性能,特征提取器F使用參數θf處理生成的樣本和真實樣本。隨后將獲得的它們的高級表示,即F(G(z;θg);θf)和F(x;θf),以參數θd1饋入判別器D1中。在特征提取器中,使用具有64、32和16個濾波器的三個卷積層,然后是具有512個神經元的平坦層和全連接層。最后,一個神經元附著在判別器D1中,其值表示屬于真實數據的輸入樣本的預測置信度。在整個網絡模型中,大多采用滲漏整流線性單元激活函數。
為簡單起見,以下將特征提取器和判別器D1的組合表示為判別器。根據GAN中的對抗訓練方案,判別器旨在準確分離真實和偽造的數據樣本,而生成器則嘗試創建無法區分的真實數據。因此,此階段的參數經過優化可以得到:
z~N(0,I),x∈Strain,h
(3)

通過將梯度反轉層(Gradient Reversal Layer, GRL)引入對抗訓練架構中,式(3)可以使用流行的隨機梯度下降(Stochastic Gradient Descent, SGD)方法求解,并且可以在訓練過程中一步同時更新參數[17]。這樣,網絡逐漸學習樣本的分布,即噪聲和真實數據之間的投影函數。
在GAN架構中,判別器O1=D1(F(x))的輸出用作輸入數據與真實樣本之間的相似性的指標。考慮到在此階段學習了健康狀態數據分布,因此輸出也適合用作健康狀況指標。根據實驗結果,當機器處于健康狀態時,可以獲得穩定的O1值,而O1在退化期間會波動。因此,在本文中,其標準偏差H=std(O1)用于表示機器健康狀態,并且引入了閾值系數α>1。H(x)超過αH(xhealthy)的時間被認為是第一個預測時間,其中xhealthy代表運行初期的健康狀態數據。
2.3.1RUL預測器
確定FPT后,可以將所有數據分為健康狀態和退化狀態。階段2旨在確定軸承在退化條件下的剩余使用壽命。基于網絡體系結構,在此階段還利用了在階段1中學習到的知識。所有樣本都直接送入經過訓練的特征提取器中,作為真實數據顯示在圖中。代替判別器1,高級表示由三個模塊進一步處理,即RUL預測器、判別器2和判別器3。
具有參數θr的RUL預測器R包括三個卷積層,分別有64、32和16個濾波器,以及兩個分別具有512和1個神經元的全連接層。在卷積層之后使用主動丟棄策略以避免過度擬合。 最后一個神經元的值表示預測的RUL。在優化中,將預測誤差最小化,并使用了三類損失函數:

2.3.2條件數據對齊
盡管在RUL預測問題中,監督訓練十分有效,但未考慮不同軸承的退化數據差異,這會導致預測性能下降。因此提出一種數據對齊方法,以使用對抗性訓練策略提取用于RUL預測的實體不變特征。總體思路在于,應該將來自類似機械健康狀況的數據投影到不同實體的學習子空間的相同區域中。
圖3顯示了提出的條件數據對齊方案的圖示。

圖3 針對不同軸承的數據對齊方案
首先,處理健康狀況數據。除訓練樣本外,機器早期運行期間的測試數據通常也可以使用,可用于更好地進行數據對齊。具體來說,將從特征提取器獲得的訓練和測試軸承的數據表示都進入具有參數θd2的判別器2中,該參數由兩個卷積層和兩個全連接層組成。Mtrain+Mtest個神經元附著在最后一個全連接層,每個神經元代表屬于不同軸承實體的輸入樣本的預測置信度。最后,采用Softmax函數進行分類。
在優化中,判別器2旨在精確識別數據源,同時訓練特征提取器以獲得無法區分的表示。 更新參數以實現。
x∈Sall,h
(5)

x∈Strain,d
(6)

2.3.3網絡模型參數優化
式(4)、式(5)和式(6)可以在此階段集成,并且通過使用GRL,可以在一個訓練步驟中更新網絡參數,例如:
Ld2=Lce(D2(F(x))),x∈Sall,h
Ld3=Lce(D3(F(x))),x∈Strain,d
(7)
式中:δ是學習率;fAdam,f、fAdam,r、fAdam,d2和fAdam,d3分別表示參數θf、θr、θd2和θd3的Adam優化方法中的計算函數;εr、εd2和εd3分別表示損失Lr、Ld2和Ld3的懲罰系數。
3.1.1XJTU-SY數據集
在本文中,利用兩組加速滾動軸承退化測試數據集驗證了本文方法。XJTU-SY數據集由西安交通大學提供。測試臺如圖4所示。15臺LDK-UER204滾動軸承在兩種轉速下進行了測試。從運行到故障的振動加速度數據是通過軸承箱上的加速度計獲取的。每1分鐘以25.6 kHz的采樣率收集1.28 s中的32 768個數據點。本文將水平方向的振動數據用于預測。為了安全起見,當振動幅度超過20g時,將停止加速退化軸承測試,并且該時刻被視為軸承的故障時間。表1中提供了數據集信息。

圖4 XJTU-SY數據集中的軸承測試臺

表1 XJTU-SY數據集的信息
3.1.2PHM2012數據集
本文中使用的第二個數據集是在平臺PRONOSTIA上收集的,如圖5所示。同步電動機、軸、速度控制器和兩個滑輪的組件用于改變滾動軸承的速度。同樣,研究水平方向的振動數據。具體來說,來自PRONOSTIA平臺的PHM 2012 Challenge數據集用于驗證,其中包含17個軸承的運行到故障數據。每10 s測量2 560個數據點,即0.1 s,采樣頻率為25.6 kHz。為了安全起見,當振動數據的振幅超過20g時,停止實驗。表2中提供了數據集信息。

圖5 用于軸承加速退化測試的PRONOSTIA平臺

表2 PHM 2012數據集的信息
以下方法與本文方法具有相似的實驗設置和網絡體系結構。
(1) Basic:利用TIR和頻域特征來構建軸承的健康指標,即文獻[9]中提到的方法。該方法遵循數據驅動預測的傳統模式。沒有使用FPT,并且RUL標簽是在軸承的整個生命周期中確定的。在RUL預測問題中進行了簡單的監督學習,這表明在優化中僅考慮了損失Lr,并刪除了數據對齊方案。
(2) NoAlign:在所提出的方法中沒有考慮數據對齊方案的情況下,實現了NoAlign方法,包括健康狀態和退化狀態數據對齊。在第2階段中,僅執行損失Lr。
(3) NoHealthyAlign:健康狀態數據的對齊未在NoHealthyAlign方法中實現,即刪除了判別器2。
(4) NoDegradeAlign:該方法忽略判別器3,并且不考慮退化數據的對齊。
在執行預測方法時,首先準備輸入數據樣本。即考慮從機器定期收集數據的兩個數據集的信息,每個樣本中包含NC個連續的測量數據片段,并且在每個片段中使用Np個連續振動加速度數據點。這導致每個樣本中包含NC×Np個數據點。數據準備方案如圖6所示。當測試某個軸承時,將使用相同工作條件下其他軸承的數據進行訓練。

圖6 本文的數據準備方案
在網絡模型優化中,采用反向傳播學習對模型參數進行更新,采用Adam優化算法。已為初始化部署Xavier標準初始化器。詳細的模型參數和實驗設置見表3。通常根據驗證任務確定它們,在該任務中對軸承A1-1進行測試,并在相同的工作條件下使用其他軸承進行訓練。在這項研究中,使用三個指標來評估預測性能,即平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)。

表3 本文使用的參數
本節將在不同情況下評估本文方法的預測性能。通常將實驗結果平均5次,以減少模型隨機性的影響。表4顯示了通過不同方法對XJTU-SY數據集進行的數值預測結果。可以觀察到,本文方法通常在包括MAE、RMSE和MAPE這三個指標的不同預測任務中實現最低的預測誤差。當MAE和RMSE測量預測值與基本事實之間的距離時,MAPE度量通過不同的方法評估比例估計誤差。Basic方法會獲得較大的預測誤差,這表明簡單的監督學習方案在RUL預測問題中的有效性較低。應當指出,Basic方法是本文的基礎方法,它遵循常規的監督學習模式。結果表明,本文方法明顯優于Basic方法,證明了本文算法的優越性。NoAlign方法的結果明顯優于Basic方法,但仍然沒有競爭力。使用提出的數據對齊方案,NoHealthyAlign和NoDegradeAlign方法都可以實現可觀的預測結果。但是,在大多數情況下,結果仍不如本文方法好。
表5給出了PHM 2012數據集的數值預測結果。該方法在不同情況下也取得了可觀的結果,并且觀察到的模式與表4中的XJTU-SY數據集相似。因此,在兩個數據集上驗證了本文方法的有效性。

表4 XJTU-SY數據集上不同方法的數值預測性能比較

表5 PHM 2012數據集上數值預測性能比較

續表5
3.3.1健康指標和FPT結果
在本節中,提出振動幅值的健康指標以及獲得的不同軸承的首次預測時間。圖7和圖8顯示了兩個數據集上的四個示例。可以觀察到,在早期運行階段,健康指標通常保持在較低水平,且波動很小。當軸承開始退化時,隨著振動的加劇,健康指標會顯著增加。結果表明,所提出的健康指標非常適合用于監測機械的健康狀況,并且相應的FPT能夠很好地指示退化時間。

(a) 軸承A2-1

(b) 軸承A2-2圖7 XJTU-SY數據集的首次預測時間和健康指標

(a) 軸承A2-1

(b) 軸承A2-1圖8 PHM 2012數據集的首次預測時間和健康指標
應該指出的是,所提出的健康指標是使用特征提取器模塊構建的,該模塊也將在隨后的階段2中使用。因此,階段1所學的知識不僅支持FPT確定,而且對RUL預測有利。
3.3.2RUL預測結果
下面分析在測試軸承的退化狀態下的RUL預測結果。圖9顯示了兩個數據集中的四個預測實例。可以看出,本文方法能夠準確預測在不同情況下軸承的剩余使用壽命。有效地捕獲了一般的退化模式,并且預測誤差很小,尤其是在后期運行期間。這在實際行業中對于后期維護至關重要。


(c) 軸承B1-1

(d) 軸承B2-7圖9 四個測試軸承的剩余使用壽命預測
3.3.3特征可視化
本節將可視化分析所提出的網絡模型學習表示,以顯示特征學習的結果。具體而言,研究了特征提取器學習到的表示,并使用t-SNE方法將高維數據轉換為二維以進行可視化。
圖10顯示了兩個RUL預測情況的可視化結果,分別測試了軸承A2-2和A2-3。可以看出,使用提出的數據對齊方法,將健康狀態下的訓練和測試數據投影到學習的子空間的相同區域中,并且訓練軸承的退化數據也實現了良好的聚類性能。盡管在模型訓練期間沒有測試退化數據,但是它們也被投影到與訓練退化數據相似的區域中。這樣,獲得了較好的數據對齊效果,有助于新測試軸承的預測知識概括。

(a) 測試軸承A2-2

(b) 測試軸承A2-3圖10 兩種預測情況下學習數據表示的可視化
此外,在可視化中只能觀察到有限數量的數據未對齊。一些退化數據樣本被投影到健康狀態數據區域中。但是通過樣本跟蹤,可以發現未對齊樣本的RUL標簽通常接近100%,這表明它們與健康狀態數據本質上相似。因此,未對齊仍然符合實際的退化方案。
針對傳統智能數據驅動軸承剩余壽命預測中存在的首次預測時間確定難度大以及模型泛化能力差等問題,提出一種基于數據對齊的生成性對抗網絡軸承剩余壽命預測方法。基于兩個軸承退化實驗分析可得如下結論:
(1) 首次預測時間的精確定位會提升最終的剩余壽命預測精度,進一步說明了首次預測時間的重要性。
(2) 數據對齊的引入不僅有利于提升預測性能,而且提高了預測模型的泛化能力,使得模型能夠充分利用各種類型的實驗數據,對數據實現了良好的聚類性能。
(3) 本文方法能夠有效地反映退化過程,并較好地實現軸承的剩余壽命預測,該模型可以很好地推廣到測試數據,提升了方法的泛化性能。