馬 潤,蔣 全
(上海理工大學機械工程學院,上海 200093)
電機軸承作為旋轉機械設備最重要的部件之一,在工業生產中常持續工作于高負荷、變工況、高溫以及高壓環境,因此極易發生故障。相關統計表明[2],電機故障的30%由軸承故障引起。當電機發生故障時,不僅會影響生產效率,造成經濟損失,而且甚至會造成傷亡事故。為保障電機正常安全運行,電機故障診斷起到了重要作用。
電機軸承的故障診斷方法主要包括基于模型、基于經驗以及基于數據驅動3 種[3]。由于傳感器技術的發展,基于數據驅動的故障診斷方法已經成為近年來研究的熱門領域[4]。數據驅動方法無需建立復雜精確的數學模型,也無需對信號進行繁瑣的分解分析。當輸入新的信號數據時,數據驅動法能夠準確地判斷是否出現故障以及所屬的故障類型。目前,數據驅動方法在電機故障診斷領域取得了諸多成果[5]。
數據驅動方法需要充足的歷史數據才能訓練模型。由于故障樣本往往存在分布不均衡的現象,樣本數量較多的故障類型的分類準確率會相對較高,而樣本數量較低的故障類型的分類準確率往往較低,甚至無法分類[6-7]。在實際的工業生產中,由于電機一般都工作在正常狀態,往往很難獲得足夠數量且分布均衡的電機故障數據。當數據不足時,會出現過擬合現象且分類效果遠遠低于預期。
針對數據樣本不平衡問題,學者們提出對訓練樣本進行數據增強。傳統的數據增強包括在原始信號中添加高斯噪聲、掩蔽噪聲、信號平移、振幅偏移以及時間拉伸等方法[8]。這些基于合成過采樣的方法大多是通過數據差值生成樣本,在反映實際圖像的潛在分布上還存在不足,并不能完全學習到數據分布的特征。此外,傳統的數據增強方法可能會造成過擬合現象,即傳統的數據增強方法可以增加樣本數量,但是無法自動學習到樣本的分布特征。
生成式對抗網絡(Generative Adversarial Network,GAN)[9]是解決數據分布不均衡問題的主流方法,被廣泛應用于言語情感感知、計算機視覺以及超分辨率圖像處理等多個領域[10]。很多學者致力于研究用改進GAN 生成高質量的故障樣本以緩解故障樣本數量不足的問題,并取得諸多成果。文獻[11]將GAN 和堆疊去噪自動編碼器(Stacked Denoise AutoEncoder,SDAE)相結合進一步優化判別器提取行星齒輪箱有效故障特征的能力,從而提高了生成樣本質量和故障診斷能力;文獻[12]針對標簽含噪聲干擾的分布不均衡的風機齒輪箱故障樣本,提出一種改進的標簽噪聲魯棒輔助分類生成式對抗網絡結構(Label-Noise Robust Auxiliary Classifier GAN,RACGAN)以提升生成樣本質量及在實際運行狀態下多類別樣本的分類準確率;文獻[13]在ACGAN 的判別器中加入了注意力機制,提高了判別器提取樣本特征的能力,解決了電壓暫降數據樣本分布不均衡問題;文獻[14]用條件生成對抗神經網絡(CGAN)生成電力系統中暫態失穩樣本,并用極限學習機(ELM)分類器篩選出G-mean 值最高的生成樣本。該方法能夠學習原始數據分布特征從而提高暫態穩定評估的正確率。
上述提到的方法在電機軸承數據增強方面取得了一定成果,但是這些方法往往基于一維振動信號或者通過全連接層或者一維卷積操作產生新的數據樣本,因此存在訓練過程不穩定、訓練時間過長或者訓練過程繁瑣等問題。
基于此,本文提出一種改進ACGAN 數據增強方法,對ACGAN 進行改進,融合了壓縮激勵機制(Squeeze and Exci?tation,SE),對不同通道的重要性進行建模,為較重要的通道賦予較大權重,從而提高GAN 的樣本生成質量,最終達到提高故障診斷準確率的效果。本文將改進的ACGAN 和原有的ACGAN 進行對比,算例結果驗證了模型的有效性和優越性。
生成式對抗網絡(GAN)是基于博弈論中的零和博弈理論而提出,由生成器(Generator,G)和判別器(Discrimi?nator,D)兩部分構成。GAN 結構如圖1 所示,輸入隨機噪聲z,由生成器G 生成樣本G(z),之后生成樣本G(z)和真實樣本x都輸入到判別器D 中,由判別器判別圖片是真實樣本還是生成樣本,并輸出判別結果。
在訓練過程中,生成器G 盡可能地捕獲原始數據的分布特征,并生成相似的樣本欺騙判別器D,使判別器無法區分真實樣本和生成樣本。生成器G 為了欺騙判別器,必須提升生成樣本質量。而判別器為了更準確地區分原始數據和生成數據,不斷提高自身判別能力。在生成器和判別器的博弈過程中,生成與原始樣本分布越來越接近的樣本,最終達到數據增強效果。GAN 的目標函數如式(1)所示。

其中,x表示真實樣本,рdata(x)表示真實樣本分布,z表示輸入的噪聲,рz(z)表示噪聲的數據分布。D(G(z))表示生成樣本輸入判別器后的判別結果。D(x)表示真實樣本輸入判別器后的判別結果。

Fig.1 Structure of GAN圖1 GAN結構
輔助分類生成式對抗網絡(Auxiliary Classifier Genera?tive Adversarial Networks,ACGAN)在GAN 的基礎上,將類別標簽作為輸入并指導樣本生成,提高了生成樣本質量。此外,ACGAN 的判別器添加了輔助分類器結構,即判別器不僅可以對輸入樣本進行真假判別,還可以輸出樣本的故障類別。在ACGAN 系統中,將樣本的標簽c~рc和隨機噪聲z融合并作為輸入,由生成器生成樣本Xfake=G(c,z)。判別器不僅對輸入樣本進行真假判別,還可以通過輔助分類器對輸入樣本所屬故障類別進行判別,即判別器輸出P(S|X),P(C|X)=D(X)。ACGAN 的目標函數如式(2)、式(3)所示。

其中,Ls為判別樣本是來自真實樣本還是生成樣本的幾率,Lc表示判斷樣本所屬分類判斷正確的幾率,Xreal、Xfake分別表示真實樣本和生成器G 生成的樣本,P(S=real|Xreal)表示真實樣本Xreal被判斷為真實樣本分布рdata(x)的概率,P(S=fake|Xfake)表示生成樣本被判斷為生成樣本分布рz(z)的概率,P(C=c|Xreal)和P(C=c|Xfake)分別表示判別器對真實樣本和生成樣本的故障類型標簽判斷準確的概率。
判別器D 的目標在于既要準確判別樣本是否是真實樣本,又要分辨樣本所屬故障類別。因此,在訓練過程中判別器盡量使得Ls+Lc達到最大。
而生成器G 在訓練過程中,要盡可能生成與真實樣本分布相同的樣本,使得判別器無法判別是否為真實樣本。因此在訓練過程中G盡量使得Lc-Ls最大。ACGAN 將樣本標簽c作為輸入,指導樣本生成,提高了生成樣本質量。ACGAN 的判別器增加了輔助分類結構,使得判別器在分別真假樣本的同時,能夠對樣本進行精準分類。因此,AC?GAN 的生成樣本質量相比GAN 更高,并且訓練過程更穩定。ACGAN 的系統結構如圖2所示。

Fig.2 Structure of ACGAN圖2 ACGAN結構
GAN 作為數據增強的主流方法仍存在生成樣本質量不高、訓練過程不穩定以及容易出現模式坍塌等問題[16]。為進一步提升GAN 的性能,生成高質量的樣本,本文將壓縮激勵機制(SE)融合到ACGAN 結構中[17],通過顯式建模通道之間的相互依賴性,自適應地重新校準通道特性響應。
首先,對于輸入X,通過變換Ftr將X映射到特征U,其中U∈RH×W×C;然后對U進行壓縮操作Fsq,即跨空間維度(H×W)聚合要素圖,產生尺寸為(1×1×C)的通道特征zc;再進行拓張操作Fex。Fex采用自選通道機制的形式,將通道特征zc作為輸入,生成每個信道調制權重的集合sc。將這些權重應用于特征映射U以生成SE 塊的輸出,可以直接輸入到網絡的后續層。SE 結構如圖3所示。

Fig.3 Structure of SE圖3 SE結構
其中,Fsq表示使用全局平均池化操作對輸入按通道進行壓縮,輸入樣本U的維度為(H,W,C),H和W分別表示輸入樣本的長和寬,C表示通道數。對樣本按通道進行壓縮,求得每個通道的權重。Fsq操作表達式如式(4)所示。

通過Fsq對尺寸為(H,W,C)的映射集合U按通道進行壓縮,得到每個通道的權重,輸出為(1,1,C)的向量zc,之后將zc輸入到Fex進行激勵操作。Fex操作的表達式如式(5)所示。

其中,δ表示激活函數ReLU,σ表示激活函數Sigmoid。此外,并且。為了限制模型的復雜程度并增強通用性,壓縮操作Fex用兩層全連接層增強非線性。第一層全連接層以降維比率r對輸入樣本z進行降維,再由第二層全連接層進行維度擴張。經過Fex操作,得到通道的權重輸出sc。之后,經過權重優化Fscale操作,可以得到通道特性響應校準后的樣本分布xc。Fscale表示將輸入uc與權重sc按通道相乘,Fscale表達式如式(6)所示。

本文在SE 結構上添加了殘差結構(Residual Network,ResNet)[19],解決GAN 中容易出現的梯度消失和梯度爆炸問題,提高ACGAN 的穩定性。其中,殘差結構中卷積操作的卷積核數量C與輸入樣本的通道數相同,并采用Padding操作,保證輸入與輸出形狀相同。
將SE 結構融合到ACGAN 的判別器結構中,提高判別器特征提取能力,使得訓練過程更加穩定從而提升生成樣本質量。改進后的ACGAN 結構如圖4所示。
ACGAN 和ACGAN 均采用相同的RMSprop 方法,解決訓練中的不穩定問題[20]。此外,本文引入IS(Inception Score)[21]和FID 距離(Fréchet Inception Distance)[22]以評價模型的生成樣本質量及多樣性。仿真實驗采用的是凱斯西儲大學(Case Western Reserve University,CWRU)提供的電機軸承數據,共有10 種故障類別,其中包括1 種正常狀態以及外圈、內圈和滾珠3 種故障,每種故障分別包含0.18mm、0.36mm、0.54mm 3種故障尺寸。
本文將改進后的ACGAN 和ACGAN 的生成器損失、判別器損失及故障類別分類準確率進行對比。當訓練樣本數量為1 000時仿真結果如圖5——圖7所示。
圖5 為ACGAN 和改進后的ACGAN 生成器G 損失函數值的變化趨勢對比圖。改進后ACGAN 的生成器在訓練10 000 次左右已經收斂并趨于穩定。而ACGAN 的生成器大概在訓練25 000 次之后開始收斂。相比之下,改進后ACGAN 的生成器可以更快收斂,損失值較小并且訓練過程更為穩定。
圖6 為判別器D 損失函數值變化趨勢對比圖。改后的ACGAN 模型在開始訓練之后,判別器D 的損失函數值迅速下降,并且在10 000 次之前就趨于穩定和收斂。而AC?GAN 模型的判別器D 在15 000 次之后才開始收斂。改進后的ACGAN 判別器D 損失函數值可以更快收斂并且收斂值更小。
圖7 為輔助分類器故障分類準確率變化趨勢對比圖。改進后ACGAN 的輔助分類器的分類準確率比ACGAN 更高,并且在迭代訓練10 000 次左右已經穩定,而ACGAN 需要訓練15 000 次之后才能趨于穩定。改進后ACGAN 的輔助分類器收斂速度更快、準確率更高。

Fig.5 Comparison of generator loss function values圖5 生成器損失函數值對比
由仿真結果可得,改進后的ACGAN 結構可以更快地收斂,生成器和判別器的損失函數穩定值更小,訓練過程更穩定。此外,改進后ACGAN 輔助分類器在訓練過程中的收斂速度、分類準確率更高。
本文使用IS 和FID 距離評價生成樣本質量和多樣性。IS 以生成樣本x屬于各類別的概率分布為依據量化生成樣本質量。IS 參數計算公式如式(7)所示,相關參數如式(8)、式(9)所示。

Fig.6 Comparison of discriminator loss function圖6 判別器損失函數對比

Fig.7 Comparison of classification accuracy of auxiliary classifier圖7 輔助分類器分類準確率對比

其中,x表示生成樣本,рg表示生成樣本分布,y表示類別標簽,P(y|x)表示生成樣本x屬于各類別的概率。P(y)表示生成樣本x的邊緣概率密度,計算公式如式(8)所示,DKL表示求散度,用以衡量兩個概率密度分布之間的差距,DKL的表達式如式(9)所示。當GAN 性能較好時,生成樣本所屬類別的概率很大,而其他類別的概率很小,即概率密度分布圖呈現尖峰狀,而邊緣概率密度P(y)與類別概率分布P(y|x)相反。當模型性能優良時,邊緣概率密度P(y)趨向于平均。因此,當迭代次數不斷增大時,IS 的值應不斷增大。當數據樣本為1 000 時,傳統模型以及改進ACGAN的IS對比如圖8所示。
由圖8 可知,傳統模型的ACGAN 在訓練15 000 次訓練之后IS 值開始收斂,而改進后的ACGAN 在訓練10 000次時已經收斂,并且收斂值大于傳統模型的IS值。
此外,引入FID 距離進一步衡量生成樣本的多樣性。當FID 越小時,生成樣本與真實樣本分布越接近;當FID 距離等于0 時,生成樣本分布與真實樣本相等。FID 相比于IS 對系統的噪聲具有更好的魯棒性。此外,FID 距離對于GAN 時常出現的模式坍塌問題更為敏感。當模型出現模式坍塌問題時,FID 距離的值會非常大。因此,FID 可以更好地評價生成樣本的多樣性。FID 距離的計算公式如式(10)所示。

Fig.8 Comparison of IS圖8 IS指標對比

其中,μx和μg分別表示真實樣本x和生成樣本g的數學期望,covx和covg分別表示真實樣本x和生成樣本g的協方差矩陣,Tr 表示對矩陣求解,即對矩陣對角線上的所有數求和。此外,對兩個協方差矩陣求乘積之后開平方,當結果出現復數時,只保留實數部分。當故障樣本為1 000張時,ACGAN 和改進后ACGAN 的FID 距離如圖9所示。
由圖9 的FID 距離對比可知,改進后ACGAN 的FID 值與傳統模型相比更穩定,并且FID 收斂值更小。由仿真結果可得,在ACGAN 結構中融入殘差壓縮激勵機制可以使得系統更快收斂,提高了生成樣本質量。
本文用不同數量的樣本分別訓練ACGAN 及改進后的ACGAN 算法,分別得到生成樣本。對傳統的ACGAN 和改進后ACGAN 的生成樣本質量進行評估,評估結果如表1所示。可以看出,改進后ACGAN 的生成樣本質量更優。表1 中,IACGAN 表示改進ACGAN(Improved ACGAN)。由表1 可知,當訓練樣本數量越多,ACGAN 和改進后ACGAN的生成樣本的FID 值越小,IS 值越大,即生成樣本質量更優。而在相同數量訓練樣本的前提下,改進后ACGAN 生成樣本質量相比較傳統ACGAN 表現更好。

Fig.9 Comparison of FID圖9 FID指標對比
為進一步驗證改進ACGAN 的數據增強方法的優越性,本文分別用傳統ACGAN 模型和改進后ACGAN 的生成樣本擴充原始樣本,并進行故障診斷分類。本文對不同數量等級進行數據增強,不同數據增強方法下故障診斷準確率如表2所示。
當原始樣本數量一定時,生成樣本數量越多,故障診斷準確率越高。但是,當生成樣本增加到一定程度時,即當生成樣本大于等于4 000 張時,準確率不再上升。由仿真結果可知,用改進的ACGAN 方法擴充原始數據集相比于傳統的ACGAN 可以得到更高的故障診斷準確率。

Table 2 Comparison of fault diagnosis accuracy under different data enhancement表2 不同數據增強下的故障診斷準確率對比
本文在ACGAN 結構基礎上進行改進,在ACGAN 的判別器中融合了改進的殘差壓縮激勵機制。改進后的AC?GAN 針對不同通道的重要性建模,自適應地重新校準通道特性響應,解決了GAN 訓練過程中容易出現的梯度消失或者梯度爆炸問題,算法在訓練過程中更加穩定。改進后的ACGAN 與傳統模型相比,生成樣本質量更好,其分布與真實樣本分布更接近,電機軸承故障診斷準確率可達99.82%,為解決小樣本軸承故障診斷分類準確率低的問題提供了思路。
雖然本文提出的數據增強方法能夠提高故障診斷準確率,但是仍存在一些問題亟待解決:①著重于改進數據增強方法研究,在故障診斷分類方法上并未深入探討,在后續研究中,將對不同分類方法進行仿真實驗,進一步驗證本文所提方法的可行性;②驗證了所提出的數據增強方法在數據集數量有限情況下的優化效果,在后續研究工作中,將驗證在數據集分布不均衡情況下的優化效果。