












摘 要 實際工業應用中轉子系統能夠采集到的故障樣本遠少于正常工況樣本。針對不同類別樣本數量不均衡時傳統深度學習模型會傾向于預測出樣本更多的類別而忽視較少出現的類別的現狀,提出基于條件深度卷積生成式對抗網絡(CDCGAN)結合改進的卷積塊注意力機制(CBAM)+可變性卷積的有監督二維數據生成方法(CBAMCDCGAN),實現不均衡樣本轉子系統的故障診斷。首先用小波變換將得到的振動數據轉換為二維時頻圖像;之后將改進的CBAM注意力機制與可變形卷積分別嵌入生成式對抗網絡的生成器與判別器中,并利用該生成網絡進行樣本生成;最后將生成樣本與原始樣本混合,劃分為訓練集和測試集,通過雙路徑網絡進行訓練和測試,結果表明:在樣本不均衡比為1:10時,用CBAMCDCGAN模型生成樣本后進行故障診斷,轉子和軸承故障識別的準確率較不均衡時分別提升16.10%和21.28%。
關鍵詞 故障診斷 CBAMCDCGAN模型 轉子系統 雙路徑網絡 樣本不均衡 生成式對抗網絡
中圖分類號 TP277;TE95" "文獻標志碼 A" "文章編號 10003932(2025)0223911
轉子系統是石油化工行業轉動設備(如離心壓縮機、離心泵)的重要部件。為確保機械設備的可靠性,保護人員安全,避免財產損失,對轉子系統進行故障診斷極為必要[1]。實際工作中,由于故障發生率低、數據收集困難、復雜系統故障類型多樣、故障檢測系統的提前預警等,致使采集到的故障樣本數量少于正常樣本數量而產生樣本不均衡,導致原針對均衡樣本的故障診斷模型適應性差。因此,開展不均衡樣本的轉子系統故障診斷方法研究對于保障設備安全可靠運行意義重大。目前針對樣本不均衡問題,有數據和模型兩大類解決方案。從數據角度解決樣本不均衡問題是最為直觀的方法,主要是針對數據量的擴大方法,較為常見的有合成少數類過采樣技術[2]、變分自編碼[3]及生成式對抗網絡(Generative Adversarial Networks,GAN)[4]等。其中,GAN于2014年由GOODFELLOW I等[5]提出,GAN由生成器和判別器組成,在GAN的發展與應用過程中,研究人員根據效果與實際需求又創新了諸多變體,如深度卷積生成對抗網絡(Deep Convolution Generative Adversarial Networks,DCGAN)[6]、條件生成式對抗網絡(Conditional Generative Adversarial Networks,CGAN)[7]等,這些模型也被廣泛應用于解決實際工況下設備各工況數據不均衡的情況,文獻[8]提出一種基于CGAN和卷積神經網絡的同步電機轉子故障診斷系統,利用平衡后的數據集進行故障識別,準確率達到99.5%以上;文獻[9]針對行星齒輪箱各工況數據不均衡的問題,采用格拉姆角場進行數據預處理,再通過DCGAN進行樣本生成;文獻[10]利用峭度指標與遺傳算法優化WGAN,對風電機組齒輪箱不均衡數據集進行故障診斷。在GAN的諸多研究方向中,提高生成樣本質量是目前研究的重點,現有的提高生成樣本質量的方法包括在生成器前端加入變分自編碼器[11]、在判別器中引入正則化[12]等,但這些方法不僅加大了模型的復雜性和調試難度,而且只在判別器或生成器單方面進行改進。
筆者提出一種基于條件深度卷積生成式對抗網絡(Conditional Deep Convolutional Generative Adversarial Network,CDCGAN)結合卷積塊注意力機制(Convolutional Block Attention Module,CBAM)以及可變性卷積的有監督二維數據生成方法,首先在DCGAN網絡的基礎上引入標簽信息,建立CDCGAN,之后針對網絡的生成器與判別器同時進行改進,研究提高生成樣本效果的方法。
1 基本理論
1.1 CDCGAN模型
CDCGAN模型是將CGAN與DCGAN的思想和網絡結構相結合,同時具備兩個模型的優點。CGAN通過向GAN架構引入監督機制,將附加信息作為條件輸入模型,增強了其指導性和約束力。在生成模型中,輸入層接收的輸入不僅是噪聲信號,也融入了條件信息。而在判別模型中,輸入數據同樣要與相應的條件信息配對,以確保能夠正確學習到數據與條件間的關聯,同時也可以約束生成網絡生成所需類別的樣本。DCGAN是將生成對抗網絡與卷積神經網絡的理念融合的模型,其主要應用場景是針對圖像數據的生成。與原始GAN相比,DCGAN在生成器網絡和判別器中都采用了卷積網絡結構。在DCGAN判別器中使用帶步長的卷積層替代原池化層進行下采樣,減少了網絡對空間信息的壓縮進而保留了更多的圖像細節,并通過設計適當的卷積層代替全連接層,提高了模型的魯棒性。
1.2 雙路徑網絡
雙路徑網絡(Dual Path Networks,DPN)是一種將殘差連接和密集連接結構相結合的深度神經網絡模型,通過將傳統的單一路徑深度運算改為雙路徑運算,將雙路徑塊的輸入拆分到殘差連接與密集連接兩個不同路徑中,充分利用兩種不同結構的網絡特點,再將它們的特征圖進行拼接。具體地,DPN首先將輸入數據分成兩個路徑,其中一個路徑通過殘差結構處理,另一個路徑則通過密集連接結構處理。殘差結構允許網絡在學習過程中通過跨層的信息流動,更好地捕捉底層特征和高層特征的關系。而密集連接則將每一層的特征都與之前的所有層進行連接,使得網絡可以直接利用之前層的特征信息并加強特征的傳遞和利用。同時,DPN在殘差結構中引入了分組卷積的思想,在傳統卷積的基礎上對輸入通道進行分組,并分別對每個組進行卷積操作。這種結構在減少參數數量和計算成本的同時,還能保持網絡性能。最后,DPN將殘差結構和密集連接結構生成的特征圖進行拼接,得到融合了兩者信息的最終特征表示。
通過這種雙路徑的設計,DPN充分利用了殘差連接和密集連接的優勢,提高了模型的學習能力和表達能力。該網絡提供了特征的有效利用,一個路徑用于維護特征的復用,另一個路徑用于探索新特征。雙路徑網絡流程如圖2所示,本研究選擇的是DPN56網絡,具體結構見表1(max pool為最大池化,stride為卷積操作時的步長,G代表分組卷積的組數,(+n)為密集連接部分增加的通道數)。
2 CBAMCDCGAN樣本生成網絡
2.1 改進的CBAM注意力機制
CBAM注意力機制是一種混合域注意力機制,其在結構上將通道注意力模塊和空間注意力模塊串聯在一起,因此可以同時學習通道和空間的重要性權重,使模型能夠自適應地選擇和聚焦在關鍵通道和位置上,從而提高特征的質量和表達能力。CBAM模塊可以直接應用于現有的卷積神經網絡架構中,并在許多計算機視覺任務中取得了很好的性能提升,如圖像分類、目標檢測、圖像生成等。CBAM的結構如圖3所示。
通道注意力模塊的設計目的是探究通道間的相互依存關系,通過引入一個全局平均池化層獲取各通道的全局特征,然后通過兩個全連接層學習通道權重(調整每個通道在后續層的貢獻,減少不相關通道的影響)。
空間注意力模塊的設計目的是探尋特征圖上各位置間的相互依存關系,增強網絡對特定位置的關注,從而提高對空間細節的建模性能。筆者在原始空間注意力的基礎上加入多尺度卷積,通過較小的卷積核捕捉圖像中的細節特征,通過較大的卷積核提取更加全局的信息[13]。改進的空間注意力模塊結構如圖4所示。
改進的空間注意力模塊首先對輸入特征圖F沿著通道維度進行最大和平均池化操作,得到兩個特征圖,之后將得到的特征圖在通道維度上進行拼接,然后進行3×3、5×5、7×7卷積操作,通過多尺度卷積操作擴大特征圖的感受野并捕捉圖像的細節特征。再將不同卷積得到的特征進行拼接,此時特征圖的尺寸與經過池化操作后得到的兩個特征圖尺寸相同。最后將特征圖輸入Sigmoid激活函數,得到空間注意力向量M■,其計算式為:
2.2 可變形卷積
可變形卷積由DAI J F等于2017年提出[14],該方法可以動態調整卷積核的形狀,使得卷積層在采樣時更貼近圖片特征的形狀和尺寸,更具魯棒性,而標準卷積無法實現。
傳統卷積神經網絡可定義為用一個給定尺寸的滑動窗口,按照設定的規則,在輸入的特征映射x上滑動,當窗口滑動完整個輸入矩陣后,通過網絡參數設置和激活函數的作用形成新的特征矩陣。而可變形卷積在傳統卷積的基礎上增加了偏移概念,使得卷積核在采樣時各采樣點發生偏移??勺冃尉矸e公式為:
通過引入偏移概念,可變形卷積可根據圖像特征調整采樣坐標,流程如圖5所示(藍色特征圖上的紅點代表應用偏移后的卷積核采樣的位置),可以看出,在可變形卷積過程中,利用卷積窗口內特征圖中的數值作為輸入,對梯度根據雙線性插值算法的反向傳播獲得偏移矩陣。然后將各點位的偏移量與原始坐標進行加和,得到新的點位坐標,并利用新的點位坐標上對應的特征數值代替原坐標數值去執行卷積操作,最終得到一個輸出特征圖數據點。
2.3 CBAMCDCGAN模型構建
CBAMCDCGAN模型在Pytorch框架下搭建,設置生成器和判別器學習率為0.000 1,選用Adam優化器。同時,在生成器中將注意力機制放置在嵌入條件向量層之后,以便模型能夠針對具體條件更好地專注于生成圖像的相關區域。在判別器中,將可變形卷積加入圖片輸入的第1層,以增強局部特征適應性。生成器和判別器模型的結構如圖6、7所示,其中,conv為卷積操作,Deconv為反卷積操作,DCN是可變形卷積操作。
3 試驗研究
3.1 故障診斷方法實現
為了驗證CBAMCDCGAN模型在樣本生成效果的優越性,以及采用生成對抗網絡在處理樣本不均衡問題時提升故障診斷準確率的有效性,設計了基于CBAMCDCGAN的故障診斷流程,步驟如下:
a. 用小波變換將轉子系統一維振動信號轉換為二維時頻圖像;
b. 將時頻圖像按不同不均衡比輸入CBAMCDCGAN模型;
c. 通過CBAMCDCGAN生成器和判別器進行對抗學習,并在生成器中更換不同的注意力機制;
d. 生成在不同注意力機制下的圖像,并分別通過量化指標加以評價;
e. 將訓練好的數據與原始樣本進行混合,并劃分為訓練集和測試集,通過DPN56進行訓練和測試。
基于CBAMCDCGAN的試驗流程如圖8所示。
3.2 試驗數據
試驗數據采用Bently RK4轉子故障數據和凱斯西儲大學的軸承故障數據,由于振動信號是設備工作狀態的重要載體,承載著機械設備運行的關鍵信息,因此筆者收集了兩試驗臺的振動信號。
針對轉子實驗設置正常、不平衡、不對中、軸承座松動4種工況(表2)。針對軸承數據選擇
12 kHz采樣頻率下的正常狀態數據,以及在0.18、0.36、0.53 mm3種不同損失直徑下的內圈故障(IF)、滾動體故障(BF)和外圈故障(OF),各類別數據標簽列于表3。
同時,為驗證在數據不均衡條件下的效果,按照每類故障工況與正常工況樣本1:2、1:5、1:10的比例來設計樣本不均衡數據集。
3.3 生成樣本時頻圖對比分析
現有注意力機制可劃分為通道域、空間域、時間域、混合域[15]。注意力機制在幫助神經網絡處理大量輸入數據時,選擇性地關注對當前任務更為關鍵的信息,從而減少對其他無關信息的關注,提高了處理效率和準確性。因此,注意力機制也被用于深度學習中,用于提高網絡效率。但目前的研究多為注意力機制改進網絡與原始網絡的對比,缺少各類注意力機制間的對比。因此,筆者將各類型注意力機制嵌入生成器網絡,網絡名稱見表4。由于時間注意力機制多用于一維時頻數據中,因此暫不進行比較。
將制作好的各數據集分別輸入CBAMCDCGAN網絡。為了進行不同領域注意力對生成樣本影響的對比,也將各數據集輸入SECDCGAN和ECACDCGAN兩種生成網絡,并設定每種故障類型生成400張新的圖像。表5為不均衡比為1:2時轉子系統在各改進模型生成圖像以及原始圖像對比,其中軸承的原始故障圖像是在損傷直徑為0.53 mm下的數據。
3.4 量化指標
為了更好地評價不同模型的效果,選取兩種量化指標對生成的樣本進行評價。
3.4.1 距離得分
由于FID描述的是原始樣本與生成樣本間的近似性,因此當特征均值差越小、協方差越小時,生成樣本的真實性越高,即當FID越小模型效果越好。
3.4.2 余弦相似度
余弦相似度用于衡量兩個非零向量間的相似度,通過測量兩個向量的夾角的余弦值來確定它們的相似度,進而衡量兩個不同樣本的差異值。在深度學習中,網絡更注重的是特征空間上的分布,即使生成的圖像和原始圖像在像素層面看起來并不相似,只要在特征空間中它們是緊密的也能夠被正確分類。因此,通過計算余弦相似度,可以幫助評估生成圖像的特征是否與原始圖像特征保持在同一方向或近似,能夠簡要分析生成圖像與對應原始圖像能否被模型正確分類。
余弦相似度的取值范圍是[-1,1],如果兩個向量的方向完全相同,那么它們的余弦相似度是1;如果兩個向量正交,即沒有任何相關性,余弦相似度則為0;如果兩個向量方向完全相反,那么余弦相似度是-1。余弦相似度D′的計算式為:
為進一步驗證筆者方法的優點,現加入原始CDCGAN網絡的生成樣本進行對比,通過量化指標對所得圖像進行定量分析,結果見表6、7,可以看出,通過原始CDCGAN與加入不同注意力機制及可變形卷積的生成網絡對比,筆者方法生成圖片的質量更好。通過CBAMCDCGAN與SECDCGAN和ECACDCGAN的兩種參數指標對比可以看出,CBAMCDCGAN模型生成新樣本圖像在兩項指標對比中最為優秀,證明了改進的CBAM注意力機制對于提高生成網絡生成樣本質量的有效性。
3.5 故障分類
為了驗證CBAMCDCGAN生成網絡對于樣本不均衡轉子系統故障診斷性能的提升,首先將不均衡數據集輸入至DPN56模型中進行分類,結果見表8,可以看出,隨著不均衡比的增加,模型分類準確率不斷下降。
從圖9a可以看出,在轉子數據不均衡比不斷增大時,雖然CBAMCDCGAN的分類準確率有所下降,但仍高于CDCGAN。從圖9b可以看出,在軸承數據不均衡比為1:2時,CBAMCDCGAN分類結果可達100%;在不均衡比為1:5時,CDCGAN的準確率較CBAMCDCGAN低;而當不均衡比為1:10時,CDCGAN生成樣本與原始樣本混合后的準確率進一步下降,而CBAMCDCGAN生成樣本與原始樣本混合后的準確率仍高于95%。從圖9也可以看出,利用生成對抗網絡生成樣本,可有效解決數據不均衡導致的分類準確率下降的問題,在轉子樣本不均衡比為1:10時,利用CBAMCDCGAN生成樣本后,故障診斷準確率較不均衡時提升了16.10%;在軸承樣本不均衡比為1:10時,利用CBAMCDCGAN生成樣本后,故障診斷準確率較不均衡時提升了21.28%,準確率都較不均衡時有大幅提升。
為了進一步分析利用CBAMCDCGAN生成樣本對于故障診斷的有效性,使用混淆矩陣直觀評估分類模型的性能。轉子和軸承在3種不均衡比補充生成樣本后分類的混淆矩陣如圖10、11所示,可以看出,雖然轉子故障診斷結果隨著不均衡比的升高而有所下降,但仍保持著較高的水平。而對于軸承故障,在不均衡比為1:2時,故障診斷網絡可以準確地識別出軸承各工況,并且隨著不均衡比的上升,對于大部分工況仍然能夠正確識別。
4 結論
4.1 提出CBAMCDCGAN二維數據生成方法,在DCGAN的基礎上引入標簽信息,同時在模型判別器與生成器中分別加入可變形卷積和改進的CBAM注意力機制,提高了生成樣本的質量。
4.2 利用FID和余弦相似度指標對嵌入不同領域注意力機制下的生成網絡的生成樣本進行了量化計算,綜合分析了不同網絡下生成樣本的質量,通過指標可以看出CBAMCDCGAN生成的轉子數據與軸承數據樣本均優于其他所選對比方法。
4.3 將不同不均衡比下CDCGAN模型和CBAMCDCGAN模型的生成樣本與原始不均衡樣本進行混合后分別輸入DPN56網絡中進行轉子系統故障診斷。通過測試集準確率的對比可以看出,利用生成對抗網絡生成樣本提高了數據不均衡條件下的準確率,并且CBAMCDCGAN生成樣本與原始CDCGAN相比有著更好的效果。
參 考 文 獻
[1] 林水泉.旋轉機械故障診斷技術及其發展趨勢[J].化工機械,2019,46(6):607-610.
[2] 李國和,劉順欣,張予杰,等.面向分類模型學習的樣本類別均衡化方法[J].計算機應用與軟件,2022,39(10):230-237.
[3]" " 黃冬梅,吳志浩,孫園,等.基于VAE預處理和RP2D CNN的不平衡負荷數據類型辨識方法[J].電力系統及其自動化學報,2022,34(10):66-72.
[4]" " 馬波,蔡偉東,趙大力.基于GAN樣本生成技術的智能診斷方法[J].振動與沖擊,2020,39(18):153-160.
[5]" "GOODFELLOW I,POUGETABADIE J,MIRZA M,et al.Generative adversarial nets[C]//Advances in Neural Information Processing Systems.Cambridge:MIT Press,2014:2672-2680.
[6]" RADFORD A,METZ L,CHINTALA S.Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks[J].Computer Science,2015:1-16.
[7]" "MIRZA M,OSINDERO S.Conditional Generative Adve
rsarial Nets[J].Computer Science,2014:2672-2680.
[8]" "李俊卿,李斯璇,陳雅婷,等.一種基于CGANCNN的同步電機轉子繞組匝間短路故障診斷方法[J].電力自動化設備,2021,41(8):169-174.
[9]" " 古瑩奎,石昌武,陳家芳.基于格拉姆角場與深度卷積生成對抗網絡的行星齒輪箱故障診斷[J].噪聲與振動控制,2024,44(1):111-118.
[10]" "蘇元浩,孟良,許同樂,等.不平衡數據集下優化WGAN的風電機組齒輪箱故障診斷方法[J].太陽能學報,2022,43(11):148-155.
[11]" "張釗光,蔣慶磊,詹瑜濱,等.基于VAEGAN數據增強算法的小樣本滾動軸承故障分類方法[J].原子能科學技術,2023,57(S1):228-237.
[12]" "MIYATO T,KATAOKA T,KOYAMA M,et al.Spectral Normalization for Generative Adversarial Networks [J/OL]. Computer Science, 2018:1-26. https://arxiv.org/
abs/1802.05957.
[13]" " 郝洪濤,王凱,張炳建,等.多尺度特征自適應融合的氣動控制閥故障診斷[J].儀器儀表學報,2023,44(10):167-178.
[14]" "DAI J F, QI H Z,XIONG Y W, et al. Deformable convolutional networks[C]//Proceedings of the IEEE International Conference on Computer Vision.Piscataway,NJ:IEEE,2017:764-773.
[15]" "陳耀文,譚曉玲.基于注意力機制的卷積神經網絡在圖像分類中的應用[J].科學技術創新,2021(34):166-169.
[16]" "邵昱.關于生成式對抗神經網絡研究的思路探析[J].通信與信息技術,2024(1):117-122.
(收稿日期:2024-06-19,修回日期:2024-07-23)