王譽翔,鐘智偉,夏鵬程,黃亦翔,劉成良
(1.上海交通大學 機械與動力工程學院,上海 200240;2.上海交通大學 機械系統與振動國家重點實驗室,上海 200240)
在故障診斷領域,目前主要研究集中在單一部件的單一故障類型的故障診斷,如對軸承和齒輪的故障診斷方法[1-3].在實際工程環境中,機械系統不同的零部件是高度耦合運行的,往往會發生一個部件上多處故障、多個部件同時故障等多種復合故障的情況[4-5].針對單個部件及單一故障類型的診斷模型易受到環境噪聲、傳遞路徑等因素影響,模型準確度會極大地降低[6].以振動信號為例,當復合故障出現時,不同故障之間會互相影響,使得采集到的振動信息不再是不同故障狀態下振動信息的簡單疊加,會出現諧振等復雜現象,復合故障診斷更為復雜和困難.因此需要考慮故障解耦方法,即輸出復合故障為內部單一故障組合.若是不對復合故障進行解耦分析,將導致故障分析粒度含糊、解釋性差,不利于機械設備按不同單一故障制定針對性的運維措施以及設備的再設計.
目前常見的復合故障診斷大致可以分為2類,一類是基于經驗和模型的,另一類是基于數據驅動的.前者一般利用信號處理的方法和一定的先驗知識進行定性分析.Li等[7]在基于模型方法研究下復合行星齒輪組的太陽輪故障的特性,建立一個三維塊狀參數非線性動態模型,用來進行故障分析.Lyu等[8]基于量子遺傳算法改進最大相關峰度解卷積方法,處理軸承和齒輪的復合故障信號,與功率譜和包絡譜分析結果對比,提出的方法在復合故障分析上具有良好的效果.隨著機械設備實際運行的負載、工況條件越來越復雜,傳統的基于模型和經驗的分析很難全面覆蓋到所有情況,建模復雜度和計算量將指數倍增,難以應用于實際工況環境中,而基于數據驅動的復合故障診斷則可以很好地解決這個問題.陳仁祥等[9]利用一維卷積神經網絡和領域自適應學習單一故障和復合故障中的特征,以實現對旋轉機械的復合故障.Huang等[10-11]最早將深度學習的思想引入到軸承和齒輪的復合故障診斷中,并利用多個傳感器的數據和多個預訓練模型實現較高準確度的復合故障診斷.Jin等[12]使用解耦注意力殘差網絡進行軸承的復合故障診斷,并引入主動學習的概念.吳守軍[6]使用一維深度卷積神經網絡進行齒輪箱的復合故障診斷,在一定量復合故障數據的前提下,可以實現良好的診斷效果.Liang等[13]用小波變換處理原始振動信號,進一步將小波變換圖像結果傳遞給多標簽神經網絡進行分類,通過同時訓練單一故障數據和復合故障數據,實現較高的故障診斷準確率.Zhang等[14]提出一種混合不平衡學習方法,用以解決復合故障數據量與單個故障數據量不平衡的問題.
上述常見的復合故障診斷算法仍然存在一定局限性,原因有以下幾個方面:1)絕大多數故障診斷方法[9,15-16]僅僅將復合故障簡單等同于一種新的單一故障類型,沒有充分考慮復合故障和組成復合故障多個單一故障之間的關系,并且故障分析粒度含糊、解釋性差.不利于機械設備按不同單一故障制定針對性的運維措施以及設備的再設計.因此,需考慮故障解耦的方法,即輸出復合故障作為內部單一故障的組合.2)基于數據驅動的復合故障診斷方法具有不錯的診斷效果,但是大部分都需要大量的單一故障數據和一定的復合故障做預訓練[11-13],有些方法甚至需要多傳感器數據,在實際工業環境中往往難以獲得大量的故障數據[17].針對以上所述的問題,提出了一種基于改進Transformer的復合故障解耦診斷方法,可以在一定量單一故障數據和極少量復合故障數據樣本情況下實現較高的故障診斷準確度.
主要貢獻包含以下幾點:
1)Liu等[18]將Transformer應用于圖像的多標簽分類,進一步驗證Transformer中多頭注意力機制的有效性.因此本研究引入Transformer的解碼器以及提出一種新型的故障解耦分類器.與傳統診斷方法中視復合故障為與單一故障毫無關聯的新故障類型不同,故障解耦則充分考慮了復合故障和單一故障之間的聯系;
2)結合基于STFT的特征提取方法和所提的新型故障解耦分類器,本研究提出一種基于改進Transformer的復合故障解耦診斷方法.通過行星齒輪箱的復合故障實驗數據驗證,所提方法可以在僅訓練一定量單一故障數據和極少量復合故障數據的情況下,有較高的復合故障診斷準確度.
傳統的故障分類器和故障解耦分類器的直觀區別在于分類器一次輸出的標簽個數.如圖1所示,上側部分即為傳統故障分類器的模型,下側部分即為故障解耦分類器的模型.2種分類器的輸入均為特征提取得到的特征值,傳統分類器僅能輸出一個故障標簽,故障解耦分類器則可一次輸出多個標簽.當面對復合故障時,由于傳統分類器僅能輸出一個標簽,將復合故障視為一種新的故障類型[19],無法充分利用復合故障與單一故障之間的聯系(標簽與標簽之間都為獨立).故障解耦分類器將復合故障解耦輸出成多個單一故障的組合,用多個單一故障的標簽組合來代表復合故障,充分表達出復合故障與單一故障之間的關系.如圖1下側部分所示,用幾個已知的單一故障標簽即可排列組合表示出所有可能的復合故障情況.一般的傳統故障分類器是通過softmax函數實現的,而一般的故障解耦分類器是通過sigmoid函數實現的.

圖1 故障解耦分類器和傳統故障分類器的區別Fig.1 Difference between fault decoupling classifier and traditional fault classifier
最終傳統分類器的輸出是式(1)輸出最大值對應的第i個標簽:
在一般的故障解耦分類器中,會預設一個閾threshold sigmoid(yi)i值 ,如果 大于閾值,則輸出第個標簽,最多可以輸出n個標簽:
標準Transformer方法最早應用于自然語言處理(natural language processing, NLP)領域[20]的機器翻譯.與同時期其他深度學習方法相比,Transformer 依賴內部的多頭注意力機制,可以精確捕捉到長文本中各個詞的位置與含義,因此在機器翻譯中具有明顯優勢.Transformer開始廣受學者關注,并被不斷改進應用到圖像、視覺等[21]其他領域.Transformer采用編碼器-解碼器(encoder-decoder)的架構.編碼器主要包含多頭注意力層(multi-head attention)和前饋連接層(feed forward module),而解碼器相比于編碼器增加了遮罩多頭注意力層(masked multi-head attention).在機器翻譯中,標準Transformer的處理方法是先由編碼器對長文本進行位置編碼和特征提取,而后輸入到解碼器中,解碼器再結合輸入詞向量對編碼器的特征提取結果進行解碼,最后得到每個輸入詞向量的概率并輸出完成機器翻譯.Transformer結構的成功主要得益于內部的多頭注意力機制,這一機制可以使得模型學習到輸入的上下文信息,對不同輸入的詞向量關注到不同長文本的位置.復合故障解耦的關鍵在于模型是否能夠在復合故障中發現耦合的單一故障,基于標準Transformer結構,設計一種基于改進Transformer的故障解耦分類器.
相比于原生Transformer編碼器-解碼器的結構不同,本研究僅使用了Transformer中的解碼器.在該故障解耦分類器中,輸入特征提取得到的特征層,輸出一個或多個故障標簽.具體的工作過程與一般的解耦分類器不同,該故障解耦分類器是通過對提取的特征層進行一次次標簽查詢(query)來判斷是否輸出某個標簽.故障解耦分類器會一次次用“點蝕”、“磨損”、“斷齒”等標簽到特征提取層進行“查詢”,進一步通過“查詢結果”來判斷是否輸出“點蝕”、“磨損”、“斷齒”等標簽,“查詢結果”就對應于故障的標簽輸出概率.(“一次次”只是為了形象介紹解耦分類器的工作原理,實際可以通過矩陣運算一次性得到所有標簽的輸出概率結果,具體計算公式將在2.3節詳細闡述.)上述功能的實現依賴于Transformer中解碼器的交叉多頭注意力機制.之所以稱為交叉多頭注意力機制,是因為該模塊同時連接左側提取的特征層和下側的標簽查詢信息,將標簽查詢的信息引入到提取的特征層,因此使得解碼器可以自適應提取出與標簽對應的特征信息,進一步對該標簽的輸出概率進行預測.
為了減少噪聲干擾,傳感器一般安裝在被監測設備附近,采集到的原始振動信號如圖2所示,其中t為時間,A為振動的幅值.根據故障機理可知,不同故障的區別在頻域比時域更明顯.為了提取出振動信號中的頻域信息同時保留一定的時域信息,將先使用時頻處理工具對原始振動信號進行預處理.基于信號處理的穩定性、通用性的考慮,選擇STFT作為時頻處理工具,STFT的結果如圖3所示.使用Tukey窗函數進行STFT,其中f為振動的頻率,窗函數的長度為255,窗函數重疊數為170.

圖2 傳感器采集的振動信號Fig.2 Original vibration signal collected from sensors

圖3 預處理后的STFT圖像Fig.3 Preprocessed STFT spectrum
圖4是所提方法的算法流程圖,其中左下角部分則為特征提取模塊,右側是故障解耦模塊的示意圖,計算流程可以分為2個部分,即查詢標簽更新和概率預測,N為模塊個數.特征提取模塊主要用來進一步提取處理后的STFT圖像中有效的特征值,由一個三層卷積神經網絡組成.前2層分別包含一個二維的卷積層(Convolutional2d)、ReLU層和最大池化層(Maxpooling2d),最后一層僅包含卷積層和ReLU層,卷積層和ReLU層間通常會進行批歸一化處理.詳細的網絡模型參數如表1 所示.其中 為特征提取模塊最終的輸出維度,也是所提方法中提取特征值的維度.

表1 特征提取模塊的網絡模型詳細參數Tab.1 Detailed parameters of network model

圖4 基于改進Transformer的復合故障解耦診斷方法流程圖Fig.4 Algorithm flowchart of compound fault decoupling diagnosis based on improved Transformer
多頭注意力機制的主要優勢是可以根據不同的標簽自適應地關注到與標簽對應的局部的判別特征區域[20],這一優勢也是將其引入到故障解耦模塊中的主要原因.在該模塊中,每個查詢(query)標簽對應一種單一故障類型.在故障診斷的過程中,用每個查詢標簽依次判斷輸入特征中是否包含標簽對應的單一故障特征,如果是則輸入該單一故障標簽.當所有查詢標簽輪詢判斷后,即可實現復合故障的解耦輸出.多頭注意力機制可以借助標簽信息從不同角度或不同位置觀察輸入特征,因此復合故障模塊可以更有效地關注到各個單一故障相聯系的局部判別特征區域.
2.3.1 查詢標簽更新 對輸入到故障解耦模塊的特征值,使用標簽進行查詢判斷是否輸出標簽對應的單一故障類型.在判斷輸出之前,會先將每個標簽輸入到解耦分類器中和提取的特征一起更新迭代,根據標簽更新的結果再判斷是否輸出.標簽更新的過程可以用矩陣運算表示(使用矩陣可以將多次標簽輪詢的過程轉換為一次計算的過程).例如,設被檢測設備的常見單一故障種類為K-1種 ,則可輸出的標簽有K個(包含正常狀態的標簽).設查詢標簽矩陣為Q0∈RK×d,其中d為每個查詢標簽的維度,則為第i個查詢標簽.將查詢標簽矩陣輸入到故障解耦模塊中(如圖4右下方),該查詢標簽矩陣會依次經過2個多頭注意力模塊(第1個多頭注意力模塊的輸入只包含查詢標簽矩陣,第2個多頭注意力模塊的輸入包含查詢標簽矩陣和提取的特征值)和1個前饋連接模塊.該更新過程將重復N次(N為解碼器堆疊模塊的個數).2個注意力模塊和前饋連接模塊的迭代更新為
式中:Q為經過位置編碼的和為2個間接變量矩陣,M ultiHead(query,key,value) 和 FFN(x)為標準Transformer解碼器中多頭注意力函數和前饋連接函數,為特征提取模塊得到的特征矩陣,是經過位置編碼的.由于不需要進行自回歸預測,所以 m ultiHead函數不再需要進行遮罩.因此 ,K個標簽在每層的計算中都可以并行計算.2.3.2 概率預測 在查詢標簽迭代更新后,則進行標簽輸出的概率預測.根據上文所述,查詢標簽更新的結果(經過正向前饋模塊處理后)為QN∈RK×d,為了進行標簽輸出的概率預測,需要進一步對比查詢標簽更新的結果進行處理.如圖4右上方所示,將對QN再進行線性化處理,然后輸入到 sigmoid 層.sigmoid的 輸 出結果在0~1.0,此處可以視為標簽的輸出概率.線性層和 sigmoid層的處理同樣可以通過矩陣運算實現:
式中:Wk∈Rd,W=[W1,···,Wk]T∈RK×d;bk∈R,b=[b1,···,bK]T∈RK是線性層參數;p=[p1,···,pK]T∈RK為K個標簽的預測概率.
所提復合故障解耦算法的流程圖如圖4所示,主要計算步驟如下.
S1:對傳感器直接采集到的原始信號進行預處理,使用短時傅里葉變換(short-time fourier transform, STFT)得到時頻域圖像.
S2:將時頻域圖像輸入到特征提取模塊進行特征提取,并將提取的特征值作為故障解耦模塊的輸入.
S3:設有K個故障標簽,則初始化K個查詢標簽,將特征提取得到的特征值,作為第2個交叉注意力模塊的輸入.在訓練階段時,通過端到端的訓練可以使得最后模型的每個查詢標簽都準確代表對應的故障類型.在測試階段中,各個標簽和提取的特征會經過多頭注意力模塊、正向前饋模塊的迭代更新,最終經過線性層和sigmoid映射得到對應單一故障的輸出概率.本研究設置輸出概率閾值為0.5,當sigmoid映射結果大于閾值時,則輸出單一故障對應的標簽,反之則不輸出.在所提方法中,每個查詢標簽都有確定的物理意義,代表著某個對應的故障標簽,這也是所提方法與DETR(detection transformer)[22]的區別所在.
為了驗證所提方法的有效性,設計了多組復合故障試驗進行驗證.數據集采集自動力傳動故障診斷綜合試驗臺,如圖5所示.該試驗臺主要包含1個感應電機,1個行星齒輪箱和1個平行軸齒輪箱.行星齒輪箱和平行軸齒輪箱主要是由感應電機進行驅動,磁力制動機和負載控制器安裝在平行軸齒輪箱右側,用來施加負載,傳感器安裝位置如圖6所示,用于采集振動信號.

圖5 動力傳動故障診斷綜合試驗臺Fig.5 Power transmission fault diagnosis test bench

圖6 動力傳動故障診斷綜合試驗臺示意簡圖Fig.6 Schematic diagram of power transmission fault diagnosis test bench
本次試驗選擇9個不同故障狀態的行星齒輪,其中包含1個正常狀態的齒輪、5個單個故障的齒輪和3個不同故障組合的復合故障齒輪(如圖7).故障齒輪的位置如圖6所示.9個齒輪的詳細的健康狀態如表2所示.

表2 本研究實驗所用行星齒輪的健康狀態Tab.2 Health status of planetary gear used in test

圖7 3個不同故障組合的復合故障行星齒輪Fig.7 Three different fault combinations of compound fault planetary gear
在試驗臺運行在900 r/min的軸轉速下,制動器負載為1 hp,采樣頻率為5120 Hz.為了采集到充足的數據用以模型驗證,每個健康狀態的行星齒輪的運行時間為6 min,并截取中間平穩運行部分作為實驗驗證的數據.
在本次試驗中,時序數據的樣本長度設為2560,因此每個健康狀態下的時序數據共有720個樣本.對于單一故障和健康狀態的數據,分別選擇200個樣本作訓練集,520個樣本作測試集(復合故障數據的訓練集和測試集劃分將在第3.4節詳細說明).訓練集用來對模型進行訓練,測試集用來測試模型的準確率.
在訓練過程中,設置正常、裂紋、斷齒、缺齒、磨損和點蝕6個查詢標簽,并初始化6個獨熱編碼向量(one-hot vector),將采集到的時序數據依次經過信號預處理模塊和特征提取模塊,得到有效的特征矩陣后輸入到故障解耦分類器中.在解耦分類器的第1個解碼器中,第1個多頭注意力模塊的query和key是經過位置編碼的查詢標簽矩陣,value則是查詢標簽矩陣本身,而第2個多頭注意力模塊的query是上一個模塊的輸出,key是經過位置編碼的特征矩陣,value則是特征矩陣本身,最后經過一系列迭代過程即可得到每個查詢標簽的輸出概率.整個訓練過程使用的是交叉熵損失函數.在測試過程中,對于任意健康狀態的齒輪,只要輸出標簽和原標簽不是完全相同,則認為是預測錯誤.
為了更好地模擬實際工業環境,將在訓練樣本中僅含少量單一故障樣本數據和極少量復合故障樣本數據的情況下,研究所提方法的故障診斷性能.為了驗證所提方法的診斷效果,對比當前2種廣受認可的復合故障診斷算法,下文簡稱這2種方法為Huang[23]和Liang[13]方法.Huang方法使用一維深度卷積神經網絡對振動信號進行特征提取,進一步使用多棧式膠囊作為故障解耦分類器進行故障診斷.Liang方法先通過小波變換對振動信號進行處理得到二維時頻圖,進一步將時頻圖輸入到多標簽神經網絡進行復合故障分類.將提出的基于改進Transformer的故障解耦分類器更換為一般的故障解耦分類器,即將特征提取模塊的結果直接輸入到一維的全連接層,并使用sigmoid函數作為故障概率輸出(該方法下文簡稱STFT-CNN方法),與所提方法進行對比.考慮到公平性,上述4種方法在訓練和測試的過程中均使用相同的數據集.在訓練集方面,對于單一故障類型,每種故障選擇200個樣本作為訓練集;對于復合故障類型,從0~30個逐步增加作為訓練集,訓練集中樣本的選擇為隨機過程.為了避免偶然性,針對訓練集中各個單一故障和復合故障比例情況,每種情況重復10次(包括隨機選擇樣本作為訓練集、模型訓練與測試),取10次的測試結果的平均值為最終的診斷準確度.4種方法的學習率均設為0.001,訓練輪數為50,選擇Adam作為優化器.4種方法在不同復合故障樣本數訓練下的診斷準確度結果如圖8所示.在不同情況下訓練集中的單一故障樣本數量是相同的,因此隨訓練集中復合故障樣本數量的變化,單一故障的診斷準確度變化不大(均為98%以上),圖8僅繪制不同情況下復合故障診斷的準確度,其中N0和 A CC分別為訓練集中每種復合故障的樣本和復合故障診斷診斷準確度.
從圖8中看出,當訓練集中僅使用極少量的復合故障樣本時,所提方法在復合故障診斷準確度上明顯高于其他3種方法.當訓練集中每種復合故障的樣本數為3個時,所提方法的復合故障診斷診斷準確度達到了59.32%,而Huang方法僅為28.14%,Liang方法僅為12.15%;當訓練集中每種復合故障的樣本數為5個時,所提方法的復合故障診斷診斷準確度達到了88.29%,而Huang方法僅為45.82%,Liang方法僅為31.91%;當訓練集中每種復合故障的樣本數為7個以上時,所提方法的復合故障診斷準確度可達到95%以上.

圖8 不同復合故障樣本數訓練下的復合故障診斷準確度Fig.8 Diagnosis accuracy with different training samples of compound faults
為了進一步對比在訓練集僅含極少量復合故障樣本時所提方法和其他方法的區別,隨機選擇一組訓練集,其中該訓練集中每種復合故障的樣本數為5,使用所提方法和Huang方法進行訓練和測試,并繪制結果為混淆矩陣,如圖9所示.相較于Huang方法,所提方法在極少量復合故障樣本的情況下表現出顯著優勢.因為復合故障的正確輸出標簽應該為單一故障標簽的組合,而且必須輸出的所有單一故障標簽與實際標簽都對應才算分類正確,所以這對故障分類器提出較高要求.如圖9(b)所示,Huang方法受到訓練集中復合故障樣本的干擾,使得除點蝕外的其他標簽分類器對點蝕樣本比較敏感.在識別點蝕故障時,將識別為其他所有故障標簽組合(下文簡稱為OC),因此點蝕樣本的識別率幾乎為0.這是由于在極少量復合故障樣本的情況下,Huang方法的故障解耦分類器并不能很好地對復合故障進行解耦,因此在面對復合故障的情況時,出現了較多的識別錯誤.所提方法在訓練集中僅含極少量復合故障樣本的情況下,則表現出理想的故障診斷效果,復合故障診斷準確率均處于98%以上.

圖9 每種復合故障的樣本數為5時2種方法的診斷結果混淆矩陣Fig.9 Confusion matrix of two methods when number of samples for each compound fault in training set is 5
對比所提方法與STFT-CNN,2種方法的數據預處理模塊和特征提取模塊相同,僅故障解耦分類器不同,但是所提方法在極少量復合故障樣本的情況下的診斷效果遠好于STFT-CNN,這進一步說明基于改進Transformer的故障解耦分類器較一般的故障解耦分類器表現更好.該故障解耦分類器是所提方法在極少量復合故障樣本數據情況下,仍具有理想診斷效果的關鍵所在.
基于改進Transformer的故障解耦分類器的故障解耦能力主要來源于內部的2大機制:交叉注意力機制和多頭注意力機制.交叉注意力機制是圖2中自下而上第2個多頭注意力模塊,因為同時連接左側提取的特征層和下側的標簽查詢信息,將標簽查詢的信息引入到提取的特征層.利用交叉注意力機制,當使用不同的故障標簽進行查詢(query)操作時,即可自適應提取出與故障標簽相對應的特征,從而進一步對該標簽的輸出概率進行預測.當輸入復合故障的數據時,通過使用單一故障標簽進行查詢操作,即可依次輸出組合復合故障的單一故障標簽,以實現故障解耦.
多頭注意力機制指的是圖2中2個多頭注意力模塊.相較于單頭注意力模塊,多頭注意力模塊可以從不同角度、不同范圍提取與故障標簽對應的特征,因而可以更全面地匹配到與故障標簽相對應的具備區分度的特征.為了進一步驗證交叉注意力機制和多頭注意力機制的作用,隨機選取3段代表不同復合故障類型的振動信號進行分析.對3段振動信號進行STFT變換,得到3段振動信號的STFT圖如圖10(a)~(c)所示.故障解耦模塊中自下而上的第2個多頭注意力模塊的輸出即為多頭注意力矩陣.其中,(a)、(d)、(g)對應為第1段振動信號的處理結果,(b)、(e)、(h)和(c)、(f)、(i)分別對應第2、3段振動信號的處理結果;(a)-(c) 是3種復合故障對應的STFT圖;(d)~(i) 是使用單一故障標簽查詢時得到的注意力圖像.為了方便分析,將所有的多頭注意力矩陣求均值,并可視化為圖10(d)~(i).注意力矩陣中所有元素的取值為0~1.0,在圖10 (d)~(i)中,顏色越暗表示該位置的元素越接近0,顏色越亮表示該位置的元素越接近于1.0.
從圖10可以很直觀看到,針對不同的查詢標簽,注意力矩陣可以準確地關注到每個故障最具區分度的位置區域.圖10(f)為使用斷齒標簽查詢的注意力圖像,主要關注區域在1500 Hz附近,與斷齒頻譜圖中幅值最大的頻率相符.圖10(d)~(f)為裂紋標簽查詢的注意力圖像,主要集中在低中頻區域,這主要因為裂紋的故障特征往往很小,在齒輪嚙合的過程中對低中頻區域都有影響,關注區域較大.圖10(i)為點蝕標簽查詢的注意力圖像,主要關注在0~200 Hz的區域,對于點蝕故障,該低頻區域的特征與其他故障有較大區分度.圖10表明,經過少量的單一故障樣本訓練,故障解耦分類器通過多頭注意力機制可以捕捉到與故障標簽強相關的特征區域,具備一定物理意義.所提出的解耦分類器通過交叉注意力機制自適應提取出對應的特征值,進行標簽輸出預測.復合故障的振動信號中摻雜諧振等復雜的信息,但是僅需要極少量復合故障數據進行注意力模塊的修正,可以使得所提方法在面對復合故障時依然具有較好的診斷效果.

圖10 對 3 段振動數據處理得到的 STFT 圖像和多頭注意力圖像.Fig.10 Visualization of cross-attention maps and STFT spectrum of three segments of vibration signals.
提出一種基于改進Transformer的復合故障解耦診斷方法,在少量單一故障數據和極少量復合故障數據情況下,具有較高復合故障解耦診斷準確度,細化故障分析粒度,有利于作為設備預防維護措施及再設計的依據.主要得到以下結論.
1)為了充分考慮和利用復合故障與內部單一故障之間的聯系,不再將復合故障簡單等同于一種新的單一故障類型,而是將解耦輸出多個單一故障的標簽,提出一種新的故障解耦分類器.該故障解耦分類器正是因為內部的交叉注意力機制和多頭注意力機制,使得在故障解耦的過程中,可以自適應提取出與故障標簽相對應的特征,進一步對各個故障標簽的輸出概率進行預測,從而實現復合故障解耦.
2)基于上述的故障解耦分類器,提出一種基于改進Transformer的故障解耦診斷方法.當訓練集中每種復合故障的樣本數為5個時,所提方法的復合故障診斷診斷準確度達到88.29%,而Huang方法僅為45.82%%,Liang方法僅為31.91%.由于在極少量復合故障樣本的情況下,所提方法更好地區分復合故障中耦合的單一故障,因此能實現更好的解耦效果.
3)對所提出的解耦分類器進行深入的分析,并且可視化了多頭注意力模塊的輸出結果.結果表明,多頭注意力模塊可以從不同角度、不同范圍提取與故障標簽對應的特征,因而可以更加全面地匹配到與故障標簽強相關的特征區域,具備一定物理意義.