鞏曉赟,智澤恒,杜文遼,韓明,胡亞凱,羅雙強
(1.鄭州輕工業大學機電工程學院,河南鄭州 450002;2.河南中煙工業有限責任公司安陽卷煙廠,河南安陽 455004)
感應電動機是回轉工藝設備的關鍵旋轉動力傳動裝置,由于系統組件及其傳動之間具有強關聯的相互耦合關系,傳動裝置中一個故障的發生易導致故障的并發性、繼發性。采用傳統的單一傳感診斷方法不易揭示復合故障的關聯關系,造成一定的誤診、漏診[1]。同時,在實際工藝生產過程中,相較于無故障樣本或單故障數據樣本,復合故障數據量呈現不充分、小樣本問題,基于深度學習的故障診斷方法則需大量的數據樣本訓練以實現故障識別的高準確率。因此,針對單一傳感數據診斷復合故障難與復合故障數據不平衡問題,研究小樣本下多源異構數據融合遷移診斷方法具有工程指導意義。
工藝設備中回轉機組的感應電機通常與變速箱、支撐軸承、滾筒等負載單元聯結構成,單一傳感數據不易有效識別動力傳動裝置中多點復合故障[2]。近年來,一些學者采用多源信息對動力裝置進行故障診斷以提高識別精度,如EL YOUSFI等[3]通過仿真構建電機-齒輪箱系統電氣模型和負載端機械模型,綜合分析電流及振動等多信號響應,為感應電機的電流、振動信息融合故障診斷提供了理論基礎;JUNIOR等[4]針對電機運行過程中故障的隨機性,綜合利用不同方向的多個振動數據監測電機運行特性,基于多通道數據融合的卷積神經網絡模型獲得更高的診斷精度。
深度學習具有強大的數據挖掘能力,根據不同應用場景衍生出多種網絡模型,如自編碼器(Autoencoder,AE)[5]、生成對抗網絡(Generative Adversarial Network,GAN)[6]、卷積神經網絡(Convolution Neural Network,CNN)[7]、圖卷積神經網絡(Graph Convolution Network,GCN)[8]和遷移學習 (Transfer Learning,TL)[9]等深度學習網絡模型被應用于不同類型的旋轉機械故障診斷。針對工程診斷中故障數據不平衡、小樣本問題,基于深度學習的診斷方法目前主要有以下兩類研究方向:一是利用數據生成方法學習并生成大量所需數據[10]。如YANG等[11]利用條件生成對抗網絡(CGAN)生成分布相似的新樣本以解決樣本不足問題,并將之與二維卷積神經網絡結合實現軸承故障類型的有效分類;ZHANG等[12]提出一種多模塊梯度懲罰GAN模型,有效擴展了軸承的振動訓練數據。但采用以上數據生成方法生成樣本時,其生成方向因受多因素影響較難控制,且數據樣本生成后需要驗證其與目標樣本的相似性才能進一步被應用,生成方向的多因素影響與復雜的診斷流程給故障診斷增加了難度。二是利用遷移學習方法實現大樣本源域任務到小樣本目標域任務的遷移[13-14]。遷移學習是將源域中學習到的領域知識遷移到目標域,經過目標域微調模型的適應性算法解決目標域小樣本問題[15]。如SHAO等[16]通過小波變換將原始振動數據轉換為時頻圖像,采用ImageNet數據集構建VGG-16預訓練模型實現遷移學習的小樣本分類;CHEN等[17]采用預訓練的ResNet-50模型與連續小波變換相結合實現軸承故障小樣本分類;LU等[18]通過快速傅里葉變換(FFT)生成頻譜圖,將頻譜圖切割成幾個連續的子頻譜圖作為樣本,采用AlexNet預訓練模型實現軸承小樣本的遷移學習。
以上遷移學習主要采用共享的已封裝自然圖片預訓練模型實現遷移診斷,但對于小樣本下的復合故障診斷則存在以下不足:(1)已封裝的單一數據源預訓練模型無法適應復合故障的多源信號樣本輸入;(2)遷移后以圖片樣本形式的信號輸入對電流和振動原始信號而言,信號預處理環節增加了故障診斷的復雜度及人工選參的不確定性;(3)凍結網絡過程中缺少對源域與目標域的自適應優化?;谝陨戏治?,本文作者提出一種小樣本下基于多源信號與多頭卷積神經網絡遷移學習的電機復合故障診斷模型(Multi-head Convolutional Neural Network-Transfer Learning,TL-MHCNN),以解決單源信號對電機多點復合故障信息表征不足以及復合故障小樣本診斷問題。文中主要貢獻點如下:
(1)提出適應復合故障多源信號的MHCNN作為源域初始模型以滿足電流及振動信號的信息融合與特征提?。?/p>
(2)將大樣本單故障的電機原始數據集作為源域,通過遷移網絡模型構建解決目標域下以原始數據為輸入的電機小樣本復合故障診斷問題;
(3)遷移學習目標域微調模型中加入正則化懲罰項,解決微調參數的自適應優化更新及模型收斂過擬合問題。
遷移學習是將一個或者多個場景及任務中學習提取到的領域知識遷移到另一不同場景或任務中進而解決另一相關領域中的問題,即從源域遷移到目標域以解決目標域任務[19]。遷移學習中的兩個基本概念,一個概念為域(Domain),另一個為任務(Task)。域包括特征空間中的所有特征樣本集合X以及分布P(X);任務包括特征樣本的決策函數f(X)和標簽集合Y,其中決策函數f(X)為條件概率分布P(yi|xi),yi∈Y,xi∈X。
遷移學習本質上是利用源域中已有知識提升目標域分類函數性能的一種方法,根據源域特征樣本集Xs、類別集Ys與目標域特征樣本集Xt、類別集Yt,定義源域和目標域空間表達式為
(1)
(2)
式中:源域標簽特征樣本數量Ns與目標域標簽樣本數量Nt滿足:Ns?Nt。
遷移學習主要圍繞“遷移什么”、“如何遷移”和“何時遷移”3個方面的研究提升學習算法在目標任務上的性能。根據算法對遷移學習改造技術手段的不同可分為基于樣本權重的遷移學習方法、基于特征的遷移學習方法、基于模型參數的遷移學習方法、基于關聯規則的遷移學習方法。其中基于模型參數的遷移學習方法通過源任務與目標任務間的共享模型參數信息來實現遷移,適合源域與目標域樣本特征分布差異較小的應用場景。
本文作者利用模型遷移的方式學習源域任務Ts并根據目標域任務Tt構建網絡模型與參數更新以適應目標任務的性能要求。圖1為本文作者構建的遷移網絡模型的概念示意,其中源域是利用大樣本的電機單故障數據集完成預訓練,目標域則通過模型微調實現小樣本復合故障的診斷任務。
采用傳統的單一傳感診斷方法不易有效識別復合故障的并發性與傳播性,造成一定的誤診、漏診。構建一種如圖2所示的多頭卷積神經網絡(MHCNN)模型以解決動力裝置中電機電流、振動等多源異構數據的信息融合與特征提取。并利用動態衰減學習率與SeLU函數改進超參數以解決CNN模型的穩定性與梯度消失等問題。

圖2 多頭卷積神經網絡主要模塊結構
一維卷積層利用一維卷積核對輸入的一維數據進行滑動卷積操作,本文作者構造了由并行卷積層組成的多頭卷積網絡。當多源信號輸入多頭卷積網絡時,多卷積內核分別對多源信號進行卷積運算。假設輸入模型的多源信號表示為X1、X2、…,其中X=[x1,x2,…,xn],多頭卷積網絡各通道對多源信號的卷積運算可以表示為
(3)

為了避免誤差反向傳播過程中由于激活函數連續求導相乘導致的梯度消失和梯度爆炸問題,將卷積網絡廣泛應用的ReLU函數改造成求導不存在零值點的SeLU函數,其函數及導數表達式為
(4)
(5)
式中:μ和λ為常數,通常取值為1.673 3和1.050 7。
在所構建的網絡中將最大池化層嵌入每頭卷積之后,利用池化后的特征向量進行相加融合。池化及通道融合的過程可表示為
(6)

由多層相互交叉堆疊的卷積、池化層提取的特征映射后,將多維特征鋪平變換為一維向量輸入全連接層,經過全連接層作用后得到輸出。全連接層的作用公式可表示為
yFC=f(WFCxFC+bFC)
(7)
式中:WFC和bFC分別代表全連接層的權重參數矩陣和偏置量;f(·)代表全連接層的內部激活函數。
對于多分類問題,利用Softmax函數作為全連接層的激活函數,通過將任意實數向量映射為概率分布向量,滿足所有輸出概率和為1。對于測試樣本x,其屬于某種類別的條件概率計算公式為
(8)
式中:C為類別標簽總個數;c為某種預測類別標簽。
(9)
(10)
(11)
Adam為TensorFlow框架中常用的優化器,是一種改進的梯度下降算法,用于更新神經網絡模型中的參數[20]。文中在常用的Adam優化器中加入動態衰減學習率,模型訓練時自適應的調整學習率,如式(12):
rd=rend+(rinitial-rend)×es
(12)
式中:rinitial為初始學習率;s為迭代步長。
將模型正則化懲罰項加入到模型微調的過程中,其作用是自適應限制網絡空間的功能容量,通過搜索網絡空間的有效功能大小來優化網絡有益空間,促進優化收斂并避免收斂過擬合。正則化懲罰項在模型微調過程中自適應地樹立參數更新準則。

(13)
(14)
式中:正則化懲罰項L(w)作為w的對數先驗;M為類別個數;yic為符號函數(樣本i與真實類別c相同時為1,不同時為0);pic表示樣本i在類別c中的預測概率。
L2懲罰也稱為權值衰減,能夠驅動網絡權值為0,其公式為式(15)。但是對于模型遷移學習其微調的起點并不是從0開始,而是從源域預訓練模型凍結終點開始。假設對源域問題預訓練的網絡模型的參數向量為w0,即為微調參數起點。利用這個初始向量作為L2懲罰中的參考項,重新定義微調L2正則化懲罰的公式為式(16):
(15)
(16)

考慮遷移模型微調后結構之間的對應關系,式(16)中w0和w不構成一一映射關系,因此需要對源域共享到目標域的部分網絡結構以及目標域根據類別數量微調的新網絡結構進行適應性連接,進而構建出一種如式(17)的復合正則化懲罰:
(17)

將所構建的遷移學習模型應用于小樣本下動力裝置的電機復合故障診斷,基于TL-MHCNN遷移學習模型的診斷方法如圖3所示。

圖3 小樣本下TL-MHCNN電機復合故障診斷步驟
具體實施步驟如下:
步驟1,采用電流傳感器和振動加速度傳感器獲取動力傳動裝置的多源信號,構建大樣本單故障多通道數據集Xs和小樣本復合故障多通道數據集Xt,其中Xs被按比例劃分為訓練集Xs,train與測試集Xs,test;
步驟2,構建初始化MHCNN模型,并利用單故障訓練集Xs,train訓練模型;
步驟3,根據測試集Xs,test的最高精度保存最優收斂模型Ms及參數ws;
步驟4,調取預訓練模型,依據目標域Dt={(Xt,Yt)}復合故障類別凍結底層網絡并加入新分類層;
步驟6,將新獲取的復合故障數據輸入遷移學習模型Mt,并輸出辨識故障結果。
為驗證所提方法對小樣本電機復合故障的診斷效果,利用電機-轉子綜合試驗臺(MFS-MG2010)進行動力裝置電機復合故障的實驗模擬,圖4所示為電機動力傳動裝置示意圖及故障設置。其中采集信號分別來自A、B、C三個傳感器,其中傳感器A為電流鉗用于采集電流信號,安裝在電機接線柜的導線上;傳感器B和傳感器C都為振動加速度傳感器,分別安裝在電機外殼上和負載支撐座上,用于采集振動信號,采樣頻率為12 800 Hz。此實驗設置的故障類型分別為電機軸承內圈、滾動體故障、軸承外圈故障、電機轉子斷條故障及其復合故障。

圖4 實驗故障模擬與數據采集示意
分別采集電機軸承與斷條的單故障信號大樣本作為遷移學習源域,電機軸承與斷條的復合故障信號小樣本作為遷移學習目標域。源域的單故障數據集設置如表1所示,信號類型為正常(D1)、電機斷條缺陷(D2)、軸承內圈缺陷(D3)、軸承外圈缺陷(D4)、軸承滾動體缺陷(D5),每類單故障取1 000個樣本,單個樣本長度為2 048,共5 000個樣本,按照訓練集和驗證集(7∶3)劃分比例。

表1 源域的大樣本電機單故障數據集
目標域的小樣本電機復合故障數據集設置如表2所示,信號類型分為正常(F1)、軸承內圈-電機斷條復合(F2)、軸承外圈-電機斷條復合(F3)、軸承滾動體-電機斷條復合(F4),每類復合故障取200個樣本,單個樣本長度為2 048。

表2 目標域的小樣本電機復合故障數據集
以初始MHCNN作為遷移學習源模型,利用表1中大樣本的電機單故障數據樣本訓練源模型,根據驗證集精度保存收斂過程中的最優模型進而得到源域下的預訓練模型,其遷移學習的整體網絡結構和參數設置如表3所示。利用目標域下小樣本的復合故障數據樣本再次訓練遷移模型對其進行微調,并在正則化懲罰項和新目標函數的作用下自適應優化。

表3 模型網絡結構參數
實驗表明,在采用正則化懲罰項自適應優化網絡模型時,表3中參數α和β對構建模型的診斷精度有一定影響。利用五次交叉驗證法對α和β進行參數尋優,圖5所示為交叉驗證實驗下不同參數對診斷精度的影響結果。根據尋優結果,選取模型中正則化懲罰項中參數α=0.001,β=0.1。

圖5 五次交叉驗證實驗下超參數α和β的尋優結果
為了驗證文中所提遷移學習方法的電機復合故障診斷性能,對A、B、C三個傳感器的小樣本電機軸承-斷條復合故障數據分別進行測試,表4為10次小樣本遷移模型的復合故障診斷結果。可知:基于單源信息的診斷結果與傳感器類型和安裝位置有關,其中振動傳感器的診斷結果較好,且傳感器位置越接近故障點,診斷結果越好。相較于3個單傳感器數據的診斷精度,利用傳感器A(電流信號)、傳感器B和C(振動信號)的多源異構融合數據的診斷精度更好,其中準確率最高可達到99.75%、平均準確率為99.06%,同時誤差值為最??;相較于相同小樣本條件下的遷移診斷,無遷移學習的診斷準確率則為84.17%。

表4 不同多源信號故障診斷實驗結果對比 單位:%
圖6和圖7為表4不同診斷方法10次實驗下的箱體可視化圖和不同次數測試實驗的模型準確率。結果顯示,文中所提出的基于MHCNN的遷移學習方法相比其他方法,準確率谷值為98.25%,識別準確率最高達到了99.75%,診斷精度最高,誤差最小。

圖6 故障識別準確率誤差可視化箱體圖

圖7 不同模型10次測試識別精度比較
為進一步驗證文中所提遷移學習方法在小樣本下復合故障診斷的優勢,利用文中的遷移學習模型TL-MHCNN與未使用遷移學習的初始MHCNN模型在不同訓練樣本下進行模型診斷精度的比較,其結果如圖8所示??梢钥闯觯和瑯釉诟鞴收嫌柧殬颖? 000個的情況下,基礎初始的遷移學習平均準確率為98.85%,文中的遷移學習模型的準確率為99.88%,遷移學習模型比初始模型精度略高但優勢不明顯。兩種模型分別依次在800樣本、500樣本、200樣本下訓練實驗,從結果可以看到文中的遷移學習模型在小樣本下對復合故障的診斷精度依然達到99.06%;而未使用遷移學習的方法在小樣本訓練下模型精度隨著樣本數減少逐漸降低,在200個小樣本下模型精度僅為84.17%,且模型誤差增大,呈現出模型的不穩定性。

圖8 不同樣本數量下遷移學習前后模型精度
實驗中同時記錄小樣本下兩種模型的平均訓練時間,如圖9所示??芍耗P陀柧毷諗康阶顑炈钑r間,文中所提的遷移學習方法為112.60 s,而未使用遷移學習方法的時間為323.10 s,文中的方法將模型訓練收斂時間減少了210.5 s、縮短近2/3。因此可以驗證文中的遷移學習模型能夠實現小樣本下復合故障的高精度診斷,且模型穩定度高、收斂速度快。

圖9 兩種模型訓練收斂最優時間
將文中所提的遷移學習方法與基于ImageNet的遷移學習方法進行對比,分別包括在ImageNet上預訓練封裝好的SqueezeNet[21]、inceptionV3[22]、AlexNet[23]深度遷移學習模型。由于基于ImageNet的遷移學習模型需要將信號轉換為圖片形式的預處理,將實驗臺采集的時域信號通過小波變換方法轉換為時頻圖,預處理結果如圖10所示。

圖10 信號轉換小波時頻圖預處理
表5是不同遷移診斷模型對復合故障數據集的診斷結果,可知:AlexNet模型的訓練時間為89.42 s,訓練時間最短,但對復合故障診斷精度僅為90.17%;SqueezeNet和VGG-16模型的診斷精度分別為91.25%和83.65%,且模型收斂訓練時間較長;與其他幾種遷移診斷模型相比,文中所提的遷移診斷模型在小樣本復合故障下的診斷平均準確率和模型收斂訓練時間都有一定優勢。

表5 不同方法模型的診斷精度及訓練時間
針對電機復合故障小樣本以及單源信號對電機多點復合故障信息表征不充分問題,構建一種基于多源信號的TL-MHCNN遷移診斷模型。TL-MHCNN遷移診斷模型將MHCNN作為源域初始模型,解決了預訓練模型的多源信號輸入,以滿足電流與振動信號的信息融合與特征提取;將大樣本單故障的電機原始數據集作為源域,構建目標域下以原始數據為輸入的電機小樣本復合故障遷移網絡模型,解決了電機小樣本復合故障遷移診斷問題;將正則化懲罰項應用到遷移學習目標域微調模型中,解決了遷移網絡模型參數的自適應優化問題。文中所提的遷移診斷模型在小樣本下對電機復合故障的診斷精度為99.06%,相較于多個模型的診斷結果,文中所提方法在小樣本下復合故障的識別精度、穩定性與計算效率方面都得到有效提升。