張振良 劉君強 張 曦 黃 亮
(南京航空航天大學民航學院 南京 210000)
在維修業中,發動機設備故障中有30%左右的故障源于軸承失效,而且軸承故障壽命有著高離散性的特點,極難制定合適的定時維修方式。因此,對軸承的故障診斷有著重要意義。軸承的振動信號中包含著大量信息,體現為多種振動分量的混合,這些分量一般以混合疊加以及乘性調制的方式體現在振動信號中,而且包含背景噪聲的影響。現有的軸承故障診斷方式可歸納為基于數據的診斷方式和基于模型的診斷方式。
基于模型的診斷方式多采用經驗模態分解[1](EMD)、獨立成分分析(ICA)等方法直接對振動數據進行分解,設置模型對分解結果進行分類預測。如郭艷平、龍濤元[2]根據軸承振動信號的特殊性質,建立了軸承在各種故障時的信號模型,然后采用EMD 算法對原始振動信號做分解,并以峭度為依據進行信號重構,最后計算重構信號與不同信號模型之間的相關系數,根據系數大小可準確判斷故障類型。
基于數據的診斷方式主要從數據中提取特征來訓練神經網絡,依靠神經網絡的預測結果診斷故障。如張偉、彭高亮提出了具有兩個卷積層的卷積神經網絡,對振動信號進行卷積提取特征,最后進行診斷。劉曉東、劉朦月[3]等提出了一種基于集合經驗模態分解以及利用排列熵進行特征提取的方法,然后利用多分類向量機對故障進行預測,并組成特征向量,最后以概率輸出的形式實現對軸承的故障診斷。
但是它們都有著各自的問題,小波分析以及ICA 都存在自適應能力差的問題,當振動信號十分復雜時,人為設置的參數的誤差很難把握,EMD 有著模態混淆的問題,且需要滿足兩條基本假設,預測精度也十分不穩定。在機器學習預測方面,對于軸承的故障預測多采用支持向量機算法(或其改進算法)、卷積神經網絡等,學習能力有限。
基于此,本文采用粒子群優化以及時域分析提取振動數據特征,將膠囊網絡應用于軸承故障診斷,優化高低層膠囊網絡的路由算法,從而提高膠囊間傳輸性能以及預測精度。
當利用盲源分離技術直接對現已知的許多振動數據信號直接進行分離時,在已知噪聲的方差且方差很小的時候表現出優秀的性能,一旦失去噪聲的先驗信息,其分類效果會急劇變差甚至得出完全相反的結論,在民航軸承故障檢測中,振動信息收到各種噪聲影響,且很難估計噪聲的先驗信息。所以對振動信號的去噪是必要的。

圖1 噪聲信號的自相關波形
基于此,自相關降噪法在軸承振動信號的降噪中并不依靠先驗信息的同時保留有用信息,可以用于觀測信號的降噪。根據自相關函數式(1)的性質,周期性信號的自相關函數與原信號同周期,如圖1 所示,當時延τ 為零時,自相關值最大;隨著τ的增大,R 很快衰減并趨于零[4]。在軸承數據實際觀測信號中,R 并沒有隨著τ 的增大遞減至零。所以可將自相關函數應用于軸承振動信號的降噪中,同時可以最大保留有用信號,有效降低信號中的非周期高斯白噪聲。

其中,T 為周期,τ 為時延。從圖2 可以看出在τ =0附近時,自相關值較大,這可能是受噪聲的影響,因此在實際處理時去掉τ =0 附近的部分自相關數據。當τ 很大時,自相關值也比較大,將這一部分數據也去掉,這樣就實現了數據的二次降噪。

圖2 轉子振動信號自相關波形
2.2.1 稀疏盲源分離
盲源分離是為了從觀測信號中找出源信號,也就是找到分離矩陣W 通過y=Wx 對源信號進行估計。通過經典的矩陣—矢量映射機制,稀疏盲分離也就是指觀測信號數量少于源信號數量[5],本文中只使用兩個加速度計來觀測四個軸承的振動數據。
粒子群優化算法是一種優化工具,它具有基于全局的尋優能力[6]。先設定在一個含有N 個粒子的多維空間中,Yi(i=1,2,…,N)是一個候選解,表示第i個粒子的位置矢量。根據適應值的大小來衡量粒子Yi的優劣。D 維矢量vi(i=1,2,…,N)表示第i 個粒子的“飛行”速度。記第i 個粒子的最優位置為Pi(i=1,2,…,N);整個粒子群搜索到的最優位置為P。則粒子群優化算法采用式(2),(3)對粒子進行操作,其中w 為權因子;c1和c2為值大于0 的學習因子;r1和r2為隨機數,取值大于0小于1。

基于PSO算法的稀疏盲信號分離步驟如下:
1)記由加速度計得到的軸承振動信號平x(t)(t=1,2,…,T)作稀疏變換P 轉化為稀疏信號P(x(t)),t=1,2,…T;
2)采用2.2.2中描述的聚類方法,對稀疏信號P(X(t)),t=1,2,…T,進行聚類;
3)對聚類后的每一類確定方向矢量a1,a2,…,an,從而確定混合矩陣A=(a1,a2,…,an);
4)使用PSO算法求解式(4)的優化問題[6]:

5)對P(x(t)),t=1,2,…,T 進行逆變換得到P-1,從而分離出源信號。
2.2.2 數據聚類的粒子群優化算法
G={z1,z2,…,zn}為數據空間,聚類的目標是將所處的空間分為K 個聚類區Ci(i=1,2,…,K),即使下式成立:

mi(i=1,2,…,K)為聚類中心,設Y=(m1,m2,…,mk)表示粒子,則將PSO 應用于進行聚類和mi的步驟如下:
1)初始化Y=(m1,m2,…,mk)及其速度矢量v;
2)若對Y=(m1,m2,…,mk),下式成立:

則把zp歸到Cj類,用式(8)作為適應度函數對“粒子”進行評價。

3)求出第i個粒子迄今為止搜索到的最優位置為pi(i=1,2,…,M)和整個粒子群迄今為止搜索到的最優位置為pg;
4)用固定點算法對粒子進行迭代;
5)重復第二到第四步,直到滿足條件為止。
為了評價算法對振動信號分離情況的優劣,需要統一的指標來進行判別。
2.3.1 PI評價
PI(Performance Index)指標是性能指數,利用全局矩陣和廣義排列矩陣的差別來評價分離性能[7],定義如下,

其中gji為G 的第(i,j)個元素,G 為全局矩陣,也就是分離矩陣與混合矩陣乘積。PI 值越小表示分離效果越好。
2.3.2 相似系數
定義ρij為相似系數,最小為0,表示sj和si相互統計獨立,最大為1,表示sj和si完全相似[7]。
其中si為源信號的第i 個矢量的,sj為經過盲源分離后與si相對應的分離信號。cov表示方差。

2.3.3 二次殘差
該指標計算信號與源信號的二次殘差(VQM),其值越小表示分離效果越好[2],計算如下:

膠囊網絡由膠囊組成,所謂的膠囊由一組神經元組成,神經元由激活向量反映了某種特定實體的特征,輸出是一個向量[7]。其中,膠囊內的神經元活動表示軸承某種故障的的各種屬性,包括各種參數如:故障類型、位置等。神經元的向量模長表示故障存在的概率,向量方向代表故障參數。膠囊網絡采用Squashing 的非線性函數(式(12))[8]作為激活函數。低層的膠囊通過變換矩陣做出預測,預測結果向更高級的膠囊提供故障的參數信息,當多個預測一致時,激活更高級的膠囊;當低層膠囊的預測向量和高層膠囊的激活向量有較大的標量積時,低層級膠囊就傾向于向高層膠囊輸出。


圖3 神經元示意圖
構建基于膠囊網絡的故障分類模塊,包括:輸入層;卷積層;L 組膠囊層[9]。其中,輸入層獲得振動信號分離過后的特征。卷積層采用512 個步幅為1的7*7卷積核,對輸入的數據進行卷積,第三層是膠囊層并包含卷積運算,開始構建相應的的張量結構作為后續膠囊層的輸入,經過多層膠囊預測得到L 層膠囊的的預測向量,此向量在每個方向上的長度表示在十種故障類型上分別的概率,長度最長也就是概率最大的方向上代表的故障便是診斷結果,同時也可由概率大小得到網絡對此結果的信任程度。

圖4 故障診斷模塊
在膠囊網絡的學習以及預測中,高低層之間的路由算法決定著高低層間傳輸的效率的以及整個網絡的學習能力,過于復雜的計算方式會導致計算時間過長且難以訓練,而對于具體的軸承故障預測,膠囊網絡的具體參數以及高低層傳輸方式都需要結合軸承數據來優化[10]。為進一步闡明具體的診斷方式,接下來結合軸承實際檢測數據進行闡述,得到的研究方法也將具有可移植性。
故障分類模塊中,輸入層取盲分離后軸承的576 個時刻的數據,組成24*24 的矩陣作為膠囊網絡的輸入數據;卷積層采用512 個步幅為1 的7*7卷積核,對輸入的數據進行卷積,該層得到數據矩陣為18*18,輸出神經元向量為18*18*512=165888。
在L層膠囊層中,初始膠囊層1包含卷積運算,有64個通道,每個通道包含12維的卷積膠囊(卷積核為7*7),根據卷積定義,通道內每個卷積單元對第二層18*18 的數據進行卷積得到6*6 的數據矩陣,膠囊數量為6*6*64=2304。
如圖5 所示,膠囊層2 在膠囊層1 的輸出12 維向量的基礎上進行傳播,假設膠囊層2 工業800 膠囊,每個包含28 個神經元向量。其輸出向量模長表示故障存在的概率,方向表示故障參數[11]。
高低層的膠囊連接方式便是由低層的輸出向量通過動態路由機制發送到某個合適的高層膠囊,使得最大概率表征故障的存在性,即輸出向量被路由到某個高層膠囊使其輸出向量的模長最大化,同時保持方向不變,也就是輸出向量的參數信息保留到高層膠囊。

圖5 膠囊層傳播方式
在高低層的連接中,ui∈R12*1(i=1,2,…,2304) 為2304 個低層膠囊輸出向量,vj∈R28*1(j=1,2,…,800)表示800 個高層膠囊輸出向量,sj∈R28*1(j=1,2,…,800) 表示800 個高層膠囊的輸入向量,變換矩陣Wij與ui相乘得到預測向量乘以耦合系數cij作為sj的輸入向量。變換矩陣Wij的參數總量為28*12*2304*800=619315200,耦合系數的參數量為2304*800=1843200,決定高低層膠囊間參數量的因素為高低層膠囊的數量以及膠囊輸出向量的長度。
1)構造高層膠囊輸出向量。由于采用輸出向量vj的模長‖ vj‖來表示故障存在的概率,需要其滿足大于0 且小于1,因此采用下式的非線性函數來構造vj。其中Tj為縮放因子。這樣可以使輸入向量都壓縮到1以下。

2)高層輸出向量的計算。sj是分配給第j個的高層膠囊的預測向量和耦合系數的加權和,其中計算如下。

變換矩陣Wij編碼了低層膠囊特征和高層特征的關系[12],包括將12 維低層向量ui進行線性變換到28 維的向量,而變換矩陣的求解通過BP 算法、隨機梯度法等都可以輕松得到,這里不再贅述。把分配給第j 個高層膠囊的所有2304 個預測向量通過耦合系數進行加權求和,得到第j 個高層膠囊的輸出向量為

3)耦合系數的計算。耦合函數代表著第i個低層膠囊輸出向量被分配給第j個高層網絡的概率分布,計算方式如下,其中,bij表示低層膠囊i被耦合到高層膠囊j 的對數先驗概率,由高低層網絡的類型和位置決定。

我們通過測量高層膠囊的輸出向量與低層膠囊的預測向量之間的一致性來迭代改進初始耦合系數。一致性對應于輸出向量和預測向量的內積運算的結果,根據矩陣理論,兩者方向相同時內積最大,改進耦合系數之前由內積來更新bij[13]。經多次迭代,預測向量被較大概率的分配到與輸出向量一致性大的高層網絡。
從數學優化的角度給出改進的路由算法,將其簡化為求解一下數學優化問題:

約束為

其中,S={ sj},(j=1,2,…,800),表示高層膠囊輸出向量組成的參數空間,C={cij},(i=1,2,…,2304,j=1,2,…,800)表示耦合系數組成的參數空間,‖ Wij‖F表示變換矩陣的Frobenius 函數。目標函數中第一項與向量oj|i,sj的一致性相關,第二項包含了耦合系數的先驗概率信息,熵正則化因子α 用于調整第二項的權重,達到與第一項合理的折中[14]。
基于以上分析,得出全部膠囊層之間的動態路由算法步驟:
1)用f 表示膠囊層數,初始化層數為1,即第一層為低層膠囊。
2)輸入總層數L、每層膠囊的數理、路由算法迭代步數R以及輸出向量維數。
3)判斷f<L,若是,接第四步。若不是,算法結束,得到L層輸出向量。
4)選取第f 層為低層膠囊,讀取低層膠囊總數I,用i 表示單個膠囊;選取第f+1 層為高層膠囊,讀取高層膠囊總數J,用j表示單個膠囊并構建優化問題,設置初始迭代步數r=0;初始化bij=0。
5)判斷r<R,若不是,輸出,令f=f+1,轉到第三步。若是,接第六步。
6)計算耦合系數、高層膠囊輸出向量、更新縮放因子,令r=r+1,接第五步。
采用類似的分析方法,得到其余膠囊層的動態路由算法,從而將低層膠囊所包含的民航軸承振動信息傳遞給高層膠囊,在最高階層的L 膠囊層得到預測向量,從而對故障進行預測。
在軸承故障診斷中,故障大致分為三類,內圈、外圈以及滾珠故障,但在民航中,軸承混合故障以及故障的嚴重程度也應該是制定維修方案的依據,其中將內(外)圈損壞或裂紋部分占比整個內(外)圈的5%以下的表示為輕度內(外)圈損壞,滾珠損壞數量為一個的表示為輕度滾珠故障。當有兩種以上故障同時存在時,表示為混合故障,混合故障都有著嚴重的安全威脅,所以不再具體細分輕重[14]。具體見表1。

表1 故障類別
實驗數據采集自美國凱斯西儲大學軸承數據庫[15]。數據采集設備在一個軸上具有四個軸承位置。交流電機通過摩擦帶連接到軸上,使轉速保持在2000r/min。軸上施加6000 磅的徑向載荷,彈簧機構對軸承施加徑向載荷。所有軸承都有力潤滑。如圖6所示,在軸上安裝了Rexnord za-2115雙列軸承,在軸承外殼上安裝了高靈敏度石英ICP 加速度計。傳感器位置也如圖6 所示。所有故障都發生在軸承超過設計壽命之后,超過1億轉。
我們將十種故障形態的軸承各二十組分別放入實驗設備中,由加速度計收集振動數據。其中圖7(a)滾珠外圈同時故障軸承的振動信號,圖7(b)為選取輕度內圈損壞軸承的振動信號,分別將振動信號經過自相關降噪后如圖8。將圖7(a)經粒子群優化算法分離出兩個源振動數據,如圖9所示。
膠囊網絡難以讀懂振動信號,所以我們將處理后的振動信號進行時域分析變成時域圖像,再進行卷積來獲得其特征輸入到網絡中訓練。將圖7(a)稀疏盲分離后的振動信號圖9(a)以及圖9(b)進行S變換進行時域分析,得到時域圖(圖10),選取576個特征組成24*24 的矩陣輸入到第一層進行卷積,卷積過程如圖11,將時域圖特征經過五層卷積層后經由全連接層傳輸到膠囊網絡。

圖6 實驗設備示意圖

圖7 振動觀測數據

圖8 振動數據自相關降噪

圖9 稀疏盲分離

圖10 軸承振動時域分析

圖11 時域圖卷積過程
經由上述步驟,收集所有故障軸承的振動信號并輸入到膠囊網絡中訓練,得到成熟的膠囊網絡用以預測軸承故障。
在訓練過程中,選擇部分軸承的振動數據作為測試樣本,去噪卷積之后輸入到網絡中進行預測,并計算預測正確率的變化情況,與卷積神經網絡作比較,具體如圖12,可見膠囊網絡在具有少量訓練數據時具有巨大優勢。

圖12 預測精度變化
經粒子群優化算法分離后的數據與源數據進行對比,計算分離效果評價體系的指標。結果如表2,與ICA 等算法相比,PSO 在盲分離時更精確地還原了源振動信號,為接下來的時域分析以及膠囊網絡學習提供了可靠的數據。

表2 信號分解指標
需要進行識別的軸承類型共有10 類,樣本來源于S 變換后的時頻圖像樣本,輸入圖像尺寸為32×32。每一類樣本共有1000 個,隨機選擇其中的50%用作訓練樣本集,余下的作為測試樣本集。隨機選擇樣本20 次,
將測試軸承放入實驗設備并收集振動信號,如4.1 節以及4.2 節所示,將振動信號去噪、盲分離、S變換、卷積后的特征輸入到訓練后的膠囊網絡中,得到高維向量也就是預測結果,并計算預測正確率。按照同樣的方法提取特征使用EMD 以及卷積神經網絡進行預測[16],并計算預測正確率如圖13所示。

圖13 預測精度比較
從圖13 可以看出,三類故障檢測方法中,Cap?sNet 的結果是最好的,20 次隨機選擇樣本的過程中,只有一次的預測正確率稍低,為99.14%,其他的均是在99.9%以上。EMD的識別結果最差,雖然每次的預測正確率均維持在94%以上,但是結果不穩定,而且總體的識別率也低于另外兩種方法下的識別率。
本文研究了膠囊網絡以及PSO 算法在軸承的診斷中的性能,并通過試驗證明,此方法可以保障預測的穩定性和精確性。可以得出結論:粒子群優化算法可以通過搜索算子在稀疏盲分離時保留更多有效信息,通過時域分析進行卷積可以有效提取振動特征,膠囊間動態路由算法闡明了高低層膠囊的信息交互,將信息傳遞轉化為數學優化問題,極大地減輕了計算量。
目前該算法仍存在不成熟的地方,如耗時長,膠囊間路由算法仍可繼續優化。但相信膠囊網絡能夠為故障診斷提供新的思路。