陳世鵬,楊奕飛,張林,張洪武
(1.江蘇科技大學 電子信息學院,江蘇 鎮江 212003;2.陸軍裝備部駐沈陽軍代局駐哈爾濱地區軍代室,哈爾濱 150000;3.鎮江船舶電器有限責任公司,江蘇 鎮江 212002)
滾動軸承是船舶推進系統、甲板機械設備中廣泛應用的基礎部件,其作用是將運轉的軸與軸座之間的滑動摩擦變為滾動摩擦,從而減少摩擦損失。滾動軸承運行狀態的穩定性對機械設備有重要影響,對其故障進行準確診斷能保障機械系統平穩高效運行。
振動檢測法是滾動軸承最常用的診斷方法,軸承的振動信號具有非線性、非平穩的特點,傳統的時域、頻域分析方法不能有效提取故障特征;短時傅里葉只適用于緩慢變化的信號[1];小波變換對信號的處理缺乏自適應性[2]。經驗模態分解(EMD)[3]采用自適應基的時頻局部化分析,克服了基函數無自適應性的問題,但存在端點效應和模態混疊的問題。自適應噪聲完備集合經驗模態分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise, CEEMDAN)能有效解決EMD的模態混疊問題,減小重構誤差并提高分解效率,在軸承特征提取方面有良好表現[4-5]。
在工程實際中,監測所得通常是大量正常數據和樣本量較小的故障數據,支持向量機(SVM)適合處理小樣本問題,但存在核函數必須滿足Mercer條件、模型稀疏性不強等不足[6-7]。相關向量機(Relevance Vector Machine,RVM)[8]具有核函數無需滿足Mercer條件,稀疏性更強,所需參數少,輸出概率式分布結果等優點,在小樣本、非線性回歸和分類問題上也有很好的應用[9-10]。RVM中核函數和核參數對預測結果影響很大,多核學習通過組合基礎核函數獲得多種核函數的優點[11-12],可用于構建多核相關向量機(Multi-kernel Relevance Vector Machine,MRVM),從而獲得學習能力和泛化能力。滾動軸承的故障診斷為多分類問題,應用最廣泛的一對一算法會產生無效投票和分類不確定性問題[13],可通過智能優化算法進行模型參數的優選,常見算法如粒子群優化(PSO)算法易陷入局部最優,后期迭代收斂慢,尋優精度較低[14];遺傳算法(GA)的編碼解碼過程復雜,算子選擇依賴經驗,收斂速度慢[15];正余弦算法(Sine Cosine Algorithm,SCA)[16]參數少,結構簡單,收斂速度快,全局尋優能力強。
鑒于上述算法的特點,提出了一種基于CEEMDAN和SCA-MRVM的滾動軸承故障診斷方法,以實現滾動軸承運行狀態識別并提高分類精度。
自適應噪聲完備集合經驗模態分解在經驗模態分解的每個階段加入有限次的自適應白噪聲,從而抑制模態混疊問題,其重構誤差幾乎為零,同時解決了集合經驗模態分解的不完備性和計算效率低的問題,該算法的主要步驟為:
1)對給定信號X(t),在分解中采用Volterra模型進行端點數據預測延拓,從而抑制包絡線在端點處的發散,分解得到本征模態分量(Intrinsic Mode Functions,IMF)。對加入高斯分布白噪聲Di(i=1,2,…,I)的信號Xi進行分解獲得第1個模態分量c1,即
(1)
2)計算第1個余量
r1(t)=X(t)-c1。
(2)
3)對信號r1(t)+εE1(Di(t))進行分解,得到第2個模態分量c2,即
(3)
式中:ε為自適應系數。
4)對于j=2,3,…,n,先求出第j個余量rj(t),再計算第j+1個模態分量,即
rj(t)=rj-1(t)-cj,
(4)
(5)
式中:Ej為經驗模態分解得到的第j個分量。
5)重復執行以上步驟,直到余量不能被分解時結束,最終余量為rn(t),原信號可以表示為
(6)
振動信號經過CEEMDAN處理后,被分解為一系列瞬時頻率由高到低的IMF分量,能量主要集中在前幾個分量,具體特征提取步驟如下:
1)計算各IMF分量的能量ej
(7)
式中:cjk為第j個IMF分量離散點的幅值;n為分量個數;N為采樣點數。

(8)
(9)
式中:ai為瞬時振幅。
3)計算能量熵H
(10)
4)構造特征向量X
(11)
(12)
式中:wi為模型權重;K(x,xi)為核函數。
將logistic sigmoid連接函數σ(y)=1/(1+e-y)應用于y(x),則p(t|x)服從伯努利分布。假設樣本集獨立同分布,則整個樣本集的似然函數為
(13)
t=(t1,t2,…,tN)T,
w=(w0,w1,…,wN)T。
在貝葉斯框架下,通過最大化似然函數估計參數w,為避免過學習,相關向量機為每個權重定義了高斯先驗概率分布來約束參數,即
(14)
式中:αi為N+1維超參數。為每個權重引入超參數是相關向量機的重要特征,這最終導致了算法求解的稀疏性。
由貝葉斯定理可得
(15)
因為p(w|t,α)∞p(t|w)p(w|α),所以將w的最大后驗估計等價為最大化,即
logp(w|t,α)=log{p(t|w)p(w|α)}=
(16)
A=diag(α0,α1,…,αN),yn=σ{y(xn;w)}。
由于p(α|t)∞p(t|α)p(α),對p(α|t) 的求解可轉化為p(t|α)關于α最大化的問題,只需對p(t|α)最大化,即

(17)
通過拉普拉斯方法求解(16)式和(17)式,不斷迭代以優化參數w和超參數α,最終只有少量的wi趨于穩定的有限值,其他大部分wi將趨于0,非零的wi對應的xi即為相關向量。相關向量機的分類策略為:當σ(yi)=1/(1+e-yi)<0.5 時,標簽值ti=0;反之,ti=1。這樣相關向量機的二分類模型就獲得了樣本的類別信息和后驗概率,此概率表示分類結果的不確定性。
滾動軸承故障診斷屬于多分類問題,需要采用合適的方法將基礎的二分類器擴展為多分類器。在一個二分類器中,如果輸入樣本的類別不屬于這2類,就會產生無效投票,基礎一對一算法便會產生大量無效投票;一對一多分類模型中若不止一類獲得最多票,就會產生分類的不確定性。為有效提高相關向量機多分類模型的分類精度和可信度,本文使用一種改進的一對一多分類算法:
1)在訓練階段,按基礎一對一分類方法,假設樣本共有k類,則任意i,j(i=1,2,…,k;j=1,2,…,k;i≠j)2類可以建立一個RVM二分類器Ri,j,此時共k(k-1)/2個二分類器;再建立i類與除去i,j類的其他類rest構成的二分類器Ri,rest,j類與除去i,j類的其他類rest構成的二分類器Rj,rest;則對所有樣本共建立了3k(k-1)/2個二分類器。
2)在測試階段,測試樣本通過改進的相關向量機多分類模型,若Ri,j,Ri,rest,Rj,rest這3個分類器中i類或j類獲得2票,則i類或j類加1票;若其他類rest獲得2票,則不計入票數;若i,j,rest類各1票,則計算各自的分類決策函數值,概率值最大者為樣本對應類別,類別若屬于i或j類,則計入對應類別票數,若為rest類則不計入。這樣可有效減少無效投票。針對分類的不確定性問題,即最高票數類不止1個時,通過累加對應分類器的決策函數值,概率之和最大者對應的標簽即為樣本所屬類別。
核函數在相關向量機分類模型中起著關鍵作用,是決定模型診斷準確率的重要因素。核函數分為全局核函數和局部核函數,全局核函數有較強的泛化能力,局部核函數有較強的非線性逼近能力。單核相關向量機簡單易實現,但在模型訓練中不能完全挖掘數據的有用信息,模型泛化能力不強。
為使相關向量機具有更好的學習能力和泛化能力,引入權重參數將全局核函數和局部核函數結合起來構造多核相關向量機,其中全局核選擇多項式核函數Kpoly(x,xi),局部核選擇高斯核函數KRBF(x,xi),其表達式分別為
Kpoly(x,xi)=(xxi+1)d,
(18)
(19)
則構造的混合核函數為
K=αKpoly(x,xi)+(1-α)KRBF(x,xi),
(20)
式中:d為多項式核函數的階數;σ為高斯核函數的寬度;α為權重參數,0≤α≤1。
正余弦算法是基于種群的隨機優化算法,其利用正余弦函數的性質使解向量振蕩性地趨于全局最優,算法中自適應參數和隨機性參數較好地平衡了算法的探索和開發能力。
在正余弦算法中,先進行個體位置初始化,再采用正余弦函數在后續迭代中更新個體位置,具體更新公式為
(21)
(22)

組合(21)和(22)式后的位置更新公式為
(23)
式中:r4為[0,1]內的隨機數。
在上述3個公式中,r1,r2,r3,r4是正余弦算法的主要參數:最關鍵的是自適應參數r1,其決定了下一次迭代的位置,該位置是候選解與目標解之間的任一空間或之外的空間,r1值較大時算法偏向于全局搜索,r1值較小時算法傾向于局部開發;r2為[0,2π]內的隨機數,定義了解的更新在移動方向(朝向或遠離目標解)上的步長;r3為[0,2]內的隨機數,給目標解隨機賦予一個權值,作用是表明當前最優解對候選解的影響程度;r4表示如何在(23)式中的正弦或余弦分量之間切換,當r4<0.5時,按正弦公式迭代,當r4>0.5時,按余弦公式迭代。
為保證正余弦算法最終能收斂到全局最優解,需實現正弦和余弦函數的自適應調節以平衡全局搜索和局部開發,自適應調節公式為
(24)
式中:T為最大迭代次數;t為當前迭代次數;a為常數。
為進一步提高分類精度和可信度,采用正余弦算法對多核相關向量機的權重參數α、多項式核參數d和高斯核參數σ進行尋優,即通過正余弦算法搜尋一組向量[α,d,σ],使多核相關向量機模型的識別率最高。選擇分類準確率作為多核相關向量機的適應度函數。
優化的具體步驟如下:
1)初始化正余弦算法和多核相關向量機的參數,如種群規模N、最大迭代次數T、常數a。設定權重參數α、核參數d與σ的搜索范圍,設置算法終止條件并初始化候選解空間位置X=[X1,X2,…,XN],其中Xi=[α,d,σ]。
2)計算種群候選解的第1次迭代適應度值,并保存當前種群中的最佳候選解。
3)通過(24)式計算參數r1,利用(23)式更新候選解位置。
4)計算新候選解的適應度值并與之前最佳候選解的適應度值對比,若當前候選解優于之前最佳候選解,就保存當前候選解為最佳候選解,反之保留之前最佳候選解。
5)判斷算法是否滿足終止條件,若不滿足,則迭代次數加1,即t=t+1,并返回步驟3,若滿足則轉到下一步。
6)停止迭代,輸出最優候選解適應度值和所處空間位置,即[α,d,σ]值。
基于CEEMDAN和SCA-MRVM的故障診斷流程如圖1所示,主要步驟如下:

圖1 基于SCA-MRVM的故障診斷流程
1)采集滾動軸承振動信號,并劃分為訓練集和測試集。
2)采用自適應噪聲完備集合經驗模態分解處理信號并提取特征。
3)通過訓練集訓練多核相關向量機模型,同時采用正余弦算法進行參數優化。
4)將測試集輸入到優化后的多核相關向量機模型,輸出診斷結果。
4.2.1 試驗數據集
采用Case Western Reserve University滾動軸承振動數據進行試驗分析,驅動端軸承為SKF6205,利用加速度振動傳感器采集數據,電動機轉速為1 750 r/min,采樣頻率為12 kHz,具體故障類型分布和樣本劃分見表1。

表1 試驗軸承故障類型和樣本劃分
4.2.2 模型參數優化
采用正余弦算法對多核相關向量機模型的3個參數進行尋優,并與PSO和GA算法尋優結果進行性能對比。具體仿真參數為:MRVM的權重參數α∈[0,1],多項式核參數d∈[0,100],高斯核參數σ∈[0.01,1 000];SCA,PSO和GA的迭代次數T為300,種群大小N為20;SCA中常數a為2;PSO中學習因子c1和c2分別為1.5和1.7;GA中交叉概率為0.7,變異概率為0.01。通過仿真得到的各算法的適應度曲線如圖2所示。
由圖2可知:SCA在迭代40次左右完成收斂,且達到3種算法中最好的尋優結果;PSO在迭代120次左右收斂到最優結果,收斂速度慢于SCA,尋優結果比SCA和GA都差;GA在迭代150次左右收斂到最優結果,收斂速度慢于SCA與PSO,尋優結果弱于SCA。綜上所述,SCA收斂速度快且能達到更好的尋優結果,更適合MRVM的參數優化。

圖2 SCA,PSO和GA對MRVM參數的尋優過程
4.2.3 診斷結果分析
采用SCA-MRVM模型、PSO-MRVM模型和GA-MRVM模型分別對滾動軸承的故障數據進行分類并計算其診斷準確率。用200個數據作為測試樣本輸入到3種模型中進行識別,測試集分類結果如圖3所示,不同算法模型的診斷準確率見表2。由圖3及表2可知:SCA-MRVM模型能將滾動軸承的10類故障數據完全區分,不會出現混疊現象,診斷準確率達到100%;PSO-MRVM模型和GA-MRVM模型能基本識別出故障,但在外圈重度故障、內圈中度故障和鋼球輕度故障識別中有一定的混疊現象,診斷準確率分別為95%,96%,區分度低于SCA-MRVM模型。

圖3 不同算法模型對測試集的分類結果

表2 不同算法模型的診斷準確率
為進一步驗證SCA-MRVM模型的有效性,應用風機滾動軸承故障試驗數據進行分析。試驗所用加速度傳感器為PCBMA352A60,測點在垂直軸承座方向,轉速分為600,800,1 000 r/min,采樣頻率50 kHz,軸承的各項參數見表3。軸承的故障是人為通過切割技術分別在軸承滾子、內圈和外圈加工出微小線狀傷痕(圖4)。

表3 軸承相關參數

圖4 軸承故障類型
在不同工況下采集了3組數據,每組數據均包含正常、滾子故障、內圈故障和外圈故障4種狀態,每種工作狀態的采樣時間均為55 s。

表4 試驗數據的相關參數
基于上述數據,采用自適應噪聲完備集合經驗模態分解分解信號,并通過(7)—(11)式進行特征提取,然后將訓練集特征向量分別輸入到SCA-MRVM,PSO-MRVM和GA-MRVM模型進行參數優化和模型訓練,最后用訓練好的模型在測試集上進行狀態識別與診斷。各模型對測試集樣本的診斷準確率見表5:SCA-MRVM模型的平均診斷準確率為97.5%,高于PSO-MRVM模型的93.5%和GA-MRVM模型的94.3%;SCA-MRVM模型在不同尺寸故障和不同類型故障中都能做到較高的區分度,混疊現象明顯少于PSO-MRVM模型和GA-MRVM模型,表明SCA-MRVM模型適應性更好,能達到更高的故障診斷精度。

表5 不同算法的診斷準確率
提出了一種基于CEEMDAN和SCA-MRVM模型的軸承故障診斷方法,對樣本少、非線性、非平穩的滾動軸承振動信號進行故障模式識別研究。試驗結果表明SCA-MRVM模型的參數設置簡單,在小樣本訓練下具有很高的診斷精度,全局尋優能力和分類準確率均優于PSO和GA優化的模型,具有較好的實用性。
但本研究尚未考慮樣本數據的不平衡(如類間不平衡),正余弦算法還有改進空間,如改進轉換參數 ,結合使用凹函數和凸函數來平衡算法的全局搜索和局部開發能力等,這些將是下一步的研究方向。