郭代華
(安徽天長市工業學校,安徽 滁州 239300)
滾動軸承故障診斷與其提取的特征信息密切相關[1-2],熵值能夠有效衡量非線性信號的復雜程度,在軸承故障診斷領域得到一些應用,如廣義精細復合多尺度樣本熵[3]、復合多尺度模糊熵[4]及其與改進半監督局部切空間排列相結合[5]等滾動軸承特征提取方法;但上述方法存在樣本熵運算效率較低,模糊熵易受輸入信號長度影響,排列熵忽視信號幅值信息等缺陷;散布熵作為一種新穎的非線性技術被提出并在其基礎上發展出了多尺度散布熵[6](Multiscale Dispersion Entropy,MDE)和精細復合多尺度散布熵[7](Refined Composite Multiscale Dispersion Entropy,RCMDE)等改進方法,雖然能緩解上述方法存在的局限性,但MDE和RCMDE在粗粒化構造中的平均運算方式仍會忽視序列的重要信息,因此,本文提出一種精細時移多尺度散布熵(Refined Time-Shifted Multiscale Dispersion Entropy,RTSMDE),并將其應用于滾動軸承特征信息的提取。
獲取穩定、精確的軸承故障特征信息后,還需采用分類器對所提取特征進行模式識別。支持向量機具有泛化能力強,易處理小樣本問題等優勢[8],但其分類效果受懲罰參數和核參數的影響較大;因此,本文采用哈里斯鷹優化方法[9]對其進行參數優化,建立哈里斯鷹優化支持向量機(Harris Hawk Optimized Support Vector Machine,HHOSVM)實現滾動軸承的智能診斷。
多尺度散布熵結合了散布熵于復雜性度量和多尺度熵于多維尺度分析的優勢,對時間序列{u(i),i=1,2,…,L},定義尺度s下的粗粒化序列x(s)為
(1)
則粗粒化序列散布熵值為
(2)
式中:D(·)為散布熵運算方式;m為嵌入維數;c為類別;t為時延;N為數據長度。
隨著尺度s的增加,粗粒化序列長度會變短,從而導致EMDE在大尺度上出現較大偏差。為克服這一限制,采用精細復合多尺度散布熵進行處理。對時間序列u(i)采用復合粗粒化運算方式可得
(3)
計算s下k個粗粒化序列中每種分散模式π的概率pk并采用精細運算方式,得到精細復合多尺度散布熵,即
(4)
為克服MDE和RCMDE粗粒化平均運算方式會忽視原始信號幅值信息的問題,受時移技術啟發,提出了一種精細時移多尺度散布熵,其流程如圖1所示,具體步驟如下:
1)對時間序列u(i),采用時移粗粒化運算方式,即
(5)

3)采用精細運算方式得到精細時移多尺度散布熵,即
(6)
采用常見的50組白噪聲和50組1/f噪聲進行RTSMDE參數選取試驗和方法優越性驗證。
1.4.1 參數選取試驗
RTSMDE方法中有5個參數需要人為設置,分別是尺度s、數據長度N、嵌入維數m、類別c以及時延t。
1)對于尺度s而言,當s較小時,RTSMDE無法全面獲取滾動軸承的故障特征信息;s較大時,會出現熵值不穩定現象:為較好地挖掘軸承故障特征信息,設定s=25[3]。
2)對于數據長度N,設定s=25,m=2,c=6,t=1,分別對長度為3 000,4 000,5 000,6 000的2種噪聲進行分析,結果如圖2所示:同一數據長度下,白噪聲的熵值均值曲線均高于1/f噪聲,這是由于白噪聲的非線性特征更復雜,因此熵值較大;不同數據長度下,RTSMDE對同一類型噪聲的分析結果較為接近,表明N對試驗結果影響較小。故本文選定N=3 000。
3)對于時延t,設定s=25,N=3 000,m=2,c=6,分別對時延為1,2,3,4的2種噪聲進行分析,結果如圖3所示:t越小,2種噪聲的熵值均值曲線在大尺度上區分越明顯,與文獻[10]結論相符,故本文設定t=1。
4)對于嵌入維數m,設定s=25,N=3 000,c=6,t=1,分別對m為2,3,4的2種噪聲進行分析,結果如圖4和表1所示。

表1 不同m時RTSMDE時間對比
由圖4可知,隨著m的增加,2種噪聲的熵值均值曲線變化趨勢大致相同,熵值均有所提升,這是由于散布模式(即cm)增加所致;由表1可知,m較大時,RTSMDE分析需要更多的運行時間:因此,選取m=2作為最佳解決方案。
5)對于類別c,設定s=25,N=3 000,m=2,t=1,分別對類別為5,6,7的2種噪聲進行分析:2種噪聲的熵值均值曲線隨c的增大而增加,但整體變化趨勢大致相同,同樣是由于RTSMDE的分散模式會隨c增大而增多,從而獲取更大的熵值(圖5);但當c過大時,RTSMDE需要花費更多的運算時間(表2):故綜合考慮設定c=6。

表2 不同c時RTSMDE時間對比
綜上,RTSMDE的參數設置為:s=25,N=3 000,m=2,c= 6,t= 1。
1.4.2 對比分析
在相同的參數設置下,RTSMDE與MDE,RCMDE的對比分析如圖6所示:
1)MDE與RCMDE的熵值均值曲線較為接近,但RCMDE在大尺度上的誤差值較小,且RCMDE的熵值曲線更加光滑、波動較小;這是由于RCMDE考慮同一尺度多個復合粗粒化序列的熵值信息,比僅考慮同一尺度單個粗粒化序列的MDE效果更好。
2)與MDE和RCMDE相比,RTSMDE可以完全將2種噪聲區分開,而且RTSMDE的誤差值更小,與實際更相符,表明RTSMDE能夠保留時間序列更多的幅值信息,從而獲取更穩定的熵值。
上述分析證實了RTSMDE度量非線性信號復雜性的優越性。
支持向量機的性能與關鍵參數(c,g)密切相關,為克服人為參數對分類效果的不利影響,采用哈里斯鷹優化方法進行參數優化,建立HHOSVM分類器,其流程如圖7所示,具體步驟如下:
1)分別將訓練集和測試集進行歸一化。
2)初始化HHO參數,定義種群大小為30,迭代次數為200,個體位置為(c,g),位置上下限分別為0.001和100。
3)將訓練集經交叉驗證法得到的平均誤差定義為適應度值,即尋找全局最小值的過程。
4)將當前迭代下具有最小適應度值的個體定義為食物位置。
5)更新個體位置,對每只哈里斯鷹進行位置更新,若新食物位置的適應度值低于歷史位置,則新位置替換歷史位置,否則保留歷史位置。
6)判斷迭代是否終止,若達到最大迭代次數則停止循環,輸出食物位置,即為最佳結果。
7)根據優化結果,建立SVM預測模型并識別測試集故障類型。
鑒于RTSMDE于故障提取以及HHOSVM于故障識別的優勢,本文建立一種基于RTSMDE和HHOSVM的滾動軸承故障診斷新模型,流程如圖8所示,具體如下:
1)數據采集。利用加速度傳感器采集軸承在不同故障狀態下的振動加速度信號,并隨機劃分為訓練集和測試集樣本。
2)特征提取。采用RTSMDE方法對訓練樣本和測試樣本進行熵值特征提取,全面挖掘軸承信號特征信息。
3)模式識別。將訓練和測試特征集輸入HHOSVM分類器中進行模式識別,輸出故障類型。
通過凱斯西儲大學軸承數據集驗證所提故障診斷模型的有效性和優越性[11],選用1hp工況下的6205軸承數據進行分析,轉速為1 772 r/min,采樣頻率為12 kHz,采集每種運行狀態60組樣本,隨機選取20組作為訓練樣本,剩余40組作為測試樣本。每組樣本包含3 000個采樣點,數據集的具體描述見表3,軸承各運行狀態對應的時域波形如圖9所示。

表3 軸承故障類型和故障程度
分別采用RTSMDE,MDE和RCMDE對每組樣本進行非線性熵值提取,對比結果如圖10所示:與仿真分析結果一致,MDE和RCMDE的熵值均值曲線大致相同,但RCMDE的熵值曲線具有較低的誤差值且在大尺度上表現更為明顯,但故障狀態下的MDE和RCMDE熵值曲線較為接近,區分難度較大;RTSMDE對軸承的10種狀態的區分度較好,可用于滾動軸承故障特征的提取。
將上述方法提取到的特征集分別輸入HHOSVM分類器進行智能診斷,結果如圖11所示:RCMDE和MDE分別有6個和11個樣本出現錯誤分類,RTSMDE則正確識別出全部測試樣本的故障類型,沒有出現錯誤分類現象;RTSMDE的平均分類準確率達到100%,相對RCMDE和MDE分別提升1.50%和2.75%,表明該模型不僅可以識別出軸承故障類型,也可以識別出故障程度,適用于軸承故障監測。
為驗證HHOSVM在軸承故障識別方面的優勢,將其與SVM以及灰狼優化支持向量機(Grey Wolf Optimized Support Vector Machine,GWOSVM)[12]等分類器進行比較,結果見表4。基于參數優化的GWOSVM和HHOSVM對每種特征集的平均識別精度均高于原始SVM,表明利用優化算法對SVM進行參數優化可以避免人為選取不當而導致識別準確率不高現象的發生。此外,與GWOSVM相比,HHOSVM分類器對每種特征集均具有最高的平均識別率。這表明,對于SVM參數優化方法,HHO方法可以有效避免局部尋優情況的發生,獲取較好的參數優化結果,證實了HHOSVM分類器在滾動軸承故障診斷方面的優越性。

表4 不同分類器對3種特征集的平均分類準確率
提出一種基于精細時移多尺度散布熵和哈里斯鷹優化支持向量機的滾動軸承故障診斷模型,通過仿真試驗和CWRU軸承故障診斷試驗進行方法有效性驗證,得到如下結論:
1)采用精細運算方式和時移粗粒化構造方式的RTSMDE方法能夠有效衡量時間序列復雜特性,在軸承故障特征提取效果方面優于MDE和RCMDE方法。
2)與SVM和GWOSVM相比,HHOSVM分類器對軸承故障狀態診斷的分類準確率更高。
本文所提故障診斷模型可以有效、精準地診斷出滾動軸承不同故障類型和故障損傷程度;但RTSMDE方法中有個別參數仍需人為設置,后續將對其進行完善。