辜文娟,張 揚
(1.江西省商務學校,江西 南昌 330038;2.湖北工業大學 機械工程學院,湖北 武漢 430068)
離心泵是一種廣泛應用于化工、電力等行業的流體機械設備。由于工作環境惡劣和運行時間較長,離心泵工作過程中易發生各類故障。又由于行業的特殊性,離心泵的損傷容易引發嚴重的生產事故。因此,研究離心泵的故障診斷方法對于確保安全穩定生產具有實際工程意義[1-5]。
離心泵的結構復雜,且因為受摩擦、湍流、阻尼等多種因素的影響,所以離心泵的振動信號或聲信號表現為非線性,這增加了離心泵故障信號分析的難度[6,7]。目前,針對非線性信號的分析方法通常以樣本熵、排列熵、模糊熵和散布熵為代表。其中,由于具備穩定且優異的特征提取性能,目前排列熵已被廣泛應用于各種故障診斷領域。
高素杰等人[8]將排列熵用于齒輪箱的故障診斷,實現了齒輪箱故障準確識別的目的;然而排列熵忽略了時間序列的幅值信息。隨后,吳新忠等人[9]利用加權排列熵代替排列熵,進行了滾動軸承的故障特征提取,結果證明,加權排列熵要優于排列熵;然而該方法只是進行了單一尺度的分析,特征描述不夠完整[10]。
針對排列熵以及加權排列熵的多尺度化,學者們進行了大量的工作。
AZIZ W等人[11]提出了多尺度排列熵(multiscale permutation entropy,MPE),用于生理時間序列的分析;然而MPE仍然忽略了信號中的幅值信息[12]。為此,YUAN Xu-yi等人[13]提出了多尺度加權排列熵(multi scale weighted permutation entropy,MWPE)算法,用于泵的故障檢測,結果證明了該算法是一種有效的復雜性測量指標;但是MWPE算法所采用的加權排列熵在分析某些幅值相同的時間序列的復雜性時,仍然無法實現準確的測量。針對MWPE仍然存在的信息丟失缺陷,LIU Xiao-feng等人[14]4-7提出了增長熵(increment entropy,IE)的概念,并將其用于生理時間序列的分析,結果證明其優于排列熵和樣本熵;但是IE未進行多尺度分析。WANG Xue等人[15]進一步地提出了多尺度增長熵(multiscale increment entropy,MIE),用于處理醫學時間序列,其證明了MIE的優越性;然而MIE的粗粒化處理存在較大的缺陷,使得熵值誤差隨著尺度的增加而增大,這降低了算法的有效性[16]。
在故障的分類識別方面,由于具有效率高、數據處理能力強等優點,極限學習機(ELM)被廣泛應用于故障識別領域[17]。
姚峰林等人[18]使用ELM進行了滾動軸承的故障識別;然而其未對ELM的參數進行優化,使該模型不夠穩定。隨后,張玉學等人[19]采用粒子群算法(particle swarm optimization,PSO),對ELM進行了優化,準確地識別了齒輪箱的故障;然而PSO算法的優化性能較差。秦波等人[20]利用具有更好優化性能的蝙蝠算法,對ELM進行了優化,結果驗證了該方法的優越性;然而蝙蝠算法的局部尋優能力仍然較差,因此需要采用具有更強尋優性能的算法對ELM進行優化。劉曉悅等人[21]129-130采用麻雀搜索算法(SSA),對ELM的權重和隱含層閾值進行了尋優,建立了SSA-ELM多故障分類器,實現了對齒輪箱的準確分類。
鑒于SSA-ELM的優異性能,筆者將使用SSA-ELM進行離心泵的故障識別。
針對上述研究提到的缺陷,筆者利用改進的粗粒化對時間序列進行處理,提出改進多尺度增長熵(IMIE),其既能改善MPE忽略信號幅值信息的缺陷,也能緩解MIE算法的粗粒化問題;在此基礎上,提出一種基于IMIE、多聚類特征選擇(MCFS)和麻雀搜索算法優化極限學習機(SSA-ELM)的離心泵故障診斷方法。
首先,基于IMIE提取離心泵振動信號的故障特征,表征離心泵的故障狀態;隨后,利用MCFS對原始特征進行優化,生成低維敏感的故障特征;最后,將故障特征輸入至基于麻雀搜索算法優化的極限學習機中,進行離心泵故障的識別。
增長熵只進行了信號單一尺度的評估,忽略了其他尺度上有用的信息,因此其分析不夠完整。為此,學者們提出了多尺度增長熵(其中,增長熵的理論可參考LIU Xiao-feng等人[14]3的研究)。
多尺度增長熵(MIE)的詳細計算過程如下:
1)對于時間序列{x(k),k=1,…,N},進行粗粒化處理,得到粗粒化序列如下:
(1)

2)對粗粒化后的時間序列進行增長熵計算,得到多尺度增長熵MIE:
(2)
式中:m為嵌入維數;R為量化分辨率。
雖然MIE實現了信號的多尺度分析目的,但其依然存在缺陷[22]:
1)在進行粗粒化處理時,對每個數據點的處理存在不一致的情況,即MIE是不對稱的,這會造成IE值突變。
例如,當尺度因子為3時,對應的粗粒化過程如圖1所示。

圖1 尺度因子為3時的MIE粗粒化處理
理想情況下,x3、x4與x2、x3處的計算應保持一致,但是根據圖1的處理過程可知:x1,x2,x3與x4,x5,x6在x3處斷開,導致x3和x4存在斷點,這造成了IE值不夠穩定;
2)計算IE值時,信號的數據長度越大則結果越穩定,然而MIE的粗粒化處理會顯著減少數據的長度,導致熵值偏差不斷增加,使得IE對系統復雜性的反映精度變低。
為改善MIE的性能,筆者對粗粒化處理進行了改進,構造了改進多尺度增長熵(IMIE)。
此處仍然以尺度因子3為例,對應的改進粗粒化處理如圖2所示。

圖2 尺度因子為3時的IMIE改進粗粒化處理
與MIE不同,在同一尺度τ下,IMIE經過粗粒化處理后,能夠生成τ組粗粒序列,有效避免了斷點處的突變問題,而傳統粗粒化處理只生成一組粗粒序列。
IMIE的計算過程如下:
1)對給定時間序列進行改進的粗粒化處理,其生成τ組粗粒序列:
(3)
(4)
根據IMIE的定義可以知道,核心參數為時間序列的長度N,嵌入維數m,量化分辨率R和尺度因子τ。
通常而言,嵌入維數m的取值為[2,5],過小會造成信號重構時重構向量包含的元素太少,無法表征系統的動態特性;反之,過大會忽視系統的細節特征。筆者設置m=2。
量化分辨率R的取值會影響算法的抗噪性,R過大會對噪聲過于敏感,筆者設置R=4。
時間序列的長度會影響增長熵的精度,數據越長則熵值的精度也就越高;但是太長的數據會極大地增加計算量,若數據過短則無法準確地反映系統的動態特征。筆者設置N=2 048。
尺度因子的設置一般不會影響算法的精度,但是尺度過小會造成特征數量較少,難以全面地反映系統的固有特性;反之,尺度過大會造成特征的冗余且降低計算效率。筆者設置τ=20。
為了驗證IMIE方法的優點,筆者利用30組高斯白噪聲和1/f噪聲進行分析。
筆者采用IMIE和MIE方法分別計算兩種噪聲信號的增長熵值和標準差,如圖3所示。

圖3 高斯白噪聲和1/f噪聲的增長熵
由圖3可以發現:隨著尺度的增加,IMIE熵值的變化較MIE更加平滑,沒有出現較大的突變,而且IMIE在各個尺度上的標準差也小于MIE,即對應的誤差較小。因此,可以證明IMIE方法具有良好的穩定性,優于MIE。
根據ZHANG Wei-bo等人[23]的研究,原始故障特征通常包含部分的冗余信息,沒有必要將全部特征進行分類,有必要對其進行降維處理,以提高分類的效率和精度。
筆者引入基于MCFS的特征降維算法,依照各尺度特征的貢獻度來對特性向量進行賦分,保留分數較高的特征,并剔除分數較低的特征,實現特征的降維目的(MCFS的理論可參照候曉麗等人[24]的研究)。
極限學習機模型(ELM)具有優異的分類性能,并且兼顧效率,但是其需要對參數進行優化設置,否則容易影響泛化性。劉曉悅等人[21]128-129采用麻雀搜索算法(SSA)對ELM的參數進行了優化,并將其與基于粒子群算法、灰狼算法優化的ELM模型進行了對比,結果驗證了SSA-ELM的有效性。
為此,筆者引入了SSA-ELM分類器,用于離心泵的故障識別。
針對離心泵的故障特征提取和分類識別,筆者引入了增長熵這一具有優異性能的非線性動力學指標,并對其進行了改進,提出了改進多尺度增長熵;并結合多聚類特征選擇和麻雀搜索算法優化極限學習機,提出了一種新的離心泵故障診斷方法。
該方法的具體流程如下:
1)采集離心泵在多種工況下的振動信號,以長度為2 048的窗口進行樣本的截取,每個工況得到100組樣本;
2)利用IMIE提取振動信號的熵值信息,構造故障特征樣本;
3)利用MCFS對故障特征進行賦分,依據對分類的貢獻度選擇前15個特征,構造新的低維特征;
4)在新的特征向量中,隨機抽取30個樣本用于訓練SSA-ELM分類器,剩余70個樣本進行測試識別;
5)將測試樣本輸入到訓練好的分類器中[25,26],進行分類,完成離心泵的故障檢測任務。
該離心泵實驗數據由KUMAR A等人[27]提供。
筆者利用振動傳感器和麥克風設備采集了離心泵不同工況下的振動信號和聲信號,并對振動信號進行了分析。
離心泵的實驗平臺如圖4所示。

圖4 離心泵實驗平臺
在該離心泵平臺中,包含兩個滾動軸承,靠近葉輪端的軸承標記為實驗軸承,遠離葉輪端的軸承標記為非實驗軸承。
軸承的參數如表1所示。

表1 滾動軸承的指標參數
離心泵以一定的角速度運轉,筆者針對葉輪損傷(S1)、葉輪堵塞(S2)、正常(S3)、軸承內圈故障(S4)和軸承外圈故障(S5)這5種工況進行了研究,并采用型號為PCB353 B34的單軸加速度計,以70 kHz的頻率采集了振動信號。
筆者利用寬度2 048的窗口截取每種工況的樣本共100組,其中,隨機抽取30組樣本作為訓練樣本,剩余70組樣本作為測試樣本。
樣本的相關信息如表2所示。

表2 離心泵的樣本信息
在5種工況下離心泵的振動信號如圖5所示。

圖5 離心泵振動信號波形
由圖5可以發現:直接分析振動信號的波形難以判斷未知樣本的故障類型,這證明了對信號進行分析的必要性。
筆者對5種狀態的振動信號進行了IMIE分析。同時,為了驗證IMIE的優越性,采用MIE、MPE和改進多尺度排列熵(improved multiscale permutation entropy,IMPE)進行了對比分析,其中,MPE和IMPE的參數設置為:嵌入維數m=5,時間延遲d=1。
每種類型的樣本不同處理方法的熵均值標準差如圖6所示。

圖6 4種方法的熵均值標準差曲線
從圖6可以發現:在大多數尺度上,IMIE和IMPE方法的熵值曲線表現為故障振動信號高于正常振動信號的特點,并且不同故障類型樣本的復雜性也呈現出規律性的差異,因此,后續可以考慮將IMIE方法用于區分離心泵是否正常;
此外,IMIE和IMPE都能夠較為有效地區分5種故障樣本,且熵值具有較大的區分度。而MIE和MPE熵值曲線發生了明顯的混疊,難以有效區分不同故障類型;同時IMIE和IMPE曲線的標準差顯著小于MIE和MPE,兩種現象均表明改進的粗粒化處理優于傳統的粗粒化處理。但是仍然無法通過熵值曲線來判斷增長熵優于排列熵,為此,需要進行更深層次的分析。
隨后,為了減小原始特征中的冗余信息,提高特征的質量,筆者利用MCFS對IMIE特征進行了排序,如圖7所示。

圖7 經過MCFS排序后的新特征
從圖7可以發現:原始特征在經過MCFS排序后,所生成的新特征具有更顯著的區分度,這表明利用MCFS進行特征降維是必要的,其有助于提高故障特征的質量。筆者選擇排序得分前15的特征,作為分類器的輸入。
為了進一步對比4種方法的優劣性,同時識別離心泵的故障類型,筆者將IMIE、MIE、IMPE和MPE這4種方法提取的故障特征,采用MCFS降維,把生成的新特征輸入至SSA-ELM分類器中,進行了故障識別,其結果如圖8所示。

圖8 基于不同故障診斷方法的SSA-ELM分類結果
詳細的分類識別結果如表3所示。

表3 基于不同故障診斷方法的詳細分類結果
從表3可以發現:基于IMIE的故障診斷方法取得了100%的識別準確率,完全準確地識別了離心泵的故障,證明了該方法能夠有效地用于離心泵的故障診斷。而IMPE方法的分類準確率僅低于IMIE方法,達到了98.57%,這證明了改進多尺度分析方法能夠從振動信號中提取出質量較高的特征,并實現對故障精準識別的目的。
MIE和MPE方法的分類準確率分別為72.86%和93.71%,這表明在與傳統粗粒化相結合時,排列熵優于增長熵;而在與改進粗粒化相結合時,增長熵優于排列熵。此外,基于增長熵的方法具有非常高的效率,僅需要93.81 s即可完成故障特征提取任務。其特征提取的時間僅多于MIE方法所用時間,這表明改進的粗粒化處理方式增加了滑動的操作,因此,其效率低于傳統的粗粒化處理。
此外,IMIE的效率是IMPE的10倍,這證明IMIE不僅可以提取高質量的故障特征,還具有非常可觀的效率,優于其他3種方法。
為進一步比較IMIE方法和IMPE方法在特征提取中的優劣,筆者在輸入不同數量的故障特征時,將2種方法的準確率進行比較,將經過MCFS排序后的前20個特征依次輸入至SSA-ELM分類器中,進行故障識別。
當輸入不同數量故障特征時,基于IMIE和IMPE的故障診斷方法的識別準確率變化曲線,如圖9所示。

圖9 輸入不同數量特征時2種故障診斷方法的準確率對比
從圖9可以發現:在輸入不同數量的特征時,IMIE的準確率曲線大多數時候在上方,當輸入的特征數量為13個時,IMIE方法的準確率已經達到了99.71%,而此時IMPE方法的準確率低于IMIE,證明輸入13個特征時,基于IMIE的故障診斷方法已經能夠取得非常精確的故障識別結果了。
綜上可和,在大多數情況下,基于IMIE的故障診斷方法要優于IMPE方法,且IMIE方法的效率非常高。
最后,為了驗證SSA-ELM分類模型在故障識別中的優越性,筆者對遺傳算法(genetic algorithm,GA)、粒子群算法(particle swarm optimization,PSO)、灰狼算法(grey wolf optimization,GWO)和鯨魚算法(whale optimization algorithm,WOA)進行對比。
對于每種優化算法,種群規模都設置為30,迭代次數設置為100,并將IMIE故障特征輸入到5種分類器中,進行故障的識別;同時,為了確保性能評估的可靠性,分類重復20次。
20次實驗下,5種分類器的識別結果如圖10所示。

圖10 20次實驗下5種分類器的識別結果
5種分類器的詳細識別結果如表4所示。

表4 5種分類器的詳細識別結果
從表4可以發現:
1)5種分類器的平均識別準確率均達到了98%以上,證明不同優化算法都可以構建分類性能較強的ELM模型;
2)SSA-ELM的平均識別準確率達到了99.73%,高于其他4種分類模型,這驗證了SSA在參數優化中優于另外4種算法;
3)就參數優化的表現而言,GWO算法優于WOA、GA和PSO,證明GWO具有較強的全局優化性能。
采用多尺度排列熵分析離心泵的振動信號,存在粗粒化處理存在不足等問題,導致離心泵的故障識別準確率不高,為此,筆者提出了一種基于IMIE、MCFS和SSA-ELM的離心泵故障診斷方法,利用離心泵振動信號故障數據對該方法進行了實驗,驗證了該方法的有效性,同時將該方法和其他方法進行了對比,驗證了該方法的優越性。
研究結論如下:
1)仿真信號的分析結果表明:和基于傳統粗粒化的MIE方法相比,IMIE方法能夠更加準確和穩定地測量時間序列的復雜度,且偏差更小;
2)IMIE方法能夠有效地提取高質量故障特征,基于IMIE的故障診斷方法取得了100%的識別準確率,且特征提取時間僅需要93.81 s,綜合性能要優于IMPE、MPE和MIE方法;
3)SSA-ELM能夠準確地識別離心泵的故障,平均識別準確率高達99.73%,高于GA-ELM、PSO-ELM、GWO-ELM和WOA-ELM分類器,其具有顯著的優越性。
雖然所提方法取得了不錯的效果,但需要人為設置參數,其是否適用于其他工業場景還有待于今后的檢驗。筆者后續將對該方法中的參數自適應設置進行研究。