何勇,王紅,李晶,齊彥昆
蘭州交通大學 機電工程學院,蘭州 730070
意外失效風險成本較低的生產設備通常采用事后維修方式,但對于軌道車輛、輪船、飛機等大型裝備的機械傳動系統(如齒輪箱、滾動軸承等)來說,其意外失效不僅會造成巨額經濟損失還會釀成重大安全事故。因此,該類設備必須采取預防性維修策略,而傳統預防性維修通常基于設備可靠度或維修周期來驅動維修策略實施。近年來,隨著傳感器技術的快速發展,基于振動信號分析的狀態維修策略正逐漸成為旋轉機械設備預防性維修領域的研究熱點。該策略通過對振動信號的分析來確定設備狀態指標(即退化特征和故障特征),進而驅動維修策略實施。
Zhu等采用隨機系數模型(Random Coefficient Model)和Gamma過程來模擬關鍵部件的退化過程,并對其采取基于退化特征閾值的狀態維修策略,而其他部件采取預防性維修和修復性維修。Poppe等在Zhu等的研究基礎上提出了雙退化特征閾值的狀態維修策略:第1個閾值用來決策多部件間的機會維修,若在運行過程中“機會”沒有出現,則采取第2個閾值對部件進行預防性維修,以避免部件長時間處于較高失效風險階段。Do等提出一種考慮經濟相關和隨機相關的狀態維修策略,并將齒輪箱振動信號的均方根值(Root Mean Square, RMS)作為退化特征。通過對機會維修閾值及監測周期的優化獲得了最低維修成本率。Wang等考慮到系統內部件間的重要性不同,提出了一種基于狀態和役齡的機會維修策略。該策略采用Gamma過程模擬核心部件的退化過程,并對其進行狀態維修,而其他部件則采取基于役齡的預防性維修,最終建立了基于退化特征閾值和役齡閾值的機會維修策略。除上述以退化特征為決策條件的維修模型外,文獻[8-10]分別采用Markov過程、Gamma過程和Wiener過程來模擬部件的退化過程,并建立了基于Weibull分布的比例風險模型。最后,通過協變量閾值和可靠度閾值對狀態維修策略進行優化。
此外,對于不可修復的部件來說,其維修策略通常還需考慮備件的訂購及庫存問題。Wang等在文獻[7]的基礎上構建了狀態維修與備件的聯合決策模型,并根據不同部件的備件消耗量差異,分別對其采取了(0,1)庫存策略和(,)庫存策略(、分別為備件的訂購閾值、最大庫存閾值)。Olde Keizer等建立了基于馬爾科夫過程的狀態維修模型,并采用部件退化狀態替代(,)庫存策略中的最小庫存閾值來進行備件訂購,進一步降低了聯合維修模型的維修成本。
上述基于退化特征閾值為限制的維修策略極大地完善和拓展了狀態維修及備件管理的理論,但在部件實際運行或加速壽命試驗過程中,其退化特征通常呈現出非單調遞增(遞減)趨勢。在美國辛辛那提智能維護系統中心公布的滾動軸承加速壽命試驗中,當采用軸承加速度信號的均方根值作為軸承退化特征指標時,該指標在軸承加速壽命試驗過程中呈現出上升、下降交替出現的“跳躍”情況,如圖1所示。出現這種情況的原因是由于機械部件的表面剝離或裂紋等故障在其早期退化階段可能會隨著部件的運行被“磨平”,也稱“自恢復”。因此,退化特征的非單調性會導致優化得到的退化特征閾值在部件整個運行周期內不具有唯一性,進而使得最佳維護策略在工程實際中面臨無法實施的困境。因此,需要構建一個新的決策變量來驅動狀態維修模型,從而將理論最優維修策略更好地應用于實際維修工程中。

圖1 滾動軸承全壽命RMS值[15]Fig.1 Entire RMS values of bearing[15]
除上述因素外,部件的退化特征監測在實際過程中往往存在一定誤差,即通過退化特征的監測并不能完全識別出部件是否故障。文獻[16-18]建立了退化特征的非完美監測模型,并通過概率來反映故障特征的識別準確率。但實際上部件的故障特征監測是一項非常復雜的技術,不同信號處理方法所需要的計算時間、監測成本及取得的監測質量,對狀態維修策略的經濟性均存在著較大影響。
針對故障特征提取問題,諸多學者進行了非常深入的研究。如:小波分解、小波包分解、經驗模態分解、集合經驗模態分解、局部均值分解、經驗小波變換、變分模態分解等。經驗模態分解是一種無需預設參數的自適應分解方法,但分解得到的信號分量存在模態混疊及端點效應。小波分解、集合經驗模態分解、經驗小波變換、變分模態分解等方法在診斷前均需要預設相應參數,否則將導致診斷效果不佳。而奇異譜分解(Singular Spectrum Decomposition,SSD)可以將非線性、非平穩信號分解為從高頻到低頻的一系列奇異譜分量和剩余分量。該分解方法不僅避免了經驗模態分解后信號分量的模態混疊現象,而且無需預設參數。此外,針對信號分解后的最佳分量選取問題,傳統方法中通常采用峭度、相關系數、包絡熵等指標來確定一系列分量信號中的最佳信號分量,但上述指標在強噪聲干擾下亦會出現選擇錯誤的情況,降低了診斷方法的自適應性。
鑒于此,本文提出一種新的信號分量確定指標來確定SSD分解得到的最佳奇異譜分量,結合威布爾比例風險模型,建立以累計故障特征識別次數為決策變量的狀態維修與備件訂購聯合優化模型。并通過滾動軸承加速壽命試驗數據對本文所提方法進行驗證說明。
由于部件早期故障并不會引起明顯的異常振動,進而影響其運行穩定性與平穩性。因此,本節提出基于退化特征閾值和累計故障特征識別次數并行的狀態維修決策方法。
針對SSD分解中最佳奇異譜分量選擇不合理進而無法識別故障特征的問題,構建了一種自適應SSD降噪方法,通過加權指標(Weighted Indicator)來自適應確定最佳奇異譜分量。加權指標由信號的自相關函數包絡熵和峭度兩部分組成。自相關函數包絡熵可以較好地評價信號的周期性,而峭度則對信號的脈沖成分非常敏感。因此,該加權指標可以同時評價信號的周期成分和脈沖成分。首先,對分量的轉化峭度指標進行計算,其表達式為

(1)


(2)
式中:,()為奇異譜分量()的自相關函數;為時間延遲系數(=,為信號采樣頻率,=0,1,…,-1);()為,()經Hilbert解調后的包絡信號;,為()的歸一化形式。同理,將以作為排序指標的分量排列序號向量記為。若直接將和相加,會出現最小值不唯一的情況,如:=[1, 2, 3, 4],=[2, 1, 3, 4],則+=[3, 3, 6, 8]。因此,采用信號分量與原始信號上述2種指標的比值對、進行修正,然后再將兩者相加得到加權指標,即
=()+()
(3)
式中:為原始信號的自相關函數包絡熵;為原始信號的轉化峭度。與最小值對應的分量則為最佳分量,進一步對最佳分量進行包絡譜分析,以識別故障特征。該方法具體如下:
在部件初始正常工作階段[0,](為部件自啟動至平穩運行的時刻)選取該范圍內的最大退化特征值作為退化突變點。退化特征閾值一般取=(其中一般取1.1~1.5),并記退化特征超過該閾值的時刻為。
當部件運行至(>)時刻,若其退化特征()>,則對該時刻的監測信號進行故障特征識別,并記()為′。
針對部件故障特征識別問題,提出遞進式的故障特征識別方法。首先,在時刻對原始信號(監測信號)進行包絡譜分析,若識別到故障特征則識別結束;其次,若直接包絡譜分析無法識別到故障特征則繼續采用自適應SSD降噪分析;最后,若上述2步均無法識別到故障特征則對SSD分解得到的所有奇異譜分量進行包絡譜分析,并安排維修機械師進行人工診斷。若上述3種方法均未識別出故障特征,則在后續運行過程中繼續監測部件的退化特征而無需進行故障特征識別,直至監測到下一個′時刻,并在該時刻重復上述診斷過程。
若時刻對原始信號采取遞進式故障特征識別方法可以識別到故障特征,記該時刻為,則[0,]被定義為正常階段,[,]被定義為早期退化階段,時刻至試驗結束被定義為嚴重退化階段。
定義備件訂購閾值,即在時刻前累計識別到故障特征次則進行備件訂購,否則在時刻進行備件訂購。該方法的診斷流程如圖2所示。

圖2 遞進式故障特征識別方法流程圖Fig.2 Flow chart of progressive fault feature identification method
基于本文的研究內容進行如下假設:
1) 部件的工作狀態穩定,不會發生突發嚴重失效,即部件的退化是由正常狀態逐步向嚴重故障緩慢變化的。
2) 備件訂貨后可以在規定時間內準時到達。
3) 備件在存儲階段不會發生折損。
4) 部件的故障時間服從威布爾分布。
比例風險模型可以根據部件狀態信息和歷史失效數據建立其退化模型,因此已被廣泛應用于部件的剩余壽命預測和可靠性評估。比例風險模型由部件狀態協變量和基本失效函數組成,可表示為
(,)=()exp[()+()+
…+()]
(4)
式中:()為部件基本失效率;()為狀態協變量;為協變量系數。則部件在時刻的故障率函數為
(,)=()(-1)exp[()+
()+…+()]
(5)
式中:為尺度參數;為形狀參數。則可靠度函數為


(6)
滾動軸承出現輕微故障時,并不會立即演變為嚴重失效,而是由早期微弱故障逐漸緩變為嚴重故障。為避免部件提前更換造成浪費,并同時兼顧部件運行的安全性,受隨機沖擊維修模型中累計損傷閾值的啟發,本節以部件累計識別到的故障特征次數作為備件訂購條件。若部件在時刻滿足訂購條件,維修單位可直接發出訂購指令,在備件到達后進行更換維修。由于飛機、軌道交通車輛的關鍵部件須采取冗余庫存模式,即部件投入運營前檢修單位必須提前備好相應備件,以防止維修時因備件缺失而導致的部件長時間停運。因此,該模型進行更換維修時消耗的備件實際上是部件投入運營前的冗余備件,而更換維修時訂購的備件將作為下個運營階段的冗余庫存。設備件訂購后的運輸時間為,則備件到達時間為=(+),備件的庫存成本和部件運行過程的監測成本為

(7)
式中:為備件單位時間庫存成本;為單位時間部件退化狀態監測成本;為部件更換前采取故障特征識別方法M-SSD的次數;為M-SSD的單次識別成本。對部件的狀態監測及自適應故障識別可由計算機自主完成,成本較低;而人工識別則成本較高。備件的購買及更換時所需的附加維修成本可表示為
=+
(8)
式中:為備件單價;為部件更換時所需的人工、設備使用費。同時,為避免部件過早更換而產生價值浪費,定義部件的價值浪費成本為
=(,)
(9)
式中:為部件的更換時刻;(,)為更換時刻部件的可靠度水平。部件在更換時的可靠度越低,代表其價值發揮越充分。此外,根據1.1節中部件不同退化階段的劃分,定義部件意外失效風險成本為

(10)

式中:為部件正常運行階段的意外失效風險成本;為部件早期退化階段的意外失效風險成本;為部件嚴重退化階段的意外失效風險成本。部件處于正常運行階段,僅可能會發生較為輕微的意外失效形式。在早期退化階段,可能會發生失效損失較低的一般故障;而處于嚴重退化階段,由于運行狀態的劣化可能會發生失效損失較大的嚴重故障,因此?>。則部件在整個服役周期內考慮維修成本及備件保障成本的總成本為
=++++
(11)
綜合上述維修成本,定義部件單位運行時間維修成本率為

(12)
式(12)能夠綜合考慮部件運行時間和維修成本,一方面可避免過早更換產生的自身價值浪費,另一方面也可降低部件的整體維修成本。通過對運行時間與預防性維修成本間的權衡,尋求經濟性最佳的維修策略。
由于飛機或軌道車輛中軸承的實際退化過程非常漫長且全壽命實測數據較難獲取,本節采用美國辛辛那提大學智能維護系統中心的滾動軸承全壽命試驗數據對本文所提出的聯合維修模型進行驗證。該試驗中滾動軸承的型號為ZA-115,軸承轉速2 000 r/min,采樣頻率為20 kHz,試驗裝置如圖3所示。試驗過程中每間隔10 min對振動信號進行一次采集,每個采集樣本長度為20 480 個點。試驗結束后,1號軸承外圈出現損傷,根據該軸承結構參數計算得到其外圈故障頻率為236.4 Hz。文獻[6]中指出振動信號的RMS可以直觀反映出部件的振動能量。因此,采用RMS作為部件的退化特征。

圖3 滾動軸承全壽命試驗臺[15]Fig.3 Rolling bearing entire life test platform[15]
1號軸承在開始試驗階段的RMS變化比較平穩,如圖4(a)所示。選定初始工作階段為0~3 000 min(即=3 000 min),該階段內的RMS最大值為0.113 3(=0113 3),出現在2 760 min,如圖4(b)所示。運用1.1節中的診斷方法對該節點進行故障特征識別,并沒有發現故障特征。考慮到軸承損傷對其運行平穩性及穩定性的影響,本文取=13,即=0147 3。圖4(c) 為4 400~5 400 min內歸一化RMS的變化情況,RMS最大值在4 480 min時被更新,記′=0113 8。對該點進行診斷仍沒有發現滾動軸承的明顯故障特征頻率。隨后,在5 130 min時RMS的最大值被再次更新,對該時刻的監測信號進行包絡譜分析,其原始信號的包絡譜如圖5(a) 所示,經W-SSD(基于指標的自適應SSD方法)降噪并自適應確定的最佳分量包絡譜如圖5(b) 所示。由圖5可知,此時故障特征已可以被識別,則正常工作階段為[0,5 120] min。當試驗進行至6 490 min時,RMS為0.148 7,已超過退化特征閾值,如圖4(a)所示。因此,[5 130,6 480] min為早期退化階段,[6 490,9 800] min為嚴重退化階段。

圖4 不同時段的RMS變化情況Fig.4 Variation of RMS in different periods

圖5 5 130 min時振動信號的包絡譜分析結果Fig.5 Envelope spectrum of vibration signal at 5 130 min
為便于描述,分別將基于指標和峭度指標的自適應SSD方法記為W-SSD和K-SSD,將基于SSD分解的人工故障特征識別方法記為M-SSD。在對滾動軸承早期退化階段進行連續故障特征識別過程中,隨著滾動軸承故障程度的加深,早期退化階段中的大部分時刻已可以從原始信號中直接進行包絡譜分析實現故障特征識別。試驗過程中每10 min記錄1次監測信號,則早期退化階段共監測136次。除表1中所列的23個時刻以外,其余113個時刻均可從原始信號的包絡譜分析中識別到故障特征。表1中原始信號經SSD降噪后,采用W-SSD方法可以自適應診斷出13次故障特征,需要人工診斷10次。而采用K-SSD方法可自適應識別故障特征4次,需要人工診斷19次。由此可知,本文所提出的方法自適應性更強,可以更好地對滾動軸承早期退化階段的微弱故障特征進行識別。

表1 不同時刻的故障特征識別結果Table 1 Fault feature diagnosis results at different time points
為進一步驗證本文方法的有效性,分別以5 180、5 190 min為例對遞進式故障特征識別方法進行說明。5 180 min時刻的、、的計算結果分別為=[2.4,0.9,1.5,15,4.7,0.4,63.5,20.4,17.3,109.4,9.3,11.8,3.5],=[1.9,5.9,6.8,4.9,3.9,13.0,12.0,0.9,2.9,7.9,9.9,11.0,8.9],=[4.3,6.8,8.3,19.9,8.6,13.4,75.5,21.3,20.2,117.3,19.2,22.8,12.4]。此時原始信號被分解為13個奇異譜分量。基于K-SSD方法選擇的最佳分量序號為6,基于W-SSD方法選擇的最佳分量序號為1。圖6為5 180 min 時K-SSD、W-SSD的最佳分量包絡譜。由圖6可知,本文所提出的W-SSD方法可以準確識別到故障特征頻率。5 190 min時,原始信號被分解為33個奇異譜分量(見圖7)。由于分量較多此處不再列出的具體計算數值。該時刻基于W-SSD方法選擇的最佳分量序號為21,基于M-SSD方法選擇的最佳分量序號為19。此時,W-SSD并不能自適應識別出滾動軸承的故障特征,需要派遣維修工人進行更為詳細的診斷。

圖6 5 180 min時不同診斷方法下的最佳分量包絡譜Fig.6 Envelope spectrum with different methods at 5 180 min

圖7 5 190 min不同診斷方法下的最佳分量包絡譜Fig.7 Envelope spectrum with different methods at 5 190 min
采用文獻[32-33]中的參數估計方法,以RMS作為狀態協變量對2.1節中試驗軸承的威布爾比例風險模型進行參數估計。參數估計結果為=8 476068,=6433,=1883。為驗證本文聯合維修決策模型的維修經濟性,假設單位成本為備件的單價,即=1。其他維修參數如表2所示。

表2 維修模型參數Table 2 Maintenance model parameters
為便于不同方法進行比較,基于W-SSD方法的聯合維修模型被定義為模型1,基于K-SSD方法的聯合維修模型被定義為模型2;若在維修策略中僅考慮滾動軸承運行安全性而忽視經濟性,則在初次識別到故障特征后立即進行備件訂購,本節將其定義為模型3。上述3種維修模型分別考慮了不同的決策方法及維修需求。模型1在不同累計故障特征識別次數下的維修成本率變化如圖8所示。由圖8及2.1節中的研究結果可知,模型1自5 130 min開始對滾動軸承進行遞進式故障特征識別,在累計故障特征識別次數為127時(即=127)可取得最優維修成本率。該試驗過程中每10 min對振動信號進行一次采集,則識別到127次故障特征共需1 270 min。因此,模型1的備件最優訂購時刻為5 120 min+127×10 min=6 390 min,=6 490 min。

圖8 模型1不同累計故障識別次數下維修成本率變化情況Fig.8 Variation of maintenance cost rate with different cumulative numbers of fault feature identification (Model 1)
由圖9可知,模型2的最優成本率亦在累計故障特征識別次數為127時取得。模型3由于僅考慮運行安全性,其備件訂購時刻為5 130 min,=5 230 min;3種模型的最優維修成本率組成如表3所示。由表3可知模型1相比于模型2、3的維修成本率分別降低了2.66%、3.07%。

圖9 模型2不同累計故障識別次數下維修成本率變化情況Fig.9 Variation of maintenance cost rate with different cumulative numbers of fault feature identification (Model 2)

表3 不同模型維修成本率優化結果Table 3 Optimization results of maintenance cost rate for different models
通過對比模型1、2可知,在部件早期退化階段,故障特征識別方法的自適應識別率越高則所需人工診斷的次數越少,越有利于降低部件的維修成本率。通過對比模型1、3可知,雖然在早期退化階段可以識別到部件故障特征,但在運行狀態沒有大幅劣化的情況下,過早更換部件會導致其使用價值的浪費,進而導致維修成本上升。雖然本文所提出的聯合維修模型在降低維修成本率方面的優勢較小,但考慮到滾動軸承在工程實際中龐大的運用規模,本文方法仍可節約大量的維修成本。
同時,為驗證以累計故障特征識別次數代替退化特征指標驅動維修策略的優越性,本節進一步分析了滾動軸承RMS在6 000~6 500 min內的變化情況,如圖10所示。由圖10可知,滾動軸承在6 020 min時刻的RMS已高于6 390 min 時的RMS。

圖10 6 000~6 500 min內RMS變化情況Fig.10 Variation of RMS from 6 000 min to 6 500 min
若以最優訂購時刻的RMS作為閾值代替累計故障特征識別次數來決策備件訂購時機,實際維修工作中在6 020 min便會進行備件訂購。由圖8可知,此時的維修成本率為1.546×10,相比于模型1的最佳維修成本率增加了1.61%。因此,若以退化特征閾值為決策變量將導致聯合維修模型錯過維修成本率最佳的備件訂購時刻。這也驗證了以累計故障特征識別次數驅動狀態維修策略方法的有效性。在實際維修過程中,若缺乏性能優良的自適應故障特征識別方法和具有唯一性的維修時機決策指標,則無法對備件訂購進行合理規劃,進而無法實現理論最佳維修策略與工程實際的貼合。
針對不可修復部件提出了一種普適性更強的狀態維修和備件訂購聯合決策方法。該方法中采取故障特征和退化特征并行的方式驅動維修策略,并以累計故障特征識別次數代替退化特征閾值來決策備件的訂購時刻。
基于本文構建的自適應SSD降噪方法分析表明,該方法可以有效提高故障特征識別準確率。此外,根據不同維修需求和故障特征診斷方法的研究結果表明,當部件的退化特征非單調變化時,以退化特征閾值為備件訂購條件的決策方法無法獲得最佳維修成本率;而以累計故障特征識別次數為備件訂購條件的決策方法,則可以有效避免該問題的發生。