嚴建文 鐘小虎 范 煜 郭三敏1,
1.合肥工業大學管理學院,合肥,2300092.合肥工業大學航空結構件成形制造與裝備安徽省重點實驗室,合肥,2300093.浙江大學機械工程學院,杭州,3100584.安徽皖維集團有限責任公司,合肥,238002
高功率半導體激光器及其陣列具有體積小、質量小、能耗低、光斑易調節、光電轉換效率較高的優點,已廣泛應用于金屬材料加工,該種激光器可用于連續性焊接不同型號的合金鋼,獲得大面積深度均勻的相變硬化層,也能夠精確地控制熔覆層結構及其幾何形狀[1]。為保證材料加工過程的安全性和可靠性,需利用預測與健康管理(prognostics and health management, PHM)技術對高功率半導體激光器的狀態進行監測和分析[2]。PHM技術的主要目的在于預測故障發生的時間和地點,估計剩余使用壽命(remaining useful life, RUL)的分布或期望[3],提高激光器的可靠性。準確的RUL預測可為決策者提前制定維修計劃和優化供應鏈管理,減少不必要的維修或更換成本,提供有效的信息。
相比于傳統的基于可靠性的方法[4-5],現有的數據驅動方法主要通過對狀態監測或檢測數據進行分析,捕捉數據中潛在的退化規律和故障失效信息,通常可以分為兩類。①基于退化模型的方法[6](如維納過程模型[7]、伽馬過程模型[8]、逆高斯過程模型[9]、隱(半)馬爾可夫模型[10-11]等),旨在對設備的退化演化過程進行建模,如采用逆高斯過程模型對退化過程進行分析,以預估GaAs激光器的RUL分布[12-14]。這類方法均假定退化模型是事先知道的,模型參數利用狀態監測數據進行估計,然而實際工程中很難事先確定一個適當的退化模型,且退化模型選擇不當將會嚴重影響RUL的預測精度[15]。②基于機器學習的方法[16](如人工神經網絡(artificial neutral network, ANN)[17]、基于相似性的學習算法(SbRP)[18]、支持向量回歸(support vector regression, SVR)方法[19-20]等),試圖將退化數據與RUL之間的關系進行直接映射。如文獻[21]利用SbRP方法對GaAs激光器的RUL進行了預測;文獻[22]基于自回歸模型和SbRP方法,提出了一種基于相似性的差值分析(SbDA)方法用于GaAs激光器的RUL預測。
基于機器學習的方法能夠有效克服退化模型未知的問題,近年來已得到了廣泛的研究和應用。然而,如何可靠地在失效歷史數據有限的情況下實現對目標設備的實時預測仍然具有極大的挑戰。SVR方法是支持向量機(support vector machine,SVM)算法在RUL預測領域最常見的應用方式,可有效地解決小樣本情況下的預測問題。BENKEDJOUH等[19-20]利用SVR方法將退化時間序列映射成非線性回歸,然后將得到的回歸擬合到功率模型中,并用于機械設備的RUL預測。LIU等[23]建立了一種改進的概率SVR模型用于預測核電站裝備部件的RUL。FUMEO等[24]通過優化精度與計算效率之間的權衡,開發了一種在線SVR模型用于軸承的RUL預測。上述研究雖然拓展了SVR模型在RUL預測問題中的應用,但均未考慮關鍵預警階段特別是臨近故障失效前的預測可靠性問題,即使SVR方法所訓練模型的回歸曲線的整體誤差最小,也有可能因為關鍵預警階段數據擬合得不好而導致實時預測的結果未必能可靠地支持維護決策。關鍵預警階段RUL預測的準確性是決策者在運行可靠性和成本之間權衡的決策基礎,特別是臨近故障失效前。HUYNH等[25]提出了一種考慮RUL預測精度的預測維護決策框架,其決策框架的性能優劣取決于臨近失效階段的RUL預測精度。ZHAO等[26]根據不同的可靠性水平將產品退化過程簡化為5種狀態,其中,狀態0為正常運行狀態,狀態1為退化加速狀態,狀態2和狀態3為關鍵預警狀態,狀態4為失效狀態。相對于整個退化過程,狀態2和狀態3階段的RUL預測結果對維護決策更具有實際意義。
基于上述情況,本文提出了一種基于整群抽樣和SVR模型的方法用于高功率半導體激光器的RUL預測。對測試樣本狀態2和狀態3階段的數據進行多次整群抽樣后用于SVR模型測試,SVR模型中的參數使得SVR模型對訓練樣本的后期數據擬合得更好,更能滿足維護決策需要。最后,所提方法的有效性、準確性和穩健性通過GaAs激光器數據集得到了驗證。
SVR方法基于結構風險最小化原則,保證了模型最大的泛化能力,特別適合處理小樣本、非線性和高維數據,它在RUL預測領域最常見的應用方式為最小二乘支持向量回歸(least square support vector regression, LS-SVR)方法。給定一組訓練集{(xp,yp)|p=1,2,…,n},其中xp∈RN為N維輸入向量(N≥1),yp∈R為輸出值,n為訓練樣本總數,則LS-SVR模型可用一個非線性映射函數φ(·)來表示,即
y=wTφ(x)+b
(1)
式中,w為權向量;b為偏差項。
通過將原始輸入數據映射到高維空間,非線性可分問題在該空間上變為線性可分問題,則LS-SVR問題可變為求解為如下優化問題:
(2)
式中,ep為隨機誤差;γ為調節參數;m為支持向量的個數,且m≤n。
此外,根據拉格朗日函數和KKT定理,采用非線性核函數時的LS-SVR可表示為
(3)
式中,ap為拉格朗日乘子;K(x,xp)表示非線性核函數。
圖1給出了某個測試樣本采用現有SVR方法的測試結果,可以看出,即使訓練得到了相對于整個數據集最優的模型參數,但狀態2和狀態3這兩個階段的擬合曲線與實際曲線相差甚遠,遠遠達不到制定最佳維護策略的要求,甚至會造成提前停機或失效風險。如何提高算法預測結果的可靠性是當前工業應用的實際需求,然而直接對式(2)進行改良是個極大的挑戰,可能會使算法失去其一般性。鑒于此,本文提出了基于整群抽樣的方法,通過對狀態2和狀態3兩個階段的測試數據進行多次整群抽樣來間接增大上述兩個階段數據在算法實現過程中的誤差權重,使得算法更側重于這兩個階段的預測準確度。假設Z={z1,z2,…,zp,…,zq,…,zn}為數據集,其中z1,z2,…,zn為數據向量,則整群抽樣方法在本文方法中的應用形式如圖2所示,k(k=1,2,…,K)為整個退化過程中的某一階段,其中K為整個退化過程劃分的階段數。使用整群抽樣的本文方法與傳統SVR方法主要區別在于:本文方法將測試樣本k階段的數據Zk={zp,…,zq}進行整體抽樣h次并重新放回,從而得到新的測試樣本,對應的測試數據較原始測試數據多出了h組k階段的數據,

圖1 傳統SVR模型某樣本測試結果Fig.1 Testing result of a sample by traditional SVR model

圖2 整群抽樣在本文方法中的應用形式Fig.2 Usage mode of cluster sampling in the proposed method
用該測試數據進行測試得到的最優模型參數即為k階段的模型參數,對應模型對整個退化過程中的k階段也是擬合最優的。整群抽樣后,Zk中每個數據點的權重從1/n增大到wZk,其中,wZk可由下式計算:
(4)


圖3 基于整群抽樣和SVR模型的剩余使用壽命預測流程Fig.3 RUL prediction flow chart based on cluster sampling and SVR model
本文采用的GaAs激光器是一種廣泛應用的高功率半導體激光器,其相關數據參見文獻[22]。本研究的所有記錄數據如表1所示,均為GaAs激光器在80 ℃恒定熱應力下工作電流隨時間變化而增加的百分比,已被廣泛用作性能退化指標進行RUL估計[12-14,21-22]。表1中共有15個實驗樣本,每250 h測試一次數據,至4000 h為止。假設產品的失效閾值為6(即工作電流增加6%,GaAs激光器功能失效),狀態2和狀態3下對應的性能退化數據分別為[4,5)和[5,6),則本實驗注重性能退化數據在[4,6)之間的RUL預測準確性,實驗數據退化曲線見圖4。由于GaAs激光器的退化曲線均近似于線性回歸模型,因此其各自的失效時間可通過非參數局部線性估計方法來確定[27]。選取樣本1~5為測試樣本,樣本6~15為訓練樣本,采用本文方法對測試樣本在狀態2和狀態3下的RUL進行估計,并與傳統SVR方法、SbRP方法和SbDA方法這三種小樣本方法進行比較分析。性能評價準則依據平均絕對誤差(mean absolute error,MAE),MAE值越小,表明性能越佳。

圖4 GaAs激光器實驗數據退化曲線Fig.4 Degradation curves of GaAs laser experimental data

表1 GaAs激光器在80 ℃熱應力下的性能退化數據(工作電流增加百分比)
本實驗中,設定最大抽樣次數H=10,分別對測試樣本狀態2和狀態3下的數據進行整群抽樣,則可獲得121種測試結果。狀態2和狀態3下的抽樣次數均為0時,本文方法等同于傳統SVR方法。以樣本1為例,在狀態2和狀態3兩個狀態下所有測試結果的誤差如圖5所示,其中,最大MAE為473.76 h,最小MAE為4.27 h。測試結果表明,采用本文方法可以有效地減小離失效閾值更為接近的關鍵預警階段的預測誤差,可以使得設備在更接近失效階段預測RUL更加準確,更有利于維護決策。在本實驗中,假定性能退化狀態值取4時為關鍵預警值,當性能退化狀態值超過4但不超過6時則認為設備性能狀態處于關鍵預警階段,即狀態2和狀態3為關鍵預警階段。對于樣本1,在1500~2250 h時的性能退化數據超過關鍵預警值且處于狀態2和狀態3下,期間的預測結果直接關系到維護決策任務的經濟性和可靠性。測試結果如表2所示,假設決策者要求的預測結果置信區間為預測值±10%,則在樣本1的測試結果中,僅本文方法在1500 h、1750 h和2000 h處達到要求,傳統SVR方法、SbRP方法和SbDA方法的預測結果均不符合要求。這主要是因為在訓練樣本有限的情況下,訓練樣本的性能退化模式不能很好地概括產品總體的所有退化模式,當要進行預測的目標樣本的退化曲線與訓練樣本的群體退化曲線差異較大時,有限訓練樣本的不足就很明顯,這會造成傳統SVR方法、SbRP方法和SbDA方法在實際應用時很容易受到數據不確定性的影響。相比之下,采用本文方法則更為穩健,其預測結果的MAE最小且遠小于其他幾種方法對應的MAE,由圖6可以看出,采用本文方法得到的預測結果更接近實際值。

圖5 H=10時,樣本1采用本文方法的全部測試誤差Fig.5 While H=10,all the testing errors of sample 1 by the proposed method

表2 樣本1采用幾種常用方法的預測結果

圖6 樣本1的預測結果Fig.6 Predicted results of sample 1
同樣,樣本2~5在狀態2和狀態3下的測試結果見圖7。圖7a中,樣本2與樣本1類似,其退化模式與訓練樣本的群體退化模式差異較大,采用傳統SVR方法和SbRP方法得到的預測結果與實際值相差較大,采用SbDA方法得到的預測結果較傳統SVR方法和SbRP方法的預測結果相對更準確一些,但這三種方法的預測結果均不如采用本文方法準確。圖7b~圖7d中,采用傳統SVR方法得到的預測結果比采用SbRP方法和SbDA方法準確,更為接近實際值,但不如采用本文方法準確。此外,表3詳細列出了所有測試樣本采用這幾種方法的預測誤差,傳統SVR方法、SbRP方法和SbDA方法互有優劣,相比之下,本文方法更加準確有效,且更為穩健。

(a) 樣本2

表3 本文方法與幾種常用方法的預測誤差對比結果
本文提出了一種基于整群抽樣和支持向量回歸(SVR)模型的剩余使用壽命(RUL)預測方法,對測試樣本關鍵預警階段觀測數據進行多次整群抽樣后用于SVR模型測試,以尋找對后期數據擬合更好的模型參數,并構建了符合維修決策要求的預測模型。
(1)相比于傳統SVR方法在模型參數尋優過程中側重于使得測試樣本的整體誤差最小,本文方法在參數尋優過程中更注重對關鍵預警階段數據的擬合,可保證所得預測模型在關鍵預警階段的輸出最優,進而有效地提高了關鍵預警階段剩余壽命預測結果的準確性和可靠性。
(2)通過實驗發現,本文方法相比傳統SVR方法及兩種基于相似性的方法具有更好的準確性和可靠性,能有效用于支持激光器的維護決策,也為提高RUL預測方法的性能提供了一條新的技術途徑。
(3)相比于重新設計機器學習算法中的函數,通過整群抽樣來優化提高模型預測效果更便于在實際故障預測與健康管理中實施,值得進一步研究整群抽樣方法在其他數據驅動的RUL預測方法中的應用。