梁清政 王 浩 程垠鐘 楊天詣 姚欽博
(中國艦船研究院,北京 100192)
船舶柴油發電機組作為當前船舶電力系統的關鍵設備,其工作穩定性和可靠性將直接影響系統運行。現代船舶在工作環境、工況、性能等方面對柴油發電機組提出了更高要求[1],對船舶柴油發電機組故障特征進行預測和分析,及時判斷機組設備的健康狀態和隱患問題,制定并執行相應的維護維修策略以預防潛在異常和故障的發生,顯得十分迫切[2]。
目前,常用的特征預測方法分為統計模型預測法、人工智能預測法、組合預測法3 類[3]。其中,統計模型預測法包括時序分析法、回歸預測法和卡爾曼濾波法等,模型結構簡單、預測速度快,但健壯性較差;人工智能預測法包括隨機森林算法、支持向量機算法和神經網絡算法等,非線性處理能力強,但單一預測模型存在梯度爆炸、局部極值等問題[4];組合預測法包括一般組合法和分解組合法,一般組合法以各組成方法的預測誤差作為組合參數的調整依據,在一定程度上減小了預測誤差,但無法從根本上解決單一預測法存在的問題,而分解組合法能夠將非線性、非平穩的特征序列分解為若干子序列,將復雜時序預測問題轉化為子序列預測問題,不僅有效提高了預測精度,而且具備良好的可遷移性和拓展性。
鑒于分解組合法在復雜序列預測上的優點,將SSA-Hurst-ARIMA 組合模型應用到船舶柴油發電機組故障特征預測中。考慮到模型復雜度和運算時耗問題,不對奇異譜分析(Singular Spectrum Analysis,SSA)分解得到的每個分量單獨構建自回歸移動平均(Auto-Regressive Integrated Moving Average,ARIMA)模型,而是根據各分量的Hurst 指數值劃分低頻趨勢分量、高頻隨機分量和白噪聲分量,整合前兩者并分別構建ARIMA 模型進行預測,以達到提高船舶柴油發電機組故障特征預測精度的目的。
SSA 是一種廣泛應用于信號處理的數據分解降噪方法,不需要復雜的先驗信息,自適應能力強、分解結果穩定可靠,相較于經驗模態分解、小波分析等其他分解方法,其優勢更加突出。使用SSA 處理序列可分為嵌入、分解、分組、重構4 個步驟。在分組環節,選擇以Hurst 指數劃分數據低頻趨勢分量、高頻隨機分量、白噪聲分量的分組標準,以及以奇異值貢獻率區分數據主成分分量和噪聲分量的分組標準,比較2 種分組標準在SSA-ARIMA 組合模型上的預測效果。
Hurst 指數是衡量序列長期記憶性或自相似性的一個度量指標,取值的3 個范圍分別代表不同的序列相關性。取值小于0.5 表示該序列負相關,具有反持久性,高頻隨機成分相對顯著。取值大于0.5 表示該序列正相關,具有長期記憶性,與趨勢相關的低頻成分相對突出。取值在0.5 附近表示該序列不相關,為隨機游走序列,可以視作白噪聲[5]。為降低組合模型的復雜度,引入Hurst 指數分別對低頻趨勢分量和高頻隨機分量進行分組整合,選用重標極差法計算SSA各分量的Hurst 指數值[6]。
ARIMA 是中短期預測精度較高的預測模型,模型參數數量較少,可自動尋優,已成功應用在氣象學、金融學、醫學等領域的預測問題上。ARIMA 模型由自回歸階數p、差分階數d、滑動平均階數q組成,用ARIMA(p,d,q)表示,分別對應自回歸(AR)、差分(I)、移動平均(MA)三部分,數學表達式為
式中:Xt,Xt-1,…,Xt-p為時間序列X在t,t-1,…,t-p時刻的觀測值;φ1,φ2,…,φn為待估的自回歸系數;θ1,θ2,…,θn為待估的滑動平均系數;εt,εt-1,…,εt-p為t,t-1,…,t-p時刻的白噪聲。
ARIMA 模型預測主要分為序列平穩化和模型定階兩步,平穩化是指將非平穩序列通過差分的方式轉化為平穩序列,模型定階則是根據選定標準確定模型的p、d、q值。其中,d值可根據差分次數獲取,p值、q值能夠通過自相關函數(Auto-Correlation Function,ACF)圖像和偏自相關函數(Partial Auto-Correlation Function,PACF)圖像初步得到。當ACF 和PACF 均不呈現明顯的拖尾或截尾時,需通過其他準則確定p值、q值。
為簡化并統一各整合序列的模型定階過程,采用赤池信息準則(Akaike Information Criterion,AIC)確定p值、q值。AIC 平衡了模型復雜度和模型擬合優度的關系,不易導致過擬合情況的出現。構建ARIMA 預測模型時,以給定的p、q遍歷范圍內AIC值最小作為確定最優模型的依據。
針對船舶柴油發電機組故障特征非線性、非平穩的數據表現,在綜合考慮算法適用性和模型復雜度等因素后,建立SSA-Hurst-ARIMA 組合模型,模型的預測流程如圖1 所示。

圖1 SSA-Hurst-ARIMA 組合模型預測流程
依據Hurst 指數劃分SSA 分量中的低頻趨勢分量和高頻隨機分量,剔除白噪聲分量,同時為避免ARIMA 模型過擬合導致的預測精度低,ARIMA 模型的p、q遍歷上限設為5,并在此范圍內尋找各整合序列的最優ARIMA 模型。
采用平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)、均方根誤差(Root Mean Squared Error,RMSE)來評估預測效果。MAE、MAPE 越小,模型的準確度越高;RMSE 越小,模型的穩定性越好。MAE、MAPE、RMSE 的計算公式分別為
式(2)~式(4)中:n為預測樣本數量;為樣本i的預測值;xi為樣本i的實際值。
某次試驗中,一臺柴油發電機組的增壓器潤滑失效,選取故障前一段時間的增壓器滑油壓強為故障特征。為驗證SSA-Hurst-ARIMA 組合模型對故障特征趨勢的預測效果,以增壓器滑油壓強全工況正常數據最值設定增壓器滑油壓強最大最小歸一化的范圍,選取故障前機組于90%工況下連續18 次運行的增壓器滑油壓強歸一化數據,取每次運行中增壓器滑油壓強的平均值作為本次運行的增壓器滑油壓強值。機組故障前連續18 次運行的增壓器滑油壓強變化如圖2 所示,總樣本數為18,前14 次運行作為訓練集,后4 次運行作為測試集。

圖2 增壓器滑油壓強變化
由SSA-Hurst-ARIMA 組合模型預測流程,設定嵌入維數L=6,經奇異值分解(Singular Value Decomposition,SVD)得到6 個分量。運用重標極差法計算各分量的Hurst 指數值,結果如圖3 所示。

圖3 SVD 分量的Hurst 指數
依據Hurst 指數劃分標準,SSA 低頻趨勢分量為第1、第2、第3、第6 分量,高頻隨機分量為第4、第5 分量,分別整合各低頻趨勢分量和高頻隨機分量得到低頻整合序列和高頻整合序列。為防止過擬合,ARIMA 模型的p、q參數不宜過大,以AIC 作為各序列ARIMA 模型的尋優標準,將p、q遍歷上限設為5。首先,通過尋優得到低頻整合序列的最優ARIMA 模型為ARIMA(5,0,5),高頻整合序列的最優ARIMA 模型為ARIMA(4,0,5)。其次,在兩序列各自的最優ARIMA 模型下對測試集進行預測。最后,將兩序列的預測值疊加得到原序列的最終預測結果。低頻、高頻整合序列及其預測結果如圖4 所示。

圖4 低頻、高頻整合序列及其預測結果
為驗證組合模型的預測精度,將SSA-Hurst-ARIMA 模型、SSA 主成分-ARIMA 模型和單一ARIMA模型的預測效果進行對比和分析。值得注意的是,在構建SSA 主成分-ARIMA 模型時,SVD 第1 個分量的奇異值貢獻率在99%以上,因此可以直接將代表趨勢的第1 分量作為主成分,剩余分量視為噪聲。按ARIMA 模型p、q參數尋優標準,SSA 主成分的最優ARIMA 模型為ARIMA(5,1,3),直接預測的單一ARIMA 模型為ARIMA(5,0,5)。3 種模型對測試集的預測效果如圖5 所示。

圖5 3 種模型的預測效果
為準確比較3 種模型的預測精度,計算ARIMA模型、SSA 主成分-ARIMA 模型、SSA-Hurst-ARIMA組合模型的MAE、MAPE、RMSE,MAE分別為0.301 8%、0.258 0%、0.189 2%,MAPE 分別為1.032 9%、0.886 4%、0.650 0%,RMSE分別為0.354 9%、0.308 4%、0.216 5%。結果表明,SSA-Hurst-ARIMA 組合模型的預測效果優于單一ARIMA 模型和SSA 主成分-ARIMA 模型,SSA-Hurst-ARIMA 組合模型能更好地捕捉增壓器滑油壓強的趨勢變化。
在船舶柴油發電機組故障特征預測方面,SSAHurst-ARIMA 組合模型具備如下兩點優勢。一方面,SSA-Hurst-ARIMA 組合模型預測性能優于單一ARIMA模型和SSA 主成分-ARIMA 模型,適用于預測船舶柴油發電機組非線性、非平穩故障特征。另一方面,SSA-Hurst-ARIMA 組合模型充分利用SSA 降噪的優勢,通過Hurst 指數剔除白噪聲,有效增強了模型的健壯性,提高了模型的實際應用價值。相比自適應降噪的單一ARIMA 模型和人工分噪的SSA 主成分-ARIMA 組合模型,SSA-Hurst-ARIMA 組合模型的分噪精度更高且抗噪能力更強。
提高船舶柴油發電機組故障特征的預測精度,能夠精準跟蹤故障特征的變化趨勢,掌握特征統計量的變化情況。通過預測過閾值或異常波動等情況,提前發現機組的潛在故障,對提高機組穩定性和可靠性具有十分重要的意義。由于船舶柴油發電機組故障特征預測工作目前尚不成熟,以工程適用性為主要目標,在理論上可繼續改進和拓展文章提出的SSA-Hurst-ARIMA 組合模型。后續可通過改進研究不足之處或嘗試其他預測模型及組合方式,進一步提高預測準確度,減少預測時耗。