鄭 卓 曹 輝 高鶴元 劉如磊
(大連海事大學輪機工程學院 遼寧 大連 116026)
船舶主海水系統的正常運行,為船舶動力裝置提供了充分的冷卻條件,為船舶正常航行提供了保障。由于主海水系統直接連通舷外,工作環境惡劣,若能夠根據海水系統中某些典型參數的變化進行有效分析預測,做到將事后維修轉化為視情維修,對于使主海水冷卻系統時刻處在一個正常運行狀態以及延長設備使用壽命,具有重要意義。
目前,在工程上現有的方法主要分為兩類:單一模型預測法和組合模型預測法。單一預測模型主要有:神經網絡法[1],灰色預測法[2],回歸預測法[3],時間序列法[4]。但是,單一模型在處理非線性、非平穩的時間序列上存在一定的不穩定性和局限性[5]。因此,目前組合模型預測法更為常見。徐夢茹等[6]在對地區降雨量的預測中提出馬爾可夫與ARIMA組合模型,該模型雖然綜合了兩個模型的優點,但在模型組合時忽略了組合權重的確定對預測精度的影響。孫堂樂等[7]在對太陽黑子月均值預測中,提出將原始序列分解為若干子序列,對子序列分別建模預測并疊加重構。該方法由于會因為分解算法的固有缺陷,導致高頻分量的非線性和非穩定性仍然較高。
本文提出一種采用加權馬爾可夫鏈修正殘差的ARIMA預測模型的組合模型。首先建立ARIMA模型對原始序列預測。ARIMA模型雖然能較好地反映序列的隨機波動性,但會因為差分的過程導致信息丟失、精度降低的問題,因此,再結合加權馬爾可夫鏈對預測殘差進行修正。馬爾可夫鏈適合描述隨機波動性大的變量的預測問題,常被用于預測模型的殘差修正過程中,在風力發電、降水量等預測中都取得了明顯成效[8]。與單一ARIMA模型進行對比實驗,結果表明本文提出的預測模型精度更高,實用性更強。
ARIMA模型的主要思想就是將所得的時間序列視為一個隨機序列,然后用一個數學模型來近似地描述它。ARIMA模型通過將非平穩時間序列經過d次差分轉化為平穩的時間序列進行分析。
ARIMA(p,d,q)模型公式如下:
yt=θ0+φ1yt-1+φ2yt-2+…+φpyt-p+
εt-θ1εt-1-θ2εt-2-…-θqεt-q
(1)
式中:p為自回歸模型階數;q為滑動平均模型的階數;d為差分次數;φi(i=1,2,…,p)、θj(j=1,2,…,q)為模型的待定系數;εt為t時刻的殘差;yt為觀測值。
加權馬爾可夫鏈模型的主要思想是將一列相依的隨機序列,經馬氏檢驗后,用相關的各階(各種步長)確定的加權馬爾可夫鏈來預測未來值。
計算各階自相關系數rk:
(2)

對各階自相關系數規范化:
(3)
式中:wk為各步長的馬爾可夫鏈的權重;m為按預測需要計算到的最大階數。
結合式(2)、式(3)將同一狀態的各預測概率加權和作為該狀態的預測概率pi,即:
(4)

加權馬爾可夫鏈修正的ARIMA預測模型的流程如圖1所示。

圖1 加權馬爾可夫鏈修正的ARIMA模型預測流程圖
以ARIMA模型作為組合模型預測的第一部分,加權馬爾可夫預測模型為第二部分。ARIMA作為對獲取狀態參數序列的預測,然后獲取預測序列的已知序列部分的殘差序列,用加權馬爾可夫預測模型預測殘差。最后用殘差序列修正與其對應的參數序列,得到更為準確的預測值。
如圖2所示,在船舶海水系統中,大部分故障都會轉移到中央冷卻器的換熱問題上,如海底門濾器臟堵、海水泵故障、海水管路有滲漏等會導致中央冷卻器內的海水量不足,而不變量的低溫淡水換熱會使中央冷卻器內的海水溫度升高進而使船舶海水出口溫度升高,若中央冷卻器換熱海水側結垢,引起換熱不足,會使船舶海水出口溫度降低至正常溫度以下。所以在監測船舶海水系統運行狀態時,海水出口溫度是一項重要監測指標。本文以預測“育鯤”輪海水出口溫度為具體研究實例展開分析。

圖2 “育鯤”輪海水系統圖
本文選取了“育鯤”輪在某航次航行時海水出口溫度的數據。具體采集方式為每2小時獲取一次參數數據,共采集了6天的數據即72組數據,取前5天即60組數據作為模型的輸入,用于建立預測模型的基礎數據,根據這60組數據進行建模并預測,后12組數據作為預測結果的驗證數據[9]。如果進行長期的故障預測,隨著時間的流逝,為了保證模型的準確性,可采取采集的數據順次更迭的方式,使每次建模時數據總能保持72組數據。
(1)數據預處理。針對這6天的海水出口溫度歷史數據,取前5天歷史數據作為建模的基本數據,并繪制中央冷卻器海水出口溫度T曲線圖,如圖3所示。

圖3 中央冷卻器海水出口溫度圖
可以看出,海水出口溫度曲線呈由平穩到逐漸上升趨勢。顯然這組參數序列是不平穩的,所以應選用ARIMA模型進行建模,首先進行平穩化處理,即差分次數的確定。中央冷卻器海水出口溫度T經差分平穩化處理后如圖4所示。

圖4 中央冷卻器海水出口溫度1階差分圖
(2)模型識別。經過時間序列的平穩化處理和ADF檢驗之后,在MATLAB中使用autocorr和parcorr函數得出序列的自相關圖和偏自相關圖,如圖5、圖6所示。

圖5 樣本自相關函數圖

圖6 樣本偏自相關函數圖
圖5、圖6顯示自相關函數和偏自相關函數均拖尾,可以確定該模型應該為ARIMA(p,q)模型。在自相關圖中,1階和3階的函數值可視為顯著不為0,說明q可以取到3階,同理在偏自相關圖中,1階和2階的函數值顯著不為0,說明p可以取到2。
由于僅依靠相關系數圖判斷模型的階數具有一定的主觀性,本文結合AIC(Akaike Information Criterion)、SC(Schwarz Criterion)信息準則進行了誤差分析,選出最優模型ARIMA(2,1,3),如表1所示。

表1 模型檢驗結果
(3)模型預測。將最優模型在Eviews軟件中采用最小二乘法進行擬合預測得到接下來的12期數據。
(1)馬氏檢驗。檢驗隨機序列是否具有“馬氏性”是應用馬爾可夫鏈解決實際問題的重要條件,忽略“馬氏性”的檢驗是不科學的,也是不嚴謹的。
計算殘差序列Z的均值近似為0和均方差S近似為0.5。根據均值-均方差將序列劃分為6個狀態,如表2所示。

表2 殘差狀態等級劃分
因此,可以得到殘差序列中從狀態i經過一步轉移達到狀態j的頻數矩陣fij。
一步轉移矩陣為:

表3 統計量計算表

(2)模型預測。在MATLAB中根據式(2)、式(3)可以計算出規范化后的各種步長的馬爾可夫鏈權重,根據第1期到第60期樣本序列的殘差序列分別預測第61期到第72期殘差序列,以預測第61期為例,如表4所示。

表4 第61期殘差狀態預測
可以看出,Pi=2.05對應的狀態為4,由于預測的需求,需要將加權馬爾可夫預測的狀態值轉化為具體數值,夏樂天[10]認為可以采用隨機數學或模糊數學的方法予以推斷,例如采用狀態特征值結合線性插值法進行推斷。
計算狀態特征值公式為:
(5)

(6)
式中:
本例中,β取1.1,根據式(5)可以算出μ為4.728。用式(6)可得61期殘差預測值:
同理剩下的11期殘差值根據同樣的方法預測,但是為了保證實驗的準確性與時效性,每預測出新一期的數據就要替換掉一期的樣本數據,從第1期開始。
因為ARIMA模型較為簡單,只需內生變量而不需要其他外生變量,其實本質上只能預測線性關系,不能預測非線性關系[11],單一模型預測會存在誤差,所以采用馬爾可夫模型預測的殘差修正ARIMA模型:
Tt=yt+x
(7)
根據式(7)可繪制修正后的預測值、ARIMA模型的預測值和真實值的曲線擬合如圖7所示。

圖7 擬合曲線圖
可以看出,被修正的預測值每一期都比ARIMA模型預測值更接近真實值。為了更明顯地看出修正模型較ARIMA模型預測的精度更高,本文分別計算了兩個模型預測的平均相對誤差,如表5所示。

表5 模型誤差對比 %
可以看出,被修正模型的相對誤差對比單一ARIMA模型相對誤差大大降低,平均降低19%。隨著預測期數的增加,加權馬爾可夫對于模型修正的效果也逐漸降低,但是整體模型的預測精度還是達到了一個比較好的效果,所以在預測時并不是預測期數可以無限長,需要選取適當的預測期數,才能達到理想的效果。
本文分別采用加權馬爾可夫殘差修正的ARIMA模型與單一ARIMA對“育鯤”輪海水出口溫度進行預測,結果顯示加權馬爾可夫鏈修正的ARIMA模型達到了更好的預測效果,對于12期的預測數據,在精度上有顯著提升。該模型對海水出口溫度預測精度的提高,為早日做到將事后維修轉化為視情維修奠定了基礎,同樣也對船舶其他系統及設備故障預測方面提供很好的借鑒。