高澤宇,張鵬,張博深,張躍文,孫培廷
大連海事大學 輪機工程學院,遼寧 大連 116026
智能機艙作為智能船舶的重要組成部分,需要利用船舶機艙系統的設備狀態監測參數,對異常情況進行報警,并對運行狀態和健康狀況進行智能分析評估,從而為系統設備的使用、操控、檢修、管理等提供決策支持[1]。
目前,船舶動力系統的設備狀態評估和監控報警一般采用固定閾值法進行判斷,其中固定閾值可以根據出廠試驗、實船測試和經驗分析等予以確定。常用的閾值確定方法包括置信區間閾值法、均值方差標準閾值法[2]和閾值走廊方法[3]等。如果閾值設置過高,會使報警靈敏度降低,進而導致報警系統無法正常工作;如果閾值設置過低,則會使虛警率升高,進而導致報警泛濫。此外,支持向量機預測模型已被廣泛應用于狀態監控[4],而船舶動力裝置智能診斷系統也被開發并應用于船舶系統狀態評估[5]。然而,上述工作都沒有根據設備運行的實際情況進行閾值的自適應更新,這將導致監控系統的誤報警以及對設備運行基準與參數的判斷偏差,最終無法完成準確的智能控制及輔助決策。
基于上述問題以及智能船舶的實際需求,本文擬提出一種回歸支持向量機(support vector regression,SVR)預測模型與滑動時間窗相結合的自適應閾值模型。首先,采用模擬退火算法優化支持向量機模型中的超參數C和g,并對船舶動力系統設備的常規狀態特征參數進行建模預測;然后,通過Johnson 分布體系將建模殘差數據轉化為正態數據,并利用滑動時間窗方法計算自適應閾值,用于智能船舶動力系統設備的監控報警和狀態評估。該方法可以根據設備運行過程中的實時狀態參數確定自適應閾值,以減小閾值帶寬并降低虛警率,從而提高船舶動力系統設備狀態評估的精確度。
作為船舶機艙的重要組成部分,智能船舶動力系統主要包括主推進柴油機、柴油發電機組、推進軸系、燃油系統、潤滑油系統和冷卻水系統等。動力系統設備的常規狀態特征參數包括壓力、溫度、流量和轉速等,然而,對于振動類數據而言,由于其自身頻率過高,而本文模型計算的時效性不足,故此類數據不在本文的考慮范圍之內。設備的運行狀態可以采用單參數法或多參數法進行描述,例如,主推進柴油機的運行狀態可以選擇排煙溫度進行單參數描述,而冷卻系統的運行狀態則選擇壓力、壓差和溫度等多參數進行描述。由于船舶動力系統的工況復雜多變,受其自身固有的不確定性以及因負載、操作和工作環境變化不確定性的影響,所以智能船舶動力系統設備的常規狀態特征參數閾值的變化范圍較大,如果仍然采用固定閾值進行監控報警和狀態評估,將導致較大的評估偏差。為解決這一問題,本文將選擇智能船舶動力系統的常規狀態特征參數作為樣本集,并分析自適應閾值方法。
回歸支持向量機是在支持向量機(support vector machine,SVM)的基礎上發展而來,其考慮了樣本受退化和工況等多種因素影響的結果,具有較強的魯棒性,適于解決回歸預測問題。本文將選用ε-SVR 模型對智能船舶動力系統的狀態參數進行預測[6-7]。

假設給定的訓練樣本集D和 函數集F為:式中:xi,yi分 別為第i個 輸入樣本數據和第i個輸出樣本數據;R 為實數集;n為樣本維度;f(x)為非線性回歸函數;w為權向量,wT為權向量的轉置;b為偏置量。
回歸問題的求解過程即為找到一個函數f(x)∈F,以使該函數在訓練樣本x(x∈Rn)上的值f(x)與 樣本期望值y的誤差小于或等于給定的偏差值ε。
選擇權向量w和偏置量b,將下列規劃問題進行最優化處理:


式中:ai,aj分別為第i,j個變量對應的拉格朗日

本文將在Matlab 軟件環境下,添加 LIBSVM工具箱以建立SVR 預測模型,其中SVR 預測模型算法的具體步驟如下[8]:
1) 選擇船舶動力系統設備的常規狀態特征參數監測數據作為樣本集,并按時序劃分為訓練集和預測集。
2) 數據預處理。將訓練集和預測集進行歸一化處理,將其映射到 [0,1] 區間,其中歸一化函數為

3) 確定核函數。核函數的選擇必須滿足Mercer 條件(任何半正定的函數都可作為核函數),本文將選擇高斯徑向基核函數(radial basis function,RBF):

式中, σ為核寬度參數。
4) 選擇并優化SVR 中的超參數C(懲罰系數)和g(核函數中 σ的數值)。
5) 采用優化之后的超參數C和g對訓練集進行訓練。
6) 采用測試樣本集對SVR 預測模型進行預測與驗證。
由1.2 節可知,SVR 模型的核心問題是懲罰系數C和核函數參數g的選取。本文將采用模擬退火(simulated annealing,SA)算法對 ε?SVR的超參數C和g進行優化,其中Metropolis 準則是模擬退火算法收斂于全局最優解的關鍵所在,具體如下:

式中:p為接受新解的概率;xnew為新狀態,S(xnew)為新解的能量;xold為當前狀態,S(xold)為當前解的能量;T為當前溫度。
通過迭代方式更新目標函數的最優解時,如果新解的能量小于當前解,則直接接受新解;否則,不直接否定新解,而是以一定的概率接受比當前解更差的解,從而使算法跳離局部最優解,并最終獲得全局最優解[9]。如圖1 所示,假設初始解在圖中A 點處,算法沿迭代方向收斂于局部最優解B 點,但程序不會在此終止,而是根據Metropolis準則以一定的概率接受比B 點更差的解(C 點),從而跳出局部最優解,并最終收斂于全局最優解D 點。

圖1 模擬退火算法的尋優示意圖Fig. 1 Optimization diagram of simulated annealing algorithm
SA 算法的具體實現步驟如下:
1) 初始化。選擇足夠大的初始溫度值T0,令T=T0,然后任意選取初始解S1作為算法迭代的起點,并設定每個溫度下的最大迭代次數L和結束溫度值Tend。
2) 針對當前溫度T和迭代次數k(其中k=1,2,···,L),隨機產生一個新解S2。
3) 計 算 增 量?f=f(S2) ?f(S1),其 中f(S1),f(S2)分別為S1和S2的評價函數。
4) 如果?f< 0,則接受S2作為新的當前解,令S1=S2;如果概率p= exp(??f/T)大于0~1 之間的隨機數rand (0,1),則仍采用S2替代S1成為新的當前解,即令S1=S2;否則,保留當前解S1。
5) 退溫操作。設置降溫速度q,以及第k次和第k+1 次迭代的溫度值Tk,Tk+1,其中Tk+1=q×Tk。如果Tk+1<Tend,則停止迭代,輸出當前解作為全局最優解,并終止算法;否則,返回步驟2),重復步驟2)~5)。
算法流程如圖2 所示。SA 算法與初始值的選擇無關,根據Metropolis 準則,在搜索過程中可以按照一定的概率接受惡化解,從而跳出某局部最優解;此外,該算法具有漸近收斂性,且結構相對清晰[10]。因此,基于 SA 算法對 ε?SVR預測模型的參數進行尋優,可以有效提高模型的預測精度。

圖2 模擬退火算法流程圖Fig. 2 Flow chart of simulated annealing algorithm
根據SA-SVR 模型計算的預測數據和真實數據之間的殘差,即可得出智能船舶動力系統設備運行狀態的評估誤差,具體表現為某種未知分布。因此,需對殘差數據進行正態轉化,在殘差符合正態分布假設的前提下計算自適應閾值[11]。本文將選用Johnson 分布體系對建模殘差變量X進行正態轉化,建立SB,SL,SU(下標B,L,U 分別表示X為有界、對數正態和無界)三族分布,具體如表1所示。表1 中:h為標準正態分布; γ , η和 δ, λ分別為Johnson 曲線的位置參數和標度參數。
利用表 1 中的函數,即可將建模殘差變量X轉化為標準正態分布h,具體步驟如下:
1) 按照 Slifker 等[12]的方法,選定任意正數z。



3) 利用關系式iJ=s?Φ(ζJ)+0.5,計算樣本的第iJ順序觀測值,其中s為樣本總數。
4) 對樣本數據進行線性擬合,求得擬合函數g(i), 然后計算樣本的分位值XiJ=g(iJ),分位值設定如下:X?3z=Xi1,X?z=Xi2,Xz=Xi3,X3z=Xi4。
5) 令參數m=X3z?Xz,n=X?z?X?3z,p=Xz?X?z,設定分位值比率QR=mn/p2。
6) 利用分位值比率QR區分Johnson 分布體系中的3 個分布族,區分準則為:當QR<1時,選擇SB分布;當QR=1時 ,選擇SL分布;當QR>1時,選擇SU分布。
7) 選定分布形式后,利用下列公式計算3 種轉換類型的具體參數。
(1) 對于SB分布:
8) 根據選定的分布形式,利用表1 即可計算正態轉化之后的h值。
殘差數據經過正態轉化之后,即可在Matlab 中進行KS-檢驗 (Kolmogorov-Smirnov test),如果驗證的輸出結果為0,即表示轉化之后的數據符合標準正態分布。殘差數據正態轉化前后的正態概率圖和頻數分布直方圖分別如圖3 和圖4 所示。

圖3 正態概率圖Fig. 3 Normal probability plot

圖4 頻數分布直方圖Fig. 4 Frequency distribution histogram
在圖3 中,采用藍色“+”標記繪制每個殘差數據點的經驗概率,采用紅色實線參考線連接數據的第1 和第3 個四分位數,并采用紅色虛線參考線將實線延伸到數據的兩端。如果所有的樣本點都在紅色參考線附近,則假設樣本服從正態分布;如果樣本不服從正態分布,則“+”將構成一條曲線。由圖3 可以看出,殘差數據在進行正態轉化之前,正態概率圖中的“+”未沿紅色參考線分布,構成了一條曲線,而經過正態轉化之后,藍色“+”標記相對接近紅色參考線。由圖4 可以看出,殘差數據經過正態轉化之后的頻數分布直方圖非常接近紅色的正態分布曲線,驗證了利用本文方法進行正態轉化的可行性。
將殘差數據進行正態轉化之后,即可根據表1中的公式進行閾值計算,具體步驟如下所示。
1) 根據拉依達準則,確定標準正態分布h的閾值區間 ?v≤h≤v,其中v為最大閾值。
2) 根據選定的分布形式,利用下列公式計算X的閾值。

基于上述閾值計算流程,引入滑動時間窗來實現閾值的自適應。首先,假設存在一個窗口包含s個建模殘差數據,對其中的數據進行正態轉化;然后,按照上述方法計算其閾值,并求取平均值作為此時的閾值;最后,保證窗口的數據總數不變,逐幀向后滑動窗口,重復上述計算,依次得到每一個時刻的閾值,從而實現閾值的自適應。由于窗口的大小將直接影響閾值的準確性和對異常數據的敏感性,因此需根據實際工況對窗口大小進行相應的調整[3,13]。
根據狀態監測的歷史數據建立預測模型之后,即可模擬隊列尾插法,利用實時測量的狀態監測值不斷更新模型的訓練樣本和預測樣本,并重復當前模型的計算過程。此外,基于RBF 的ε?SVR預測模型在構建時已經考慮了退化和不同工況條件的影響,所以不需要更新模型即可實現實時自適應閾值的計算。
智能船舶動力系統設備自適應閾值模型的建立流程如圖5 所示。

圖5 自適應閾值模型的流程圖Fig. 5 Flow chart of dynamic adaptive threshold model
本文將選取某船舶動力系統設備的正常運行狀態特征參數進行方法驗證。在參數選取過程中,如果滑動窗口的尺寸過大,即窗口內的數據量過多,將減弱單組數據對計算結果的影響,進而降低模型的靈敏度,那么閾值結果所反映的參數變化會相應地出現延遲;如果滑動窗口的尺寸過小,將增強隨機誤差的影響,可能導致模型過于靈敏,進而降低評估結果的準確性。經綜合考慮,本文將窗口尺寸設定為50,以兼顧評估結果的延遲性要求和模型的靈敏性要求,自適應閾值的計算結果如圖6 所示。

圖6 自適應閾值模型的方法驗證Fig. 6 Verification of dynamic adaptive threshold model
圖6 中的紅色實線為智能船舶動力系統設備的傳統固定閾值線,藍色實線為實時狀態參數曲線,綠色實線為自適應閾值曲線。由圖6 可以看出,與傳統固定閾值相比,自適應閾值更為契合船舶動力系統設備的實時狀態參數,其閾值帶寬更為緊湊,可以提高閾值的靈敏度。在監控報警方面,可以改善因固定閾值設置過高而導致的設備出現異常情況卻不進行報警的缺陷,有利于優化船舶動力系統設備的維修與管理工作。同時,自適應閾值通過提高閾值精度,可以更準確地反映船舶動力系統設備的實際運行情況,從而為智能船舶動力系統設備的狀態評估和輔助決策提供更加合理、有效的參考基準。
主推進柴油機的運行狀態可以采用單參數,即“排煙溫度”進行描述。選取某船舶主推進柴油機的排煙溫度異常數據作為驗證數據,其中實船數據的采集周期為1 s,對所建立的自適應閾值模型進行異常數據驗證,結果如圖7 所示。

圖7 自適應閾值模型的異常數據驗證Fig. 7 Anomaly data verification of dynamic adaptive threshold model
由圖7 可以看出,與傳統固定閾值相比,自適應閾值在主機排煙溫度異常升高時,可以提前92 s成功檢測出異常并報警。由此可見,該方法克服了固定閾值對于動力系統設備對異常工況不敏感的缺點,提高了智能船舶監控報警系統的效率,可為系統狀態評估和輔助決策提供更精確的數據。
本文提出了智能船舶動力系統設備的常規狀態特征參數的自適應閾值模型。首先,在閾值自適應優化過程中,采用SA 算法優化SVR 預測模型,實現了對狀態特征參數的預測;然后,對預測數據及實際數據計算殘差,并結合Johnson 分布系統實現了自適應閾值計算。根據實船運行數據的驗證結果,作為參考閾值,自適應閾值與傳動固定閾值相比其帶寬更窄,在設備異常時具有更好的適應性,可以更早地實現故障預警,從而為船舶管理人員提供更充裕的決策時間。此外,自適應閾值與實時監控數據的相關性更緊密,其變化趨勢可以作為智能船舶狀態評估及壽命預測的參考基準。