趙俊超, 汪佳彪, 艾麥提布拉丁, 王起碩, 毛冬麟
(上海船舶設備研究所, 上海 200030)
當前,隨著科技的不斷進步,機械設備正朝著精密化、自動化和智能化方向發展,這些先進設備在提高生產效率、提升產品質量和節約生產成本的同時,也帶來了高昂的維護和保障成本[1]。傳統的船用柴油發電機組診斷基本上為故障診斷,即根據機組出現異常時的參數和狀態,或在機組發生故障之后對其進行拆檢,判斷引發故障的原因并進行處理,這種方式效率低、成本高,無法提前判斷機組的運行狀態并預防故障發生。若機組在運行過程中發生故障,輕則導致機組停機,重則影響船舶的正常運行。
本文以船用柴油發電機組為研究對象,采集功率、轉速和滑油溫度等大量機組運行參數,采用統計學方法分析數據特征,采用專家經驗法分析故障類型及相應特征,通過機器學習進行相應訓練,得到一套機組故障識別算法。在此基礎上,搭建一套機組健康診斷系統,對機組的運行狀態進行監測、分類和識別,實現對機組的健康狀態診斷、故障預測和故障報警。
統計學的基本原理是基于概率論思維建立一種數學模型,通過收集與所觀察系統有關的數據,對其進行數理分析和歸納總結,找出主要規律和特征,為制訂相關決策提供科學依據。隨著科技的飛速發展,當前統計學不斷吸收和融合新理論,已在很多領域得到應用[2]。
本文以實驗室現有的某型船用柴油發電機組為試驗對象,采集機組的功率、轉速、排氣溫度、滑油溫度、滑油壓力、冷卻水溫度、冷卻水壓力、海水溫度和罩內空氣溫度等參數。數據采集頻率為1 Hz,1個工作周期為8 h。對采集到的參數進行歸一化處理,并繪制成曲線圖,結果見圖1。從圖1中可看出機組運行時其基本參數的變化趨勢。

圖1 機組運行參數統計
由圖1可初步分析出機組參數具有以下表象特征:
1) 轉速隨功率的升高而下降;
2) 排氣溫度、罩內空氣溫度和冷卻水溫度分別與功率成正相關關系;
3) 滑油溫度的升高相較冷卻水溫度的升高有所延遲;
4) 海水泵壓力幾乎沒有變化,與功率和轉速無關;
5) 柴油機滑油壓力與轉速成正相關關系,轉速越高,壓力越大;
6) 海水泵后溫度幾乎不變;
7) 冷卻水壓力與轉速成正相關關系;
8) 部分缸排溫偶爾出現異常波動。
以上表象特征可關聯柴油發電機組的運行原理和內部特性,如:1)為機組的下垂特性;2)和3)是熱擴散導致的;4)的原因為海水泵由外部供電,不受機組運行的影響;5)和6)的原因為滑油泵和淡水泵均為機帶泵,受機組轉速的影響;7)的原因為試驗用海水為外部水源,其泵后溫度僅受外部環境溫度的影響;8)為傳感器故障導致的數據采集波動。
因此,可簡單地將以上關聯變量擬合為一個具體的公式。例如,可采用最小二乘法將排溫均值與功率擬合為圖2所示的曲線。

圖2 柴油發電機組排溫均值與功率擬合曲線
擬合曲線的函數表達式為
y=8.12×10-9x3-6.45×10-5x2+0.22x+b
(1)
式(1)中:b為不同氣缸的修正值。因此,可根據該曲線和機組當前運行功率計算出排溫理論值,通過設置合適的b值限定排溫上下限,將實際測量的排溫與計算出的排溫范圍相比較,判斷機組氣缸運行是否異常。
類似地,可采用相同的方法對機組其他參數進行判斷。
在對機組運行參數進行分析的基礎上,進行機組健康評分計算。機組結構復雜,健康構成參數眾多,不同傳感器提供的信息都存在局限性和不確定性,單獨根據某臺傳感器檢測的參數判斷設備的健康狀態會出現較大的誤差。因此,需對不同傳感器的數據進行整理、分析和判斷,根據某種優化準則將互補、冗余的信息組合起來,產生對觀測對象的一致性解釋和描述,由此提高信息的可信度和系統的容錯能力[3]。
本文采用層次分析法進行機組健康評分計算,統一量化各項指標,根據不同指標對決策目標的影響程度和實際情況分配權重[4],在綜合分析各參數在保證機組正常運行方面的重要性之后,合理選擇最能反映機組運行狀態的指標。本文選用的柴油發電機組運行狀態評估指標見圖3。

圖3 柴油發電機組性能綜合評估指標體系
機組健康評分的計算式為
P=u1+u2+u3
(2)
u1=u11+…+u17
(3)
u14=u14A1+…+u14An+u14B1+…+u14Bn
(4)
式(2)~式(4)中:P為機組實際健康評分;u1為柴油機評分;u2為發電機評分;u3為電品質評分;u11為轉速評分;u17為滑油壓力評分;u14為排溫評分;u14An為An排溫評分;u14Bn為Bn排溫評分。
同時,引入參數劣化度g(劣化度即機組某參數實際狀態與故障狀態相比的劣化程度),其取值范圍為[0, 1]。當參數在正常范圍內時,劣化度為0,此時的健康值為100;當參數的取值逐漸接近并超過報警限值時,劣化度由0逐漸變為1,此時的健康值變為0或60(具體數值根據參數的重要程度確定,例如:當停機類故障劣化度為1時,健康值為0;當不影響機組短時間正常運行的故障劣化度為1時,健康值為60)。若某個因素是由若干個子因素構成的,為提高系統的安全性,該因素的劣化度取其子因素的劣化度的最大值。
機組設備結構復雜,參數繁多,其綜合評價由多個參數共同決定,若單純對多個參數的健康值求平均值,將其作為系統的健康值,則當某個參數發生劣化時,系統評分可能會被其他健康評分平均掉,從而無法顯示系統真實的健康狀態。因此,機組健康評分應采用某種合適的權重分配。
本文采用隨劣化度變化的動態權重分配法對機組健康評分進行權重分配:當某一運行參數在正常范圍內時(此時劣化度為0),其權重為初始權重;當參數的運行狀態發生變化時,其權重開始增加;當參數的取值超出報警限值時,其權重變為1。如此便可將故障直觀地顯示在機組的綜合評估結果中。同時,權重值不呈線性變化,其在參數開始劣化時緩慢變化,當劣化度較大(如大于0.6)時,權重增長速度變快,迅速變為1,將故障參數的變化迅速體現在整體系統中[5]。
機組健康評估原理見圖4,將機組參數作為輸入變量,可實時得到機組在當前狀態下運行的健康指數。圖5為某時段機組健康狀態評分變化曲線與同時段采集到的機組部分設備參數變化曲線對比。

圖4 機組健康評估原理

圖5 某時段機組健康狀態評分變化曲線與同時段采集到的機組部分設備參數變化曲線對比
在得到健康評分之后,預測機組健康評分下降的原因,即在機組出現異常時,能通過異常參數判斷出機組發生故障的原因,從而實現健康診斷。故障判斷方法有很多,其中專家系統是近幾年設備故障診斷領域廣泛采用的方法之一,內容包括診斷知識的表達、診斷推理方法、不確定性推理和診斷知識的獲取等。隨著計算機科學和人工智能的不斷發展,基于專家系統的故障診斷方法克服了基于模型的故障診斷方法對模型的過度依賴,是開展故障檢測的有效方法,已在很多領域得到應用[5]。
基于專家系統的故障診斷方法的原理為:當系統發生故障時,相關領域的專家可根據故障發生前后系統的運行參數和設備狀態,根據對系統結構及相關歷史故障的深刻了解迅速作出判斷,確定故障發生的原因和部位。對于復雜系統的故障診斷而言,這種方法尤其有效。
在前期對機組的運行參數進行整理之后發現其中存在很多異常數據,對這些異常數據進行提取和歸納,根據專家經驗和歷史故障,將這些異常數據分為幾種類型,分別對應不同故障,其中特征明顯的4種故障及其數據特征如下。
1) 故障A:當機組功率發生變化時,某一參數劇烈抖動,持續一段時間之后恢復正常。
2) 故障B:在機組平穩運行過程中,某一參數突然增大(或變小),持續一段時間之后恢復正常。
3) 故障C:在機組平穩運行過程中,某一參數持續出現瞬間突變(尖峰)的情況。
4) 故障D:在機組平穩運行過程中,某一參數出現次數極少的偶發突變(尖峰)的情況。
上述4種典型故障的機組故障類型特征曲線見圖6。

圖6 4種典型故障的機組故障類型特征曲線
在對故障進行分類之后,需研究一種故障識別算法,使系統能在參數發生變化時準確識別出對應故障并做出相應提示。已有研究證明,機器學習算法在解決分類問題方面的效果優于傳統算法,尤其是在解決非線性分類問題方面[6]。因此,本文采用機器學習算法對數據進行訓練,得到一套機組故障識別算法,根據前期采集的參數對機組性能的描述情況,對不同數據進行規約,形成500組模型訓練數據集和模型測試數據集(訓練數據集中的數據占總數據的70%)。采用不同的機器學習算法對訓練數據集進行訓練,得到相關模型函數,采用測試數據集對模型函數進行驗證,并將驗證結果作為反饋優化訓練模型。
在綜合分析比較多種機器學習算法的特點和適用范圍之后,選用決策樹、KNN(K-Nearest Neighbor)和樸素貝葉斯網絡搭建機器學習模型。
1) 決策樹的原理為:類比樹狀結構的形式對數據進行分類,樹的每個葉節點對應1個分類,非葉節點對應某種屬性的劃分。決策樹的優點是可讀性好,對人工分析很有幫助[7]。本文在進行決策樹模型訓練時,將決策樹準則選為基尼系數,最大深度設為默認不限,分裂策略選擇最優的分裂策略,每個葉子節點需要的最少樣本數設為1個,并使各類別的權重相等。
2) KNN為限定半徑最近鄰近法,通過計算選擇最近質心來分類[8]。本文在進行KNN模型訓練時,將K值設定為5,近鄰樣本的權重選用uniform模式,限定半徑最近法算法選用auto模式,權衡選擇較優的算法。
3) 樸素貝葉斯的原理為:基于概率思想對數據進行分類,分別為先驗為高斯分布的樸素貝葉斯、先驗為多項式分布的樸素貝葉斯和先驗為伯努利分布的樸素貝葉斯[9]。由于本文中的數據認為是連續的,因此選用先驗為高斯分布的樸素貝葉斯算法,先驗率采用默認值,對模型進行訓練。
KNN算法常用于對非正態分布且密度函數未知的數據進行分類,對異常值不敏感;決策樹算法對數據處理的要求較高,需對數據進行分類,分類過程需面向問題本身,當數據量較大時,預測的準確度會下降;樸素貝葉斯算法對數據的要求較高,預測的準確度較高,通常在數據較少的情況下應用。
分別運用上述3種算法模型對訓練數據集進行訓練,采用測試數據集進行測試,得出3種機器學習算法在本文故障分類中的應用效果,選取其中3種故障的測試結果進行比較,結果見表1。

表1 3種機器學習算法應用效果比較
由表1可知:KNN算法的準確度約為65%,相對較低;決策樹算法和樸素貝葉斯算法的應用效果較好,準確度均在90%以上,符合算法的應用特性,滿足項目設計技術的需求,其中樸素貝葉斯算法的準確度在96%左右,效果最佳。
最終將前期得到的機組健康評分系統與故障識別算法相結合,建立完整的機組健康診斷系統(見圖7),將機組參數作為輸入變量,可實時得到機組在當前狀態下運行時的健康指數,若發生故障,則可自動通過故障識別算法對故障數據進行判斷,并在界面顯示相應故障。

圖7 柴油發電機組健康診斷系統
當前,受使用環境復雜、空間狹小等因素影響,船用柴油發電機組檢修較為困難,維護和維修成本高昂。若設備在運行過程中發生故障,且因無相關預警系統而未能及時發現并作相應處理,輕則導致設備停機,重則影響整個生產系統的正常運行。
本文研究的船用柴油發電機組健康診斷系統可對機組的運行狀態進行實時監測,實現對機組的健康狀態診斷、故障預測及故障報警,在實際應用之后,可建立一套通用型故障預測算法解決方案,為各類機械類設備、電力設備提供完整的故障診斷、故障預測智能化功能開發解決方案,從而降低企業的運營成本,提高設備的自動化程度。