王天語,王鴻東,梁曉鋒,易 宏
(1.上海交通大學 海洋工程國家重點實驗室,上海 200240;2.上海交通大學海洋智能裝備與系統教育部重點實驗室,上海 200240)
得益于現代工業,尤其是自動駕駛技術的迅猛發展,以及世界性的對于海洋軍事、商業問題興趣的增加,無人船領域在近幾年得到廣泛關注。智能無人船可以代替傳統船舶,在更加苛刻危險的環境條件下執行任務,或協助其進行大規模的商業貿易行動。與此同時,故障預測和健康管理(prognostic and health management,PHM)技術被用來進行對無人船系統和組件進行預期工作時間的分析,以提升無人船的工作效能。PHM 技術通過評估系統偏離正常運行條件的程度,預測組件的未來性能。通過監測磨損和老化的跡象,給出系統故障預警。將故障機制研究與生命周期管理進行關聯,從而實現即時評估無人船健康狀況,實現維修保障的智能輔助決策。
對于無人船而言,其PHM 技術需求與傳統船舶有所區別。傳統的船舶維修保障方式主要通過人工經驗對故障進行分析,以實驗的方法確定具體的故障內容,這種方式的準確性和時間效率已經難以滿足當前的要求。傳統的觀念中對于維修保障重要性的認識不夠、維修人員專業知識和技能儲備不足,船舶的安全性受到一定影響。由于無人船本身沒有隨行人員進行監控和維修,采用事后維修的方法難以滿足無人船的使用需求,這對無人船健康管理技術的實時性和自主性提出了要求。此外,相較于傳統船舶而言,無人船的控制、通信系統復雜度更高,而且執行任務的環境可能更加惡劣。因此,需要研發相應的自主檢測系統進行實時健康診斷,使無人船具備快速響應與處理復雜問題的能力。所研發的系統需要對無人船未來工況進行預測,并在故障發生前進行預警,達到預防性維修保障的目的。另一方面,近年來傳感器獲取實時狀態數據能力的增強,數據處理技術的發展和數據分析能力的提高,為無人船開展實時監測,并進行維修保障智能決策提供了條件。
傳統的PHM 方法主要包括基于物理模型、基于經驗模型或基于數據驅動等[1]。基于物理模型的方法在一定的物理基礎上建立模型,例如通過建立動力學模型計算載荷以估算剩余壽命等[2];基于經驗模型的方法則通過數學函數等形式,用無實際意義的參數描述模型,例如借助模糊邏輯的方法建立模型處理醫療診斷問題等[3]。基于數據驅動的方法則是利用已有的數據,進行建模分析,如在醫學診斷中常采用神經網絡[4]、支持向量機[5]等方式進行建模診斷分析。貝葉斯網絡是一種基于數據驅動的模型,可以完全依賴已有的數據進行結構學習和參數學習。貝葉斯網絡的方法已廣泛應用于國內外工程PHM 相關技術中。實例如JT Zhang 等[6]使用貝葉斯網絡量化海底系統的可靠性;Pui 等[7]利用貝葉斯網絡對海上鉆井作業進行了動態風險維護等,均是貝葉斯網絡模型在故障診斷與健康管理方面的成功應用。
PHM 技術在船舶系統的故障診斷與健康管理當中已經有了一些應用。美國麻省理工學院通過振動信號的采集和特征提取,研究了柴油機振動和主機壓力的關系,實現了對船舶主機的故障診斷[8]。劉晶等[9]利用網絡進行數據傳輸,針對船舶的機電控制設備故障診斷問題做出了研究,但該方法在實時性上有所欠缺。
本文針對無人船的PHM 問題,采用視情維修的策略,通過對無人船設備狀態進行實時監測,達到對設備未來狀態進行可靠預測的目的。通過動態貝葉斯網絡模型,建立無人船當前工作狀態與下一時刻健康狀態的關系,對船舶未來健康狀態進行實時評估,以滿足預防性維修保障的要求。通過全面的安全監控、異常預警、綜合診斷、故障預測與健康評估,可以充分評估船體在不同狀態下的實際工作能力,輔助岸上人員安排調整無人船的工作目標,較大提升無人船的任務實現能力。
貝葉斯網絡是一個概率圖模型,通過有向無環圖(directed acyclic graph, DAG)來表示一組隨機變量以及其中的依賴關系。這一概念最早由J.Pearl 在1982 年提出[10],用概率表定量表達每個節點和父子節點之間的條件概率[11]。網絡用節點表示論域中的隨機變量,其邊與一個節點對另外一個節點的直接影響相對應。由此帶來的組成成分是一系列的局部概率模型,用于表示每個變量對于其父節點依賴的本質[12]。
假設有全集U 包含n 個隨機變量X1, X2, ···, Xn,U={X1, X2, ···, Xn},那么其聯合概率可以表示為:

通過聯合概率的分布P(U),可以計算出各個邊際概率和條件概率。對于一組離散變量Xi,其統計證據以似然分布的形式出現,再通過網絡變量的觀察值在給定條件E 之下的條件概率:

在建立和使用貝葉斯網絡模型時,首先需要通過因果邏輯或其他結構學習進行貝葉斯網絡的結構學習,隨后根據已產生的數據集對網絡進行訓練,即進行參數學習。對于已建立起的貝葉斯網絡,通過對節點狀態觀測來判斷和預測系統故障。
為了研究現有模型當中的時序信息,使用動態貝葉斯網絡來學習和處理動態的系統模型[14]。動態貝葉斯網絡用來表達一個跟隨時間而不斷變化的模型,是一個跟隨毗鄰時間步驟把不同變量聯系起來的貝葉斯網絡,并且通過上一個時間點的模型推算當前時間點的模型取值。

圖 1 動態貝葉斯網絡圖Fig.1 Dynamic Bayesian network graph
如圖2 所示,假設故障原因A 和故障原因B 都會導致故障C,其在時間T0時刻的模型節點用A0, B0, C0表示,在其后毗鄰的時間點T1時刻的模型節點用A1,B1, C1表示,則在T1時刻內各個節點的父節點不再僅僅是原本的網絡結構中的父節點,同時增加了上一時刻的個節點的狀態。

圖 2 數據離散化示例Fig.2 Data discretization processing example
在對無人船開展PHM 工作時,首先要通過傳感器實時獲得船體的動態監測數據,通過數據處理才能進行后續的分析診斷。無人船的監測數據時序上是連續的,將其應用于貝葉斯網絡進行處理的前提是將連續數值離散化處理。在應用貝葉斯網絡等具有節點的智能決策模型時,離散的節點取值更便于快速運算與響應,因而信號數據最終的離散化處理能大大提升整體運算的性能。


式中:y 為節點的實時評分;k 為節點評分數目參數;e 為監測點期望值;x 為監測點觀察值;μmax為監測數值范圍最大值;μmin為監測數值范圍最小值;s 為監測節點敏感程度。
舉例說明其進行評分的方法。在給定的k 為10 情況下,評分可以劃為0~5 的6個離散取值,其對應的歸一化的偏離值X 與節點評分y 的關系如圖3 所示。

圖 3 全船PHM 模型Fig.3 Ship's PHM model
對于貝葉斯網絡模型,通過將各個節點的監測數值歸一化為簡單的評分機制,模型的運算量和復雜度將被大大降低,同時可以進行直觀在線顯示各個節點的工況,便于后續模型的構建和健康監測的設計處理。
本文選取上海交通大學海洋智能裝備與系統教育部重點實驗室設計、制造的風帆無人船[13]為例,進行PHM 的模型設計。選取的監測點包括全船表現、船體姿態、推進系統工況、船體結構健康、風帆系統工況、通信系統工況、控制系統工況8 個總體節點,以及每個節點對應子系統的節點構成貝葉斯網絡的變量。其底層節點由船體動態監測中的振動監測、電源電壓監測、陀螺儀和結構應力監測等完成。為了具體表現PHM 模型的應用場景,選取推進系統進行詳細的模型構建與檢測方案設計,并對模型性能進行測試評估。
振動分析是用于旋轉機械狀態監測的最成功的技術之一,是診斷電機等元件機械問題的一種非常高效和便捷的工具[16]。當機械結構發生異常時,振動的頻率和幅值會相應的發生變化。通過傳感器采集信號,將采集信號通過短時傅里葉變換進行提取,并與已知的故障模式進行比較,即可判斷出其工況以及潛在的故障可能[17]。
在該船的推進系統中主要選取主機、螺旋槳、軸系三部分作為貝葉斯網絡中的節點。根據振動類型的不同,推進系統中的振動可以分為扭轉振動、軸向振動、垂直軸系振動三類。
在船舶正常推進時,主機通過軸系連接螺旋槳,通過帶動軸系旋轉引發螺旋槳的旋轉,故該部分的旋轉振動由主機提供激勵,而扭轉振動的系統結構可以簡化為主機到軸系到螺旋槳的順序,其振動頻率應當與主機正常工作時設計的頻率相當。

圖 4 推進系統扭轉振動示意Fig.4 Thrust system torsional vibration
推進系統的軸向振動則是由螺旋槳傳遞到軸系再傳遞到主機。由于螺旋槳在轉動時單個槳葉在轉動起始點和終點處收到的水流作用不同,其軸向收到的推力也隨之發生變化。當螺旋槳連續旋轉時,在沿軸線方向會產生周期性的交替推里,即螺旋槳的軸向激勵,其頻率為螺旋槳每分鐘轉速乘以其槳葉數量。

圖 5 推進系統軸向振動示意Fig.5 Thrust system axial vibration
除此之外,推進系統工作時還會產生垂直于軸系的振動。由于軸的彎曲,軸的重心與軸的理想中心線不重合,因此當軸旋轉時,重心上的離心力將使其進一步遠離理想的中心線,從而導致其在垂直于軸系的方向發生振動。該振動的頻率應與其旋轉速度保持適應。
根據上述3 種振動監測方案設計,加之對于主機溫度的實時監控,可以構成推進系統的整體貝葉斯網絡,其結構如圖7 所示。

圖 6 推進系統垂直軸向振動示意Fig.6 Thrust system vertical axial vibration

圖 7 推進系統貝葉斯網絡模型Fig.7 Thrust system Bayesian network model
在動態貝葉斯模型中,相鄰2 個時間片中的貝葉斯網絡的底層節點被連接起來。在診斷過程中,故障信號往往不會隨時間而直接消失,即上一個時間片的故障特征很大程度上會保留至緊鄰的一個時間片中,其動態貝葉斯網絡模型如圖8 所示。隨后進行動態貝葉斯網絡模型進行簡化,相當于為底層節點依次增加1 個子節點,為對應的上個時間片的狀態。貝葉斯網絡可轉化為如圖9 所示模型進行表示,其中虛線連接部分節點表示上一個時間片中的節點數值。
通過無人船監測數據進行對樣本的參數學習,即可得到推進系統工況關于各個子節點取值的概率分布情況。根據式(2),令其中U 為節點推進系統工況的具體取值,E 為已有的觀測數值,即可得到在當前狀態下船舶推進系統健康狀態的預測分布,此即系統中進行的推理過程。對于動態貝葉斯網絡在健康管理系統中的運用的具體效果,給出算例加以演示。

圖 9 簡化動態貝葉斯網絡模型Fig.9 Simplified dynamic Bayesian network model
現將各個節點所對應觀測點健康狀況劃分為1~3 評分,分別代表危險、有風險和運行良好。在本系統中每次監測數據的輸入間隔為1 min,即2 個時間片之間的間隔為1 min。在此例中根據元件故障率及分布概率等條件模擬生成20 000 個樣本數據集,數據包括某一時間所有節點的取值情況,用以測試模型是否能準確反映故障分布的概率關系以及響應速度。模型通過MLE 參數學習的方式得到動態貝葉斯網絡的條件概率分布。取時間片T0樣本數據,并記其后3 個時間片分別為T1,T2,T3。T0時通過監測數據知所有節點數值均為3,即運行狀況良好。用TTi,FPTi,FETi,FSTi分別代表在Ti時刻的主機溫度、螺旋槳軸向振動頻率、主機扭轉振動頻率、軸系垂向振動頻率4 個節點的取值,用Th 代表推進系統工況節點的數值,則有TT0=FPT0=FET0=FST0=3,將其作為觀測值代入T1時刻的動態貝葉斯網絡,可根據式(2)分別得到P(Th=1|E),P(Th=2|E),P(Th=3|E)的取值概率分布如表1所示。

表 1 T1 時刻Th 節點狀態概率分布Tab.1 Th node state probability distribution at time T1
在T1前所有節點工作正常,而在T1時刻由于軸系偏心加大等原因,軸系垂向振動頻率明顯偏離正常取值,即FST1節點數值降至2,其他節點數值保持不變。將TT1=FPT1=FET1=3,FST0=2 作為觀測值代入T2時刻的動態貝葉斯網絡,對此時的貝葉斯網絡做條件概率分布因式分解得到當前網絡的Th 節點取值概率分布,可以得到其概率分布如表2 所示。

表 2 T2 時刻Th 節點狀態概率分布Tab.2 Th node state probability distribution at time T2
動態貝葉斯網絡,對由于T1時刻軸系振動發生的變化,系統將認為在T2時刻系統有風險的概率大大增加。如果在T2時刻軸系垂向振動的偏離程度進一步加劇,即FST2節點數值降至1,其他節點數值保持不變,對應預測T3時刻的推進系統工況概率分布將如表3所示。
此時由于軸系振動已經達到了危險程度,系統預測在下一時刻推進系統整體評價為危險的概率大大上升。上述3 種情況指明了系統對于每個子節點變化進行風險評估的能力,通過將更復雜的、更多節點綜合成全船的動態貝葉斯網絡模型,可以對全船工作狀況進行實時監控與風險預測,達到健康管理的目的。

表 3 T3 時刻Th 節點狀態概率分布Tab.3 Th node state probability distribution at time T3
在上述算例中,船舶在T 2 時刻的有風險概率>0.5,而危險概率>0.3,即軸系振動帶來的潛在風險大于系統設定的閾值時,系統將選擇停止任務而進行靠港維修。同時對于在岸人員,系統可以根據軸系振動故障的可能原因和歷史故障案例,提供相應的排查建議和維修策略。采用動態貝葉斯網絡的方式避免了無人設備在發生故障時既無法完成既定任務,也無法維修的場景出現。動態貝葉斯網絡模型反映的是當前工況對下一時刻故障概率的影響,對于工作風險較大的無人船選擇停止任務尋求檢修,從而達到預先維修保養的目的。


根據上式,RPS 是一個處在0~1 之間的具體評分數值。顯而易見的是,預測概率越準確的模型,其RPS 數值就會越小。針對不同樣本學習情況的模型準確性,計算不同樣本數據大小的PRS 計算,其結果如圖10 所示。

圖 10 RPS 隨樣本數的變化Fig.10 RPS changes with the number of samples
當樣本數據過小時,故障信息并不完全,貝葉斯網絡中的部分概率分布會缺失,RPS 檢驗的評分較高。當進行參數學習所用的樣本數據集逐漸增加時,模型的RPS 評分迅速減小。當樣本數量達到15 000 個時,RPS 評分小于0.175,體現了模型對于當前故障信息的準確還原能力。在實際使用中,伴隨著獲得的故障信息逐步完善,模型準確預測故障避免風險的能力也會隨之提高。
對于實時監測的PHM 模型而言,除了需要能夠做出準確的判斷,還需要PHM 模型能在足夠短的時間內做出判斷,即擁有足夠的實時性。為了評價PHM 模型是否能夠快速響應,評價模型兩方面運算的速度,共分3個實驗組別進行5次實驗計算其平均耗時:1)模型對20 000 個樣本進行參數學習,更新概率分布所需的時間;2)系統根據當前所的觀測值進行推理計算,預測下一時間片健康程度的時間;3) 利用for 循環計算1~106的整數求和的時間。其中第3 組作為對照試驗組,以供不同系統工作平臺等進行參考,避免由于平臺算力差異帶來的問題。測試結果如表4 所示。

表 4 系統實時性測試結果Tab.4 System real-time test results
觀察測試結果可知,對于能夠勝任一般循環加法的計算平臺,模型的參數學習、推理計算等都有極快的運算速度。由于貝葉斯網絡方法本身系統復雜度小而系統編寫并未額外增加復雜度,本系統可以勝任實時監測推理計算的任務,顯示出較好的實時性,適合在無人船上進行實時監測的PHM 使用。
近年來,隨著無人船領域的發展,PHM 技術被用來進行對于其系統和組件進行預期工作時間的分析,以追求準確、即時的故障預測與風險評估。本文選取實驗室設計的無人船為具體研究對象,設計了基于動態貝葉斯網絡的無人船PHM 模型。基于動態貝葉斯網絡,對給出的算例進行時序分析,證明通過動態貝葉斯網絡進行船舶故障預警的可行性,完善了系統對于船舶健康管理方案的指導功能。基于動態貝葉斯網絡的無人船PHM 技術可以在故障發生前進行預警,從而調整無人船工作目的及時檢修,進行預防性維修保障工作。此外還對開發設計的PHM 模型進行準確性和實時性雙方面評價,根據排序概率評分評估方案的準確性,可知所研發的系統通過對于故障案例的學習,可以準確地還原船舶的故障分布情況。通過實時性評估可知系統可以快速響應做出故障預測,充分體現船體在不同狀態下的實際工作能力,輔助岸上人員安排調整無人船的工作目標,較大提升無人船的任務實現能力。在未來,無人船的PHM 技術可以涉及更多的船體系統并優化監測和評價方法,以求獲得更為準確、即時的船體健康狀態,充分評估船體在不同狀態下的實際工作能力。