王富銀,鄭學林
(上海海事大學商船學院,上海200135)
故障樹分析法(Fau lt Tree A nalysis)是一種將系統故障形成原因按樹枝狀逐級細化的圖形演繹方法,是20世紀60年代發展起來的用于對系統可靠性、安全性分析和風險評價的一種方法。它通過對可能造成系統故障的各種因素(包括硬件、軟件、環境、人為因素等)進行分析,畫出邏輯框圖(即故障樹),再對系統中發生的故障事件,作由總體至部分按樹枝狀逐級細化的分析,并對系統在方案與初步設計階段進行可靠性、安全性分析,常用于系統的故障分析、預測和診斷,找出系統的薄弱環節,以便在設計、制造和使用中采取相應的改進措施。FTA以系統最不希望出現的故障狀態作為分析的目標(頂事件),找出能導致這一故障發生的全部因素(中間事件),再尋找出造成中間事件發生的全部因素,按此方式一直追溯到引起系統發生故障的全部原因(底事件),將系統的故障與中間事件、底事件之間的邏輯關系用邏輯門聯結起來,形成樹形圖,以表示系統與產生原因之間的關系;并通過計算找出系統發生故障和不發生故障的各種途徑;利用概率論方法計算系統出現故障的概率,評價引發系統故障的各種因素的相關重要度。
故障樹的建造是FTA法的關鍵,故障樹建造的完善程度將直接影響其定性分析和定量計算的準確性。實際上建樹過程常常是一種反復的過程,應廣泛吸取和掌握設計、使用等方面的知識和經驗,對系統進行仔細、透徹地分析,多次討論、修改,將會使建造的故障樹更完善。目前還沒有一種有效的統一建樹方法,但通常采用的是演繹法建樹。該法是先選定系統中不希望發生的故障事件為頂端事件,其后是找出直接導致頂端事件發生的各種可能因素或因素組合,如硬件故障、軟件故障、環境因素、人為因素等。再找出各因素的直接原因。循此方法逐級向下演繹,一直追溯到引起系統發生故障的全部原因,即分析到不需要繼續分析原因的底事件為止。然后,把各級事件用相應的符號和適合于它們之間邏輯關系的邏輯門與頂端事件相連接,就建成了一棵以頂事件為根,中間事件為節,底事件為葉的具有若干級的樹。
故障樹分析的過程是一個對系統更深入認識的過程,它要求分析人員把握系統的內在聯系,弄清各種潛在因素對故障發生影響的途徑和程度,以便在分析過程中發現問題,找出零、部件故障與系統的邏輯關系,以確定系統的薄弱環節。建樹的步驟如圖1所示。

圖1 建樹步驟示意圖
故障樹分析法是故障事件在一定條件下的邏輯推理方法。在清晰的故障樹圖形下,顯示出系統故障內在聯系,并反映零部件故障與系統之間的邏輯關系,便于圍繞某些特定的故障樹狀態作層層深入的分析,故建樹時應遵循以下原則。
(1)建樹前應對所分析系統有深刻了解,廣泛收集有關系統設計運行流程圖、設備技術規范等描述系統的技術文件和資料,并進行深入細致的分析研究。
(2)對故障事件應精確定義,指明故障是什么,在何種條件下發生,即應有唯一解,切忌模棱兩可,含糊不清。
(3)選好頂端事件,選擇的頂端事件必須是能進一步分解的,即可以找出其發生的次級事件,并且能夠用數值度量的。否則,就有可能無法對事件進行分析和計算。
(4)合理確定系統的邊界條件,邊界條件包括確定頂事件、確定初始條件、確定不許可事件、以及作出一些必要的假設,不考慮人為失誤等均可為系統的邊界條件,有了邊界條件才明確了故障樹建到何處為止。
(5)對系統中各事件的邏輯關系及限定條件必須分清楚,不能產生邏輯關系上的紊亂和限定條件之間的矛盾。
由于故障樹是構成它的全部底事件的“與”和“或”的邏輯關系連接而成,因而可以用結構函數作為數學工具,建立故障樹的數學表達式,以便于對故障作為定性分析和定量計算。
為了簡化起見,假設所分析的零部件和系統只能取兩種狀態,即正常或故障;且假設零部件的故障是相互獨立的。現以由n個相互獨立的底事件構成的故障樹為研究對象。底事件的狀態,采用狀態變量 xi(i=1,2,3)表示,則表示為:

系統頂事件 T的狀態,采用狀態變量φ表示,則φ必然是底事件狀態變量xi的函數。φ=φ(x)=φ(x1,x2,……,xn),則表示為:

式中,X=(x1,x2,……,xn),稱 φ(x)為故障樹的結構函數,是表示系統狀態的一種布爾函數。
故障樹定性分析的主要目的是為了弄清系統出現某種故障(頂事件)有多少種可能性。如果某幾個底事件的集合失效時,將引起系統故障的發生,則這個集合就稱為割集。這就是說,一個割集代表了子系統發生故障的一種可能性,即一種失效模式;與此相反,一個路集,則代表了一種成功可能性,即系統不發生故障的底事件的集合。一個最小割集則是指包含有最小數量,而又最必需的底事件的割集,而全部最小割集的完整集合則代表了給定系統的全部故障。因此,最小割集的意義就在于它描述了處于故障狀態的系統中必需修理的故障,它指出了系統中最薄弱的環節。定性分析的主要任務也就在于確定系統所有的最小割集。
故障樹定量分析的主要任務是根據其結構函數和底事件(即系統基本故障事件)的發生概率,應用邏輯與、邏輯或的概率計算公式,定量地評定故障樹頂事件出現的概率。故障樹定量分析的另一個是關于事件重要度的計算。一個故障樹往往包含多個底事件,各個底事件在故障樹中的重要性,必然因它們所代表的元件(或部件)在系統中的位置(或作用)的不同而不同。因此,底事件的發生在頂事件的發生中所作的貢獻稱為底事件的重要度。底事件的重要度在確定系統需要監控的部位、確定系統故障診斷方案有著重要的作用。
冷藏集裝箱制冷機組故障樹的構建,可根據各部件之間的結構關系、功能關系、各部件技術故障的邏輯關系等構建,有時可把各種關系結合起來共同應用。機組循環系統本身的故障通常可分為兩類,即硬故障和“亞健康”故障。所謂硬故障是指故障突然發生,從而使系統不能運轉或不能滿足冷藏集裝箱的制冷要求。所謂“亞健康”故障,是指系統逐漸產生的、致使系統的效率下降,設備的壽命降低,造成過多的能量消耗的運行狀態。下面根據調研結果及專家經驗,建立一個冷藏集裝箱制冷機組的典型硬故障-制冷機組不啟動的故障樹。機組不啟動的故障樹如圖2,其故障診斷流程圖如圖3。

圖2 制冷機組不啟動故障樹
由下面的診斷流程圖3可以很快找出故障的原因,所以硬故障只要結合各種實際采集的參數及其相應的故障樹,就可以很快查找出故障的原因,然后采取相應的措施進行維修管理。而在現實的使用過程中往往是系統的“亞健康”故障比較難查找,而且不易察覺。而為了實現冷藏集裝箱故障遙測系統中故障的預報預警就要挖掘出“亞健康”故障時系統的運行參數之間的關系,建立起相應的邏輯關系,以實現故障的預報,從而提前通知有關人員進行維護保養,防止發生故障而引起貨損貨差。

圖3 制冷機組不啟動故障診斷流程圖
在冷藏集裝箱的管理運行中,箱內溫度是需要控制的重要參數,而與箱內溫度直接相連的就是制冷機組的制冷量。因此接下來就從機組運行但制冷不良,效率低下這一“亞健康”故障做具體的分析,建立一個典型的故障范例。根據專家經驗,導致機組運行但制冷不良,效率低下的故障現象有制冷循環系統故障、電氣控制系統故障,具體情況見表1所示。根據調研和專家經驗,下面將給出換熱器故障的故障樹,見圖4所示。

表1 機組運行但制冷不良,效率低下“亞健康”故障集合表

圖4 換熱器故障樹
建起了冷藏集裝箱制冷機組的典型故障樹,依靠故障樹分析的理論,就可以對故障樹中各事件的重要度進行分析。以此為依據來確定系統需要監控的部位和系統的故障診斷方案。但是冷藏集裝箱的發展歷史并不是很長,所以有關其故障的研究就比較少,其各部件故障發生的先驗概率是很難確定的。
[1]史定華,王松瑞.故障樹分析技術和理論[M].北京:北京師范大學出版社,1993.
[2]冒天誠.故障樹與船舶自動控制系統的故障診斷[M].大連:大連海事大學出版社,2000.
[3]江彥橋,王世良.冷藏集裝箱制冷機組可靠性統計分析[J].上海海運學院學報,1994,15(3):79~84.
[4]許化東.基于故障樹分析法的汽車故障診斷專家系統的研究[D].合肥:合肥工業大學,2002.
[5]高 剛.冷藏集裝箱CARRIER制冷機組常見的報警現象釋介和清除[J].航海技術,1999(2):71~72.