張偉,賈瑤
(中國電子科技集團公司第三十六研究所,嘉興 314033)
系統(tǒng)工程中關于系統(tǒng)的定義為,是由相互聯系、相互作用的許多要素組成的具有特定功能的復合體。系統(tǒng)整體與構成系統(tǒng)的部分是相對而言的,整體中的某些部分可以看成是該系統(tǒng)的子系統(tǒng),而整個系統(tǒng)又可以成為一個更大規(guī)模系統(tǒng)中的一個組成部分或者子系統(tǒng)[1]。
所謂“系統(tǒng)可靠性”主要區(qū)別于一般的元器件、零部件和組件模塊的可靠性,它的研究對象是整個系統(tǒng)。系統(tǒng)可靠性分析方法又有區(qū)別于眼下比較流行的失效物理(Physics of Failure,PoF)法,失效物理研究方法是基于產品失效的實際物理過程,通過探究產品失效模式與失效根因,從而構建相應的失效物理模型,達到對于產品失效的定量化描述和評價的目的。顯然,失效物理研究方法不適用于系統(tǒng)可靠性評價問題,系統(tǒng)可靠性評價的核心目的在于達成針對對象產品的量化評價要求,即在數值上合理確定并最終給出對象產品的可靠性量化指標或稱可靠性特征量。
不同的系統(tǒng),不同的應用場合具有不同的可靠性分析手段,但研究系統(tǒng)可靠性的方法不外乎以下幾種,分別是可靠性框圖(RBD)法、故障樹分析(FTA)法、Markov分析法、Monte-Carlo仿真、GO法和Petri網等方法。本文以這六種系統(tǒng)可靠性分析方法為基礎,從方法的研究背景、原理、適用范圍出發(fā),闡述所謂“系統(tǒng)可靠性”分析方法的基本內涵與特征,在此基礎上,針對不同分析方法的特點,結合工程實踐與應用需求,對各種分析方法做了比較研究,研究結論供廣大工程人員在做系統(tǒng)可靠性分析選擇時參考。
可靠性框圖法為各種系統(tǒng)可靠性分析方法中最簡單的方法,但也是使用最為廣泛的方法??煽啃钥驁D是用方框表示系統(tǒng)各組成部分的故障或它們的組合如何導致產品故障的邏輯關系圖,它描述了系統(tǒng)各組成部分之間的可靠性關系,并能夠給出一個確切的數學表達式。典型的系統(tǒng)可靠性框圖有:串聯系統(tǒng)、并聯系統(tǒng)、表決系統(tǒng)、旁聯系統(tǒng)和網絡系統(tǒng)??煽啃钥驁D的研究基礎是概率論,適用場合為不可修系統(tǒng)。下面簡單描述以上幾種典型的系統(tǒng)可靠性框圖及其數學表達形式[2]。
1)串聯系統(tǒng)
組成系統(tǒng)的所有單元中任一單元的故障都會導致整個系統(tǒng)的故障稱為串聯系統(tǒng)。
其邏輯框圖(RBD)如圖1所示。
圖1 串聯模型
其數學模型為:
式中:
Rs(t)—系統(tǒng)可靠度;
Ri(t)—第i個單元的可靠度。
2)并聯系統(tǒng)
組成系統(tǒng)的所有單元都發(fā)生故障時,系統(tǒng)才發(fā)生故障稱為并聯系統(tǒng),并聯系統(tǒng)是最簡單的冗余系統(tǒng)(熱儲備)。
其RBD如圖2所示。
圖2 并聯模型
其數學模型為:
式中:
Rs(t)—系統(tǒng)可靠度;
Ri(t)—第i個單元的可靠度。
3)表決系統(tǒng)
組成系統(tǒng)的n個單元中,正常的單元數不小于r(1≤r≤n)系統(tǒng)就不會故障,這樣的系統(tǒng)稱為r/n(G)表決模型。
其RBD如圖3所示。
圖3 表決模型
其數學模型為:
式中:
Rs(t)—系統(tǒng)可靠度;
R (t)—單元可靠度。
4)旁聯系統(tǒng)
組成系統(tǒng)的各單元只有一個單元工作,當工作單元故障時,通過轉換裝置接到另一個單元繼續(xù)工作,直到所有單元都故障時系統(tǒng)才故障,稱為旁聯系統(tǒng),又稱非工作貯備(冷備)系統(tǒng)。
其RBD如圖4所示。
圖4 旁聯模型
其數學模型為:
式中:
Rs(t)—系統(tǒng)可靠度;
RD—轉換裝置可靠度;
λ—第i個單元的故障率。
5)網絡系統(tǒng)
網絡系統(tǒng)為上述幾種系統(tǒng)的組合,系統(tǒng)某些功能冗余形式或替代工作方式的實現,是一種既非串聯也非并聯的橋形式,稱為橋聯系統(tǒng)或網絡系統(tǒng)。其數學模型的建立較為復雜且有個性,不能建立通用的表達式,具體情況需要具體去分析。
故障樹分析(Fault tree analysis,FTA)是以一個不希望發(fā)生的產品故障事件或災難性危險事件作為頂事件,通過由上向下的嚴格層次的故障因果邏輯分析,找到導致頂事件發(fā)生的所有原因和原因組合的邏輯因果關系圖。FTA不僅能夠對系統(tǒng)進行定性風險分析,在有基礎數據時還可以進行定量分析計算,估計系統(tǒng)頂事件發(fā)生概率以及底事件的重要度。
FTA的核心在于尋找故障樹的最小割集,所謂的最小割集是指導致頂事件發(fā)生故障的底事件組合,且缺少這個組合中的任一底事件都將不能導致系統(tǒng)故障。
FTA一般有3個步驟[2]:
第一步:建立故障樹。確定分析目的、明確系統(tǒng)定義和故障判據,利用專用的事件和邏輯門符號,將系統(tǒng)中故障事件之間的邏輯關系表達出來,形成故障樹。
第二步:規(guī)范故障樹。將建立的故障樹規(guī)范化,形成僅含有底事件、結果事件和與、或、非三種邏輯門的故障樹,并將故障事件用字母代替予以簡化。
第三步:分析與建議。根據建立的故障樹,求得故障樹的割集和最小割集,進行定性分析和定量計算。根據分析結果確定系統(tǒng)薄弱環(huán)節(jié)并提出相應的改進措施。
Markov分析將系統(tǒng)看做由多種狀態(tài)構成,屬于狀態(tài)圖State Diagrams的一種,具有兩種狀態(tài),即工作狀態(tài)和故障狀態(tài)。系統(tǒng)從一種狀態(tài)到另一種狀態(tài)的轉移概率僅與系統(tǒng)的當前狀態(tài)相關,而與系統(tǒng)先前的狀態(tài)無關,稱之為Markov過程。
對于一個由N個相同單元組成的并聯系統(tǒng),可以確定N+1種狀態(tài),其中狀態(tài)N表示所有N個單元均可正常工作,狀態(tài)N-1表示有一個單元故障處于維修狀態(tài),而其它N-1個單元可正常工作,……,狀態(tài)1則表示只有一個單元處于工作狀態(tài),而其它N-1個單元中的一個或多個處于維修狀態(tài),狀態(tài)0表明系統(tǒng)中所有的單元均故障,即整個系統(tǒng)處于故障狀態(tài)。應用Markov分析的一般過程為[3]:
第一步:確定系統(tǒng)所有存在的狀態(tài)。
第二步:在僅考慮傳輸率的情況下確定系統(tǒng)在t時刻處于每種狀態(tài)的概率,并給出用于描述系統(tǒng)整體狀態(tài)的不同方程。
第三步:求解系統(tǒng)不同的方程,并定義系統(tǒng)的可靠度為:
式中:
R0(t)—系統(tǒng)在t時刻故障的概率;
λ和μ—系統(tǒng)中單元的故障率和維修率,一般均為常數,如果不是常數時將會變成半Markov過程或非Markov過程,其應用求解將會更為復雜。
對于給定的系統(tǒng),通常有3種方法用于求解并可得到3種不同的方程,即系統(tǒng)狀態(tài)分析方法、狀態(tài)傳輸矩陣以及Markov圖方法。這些方法在大量的教程和文獻中已有系統(tǒng)詳細的論述,本文不再贅述。
在大多數情況下,由于方程求解的難度很難得到一個精確的解析解時,Monte-Carlo是一種很好的解決方法。
Monte-Carlo方法是一種以概率和數理統(tǒng)計理論為基礎, 通過隨機變量的統(tǒng)計試驗,隨機模擬來求解數學物理、工程技術問題的近似解的數學方法。根據求解問題的不同,這里的隨機變量主要有兩類,即一類是影響系統(tǒng)性能的參數,另一類是系統(tǒng)各組成部分(部件或組件)的可靠性參數(如失效率、可靠度等)。
第一類隨機變量主要用于那些性能難以用解析形式來表達,或者只能需要通過大量的試驗結果對其性能進行評估的問題,并且組成該系統(tǒng)的部件或組件的性能可以隨機變量的形式來表示的復雜系統(tǒng)。
對于這類問題的求解,首先需要確定那些所有可能影響系統(tǒng)性能的參數,并確定相應的隨機變量及其分布。然后通過隨機產生的性能參數來確定系統(tǒng)的性能,并與性能參數要求進行比對,按事先確定的失效判據來確定系統(tǒng)的故障與否,即若性能參數超標則計系統(tǒng)故障發(fā)生一次,最后可以確定系統(tǒng)的可靠度為:
由于Monte-Carlo方法以大數定理為基本原則之一,故仿真的次數越多,其預計或評估的結果越真實,利用Monte-Carlo方法分析系統(tǒng)可靠性的基本流程如圖5所示[4]。
圖5 Monte-Carlo仿真的基本流程圖
對于復雜的電子產品而言,就可以考慮利用Monte-Carlo方法,在產品電路基礎上對其功能進行仿真,來評估或預計電子產品的系統(tǒng)可靠性。
第二類隨機變量主要用于那些已知系統(tǒng)各組成部分的可靠性特征量,并且可以給出該系統(tǒng)的可靠性框圖或故障樹的情況。但由于系統(tǒng)的可靠性模型過于復雜,難于推導出一個可以求解的通用公式時,Monte-Carlo方法可根據單元完成任務的概率,直接通過可靠性框圖或故障樹的近似計算來預計系統(tǒng)的可靠度。
GO法的基本思想是在20世紀60年代中期由美國Kaman科學公司最先提出,經過應用中不斷完善,20世紀80年代以后在核領域得到了應用,是一種用圖形演繹法來分析系統(tǒng)可靠性的方法。
GO法以成功為導向,運用操作符與信號流將系統(tǒng)的原理圖或工程圖直接翻譯成GO圖,并且用GO法程序計算所分析系統(tǒng)的各種狀態(tài)的發(fā)生概率,用于評估系統(tǒng)的可靠度或可用度。
運用GO法進行系統(tǒng)可靠性分析的一般過程為[5]:
第一步:定義系統(tǒng)與邊界。定義系統(tǒng),確定系統(tǒng)的范圍,明確系統(tǒng)中所有的可修單元和單元組成的系統(tǒng)結構,并給出系統(tǒng)的原理圖或工程圖。確定系統(tǒng)的輸入邊界與輸出邊界,確定系統(tǒng)、子系統(tǒng)和元件之間的接口關系。
第二步:建立GO圖。根據系統(tǒng)工作原理圖或工程圖,用操作符表示系統(tǒng)的功能或部件,GO法中共定義了17種操作符。用信號流連接各個操作符,表示系統(tǒng)中各部件邏輯上的關系,最后生成GO圖,用于系統(tǒng)的定性分析與定量評價。
第三步:進行GO運算。輸入的系統(tǒng)單元可靠性參數(通常為故障率和平均修復時間MTTR), 根據GO法的運算規(guī)則,從輸入操作符的輸出信號開始,逐步運算至系統(tǒng)的輸出信號,最終得到各個單元和系統(tǒng)的可靠性特征量。
Petri網最早是由聯邦德國的Carl Adam Petri于1962年在他的博士論文中提出,通過建立網狀結構來模擬通信系統(tǒng)。Petri網是研究系統(tǒng)的一種工具,用來揭示出被模擬的系統(tǒng)在結構和動態(tài)行為方面的重要信息。Petri網既能圖形化建模也可以進行數學計算,理論基礎是系統(tǒng)各種狀態(tài)及其動態(tài)變化之間的相互聯系。Petri網是一種特殊的有向網,可用于描述復雜系統(tǒng)的靜態(tài)和動態(tài)變化,直觀的反映了系統(tǒng)狀態(tài)變化和事件發(fā)展的過程[6]。
Petri網由三種類型的對象組成:庫所(圓圈)、變遷(矩形)和有向?。^)。連接庫所與變遷之間的有向弧表示輸入輸出函數,用黑點或數字來表示標識以顯示庫所中資源的數量。庫所中標識的數目決定變遷的使能和激發(fā),變遷的激發(fā)又將改變庫所中標識的數目,變遷的激發(fā)使得標識在庫所之間流動[7]。因此,Petri網常用于描述系統(tǒng)動態(tài)的變化過程,能夠直觀的反映系統(tǒng)的動態(tài)特性。
在系統(tǒng)可靠性分析中Petri網尤其適合描述故障傳播的過程,推斷故障發(fā)生的原因,因此常用于故障診斷的場合,此外Petri網在可修系統(tǒng)的可靠性建模與分析、冗余系統(tǒng)的可靠性分析等方面也有廣泛的應用。
系統(tǒng)可靠性量化評價必然要輸出可靠性指標,對于不可修系統(tǒng),通常選用的系統(tǒng)可靠性指標為系統(tǒng)可靠度R、系統(tǒng)失效率λ、系統(tǒng)平均故障前時間MTTF(Mean Time To Failure,MTTF)。對于可修系統(tǒng),通常選用的系統(tǒng)可靠性指標為系統(tǒng)可用度Ai、單元工作失效率λ與修復率μ、平均故障間隔時間MTBF(Mean Time Between Failure,MTBF)和平均故障修復時間MTTR(Mean Time To Repair,MTTR)。其中系統(tǒng)固有可用度Ai與其余可靠性指標參數的關系為[8]:
對于可修系統(tǒng),不但要求使用期間具有很高的可靠性,同時還要求在使用以前能夠保持很高的可用能力,因此,在滿足系統(tǒng)高可靠性的前提下,還因適當降低系統(tǒng)的維修時間,以保持系統(tǒng)足夠的可用度。
本文重點介紹了六種系統(tǒng)可靠性分析方法,包括可靠性框圖法、故障樹分析、Markov分析、Monte-Carlo仿真、GO法和Petri網?;谶@六種系統(tǒng)可靠性分析方法的特點,分別從其適用范圍、輸入條件、輸出結果以及優(yōu)缺點等幾個維度進行比較,比較結果如表1所示,研究結論供廣大工程人員在做系統(tǒng)可靠性分析時選擇。
表1 系統(tǒng)可靠性分析方法比較
系統(tǒng)可靠性分析需要建立相應的系統(tǒng)可靠性模型,而系統(tǒng)可靠性模型一般分為兩類,即解析模型和仿真模型,而解析模型又可細分為網絡模型和Markov模型。
其中網絡模型由簡單的可靠性框圖或故障樹組成。系統(tǒng)可靠性分析的輸出結果(指量化結果)一般為通常所說的可靠性指標,系統(tǒng)可靠性指標一般用系統(tǒng)可用度進行評價,系統(tǒng)可用度綜合反映了系統(tǒng)的可靠性與系統(tǒng)的維修性水平。
本文介紹了六種常見的應用于系統(tǒng)可靠性分析的方法,對六種方法從原理、適用范圍及工作流程分別進行了簡要的闡述分析,并對各種不同的系統(tǒng)可靠性方法分別從不同的維度進行比較研究,給出其適用的范圍、輸入與輸出和優(yōu)缺點分析,以便于在工程實際應用時進行選擇參考。