溫艷清, 崔利榮, 劉寶亮, 師海燕
(1. 西北工業大學機電學院, 陜西 西安 710072; 2. 北京理工大學管理與經濟學院, 北京 100081; 3. 山西大同大學數學與計算機科學學院, 山西 大同 037009)
貯備系統的可靠性一直是可靠性領域研究的熱點問題之一,對于一些高可靠性要求的產品,通過貯備部件,可以大大地提高系統的可靠性,例如航空設備、汽車零部件等[1]。研究者們在以往的可靠性研究中,常用指數分布作為故障時間的分布。指數分布具有無記憶性且解析式易于處理,但其只適應于壽命具備無記憶的設備場合,對于壽命是退化型的設備(部件),再用指數分布去刻畫效果就不太理想。為了克服以上困難,假設所涉及的分布是一般分布時,通過運用補充變量法可以處理相對比較簡單的可用度模型,對于比較復雜的模型,這些方法顯得舉步維艱。位相型(phase-type, PH)分布可以把任一個非負連續隨機變量逼近到任意的精度,且任何取值為正整數的離散概率分布是一個離散PH分布[2]。由于PH分布具有指數分布易處理的特點,所以其在排隊論、交通系統、統計信號處理、可靠性理論[3-7]等方面取得了廣泛應用。以上參考文獻都是針對連續時間情形下系統模型的,然而實際工程領域中,并不是所有的系統都能被連續地檢測,正如國際著名可靠性專家Ruiz-Castro[8]所說:“或許因為不可能進行連續的檢測,或許因為系統自身內部結構的原因,工程上一些系統僅僅能在某些離散時間點被檢測,例如土木和航空工程領域的設備。”近年來,離散時間情形下系統可靠性的研究越來越得到學者們的重視。文獻[8-11]在假設系統模型中所涉及的時間分布均為離散PH分布的情形下,研究了各種離散時間系統模型的可靠性。修理工多重休假策略在連續時間系統可靠性建模[12-15]中被研究者們廣泛使用,因為這樣使修理工這個人力資源得到更有效的利用。在連續時間情形下,文獻[5]假設所涉及的隨機時間分布為連續PH分布,研究了修理工具有多重休假的兩部件可修系統的可靠性;文獻[7]假設所涉及的隨機時間分布為連續PH分布,考慮了修理工帶多重休假的n部件冷貯備系統的可靠性。修理工多重休假是指當系統中的部件都完好時,修理工離開系統去休假,休假結束返回系統中,如果發現系統中有故障部件等待修理,那么他開始修理故障部件,直到系統中沒有故障部件,他再離開系統去休假。這兒的“休假”指的是修理工兼職去做一些其他的事情,使得修理工這個人力資源得到充分的利用。例如:鐵路維修工對火車、地鐵等的維修檢查,不同工作的時間分配,船舶修理工的救助待命就屬于多重休假,有緊急救助時工作,沒有救助就做別的維修檢測。到目前為止,所了解的文獻中,尚沒有學者在所涉及到的隨機分布為離散PH分布的假設下研究有多重休假的貯備系統,因此本文研究離散時間下修理工可多重休假的冷貯備系統的可靠性,系統中有2個部件,一個部件正常工作,另一個部件冷貯備,工作部件出現故障,冷貯備部件立即替換變為工作部件。部件正常工作時間、修理時間、修理工的休假時間都服從離散時間的PH分布。本文所建的模型在工程實踐中有廣泛的應用,例如醫生在進行大型手術的時候,有兩個供電系統:正常電力供應系統(可以看作部件1)和應急發電系統(可以看作部件2,作冷貯備),電力系統維護工(修理工)可以進行多重休假。又如可以把飛機上的兩個同樣的發動機看作兩個部件,當其中一個發動機正常運轉的時候,飛機將正常工作,供電系統扮演修理工的作用,其將給飛機的每個子系統進行正常電力供應,即進行休假。當正運轉的這個發動機故障停止運轉時,另一個發動機立即啟動,同時這個“修理工”也將給檢測和維護系統供電來檢測和維護出現故障的這個發動機。本文所建立的模型是文獻[5]中模型在離散情形下的推廣,在工程實踐中,系統只在離散時間檢測普遍存在,例如火車、飛機、船舶上的一些關鍵零部件的檢測。由于任何取值為正整數的離散概率分布是一個離散PH分布,且離散時間情形并不是連續時間情形的一個特殊情況,當系統在離散時間情形下運行,在線部件的故障、修理的完成以及休假的完成能夠同時發生,這是與連續時間情形下完全不同的,所以本文所得結果更具有一般性,有重要的理論和實際應用價值,可以為管理人員的管理決策提供依據。
下面介紹Kronecker積與Kronecker和的定義,其在隨后論文的研究中被大量使用。
定義1[16]Kronecker積
如果A和B分別為m1×m2和n1×n2的矩陣,則其Kronecker積A?B是階數為m1n1×m2n2的矩陣,且

定義2[16]Kronecker和
如果A和B分別為m和n階方陣,則Kronecker和定義為
A⊕B=A?In+Im?B
式中,In和Im分別為m和n階單位矩陣。
考慮修理工具有多重休假的冷貯備離散時間可修系統,系統由2個部件和1個修理工組成,系統模型的假設如下:
(1)κ=0時刻,部件都是新的。系統一旦啟動,其中一個部件開始工作,另一個部件冷貯備,修理工立即進入休假,在休假結束后,兩個部件仍沒有出現故障,重新開始另一次休假,稱為多重休假;若工作部件發生故障需要維修,冷貯備部件(如果系統中有貯備部件)立即替換這個故障部件開始工作。
(2) 修理工的多重休假策略參考文獻[6]中系統模型建立中的(2)。
(3) 部件正常工作時間X, 修理時間Y, 修理工的休假時間Z相互獨立,都服從離散的PH分布,且X~PH(α,T),位相的階數為m,Y~PH(β,S),位相的階數為k,Z~PH(γ,L)。假設隨機變量X,Y,Z相互獨立。
基于以上的假設,系統可以用一個離散時間Markov鏈{Xn,n=0,1,2,…}來描述,其狀態空間是S={S1,S2,S3,S4,S5},其中,S1,S2,S3,S4,S5是宏狀態,下面給出這些宏狀態表示的具體意義。
S1={(0,i,l),1≤i≤m,1≤l≤k}表示一個部件正常工作,工作時間在位相i,另一個部件冷貯備,修理工處于休假狀態,且修理工休假在位相l。
S2={(1,i,l),1≤i≤m,1≤l≤k}表示一個部件正常工作,工作時間在位相i,另一個部件出現故障,修理工處于休假狀態,休假時間在位相l。
S3={(1,i,j),1≤i≤m,1≤j≤n}表示一個部件正常工作,工作時間在位相i,另一個部件出現故障,修理工正在修理故障部件,修理時間在位相j。
S4={(2,l),1≤l≤k}表示兩個部件都發生故障,修理工在休假,休假時間在位相l。
S5={(2,j),1≤j≤n}表示系統中兩個部件都發生故障,修理工在修理第一個故障的部件,修理時間在位相j,另一個部件等待修理。
在上述假設下,系統的狀態空間為S=W∪F={S1,S2,S3}∪{S4,S5},其中,W表示系統的工作狀態集;F表示系統的故障狀態集。系統的轉移概率矩陣表示為P,其是一個分塊矩陣,每一塊相應于S={S1,S2,S3,S4,S5}中狀態之間的轉移,即
S1S2S3S4S5
(1)
下面說明轉移概率矩陣矩陣P中的這些分塊元素如何得到。
轉移S1→S1相應于T?L+T?L0γ。這是兩項的和,因為系統中沒有發生部件故障修理工休假也沒有結束,表示為T?L;或者修理工休假結束了但發現系統中沒有故障部件,所以其進行第二次休假,表示為T?L0γ。
轉移S1→S2相應于T0α?L。這是因為正常工作的部件出現故障,冷貯備部件立刻取代其開始工作,表示為T0α,而修理工仍然在休假L。
轉移S1→S3相應于T0α?L0?β。這是由于正常工作的部件出現故障,冷貯備部件取代其工作,表示為T0α,修理工休假結束后發現有故障部件,立即開始修理,表示為β。
轉移S2→S2相應于T?L。這是因為系統中在線工作的部件沒有發生故障T,修理工的休假也沒有結束L,所以先前故障的部件也沒有得到修理。
轉移S2→S3相應于T?L0?β。這是因為在線工作的部件沒有發生故障T,修理工從休假返回,發現系統中有一個故障部件等候修理L0,所以其立即以初始向量β開始修理這個故障部件。
轉移S2→S4相應于T0?L。這是因為系統中在線工作的部件發生了故障T0,而修理工仍然在休假L,先前故障的部件也沒有得到修理。
轉移S2→S5相應于T0?L0?β。這是因為系統中在線工作的部件發生了故障T0,修理工從休假返回L0,立即開始修理第一個故障部件β。
轉移S3→S1相應于T?S0?γ。這是因為修理工正在修理的故障部件修理完好了S0,而在線工作的部件沒有發生故障T,所以其以初始向量γ開始休假。
轉移S3→S3相應于T?S+T0α?S0β。這是兩項的和,因為系統中在線工作的部件沒有發生故障且正在修理的故障部件也沒有修理完成,表示為T?S;或者正在修理的故障部件修理完好了且在線工作的部件發生了故障,所以這個剛修理完好的部件代替其開始工作,修理工繼續修理這個剛發生故障的部件,表示為T0α?S0β。
轉移S3→S5相應于T0?S。這是因為在線工作的部件發生了故障T0,而正在修理的故障沒有修理完成S,所以其只能排隊等待修理。
轉移S4→S4相應于L。這是因為修理工仍然在休假L,所以兩個故障的部件繼續等待修理。
轉移S4→S5相應于L0?β。這是因為修理工從休假返回L0,所以其立即以初始向量β修理先發生故障的部件,另一個部件等待修理。
轉移S5→S3相應于α?S0β。這是因為正在修理的部件修理完成了S0,所以這個部件立即以初始向量α在線開始工作,修理工繼續以初始向量β開始修理另一個故障部件。
轉移S5→S5相應于S。這是因為正在修理的部件沒有修理完成。
用向量π=(π1,π2,π3,π4,π5)表示相應于轉移概率矩陣P的穩態概率向量,則這個穩態向量滿足矩陣方程πP=π且πe=1,即
(2)
通過運用計算程序可以得到這個方程組的解,以下假定穩態概率向量π1,π2,π3,π4,π5是已知的。
系統的可用度定義為:在時刻κ,系統正常工作的概率,也就是說兩個部件中少有一個部件是正常工作的。令系統在宏狀態{S1,S2,S3,S4,S5}之間的轉移概率矩陣記為P,所以在時刻κ,系統的可用度為
(3)

?γ,0)Pκ]1∶mk,


(α?γ,0)表示系統的初始狀態概率,即初始時刻系統中兩個部件都是完好的,處于宏狀態S1。
在式(3)中讓κ→∞取極限,可得系統的穩態可用度為
A=π1e+π2e+π3e=1-π4e-π5e
(4)
故障的條件概率包括在線部件故障的條件概率和系統故障的條件概率。當系統處于宏狀態S1,S2或者S3時,在線部件或許發生故障;系統中兩個部件都不能正常工作了,系統就發生了故障,所以只有當系統處于宏狀態S2或者S3時,系統才可能發生故障,因此在時刻κ,在線部件故障的條件概率為

(5)
穩態時在線部件故障的條件概率為
v=π1(T0?e)+π2(T0?e)+π3(T0?e)
(6)
時刻κ系統故障的條件概率為

(7)
穩態時系統故障的條件概率為
vs=π2(T0?e)+π3(T0?e)
(8)
可見,在線部件故障的條件概率大于系統故障的條件概率。

S1S2S3S*
(9)
式中,S*是吸收狀態。令矩陣U是矩陣P*去掉最后一行和最后一列所得到的矩陣,則系統的可靠度為
R(κ)=(α?γ,0)Uκe
(10)
系統首次故障前的平均時間為
MTTFF=(α?γ,0)(I-U)-1e
(11)
以某供電系統為例,該供電系統由正常電力供應系統、應急發電系統和電力系統維護工(修理工)組成。下面對其進一步假設與描述。
正常電力供應系統的工作時間X~PH(α,T),且
X的均值為220。
故障供電系統的修理時間Y~PH(β,S):
Y的均值為10。
電力系統維護工的休假時間Z~PH(γ,L):
Z的均值為20。
運用Matlab軟件,可以求得供電系統的穩態概率向量為
π1=(0.421 1,0.369 4,0.044 8,0.039 4)
π2=(0.037 7,0.035 4,0.001 8,0.001 7)
π3=(0.020 1,0.019 6,0.001 2,0.001 3)
π4=(0.001 7,0.001 6)
π5=(0.001 3,0.001 6)
圖1是供電系統的可用度曲線,可以看出,在時刻κ=170之后,供電系統達到穩定狀態,且供電系統達到穩態時,在工作狀態集W中逗留的概率為0.993 8,即供電系統大約有99.38%的時間是可用的。圖2是供電系統的可靠度曲線,可以求得供電系統首次故障前的平均時間為MTTFF=3 449.6。圖3和圖4分別是在線運行供電設備和供電系統的故障條件概率曲線,可以看出,兩條曲線在剛開始的一段時間內快速上升,在時刻κ=80之后,系統在線部件故障的條件概率達到穩定值,且為0.004 5;而在時刻κ=210之后,系統故障的條件概率達到穩定值,為3.043 2×10-4。在相同的時刻點,在線部件故障的條件概率值要遠遠大于系統故障的條件概率值,這與直覺是相吻合的。

圖1 系統的可用度曲線Fig.1 Curve of the system availability

圖2 系統的可靠度曲線Fig.2 Curve of the system reliability

圖3 在線部件故障的條件概率曲線Fig.3 Conditional probability of failure for the online component

圖4 系統故障的條件概率曲線Fig.4 Conditional probability of failure for the system
(1) 把修理工的多重休假策略加入到離散時間可靠性模型的建模中,建立了修理工具有多重休假的兩部件冷貯備離散時間系統模型。
(2) 假設所涉及的隨機分布均為離散PH分布,且任何取值為正整數的離散概率分布是一個離散PH分布,所以建立的離散時間可靠性模型更具有一般性。
(3) 推導出離散時間可靠性系統所特有的可靠性指標:故障的條件概率以及可靠性系統模型一些常見的可靠性指標(可用度和可靠度)。
(4) 本文僅研究了離散時間情形下一種只有2個部件的特殊的系統模型,如果將其推廣到更一般的系統模型,如部件數增加、部件故障機理復雜化(遭受沖擊)、維修策略多樣化等,系統在離散時間情形下運行,在線部件的故障、修理的完成以及休假的完成能夠同時發生,系統狀態和維數將急劇增加,推導系統的轉移率矩陣考慮的情形將非常復雜,這是后續將要研究的一些問題。