溫艷清, 崔利榮, 劉寶亮, 師海燕
(1. 西北工業(yè)大學(xué)機(jī)電學(xué)院, 陜西 西安 710072; 2. 北京理工大學(xué)管理與經(jīng)濟(jì)學(xué)院, 北京 100081; 3. 山西大同大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院, 山西 大同 037009)
貯備系統(tǒng)的可靠性一直是可靠性領(lǐng)域研究的熱點(diǎn)問(wèn)題之一,對(duì)于一些高可靠性要求的產(chǎn)品,通過(guò)貯備部件,可以大大地提高系統(tǒng)的可靠性,例如航空設(shè)備、汽車(chē)零部件等[1]。研究者們?cè)谝酝目煽啃匝芯恐?常用指數(shù)分布作為故障時(shí)間的分布。指數(shù)分布具有無(wú)記憶性且解析式易于處理,但其只適應(yīng)于壽命具備無(wú)記憶的設(shè)備場(chǎng)合,對(duì)于壽命是退化型的設(shè)備(部件),再用指數(shù)分布去刻畫(huà)效果就不太理想。為了克服以上困難,假設(shè)所涉及的分布是一般分布時(shí),通過(guò)運(yùn)用補(bǔ)充變量法可以處理相對(duì)比較簡(jiǎn)單的可用度模型,對(duì)于比較復(fù)雜的模型,這些方法顯得舉步維艱。位相型(phase-type, PH)分布可以把任一個(gè)非負(fù)連續(xù)隨機(jī)變量逼近到任意的精度,且任何取值為正整數(shù)的離散概率分布是一個(gè)離散PH分布[2]。由于PH分布具有指數(shù)分布易處理的特點(diǎn),所以其在排隊(duì)論、交通系統(tǒng)、統(tǒng)計(jì)信號(hào)處理、可靠性理論[3-7]等方面取得了廣泛應(yīng)用。以上參考文獻(xiàn)都是針對(duì)連續(xù)時(shí)間情形下系統(tǒng)模型的,然而實(shí)際工程領(lǐng)域中,并不是所有的系統(tǒng)都能被連續(xù)地檢測(cè),正如國(guó)際著名可靠性專(zhuān)家Ruiz-Castro[8]所說(shuō):“或許因?yàn)椴豢赡苓M(jìn)行連續(xù)的檢測(cè),或許因?yàn)橄到y(tǒng)自身內(nèi)部結(jié)構(gòu)的原因,工程上一些系統(tǒng)僅僅能在某些離散時(shí)間點(diǎn)被檢測(cè),例如土木和航空工程領(lǐng)域的設(shè)備。”近年來(lái),離散時(shí)間情形下系統(tǒng)可靠性的研究越來(lái)越得到學(xué)者們的重視。文獻(xiàn)[8-11]在假設(shè)系統(tǒng)模型中所涉及的時(shí)間分布均為離散PH分布的情形下,研究了各種離散時(shí)間系統(tǒng)模型的可靠性。修理工多重休假策略在連續(xù)時(shí)間系統(tǒng)可靠性建模[12-15]中被研究者們廣泛使用,因?yàn)檫@樣使修理工這個(gè)人力資源得到更有效的利用。在連續(xù)時(shí)間情形下,文獻(xiàn)[5]假設(shè)所涉及的隨機(jī)時(shí)間分布為連續(xù)PH分布,研究了修理工具有多重休假的兩部件可修系統(tǒng)的可靠性;文獻(xiàn)[7]假設(shè)所涉及的隨機(jī)時(shí)間分布為連續(xù)PH分布,考慮了修理工帶多重休假的n部件冷貯備系統(tǒng)的可靠性。修理工多重休假是指當(dāng)系統(tǒng)中的部件都完好時(shí),修理工離開(kāi)系統(tǒng)去休假,休假結(jié)束返回系統(tǒng)中,如果發(fā)現(xiàn)系統(tǒng)中有故障部件等待修理,那么他開(kāi)始修理故障部件,直到系統(tǒng)中沒(méi)有故障部件,他再離開(kāi)系統(tǒng)去休假。這兒的“休假”指的是修理工兼職去做一些其他的事情,使得修理工這個(gè)人力資源得到充分的利用。例如:鐵路維修工對(duì)火車(chē)、地鐵等的維修檢查,不同工作的時(shí)間分配,船舶修理工的救助待命就屬于多重休假,有緊急救助時(shí)工作,沒(méi)有救助就做別的維修檢測(cè)。到目前為止,所了解的文獻(xiàn)中,尚沒(méi)有學(xué)者在所涉及到的隨機(jī)分布為離散PH分布的假設(shè)下研究有多重休假的貯備系統(tǒng),因此本文研究離散時(shí)間下修理工可多重休假的冷貯備系統(tǒng)的可靠性,系統(tǒng)中有2個(gè)部件,一個(gè)部件正常工作,另一個(gè)部件冷貯備,工作部件出現(xiàn)故障,冷貯備部件立即替換變?yōu)楣ぷ鞑考2考9ぷ鲿r(shí)間、修理時(shí)間、修理工的休假時(shí)間都服從離散時(shí)間的PH分布。本文所建的模型在工程實(shí)踐中有廣泛的應(yīng)用,例如醫(yī)生在進(jìn)行大型手術(shù)的時(shí)候,有兩個(gè)供電系統(tǒng):正常電力供應(yīng)系統(tǒng)(可以看作部件1)和應(yīng)急發(fā)電系統(tǒng)(可以看作部件2,作冷貯備),電力系統(tǒng)維護(hù)工(修理工)可以進(jìn)行多重休假。又如可以把飛機(jī)上的兩個(gè)同樣的發(fā)動(dòng)機(jī)看作兩個(gè)部件,當(dāng)其中一個(gè)發(fā)動(dòng)機(jī)正常運(yùn)轉(zhuǎn)的時(shí)候,飛機(jī)將正常工作,供電系統(tǒng)扮演修理工的作用,其將給飛機(jī)的每個(gè)子系統(tǒng)進(jìn)行正常電力供應(yīng),即進(jìn)行休假。當(dāng)正運(yùn)轉(zhuǎn)的這個(gè)發(fā)動(dòng)機(jī)故障停止運(yùn)轉(zhuǎn)時(shí),另一個(gè)發(fā)動(dòng)機(jī)立即啟動(dòng),同時(shí)這個(gè)“修理工”也將給檢測(cè)和維護(hù)系統(tǒng)供電來(lái)檢測(cè)和維護(hù)出現(xiàn)故障的這個(gè)發(fā)動(dòng)機(jī)。本文所建立的模型是文獻(xiàn)[5]中模型在離散情形下的推廣,在工程實(shí)踐中,系統(tǒng)只在離散時(shí)間檢測(cè)普遍存在,例如火車(chē)、飛機(jī)、船舶上的一些關(guān)鍵零部件的檢測(cè)。由于任何取值為正整數(shù)的離散概率分布是一個(gè)離散PH分布,且離散時(shí)間情形并不是連續(xù)時(shí)間情形的一個(gè)特殊情況,當(dāng)系統(tǒng)在離散時(shí)間情形下運(yùn)行,在線部件的故障、修理的完成以及休假的完成能夠同時(shí)發(fā)生,這是與連續(xù)時(shí)間情形下完全不同的,所以本文所得結(jié)果更具有一般性,有重要的理論和實(shí)際應(yīng)用價(jià)值,可以為管理人員的管理決策提供依據(jù)。
下面介紹Kronecker積與Kronecker和的定義,其在隨后論文的研究中被大量使用。
定義1[16]Kronecker積
如果A和B分別為m1×m2和n1×n2的矩陣,則其Kronecker積A?B是階數(shù)為m1n1×m2n2的矩陣,且

定義2[16]Kronecker和
如果A和B分別為m和n階方陣,則Kronecker和定義為
A⊕B=A?In+Im?B
式中,In和Im分別為m和n階單位矩陣。
考慮修理工具有多重休假的冷貯備離散時(shí)間可修系統(tǒng),系統(tǒng)由2個(gè)部件和1個(gè)修理工組成,系統(tǒng)模型的假設(shè)如下:
(1)κ=0時(shí)刻,部件都是新的。系統(tǒng)一旦啟動(dòng),其中一個(gè)部件開(kāi)始工作,另一個(gè)部件冷貯備,修理工立即進(jìn)入休假,在休假結(jié)束后,兩個(gè)部件仍沒(méi)有出現(xiàn)故障,重新開(kāi)始另一次休假,稱(chēng)為多重休假;若工作部件發(fā)生故障需要維修,冷貯備部件(如果系統(tǒng)中有貯備部件)立即替換這個(gè)故障部件開(kāi)始工作。
(2) 修理工的多重休假策略參考文獻(xiàn)[6]中系統(tǒng)模型建立中的(2)。
(3) 部件正常工作時(shí)間X, 修理時(shí)間Y, 修理工的休假時(shí)間Z相互獨(dú)立,都服從離散的PH分布,且X~PH(α,T),位相的階數(shù)為m,Y~PH(β,S),位相的階數(shù)為k,Z~PH(γ,L)。假設(shè)隨機(jī)變量X,Y,Z相互獨(dú)立。
基于以上的假設(shè),系統(tǒng)可以用一個(gè)離散時(shí)間Markov鏈{Xn,n=0,1,2,…}來(lái)描述,其狀態(tài)空間是S={S1,S2,S3,S4,S5},其中,S1,S2,S3,S4,S5是宏?duì)顟B(tài),下面給出這些宏?duì)顟B(tài)表示的具體意義。
S1={(0,i,l),1≤i≤m,1≤l≤k}表示一個(gè)部件正常工作,工作時(shí)間在位相i,另一個(gè)部件冷貯備,修理工處于休假狀態(tài),且修理工休假在位相l(xiāng)。
S2={(1,i,l),1≤i≤m,1≤l≤k}表示一個(gè)部件正常工作,工作時(shí)間在位相i,另一個(gè)部件出現(xiàn)故障,修理工處于休假狀態(tài),休假時(shí)間在位相l(xiāng)。
S3={(1,i,j),1≤i≤m,1≤j≤n}表示一個(gè)部件正常工作,工作時(shí)間在位相i,另一個(gè)部件出現(xiàn)故障,修理工正在修理故障部件,修理時(shí)間在位相j。
S4={(2,l),1≤l≤k}表示兩個(gè)部件都發(fā)生故障,修理工在休假,休假時(shí)間在位相l(xiāng)。
S5={(2,j),1≤j≤n}表示系統(tǒng)中兩個(gè)部件都發(fā)生故障,修理工在修理第一個(gè)故障的部件,修理時(shí)間在位相j,另一個(gè)部件等待修理。
在上述假設(shè)下,系統(tǒng)的狀態(tài)空間為S=W∪F={S1,S2,S3}∪{S4,S5},其中,W表示系統(tǒng)的工作狀態(tài)集;F表示系統(tǒng)的故障狀態(tài)集。系統(tǒng)的轉(zhuǎn)移概率矩陣表示為P,其是一個(gè)分塊矩陣,每一塊相應(yīng)于S={S1,S2,S3,S4,S5}中狀態(tài)之間的轉(zhuǎn)移,即
S1S2S3S4S5
(1)
下面說(shuō)明轉(zhuǎn)移概率矩陣矩陣P中的這些分塊元素如何得到。
轉(zhuǎn)移S1→S1相應(yīng)于T?L+T?L0γ。這是兩項(xiàng)的和,因?yàn)橄到y(tǒng)中沒(méi)有發(fā)生部件故障修理工休假也沒(méi)有結(jié)束,表示為T(mén)?L;或者修理工休假結(jié)束了但發(fā)現(xiàn)系統(tǒng)中沒(méi)有故障部件,所以其進(jìn)行第二次休假,表示為T(mén)?L0γ。
轉(zhuǎn)移S1→S2相應(yīng)于T0α?L。這是因?yàn)檎9ぷ鞯牟考霈F(xiàn)故障,冷貯備部件立刻取代其開(kāi)始工作,表示為T(mén)0α,而修理工仍然在休假L。
轉(zhuǎn)移S1→S3相應(yīng)于T0α?L0?β。這是由于正常工作的部件出現(xiàn)故障,冷貯備部件取代其工作,表示為T(mén)0α,修理工休假結(jié)束后發(fā)現(xiàn)有故障部件,立即開(kāi)始修理,表示為β。
轉(zhuǎn)移S2→S2相應(yīng)于T?L。這是因?yàn)橄到y(tǒng)中在線工作的部件沒(méi)有發(fā)生故障T,修理工的休假也沒(méi)有結(jié)束L,所以先前故障的部件也沒(méi)有得到修理。
轉(zhuǎn)移S2→S3相應(yīng)于T?L0?β。這是因?yàn)樵诰€工作的部件沒(méi)有發(fā)生故障T,修理工從休假返回,發(fā)現(xiàn)系統(tǒng)中有一個(gè)故障部件等候修理L0,所以其立即以初始向量β開(kāi)始修理這個(gè)故障部件。
轉(zhuǎn)移S2→S4相應(yīng)于T0?L。這是因?yàn)橄到y(tǒng)中在線工作的部件發(fā)生了故障T0,而修理工仍然在休假L,先前故障的部件也沒(méi)有得到修理。
轉(zhuǎn)移S2→S5相應(yīng)于T0?L0?β。這是因?yàn)橄到y(tǒng)中在線工作的部件發(fā)生了故障T0,修理工從休假返回L0,立即開(kāi)始修理第一個(gè)故障部件β。
轉(zhuǎn)移S3→S1相應(yīng)于T?S0?γ。這是因?yàn)樾蘩砉ふ谛蘩淼墓收喜考蘩硗旰昧薙0,而在線工作的部件沒(méi)有發(fā)生故障T,所以其以初始向量γ開(kāi)始休假。
轉(zhuǎn)移S3→S3相應(yīng)于T?S+T0α?S0β。這是兩項(xiàng)的和,因?yàn)橄到y(tǒng)中在線工作的部件沒(méi)有發(fā)生故障且正在修理的故障部件也沒(méi)有修理完成,表示為T(mén)?S;或者正在修理的故障部件修理完好了且在線工作的部件發(fā)生了故障,所以這個(gè)剛修理完好的部件代替其開(kāi)始工作,修理工繼續(xù)修理這個(gè)剛發(fā)生故障的部件,表示為T(mén)0α?S0β。
轉(zhuǎn)移S3→S5相應(yīng)于T0?S。這是因?yàn)樵诰€工作的部件發(fā)生了故障T0,而正在修理的故障沒(méi)有修理完成S,所以其只能排隊(duì)等待修理。
轉(zhuǎn)移S4→S4相應(yīng)于L。這是因?yàn)樾蘩砉と匀辉谛菁貺,所以?xún)蓚€(gè)故障的部件繼續(xù)等待修理。
轉(zhuǎn)移S4→S5相應(yīng)于L0?β。這是因?yàn)樾蘩砉男菁俜祷豅0,所以其立即以初始向量β修理先發(fā)生故障的部件,另一個(gè)部件等待修理。
轉(zhuǎn)移S5→S3相應(yīng)于α?S0β。這是因?yàn)檎谛蘩淼牟考蘩硗瓿闪薙0,所以這個(gè)部件立即以初始向量α在線開(kāi)始工作,修理工繼續(xù)以初始向量β開(kāi)始修理另一個(gè)故障部件。
轉(zhuǎn)移S5→S5相應(yīng)于S。這是因?yàn)檎谛蘩淼牟考](méi)有修理完成。
用向量π=(π1,π2,π3,π4,π5)表示相應(yīng)于轉(zhuǎn)移概率矩陣P的穩(wěn)態(tài)概率向量,則這個(gè)穩(wěn)態(tài)向量滿足矩陣方程πP=π且πe=1,即
(2)
通過(guò)運(yùn)用計(jì)算程序可以得到這個(gè)方程組的解,以下假定穩(wěn)態(tài)概率向量π1,π2,π3,π4,π5是已知的。
系統(tǒng)的可用度定義為:在時(shí)刻κ,系統(tǒng)正常工作的概率,也就是說(shuō)兩個(gè)部件中少有一個(gè)部件是正常工作的。令系統(tǒng)在宏?duì)顟B(tài){S1,S2,S3,S4,S5}之間的轉(zhuǎn)移概率矩陣記為P,所以在時(shí)刻κ,系統(tǒng)的可用度為
(3)

?γ,0)Pκ]1∶mk,


(α?γ,0)表示系統(tǒng)的初始狀態(tài)概率,即初始時(shí)刻系統(tǒng)中兩個(gè)部件都是完好的,處于宏?duì)顟B(tài)S1。
在式(3)中讓?duì)省奕O限,可得系統(tǒng)的穩(wěn)態(tài)可用度為
A=π1e+π2e+π3e=1-π4e-π5e
(4)
故障的條件概率包括在線部件故障的條件概率和系統(tǒng)故障的條件概率。當(dāng)系統(tǒng)處于宏?duì)顟B(tài)S1,S2或者S3時(shí),在線部件或許發(fā)生故障;系統(tǒng)中兩個(gè)部件都不能正常工作了,系統(tǒng)就發(fā)生了故障,所以只有當(dāng)系統(tǒng)處于宏?duì)顟B(tài)S2或者S3時(shí),系統(tǒng)才可能發(fā)生故障,因此在時(shí)刻κ,在線部件故障的條件概率為

(5)
穩(wěn)態(tài)時(shí)在線部件故障的條件概率為
v=π1(T0?e)+π2(T0?e)+π3(T0?e)
(6)
時(shí)刻κ系統(tǒng)故障的條件概率為

(7)
穩(wěn)態(tài)時(shí)系統(tǒng)故障的條件概率為
vs=π2(T0?e)+π3(T0?e)
(8)
可見(jiàn),在線部件故障的條件概率大于系統(tǒng)故障的條件概率。

S1S2S3S*
(9)
式中,S*是吸收狀態(tài)。令矩陣U是矩陣P*去掉最后一行和最后一列所得到的矩陣,則系統(tǒng)的可靠度為
R(κ)=(α?γ,0)Uκe
(10)
系統(tǒng)首次故障前的平均時(shí)間為
MTTFF=(α?γ,0)(I-U)-1e
(11)
以某供電系統(tǒng)為例,該供電系統(tǒng)由正常電力供應(yīng)系統(tǒng)、應(yīng)急發(fā)電系統(tǒng)和電力系統(tǒng)維護(hù)工(修理工)組成。下面對(duì)其進(jìn)一步假設(shè)與描述。
正常電力供應(yīng)系統(tǒng)的工作時(shí)間X~PH(α,T),且
X的均值為220。
故障供電系統(tǒng)的修理時(shí)間Y~PH(β,S):
Y的均值為10。
電力系統(tǒng)維護(hù)工的休假時(shí)間Z~PH(γ,L):
Z的均值為20。
運(yùn)用Matlab軟件,可以求得供電系統(tǒng)的穩(wěn)態(tài)概率向量為
π1=(0.421 1,0.369 4,0.044 8,0.039 4)
π2=(0.037 7,0.035 4,0.001 8,0.001 7)
π3=(0.020 1,0.019 6,0.001 2,0.001 3)
π4=(0.001 7,0.001 6)
π5=(0.001 3,0.001 6)
圖1是供電系統(tǒng)的可用度曲線,可以看出,在時(shí)刻κ=170之后,供電系統(tǒng)達(dá)到穩(wěn)定狀態(tài),且供電系統(tǒng)達(dá)到穩(wěn)態(tài)時(shí),在工作狀態(tài)集W中逗留的概率為0.993 8,即供電系統(tǒng)大約有99.38%的時(shí)間是可用的。圖2是供電系統(tǒng)的可靠度曲線,可以求得供電系統(tǒng)首次故障前的平均時(shí)間為MTTFF=3 449.6。圖3和圖4分別是在線運(yùn)行供電設(shè)備和供電系統(tǒng)的故障條件概率曲線,可以看出,兩條曲線在剛開(kāi)始的一段時(shí)間內(nèi)快速上升,在時(shí)刻κ=80之后,系統(tǒng)在線部件故障的條件概率達(dá)到穩(wěn)定值,且為0.004 5;而在時(shí)刻κ=210之后,系統(tǒng)故障的條件概率達(dá)到穩(wěn)定值,為3.043 2×10-4。在相同的時(shí)刻點(diǎn),在線部件故障的條件概率值要遠(yuǎn)遠(yuǎn)大于系統(tǒng)故障的條件概率值,這與直覺(jué)是相吻合的。

圖1 系統(tǒng)的可用度曲線Fig.1 Curve of the system availability

圖2 系統(tǒng)的可靠度曲線Fig.2 Curve of the system reliability

圖3 在線部件故障的條件概率曲線Fig.3 Conditional probability of failure for the online component

圖4 系統(tǒng)故障的條件概率曲線Fig.4 Conditional probability of failure for the system
(1) 把修理工的多重休假策略加入到離散時(shí)間可靠性模型的建模中,建立了修理工具有多重休假的兩部件冷貯備離散時(shí)間系統(tǒng)模型。
(2) 假設(shè)所涉及的隨機(jī)分布均為離散PH分布,且任何取值為正整數(shù)的離散概率分布是一個(gè)離散PH分布,所以建立的離散時(shí)間可靠性模型更具有一般性。
(3) 推導(dǎo)出離散時(shí)間可靠性系統(tǒng)所特有的可靠性指標(biāo):故障的條件概率以及可靠性系統(tǒng)模型一些常見(jiàn)的可靠性指標(biāo)(可用度和可靠度)。
(4) 本文僅研究了離散時(shí)間情形下一種只有2個(gè)部件的特殊的系統(tǒng)模型,如果將其推廣到更一般的系統(tǒng)模型,如部件數(shù)增加、部件故障機(jī)理復(fù)雜化(遭受沖擊)、維修策略多樣化等,系統(tǒng)在離散時(shí)間情形下運(yùn)行,在線部件的故障、修理的完成以及休假的完成能夠同時(shí)發(fā)生,系統(tǒng)狀態(tài)和維數(shù)將急劇增加,推導(dǎo)系統(tǒng)的轉(zhuǎn)移率矩陣考慮的情形將非常復(fù)雜,這是后續(xù)將要研究的一些問(wèn)題。