馮 曉, 郭霖瀚, 宋常浩, 孔丹丹
(1. 北京航空航天大學可靠性與系統工程學院, 北京 100191;2. 中國電子科技集團公司第十四研究所, 江蘇 南京 210039)
為了完成特定的使用任務要求,往往需要包含多個相同功能裝備的裝備群[1]來執行工作。可用度是指裝備群在任一時刻開始執行任務時,處于可工作或可使用狀態的概率度量。針對連續工作的裝備群來說,穩態可用度可以被用來表征裝備群的可用程度。因此準確計算其穩態可用度對裝備群的設計、運行和管理均具有顯著的理論意義和實用價值。
當裝備的各部件壽命分布和故障后的修理時間分布均為指數分布時,只要合理定義裝備的狀態,便可以使用馬爾可夫過程來描述裝備,從而進行穩態可用度的建模和求解。文獻[2-3]針對串聯、并聯等系統,在不考慮備件庫存的條件下利用馬爾可夫過程建模,計算系統穩態可用度和瞬時可用度。文獻[4]以單部件可修系統為研究對象,假設維修時間小于給定的常數時可以忽略,從而計算系統的穩態可用度。文獻[5-8]分別研究了兩類部件串聯的系統穩態可用度計算問題。文獻[9]給出了n個部件串聯的系統瞬時可用度和穩態可用度的表達式。文獻[10]研究了一種計算含有混合冷溫備件的多部件系統穩態可用度的方法。文獻[11]研究了包含3個不相同的部件、帶有優先權的串并聯可修系統,通過使用補充變量法和矢量馬爾可夫過程理論計算系統的穩態可用度。文獻[12-17]分別研究了k/n表決系統穩態可用度計算問題。文獻[18]中通過連續時間馬爾可夫鏈來描述系統的有限狀態,使用兩種方法分析長期使用的可修系統穩態可用度。
目前利用馬爾可夫過程研究穩態可用度時,考慮可修件庫存影響的并不多,但在實際維修過程中,經常出現由于等待或缺少備件造成維修延誤的情況,導致系統可用性降低。此外,現有文獻提供的方法多是利用馬爾可夫過程對單個系統進行可用度分析。由于裝備群中的裝備共用給定的備件資源,當某類備件出現短缺后,可用裝備的數量會隨之發生變化。因此無法通過計算單個裝備的可用度來求解考慮備件庫存影響下的裝備群可用度。
針對以上這些問題,本文考慮備件庫存影響,構建一種基于多個連續時間馬爾可夫鏈(continuous time Markov chain,CTMC)的模型來分析裝備群穩態可用度。首先,考慮裝備群中部件使用與維修的特點,采用可用裝備數、備件庫存數、備件短缺數3個參數來刻畫部件的狀態,對各類部件分別建立CTMC,進而建立裝備群的CTMC族模型;其次,根據各類部件的轉移率矩陣,求解各狀態穩態概率,并結合部件的期望備件短缺數(expected backorder,EBO)與可用裝備數之間的關系確定裝備群穩態可用度;再次,構造案例進行仿真驗證分析;最后,提出結論和未來的研究工作方向。
本文的研究對象是由N個同型的多部件裝備組成的裝備群。當執行任務時,裝備群中的裝備相互獨立地開展內容相同的工作。每個裝備由L類不同的關鍵部件串聯組成,其中第i類部件的單裝備安裝數為Zi,初始庫存數為Si。當備件不短缺時,直接使用備件來更換故障部件;當備件短缺時,需等待故障的部件維修好后,裝備才能重新執行任務。建模過程中考慮以下假設:
假設1部件及其備件均可修,且維修后能夠修復如新,不考慮報廢問題。
假設2第i類部件的故障間隔時間服從參數為λi的指數分布,維修時間服從參數為μi的指數分布。
假設3裝備群工作時間連續。
假設4除備件外其他維修資源均供應充足,并且修理能力無限。
假設5庫存結構為單基地模型,備件實行(s-1,s)及時送修策略。
假設6忽略故障件的更換時間。
由庫存平衡公式[19]BOi=OHi+DIi-Si可知,利用部件i的現有庫存量OHi、在修故障件數DIi以及部件的初始庫存量Si可以計算部件i的備件短缺數BOi。當部件i發生一次備件需求時,DIi就增加一件;若OHi≥1,則OHi就會減少一件;否則,BOi就增加一件。初始庫存量Si根據費用、庫存空間等約束提前確定。任意一類部件出現故障后,當備件不短缺時,直接使用備件來更換故障部件;當備件短缺后,該類部件的備件短缺數和在修故障件數均加1,則裝配該故障部件的裝備將處于故障維修狀態,導致裝備群中可用的裝備數減1。因此根據部件的備件短缺數、現有庫存量、在修件數與可用裝備數的上述關系,對帶有備件的裝備群進行馬爾可夫過程建模時,描述狀態的粒度可由裝備群細化到各類部件,從而避免直接對裝備群建模。
當各類部件的初始備件庫存為零時,如果考慮備件短缺對可用裝備數造成的影響,基于各類部件的CTMC建立裝備群的CTMC族模型,狀態空間規模將隨部件種類數L的增加呈線性增長;反之,基于馬爾可夫過程直接對裝備群進行建模,狀態空間的規模將隨L的增加呈指數增長。當各類部件有初始備件庫存時,使用前者方法得到的狀態空間將遠小于后者。故本文提出的模型將能夠顯著減少狀態空間的規模,從而降低計算穩態可用度的復雜度。
初始時刻裝備群中的N個裝備都能正常執行任務。在執行任務過程中,部件i(1≤i≤L)的狀態由Oi,Gi,BOi3個參數表示。其中,Oi表示受部件i影響的可用裝備數,0≤Oi≤N。Oi的取值與部件i的在修件數DIi有關。當DIi≤Si時,Oi=N;當DIi≥Si+1時,部件i每出現一次故障將導致一個裝備停機等待維修,Oi的取值從N-1逐漸減少到0。Gi表示在工作過程中部件i的庫存量,最大取值為部件i的初始庫存量Si。BOi表示部件i的備件短缺數,0≤BOi≤N。根據定義部件i的3個參數,建立部件i的CTMC為{Xi(t)=(Oi(t),Gi(t),BOi(t));t≥0},狀態轉移圖如圖1所示。其中包含有Ei=Si+N+1個狀態,編號分別為0,1,…,Si+N。圖1虛線左側表示備件充足時部件i的各狀態轉移過程,虛線右側表示備件短缺時部件i的各狀態轉移過程。

圖1 部件i的CTMCFig.1 CTMC of component i
當備件i充足時:如果1個部件i出現故障,將使用備件更換故障的部件,此時備件數量減1,可用的裝備數仍為N,部件i從狀態(N,Si-v,0)轉移到相鄰狀態(N,Si-v-1,0),轉移率為NZiλi;當1個部件i被修復后運回備件庫中,部件i的備件數增加1,部件i從狀態(N,Si-v-1,0)轉移到相鄰狀態(N,Si-v,0),轉移率為(v+1)μi。其中,0≤v≤Si-1。
當備件出現短缺時:如果一個部件i出現故障,將造成1個裝備暫停運行,即造成可用裝備數Oi減少1,備件短缺數BOi增加1,部件i將從狀態(N-k,0,k)轉移到狀態(N-k-1,0,k+1),轉移率為(N-k)Ziλi;當1個故障的部件i被修復后,能夠使得1個裝備恢復正常運行,即可用裝備數Oi將增加1,備件短缺數BOi減少1,部件i將從狀態(N-k-1,0,k+1)轉移到狀態(N-k,0,k),轉移率為(Si+k+1)μi。其中,1≤k≤N-1。
狀態(N,0,0)和狀態(N-1,0,1)是連接備件i是否出現短缺的兩個狀態。分析可知當部件i處于狀態(N,0,0)時,如果發生故障,可用裝備數Oi將減1,備件短缺數BOi從0變為1,從狀態(N,0,0)轉移到狀態(N-1,0,1)的轉移率為NZiλi;當部件i處于狀態(N-1,0,1)時,如果1個故障的部件i被修復,將使可用裝備數Oi增加1,備件短缺數BOi由1變為0,從狀態(N-1,0,1)轉移到狀態(N,0,0)的轉移率為(Si+1)μi。

表1 部件i的狀態轉移率

設部件i的瞬時概率分布為pi(t),穩態概率分布為πi,并且滿足
(1)
根據CTMC的性質,穩定狀態下可以列出方程組
(2)
式中,Ri表示部件i的轉移率矩陣;0表示1×Ei維的零矩陣;πi,j表示部件i處于狀態j的穩態概率,0≤j≤Si+N。
由圖1可以看出各狀態之間彼此互通,因此部件i的CTMC是非周期不可約的。由CTMC理論可知[20],方程組(2)存在唯一非負解,因此部件i的各狀態存在唯一的穩態概率分布。分析方程組(2)的特點,將狀態p(1≤p≤Si+1)的穩態概率表示為
(3)
狀態Si+h(2≤h≤N)的穩態概率表示為
πi,Si+h=
(4)
(5)
將式(5)的結果分別代入式(3)和式(4),計算得到部件i的穩態概率矩陣πi。
穩定狀態下部件i的期望備件短缺數計算公式為
(6)
式中,EBO(Si,t)是指t時刻部件i的期望備件短缺數;bi是指部件i的備件短缺數向量;bi,m是bi中的元素,指部件i處于狀態m時的備件短缺數。bi的具體形式為
bi=[bi,0,bi,1,…,bi,Si+N]T=
(7)
如果某個裝備出現備件短缺,該裝備即處于不可用狀態。故部件i的EBO(Si,t)等價于因備件i短缺造成的不可用裝備數的期望值。因此當各裝備處于平穩狀態時(t→∞),裝備群的EBOq等價于因各類備件短缺而造成不可用裝備數的期望值之和,即
(8)
裝備總數N與穩態下裝備群的EBOq相減,得到可用裝備數的期望值;而裝備群的穩態可用度Aq等價于可用裝備數期望值占總裝備數N的百分比[19]。因此裝備群Aq的計算公式為
(9)
式中,A(t)是指裝備群t時刻的瞬時可用度。
如果EBOq≥N,則Aq=0。因為當裝備群的EBOq≥N時,表明穩定狀態時任何一個裝備都不能正常使用,故穩態可用度Aq=0。
通過第2.1節和第2.2節的分析可知,根據裝備群和各類部件的相關信息,分別建立各類部件的CTMC,形成裝備群CTMC族模型;然后利用備件短缺數與可用裝備數之間的關系,構建裝備群穩態可用度模型。算法具體流程圖如圖2所示,具體步驟如下:
步驟1確定裝備群的相關參數。裝備總數N、部件類型數L、部件i的故障率λi、維修率μi、部件i的單裝備安裝數Zi以及部件i初始庫存數Si,其中i=1,2,…,L。各部件故障間隔時間以及故障后的維修時間均服從指數分布。
步驟2定義部件i的狀態。使用3個參數:受部件i影響的可用裝備數Oi、工作過程中部件i的庫存量、備件短缺個數,從而確定部件的狀態空間。
步驟3建立部件的CTMC。
步驟4確定部件的轉移率矩陣。
步驟5求解與部件的CTMC模型相關的方程組,計算部件的穩態概率分布。
步驟6計算部件的期望備件短缺數。
步驟7計算裝備群的期望備件短缺數。將每類部件分別執行步驟2~步驟6,聯合各類部件的CTMC,構建裝備群的CTMC族模型,將各部件的期望備件短缺數進行累加運算,從而計算裝備群的期望備件短缺數。
步驟8計算裝備群穩態可用度。根據裝備群期望備件短缺數與可用度之間的關系,計算裝備群穩態可用度。

圖2 穩態可用度算法流程圖Fig.2 Algorithm flowchart of steady availability
假設裝備群包含5個同型裝備,每個裝備由4類不同的關鍵部件串聯組成。忽略各類部件故障時的更換時間,并要求裝備群連續工作。假設各類部件之間相互獨立,部件平均故障間隔時間(mean time between failure,MTBF)、平均維修時間(mean time to repair, MTTR)均服從指數分布,具體數值如表2所示。各類部件的備件庫存方案如表3所示。為了驗證本文建立的裝備群穩態可用度計算模型的有效性,將案例中的數據分別代入本文構建的CTMC族模型(模型1)和多級可修產品庫存控制(multi-echelon technique for recoverable item control,METRIC)模型[19](模型2),使用Matlab軟件計算裝備群穩態可用度;同時使用保障效能仿真軟件(SIMLOX)進行仿真檢驗。3種計算方法的結果如表4所示,繪制的曲線如圖3所示。

表2 部件信息

表3 備件庫存方案
圖3可以看出,在各備件庫存方案下,3種模型的穩態可用度曲線幾乎重合。隨著各類備件數量的增多,裝備群穩態可用度逐漸增大并接近于1。對圖3中庫存方案編號為4、5處進行局部放大,結果顯示本文模型的結果同METRIC模型結果十分接近,但前者略微大于后者,更接近SIMLOX仿真的結果。METRIC模型假設裝備在工作過程中,對備件的需求量服從泊松分布。在計算備件的EBO時,設定備件短缺數的取值從1到無窮大,而實際裝備群中備件短缺數取值是有限的,因此使用METRIC模型計算的EBO會偏高。而本文建立的CTMC族模型中,選取的狀態空間確保備件短缺數的取值符合實際情況,因此本文模型計算的備件短缺數要小于METRIC模型的結果。通常情況下,裝備群的EBO最小等價于無串件拼修時穩態可用度最大。故本文模型計算的穩態可用度要略微大于METRIC模型的計算結果,更接近于SIMLOX仿真的結果。由此可以看出,本文通過構建CTMC族模型計算裝備群穩態可用度的方法是可行且有效的。

表4 不同備件庫存方案下穩態可用度的結果

圖3 不同備件庫存方案下穩態可用度曲線Fig.3 Steady state availability curves under different spare parts inventory schemes
通過本文研究,可以得出如下結論:
(1) 分析了裝備群的構型特點,構建了滿足庫存平衡關系的部件CTMC,并根據部件間的故障邏輯關系建立了裝備群CTMC族模型。相對以往利用馬爾可夫過程分析裝備群可用度的模型而言,這種建模方式能夠有效降低裝備群CTMC建模空間維數。
(2) 在求解裝備群CTMC族穩態概率的基礎上,結合各類部件的期望備件短缺數與可用裝備數之間的關系,給出了裝備群穩態可用度與部件庫存狀態穩態概率之間的函數關系。
(3) 提出了基于CTMC族的裝備群穩態可用度建模的算法流程與框架,為應用CTMC方法計算裝備群效能指標提供了一種新的技術途徑。
(4) 對本文建立的模型進行仿真實驗驗證。對比案例結果發現,應用本文模型計算裝備群穩態可用度比METRIC模型結果更接近于仿真實驗結果。
本文假設對故障件的維修能力無限,但在實際維修中由于一些原因的限制,維修能力往往是有限的。故未來的研究工作會著眼于研究包含維修約束的情況,建立維修能力有限的裝備群穩態可用度模型。
參考文獻:
[1] 郭小威,李保剛.備件冷儲備方案下裝備群任務可靠性建模[J].火力與指揮控制,2016,41(1):161-164.
GUO X W, LI B G. Mission reliability modeling of equipment group with cold standby scheme of spare parts[J]. Fire Control & Command Control, 2016, 41(1): 161-164.
[2] 曹晉華, 程侃. 可靠性數學引論[M]. 2版. 北京: 高等教育出版社, 2012: 182-249.
CAO J H, CHENG K. Introduction to mathematical reliability[M]. 2nd ed. Beijing: Higher Education Press, 2012: 182-249.
[3] WOOD A. Availability modeling[J]. IEEE Circuits & Devices Magazine, 1994, 10(3): 22-27.
[4] ZHENG Z, CUI L, HAWKES A G, et al. A study on a single-unit Markov repairable system with repair time omission[J]. IEEE Trans.on Reliability, 2006, 55(2): 182-188.
[5] JIA X J, SHEN J Y, XING R. Reliability analysis for repairable multistate two-unit series systems when repair time can be neglected[J]. IEEE Trans.on Reliability, 2016, 65(1): 208-216.
[6] 印明昂, 孫志禮, 王宇寧, 等. 有備件串聯系統的可靠性分析模型[J].東北大學學報(自然科學版),2012,33(10):1461-1464.
YIN M A, SUN Z L, WANG Y N, et al. Reliability model of series system with spare parts[J]. Journal of Northeastern University (Natural Science), 2012, 33(10): 1461-1464.
[7] KHALIL Z S. Availability of series systems with various shut-off rules[J].IEEE Trans.on Reliability,1985,34(2):187-189.
[8] 耿巖, 郭霖瀚, 王寄明, 等. 考慮休眠的兩部件系統可用度馬氏建模方法[J]. 儀器儀表學報, 2016, 37(9): 1996-2003.
GENG Y, GUO L H, WANG J M, et al. Markov modeling method for availability of two-item system under passivation[J]. Chinese Journal of Scientific Instrument,2016,37(9):1996-2003.
[9] 李紅霞, 孟憲云, 李寧. 可忽略部分維修時間的串聯可修系統的可用度分析[J]. 燕山大學學報, 2007, 31(6): 542-544.
LI H X, MENG X Y, LI N. An availability analysis of series repairable system with repair omission[J]. Journal of Yanshan University, 2007, 31(6): 542-544.
[10] KUO C, SHEU S, KE J, et al. Reliability-based measures for a retrial system with mixed standby components[J]. Applied Mathematical Modelling, 2014, 38(19): 4640-4651.
[11] HU L M, YUE D Q, LI J D. Probabilistic analysis of a series-parallel repairable system with three units and vacation[J]. Applied Mathematical Modelling, 2010, 34(10): 2711-2721.
[12] FROSTIG E, LEVIKSON B. On the availability of R out of N repairable systems[J]. Naval Research Logistics (NRL), 2002, 49(5): 483-498.
[13] MOGHADDASS R, ZUO M J, QU J. Reliability and availability analysis of a repairable k-out-of-n: G system with R repairmen subject to shut-off rules[J]. IEEE Trans.on Reliability, 2011, 60(3): 658-666.
[14] XIE W, LIAO H T, JIN T D. Maximizing system availability through joint decision on component redundancy and spares inventory[J]. European Journal of Operational Research, 2014, 237(1): 164-176.
[15] CEKYAY B, OZEKICI S. Reliability, MTTF and steady-state availability analysis of systems with exponential lifetimes[J]. Applied Mathematical Modelling, 2015, 39(1): 284-296.
[16] WU W, TANG Y, YU M, et al. Reliability analysis of a k-out-of-n: G repairable system with single vacation[J]. Applied Mathematical Modelling, 2014, 38(24): 6075-6097.
[17] SMIDT-DESTOMBES K S D, HEIJDEN M C V D, HARTEN A V. On the availability of a k-out-of-N, system given limited spares and repair capacity under a condition based maintenance strategy[J]. Reliability Engineering & System Safety, 2004, 83(3): 287-300.
[18] ANGUS J E. Availability of continuous service and computing long-run MTBF and reliability for Markov systems[J]. Probability in the Engineering and Informational Sciences,2001,15(3): 369-381.
[19] SHERBROOKE C C. Optimal inventory modeling of systems: multi-echelon techniques[M]. 2nd ed. Boston: Springer Science & Business Media, 2006: 37-40.
[20] KULKARNI V G. Modeling and analysis of stochastic systems[M]. 2nd ed. Boca Raton: CRC Press, 2009: 231-232.