楊鵬,邱靜,劉冠軍,張勇
國防科技大學 智能科學學院 裝備綜合保障技術重點實驗室,長沙 410073
測試性是指產品能及時并準確地確定其狀態(可工作、不可工作或性能下降),并隔離其內部故障的一種設計特性。作為產品通用質量特性之一,測試性對于保證產品可用性十分重要。測試性指標是對產品測試性水平的定量化描述,常見的測試性指標包括故障檢測率、故障隔離率、機內測試(Built-in-Test, BIT)虛警率等。測試性指標論證是指在裝備立項之初,由訂購方負責,在承制方配合下確定裝備測試性指標的過程。所確定的測試性指標將被寫入任務書作為裝備驗收的一項依據,明確新研裝備明確的測試性指標,無論對測試性設計還是對試驗鑒定都具有十分重要的意義。目前關于測試性指標論證的文章和報告雖有不少,但從實際應用情況來看,不少在研裝備的測試仍采用經驗法、類比法等方法,這反映實踐中仍缺乏理論性、可實施性強的指標論證方法,因此對測試性指標論證開展持續研究仍很有必要。
現有測試性指標論證方法大體上可分為3類:經驗法、類比法和模型法。
經驗法是借鑒老裝備測試性指標,綜合考慮新裝備任務要求、系統構成特性、使用和保障要求以及可利用的新技術,確定新裝備測試性指標的方法。經驗法的前提是必須有足夠的歷史數據或工程經驗。目前可供參考的數據大多來自于雷達和航空電子裝備,如GJB 3970—2000《軍用地面雷達測試性要求》給出BIT故障檢測率≥90%,BIT故障隔離率≥90%;GJB 4260—2001《偵查雷達測試性通用要求》給出基層級地面雷達的BIT故障檢測率≥80%,機載雷達的BIT故障檢測率≥80%等,而且近年來一些新裝備陸續開展了測試性試驗,積累了一定的驗證數據,這對同類新裝備的指標論證提供了一定的經驗。但是經驗法對非同類裝備尤其是過去缺乏測試性設計和試驗鑒定的裝備是不可取的,而且上述已知的指標并未公開其論證過程,經驗成分較多。由于經驗法主觀性較強,常被稱為“拍腦袋法”,但又因其操作簡便,是目前應用較多的方法。
類比法[1-3]是通過調查了解正在研制及已經投入使用的裝備的測試性技術狀況,包括設計要求、使用結果和存在的問題等,找出與新研裝備在使用要求、組成特性和技術水平等方面相近似的裝備,以其測試性指標為基準,參考當前測試性的一般要求值,并考慮本裝備與類比裝備不同之處,修正后確定該裝備測試性指標的一類方法。類比法需要相似裝備的指標作為參考,但是從目前檢索到的文獻資料來看,主要涉及電子裝備如雷達、火控、飛控計算機等,對非同類裝備并不適用。即使是同類裝備,對于新舊裝備進行類比評分時也存在主觀性強的問題。
模型法是建立測試性指標與相關指標的數學關系模型,然后代入相關指標的取值,求解出測試性指標的一類方法。相比于前兩類方法,模型法從測試性指標,如故障檢測率、故障隔離率的內涵和定義入手,試圖理清它們與其他相關指標之間錯綜復雜的內在關系,再從各種制約關系中求解出合理的測試性指標,使得指標論證具備充分的理論依據,理應成為測試性指標論證的不二選擇,然而實踐中因各種問題導致難以實施,下面做簡要分析。
代表性的模型法有2種,一種是文獻[1]介紹的方法,該方法首先建立測試性、可用性、可靠性和維修性四性之間的關系式(見本文式(1)),通過“四性”間的權衡分析來確定測試性指標,可稱其為權衡法。謝宗仁等[4]將權衡法的基本公式與馬爾科夫鏈、類比方法和故障列表等進行組合,對艦船裝備進行了測試性指標論證。蘇永定等[5]對權衡法的基本公式進行了拓展,分別構建了導彈儲存可用度、戰斗準備任務成功率、部署戰備完好率、發射任務成功率等指標與測試性指標的關系式,然后綜合上述關系式論證了導彈測試性指。Lv等[6]從戰備狀態和可用度等指標進行了建模,對可靠性、維修性和測試性指標進行了權衡分析。張延生等[7]綜合權衡法基本公式與馬氏模型、層次分析法(Analytic Hierarchy Process, AHP)等4種模型對某電子設備進行了測試性指標論證。呂曉明等[8]綜合權衡裝備可用度和全壽命周期費用這2方面因素,以可用度最大、全壽命周期費用最小為評價目標,建立了雙函數的測試性指標優化模型,通過假設變雙函數優化為單函數優化并進行了求解。Vorob’ev等[9]從測試性對飛機武器系統使用效率影響的角度研究了測試性指標確定方法。呂建偉等[10]針對故障模糊度的確定問題,建立了通用優化模型,給出了模型求解的逐步尋優算法和動態規劃算法。上述方法均是從基本公式出發,或改進或擴展,可將其統稱為權衡法。權衡法將測試性指標同可用度聯系起來,不僅體現了測試性的重要性,還揭示了測試性指標與其他指標的內在聯系。經驗法和類比法只能說明新裝備的測試性可以做到這樣,無法表明做到這樣是否足夠,而權衡法則明確回答了為什么要做到這樣。站在用戶的角度,“我應”比“我能”更重要,因為滿足可用度是新裝備立項的基本條件之一,如果“三性”指標達不到,將導致可用度不達標,所以權衡法對裝備論證單位而言更合適。但是權衡法仍存在一些問題,例如其基本公式存在一定偏差,對相關影響因素分析不夠全面,部分相關因素(如各種費用等)難以科學量化等,還需進一步研究。
另一種是由錢彥嶺等[11]提出的基于廣義隨機Petri網的論證法,該方法利用Petri網工具建立裝備在壽命周期里的各種測試、診斷和維修活動的數學模型,代入已知的(或者假定)過程參數,采用數值分析方法得出穩態可用度與測試性指標之間的關系曲線,再通過權衡確定測試性指標。此后,蘇永定等[12-13]、白力舸等[14]、王小強和韓斌[15]、翟禹堯等[16]繼續開展了研究。上述方法均是基于Petri網及其改進模型,不妨統稱為Petri網法。此外Petri網法還被用于可靠性、安全性等指標的分析和論證[17-22],成為一個研究熱點。相比于權衡法,Petri網法將指標模型動態化、細節化,理論性更強、科學性更高。但另一方面,要獲得精確解必然要求模型更加精細,而這將導致建模難度加大;不同對象的模型差別較大,導致模型適用范圍較窄;在推理計算中需要大量的數據,而這些數據在實際應用中往往難以獲取,導致實際應用比較困難。
不妨對上述方法做一簡單排序,若從可實施性來比較,經驗法最易實施,然后依次是類比法、權衡法、Petri網法;若從科學性來比較,Petri網法最科學、理論性最強,然后依次是權衡法、類比法、經驗法。本文從兼顧實施性和科學性的角度出發,選擇權衡法開展進一步研究,致力于解決其存在的技術問題,進一步提高其科學性和可實施性。
本文提出的ROM論證法源自文獻[1],其基本思路如圖1所示。圖1中,A(ta)為裝備在ta時間內的可用度;R(tm)為裝備在tm時間內無故障工作的概率(即可靠度);M(tr)為檢測出的故障在tr時間內修復的概率(即可維修度);MTTR(Mean Time to Repair)為平均修復時間;γFD為故障檢測率;γFI為故障隔離率;γFA為虛警率。
圖1 權衡論證法的技術流程[1]
步驟1構建故障檢測率、可用度、可靠度、維修度之間的關系模型:
A(ta)=R(tm)+γFDM(tr)[1-R(tm)]
(1)
式中:ta=tm+tr。式(1)說明,裝備在規定時間內是否可用,取決于裝備的可靠度與其故障后的檢測和維修能力。
步驟2將已知的A(ta)和R(tm)代入式(1)得到γFDM(tr),再對γFD和M(tr)進行權衡分析,得到γFD和M(tr)。
步驟3由M(tr)與MTTR之間的關系式計算MTTR。
步驟4由MTTR與γFI的關系式計算γFI。
步驟5由γFA與γFD的關系式計算γFA。
上述步驟省略了部分推導過程和關系式,詳見文獻[1]。本文認為該方法存在以下問題:
問題1根據可用度及戰備完好率的標準定義[23],式(1)中的“可用度”實則應為“戰備完好率”,且該式把故障檢測率與可維修度相乘的表達欠妥。因為可維修度不僅受維修過程(拆卸與更換等)的影響,還受到故障診斷過程(檢測與隔離)的影響,所以故障檢測率與可維修度不宜并列出現。在可維修度的公式中引入測試性指標更合理,這樣能更好地反映故障診斷能力對維修性的影響。
問題2沒有體現故障檢測率與故障隔離率之間的關聯性。根據文獻[1],故障檢測率是指BIT檢測到的故障數與總故障數之比,故障隔離率是指BIT隔離的故障數與檢測到的故障數之比。顯然這2個指標之間存在聯系,為簡化推導可將它們合并為一個指標進行論證。
定義1故障診斷率,指在規定條件下,用BIT正確診斷出的故障數與總故障數之比。它反映BIT的故障診斷(含檢測與隔離)能力,記為
(2)
式中:ND和NS分別為裝備在規定時間(例如時間ta內)正確診斷出的故障數和發生的故障數;λS=NS/ta和λD=ND/ta分別為裝備在單位時間內發生的平均故障數(即故障率)和診斷出的平均故障數。引入故障診斷率之后,對虛警率定義式進行相應改動。
定義2虛警率,指在規定時間內BIT虛警(含假報和誤報)次數與全部報警(含虛警和正確診斷)次數之比,記為
(3)
式中:NFA為在時間ta內的虛警次數;λFA=NFA/ta為在單位時間內的平均虛警次數。式(3)與文獻[1]中定義的區別在于后者將ND和λD定義為在時間ta和單位時間內檢測出(而非診斷出)的故障數。之所以要對虛警率做此改動,一是為了在后面的推導中便于將指標符號統一;二是在實際中把ND和λD理解為“檢測出”或者“診斷出”的區別并不大,因為實際中BIT不限于檢測故障,而是同時具備檢測和隔離故障的能力。
問題3沒有體現虛警率對可靠度和可維修度的影響,而這對確定虛警率極為重要;沒有考慮BIT對可靠度的影響,因為診斷能力的提升依賴于BIT,而BIT反過來會降低可靠度,這一點對權衡診斷能力和可靠度十分重要。事實上,文獻[1]分析了BIT診斷能力和BIT虛警對可靠度和可維修度的影響,但是并未將其用于測試性指標論證。
基于上述分析,提出圖2所示技術路線。
圖2 ROM論證法的技術流程
步驟1建模。具體步驟包括:
1)構建ROM初始模型。記O=f(MTBF,MTTR),其中O為戰備完好率,MTBF(Mean Time Between Failure)為平均故障間隔時間。建模過程詳見3.1節。
2)構建MTBF模型。因為BIT也有可靠性問題,帶BIT的裝備故障率是自身故障率與BIT故障率之和,據此建立MTBF模型,簡寫為MTBFSB=f(γD,γFA,β)MTBFS,MTBFS和MTBFSB分別為不帶BIT和帶BIT裝備的平均故障間隔時間;β為BIT故障率與裝備自身(不含BIT)故障率的比值。建模過程詳見3.2節。
3)構建MTTR模型。一方面BIT可縮短故障診斷時間,另一方面BIT自身故障需要額外的診斷時間,據此建立MTTR模型,簡寫為MTTRSB=f(γD,γFA,β,k)MTTRS,MTTRS和MTTRSB分別為不帶BIT和帶BIT裝備的平均修復時間,k為維修作業時間占整個修復時間的比重。建模過程詳見3.3節。
4)構建γD、γFA、β的數學模型。由于把MTBFSB和MTTRSB代入ROM初始模型后,得到一個多元一次方程,除了需要求解的γD、γFA,還有β等未知參數,無法直接求解γD、γFA。本文發現γD、γFA和β都與BIT數量n有關,據此分別建立模型,簡寫為γD=f(α1,n),γFA=f(α2,n),β=f(α3,n),其中α1、α2、α3為待定參數。建模過程詳見3.4節。
5)將γD、γFA、β代入MTBFSB、MTTRSB,再代入ROM初始模型,得到OSB=f(α1,α2,α3,k,n)。
步驟2求解指標。具體步驟包括:
1)根據OSB=f(α1,α2,α3,k,n),即使給定OSB,并根據文獻[1]確定參數k,仍有4個未知參數,無法求解參數n,需要研究參數α1、α2、α3的確定方法。推導過程詳見第4節。
2)將已知參數全部代入OSB模型,求解參數n。
3)將n代入γFA模型,得到γFA。
4)將n代入γD模型,得到γD。
5)對式(2)的γFD和γFI進行權衡,得到γFD和γFI。
以上步驟中,核心步驟是步驟1的第1)~4)步和步驟2的第1)步,將分別在本文第3、4節進行詳細介紹,其他步驟將在第5節中介紹。
根據第1節的分析對式(1)進行修改,得到
O(ta)=R(tm)+M(tr)[1-R(tm)]
(4)
與式(1)相比,式(4)去掉了γFD,表達式更加準確,后續可以通過分析測試性與可靠性、維修性的影響關系來建立測試性指標與戰備完好率之間的聯系。
假設裝備壽命服從指數分布,則有
(5)
假設維修概率密度也服從指數分布,則有
(6)
將式(5)、式(6)代入式(4),可得
(7)
式(7)稱為ROM初始模型,它將式(4)中的R(tm)和M(tr)分別替換為MTBF和MTTR,便于后面引入故障診斷率γD和虛警率γFA。
測試性設計的核心是BIT設計,而BIT是一把雙刃劍。一方面,它可以增強裝備的診斷能力,提高其可靠性;另一方面,BIT會發生故障,還存在虛假報警(虛警)問題,所以BIT會降低裝備的可靠性。為了刻畫BIT的這一特性,定義了帶BIT裝備的故障率λSB[1]為
λSB=λS+λB+λFA
(8)
式中:λS、λB、λFA分別為在單位時間內裝備發生的平均故障數(即裝備自身故障率)、BIT發生的平均故障數(即BIT故障率)和BIT發生的平均虛警數。式(8)等號右邊加上了虛警次數λFA,這是因為無論什么原因造成的BIT虛警,從使用者的角度來看裝備都是非正常的,即發生了故障,盡管這個故障是假的。值得注意的是,式(8)中的λS不包括BIT故障數,僅指裝備自身(不含BIT)的平均故障數,這與式(2)中的λS略有不同,下文出現的λS均沿用此處的定義。
假設裝備故障服從指數分布,有
(9)
再令
(10)
式中:β為BIT故障率與裝備自身故障率的比值。將式(2)、式(3)、式(9)、式(10)代入式(8),消去λSB、λB、λFA、λS,可得
(11)
由圖3可以看出:① 隨著β的增大,KR顯著降低;② 隨著γFA的增大,KR明顯降低;③ 隨著γD的增大,KR呈現下降趨勢,而且當γFA較大時,下降幅度更大。前面2條規律容易理解,對于第3條規律,理論上講故障診斷率與平均故障間隔時間并無直接關系,但是γD的改變使得λFA發生改變進而影響了MTBF,而且γD和γFA共同作用加速了MTBF的下降。
因此可以得出結論:提高故障診斷率會降低裝備可靠性,所以不能無節制地提升故障診斷率,
必須對其設置上限;虛警率提升會降低裝備可靠性,應降低虛警率。
一方面BIT具有自動檢測和隔離故障的能力,可減小平均修復時間;而另一方面BIT故障和虛警會造成不必要的維修,進而增加平均修復時間。據此,將帶BIT裝備的平均修復時間[1]定義為
(12)
式中:λD、λS、λB、λFA分別為在單位時間內BIT診斷出的平均故障數、裝備發生的平均故障數(即裝備自身故障率)、BIT發生的平均故障數(即BIT故障率)、BIT發生的平均虛警數;tD、tNB、tB分別為修復BIT診斷出的裝備故障、非BIT診斷出的裝備故障及BIT故障的所耗費的平均時間;tFA為排除BIT虛警所耗費的平均時間。
tNB包括維修前的準備時間tSU、故障隔離時間tFI、故障單元更換時間tR和修復后的檢驗時間tV;tD主要包括tSU、tR,BIT隔離故障的時間和檢驗時間較短,相對于tSU、tR這2個時間可忽略不計;因為BIT不能檢測和隔離它自身的故障,修復BIT故障需要采取常規手段,所以tB=tNB;因為虛警導致的維修也必須采用非BIT的常規手段,所以tFA=tNB。綜上分析,有
(13)
令MTTRS表示不帶BIT裝備的平均修復時間,據前面的分析有
MTTRS=tNB
(14)
再令
(15)
式中:k為維修作業時間(維修前的準備時間加故障單元更換時間)占整個修復時間的比重;β為BIT故障率與裝備自身(不含BIT)故障率的比值。
將式(2)、式(3)、式(13)~式(15)代入式(12),消去λSB、λB、λFA、λS、tD、tB、tNB、tFA,得
MTTRSB=
(16)
可以看出:① 隨著γD的提升,KM顯著下降(圖4);② 隨著γFA的增大,KM變化不明顯(圖4(a)、圖4(b));③ 隨著β的增加,KM下降速率變緩(對比圖4(a)~圖4(d),曲線傾斜度變小);④ 隨著k的增加,KM下降速率變緩(圖4(c)、圖4(d),曲線傾斜度變小)。
圖4 函數KM=f(β,γFA, k,γD)的曲線
因此可以得出結論:提高故障診斷率可以提升裝備維修性水平,所以從維修性角度來看,應盡量提升故障診斷率。
不妨令帶BIT裝備的戰備完好率為OSB,套用式(7),有
(17)
其中:
(18)
式中:OSB、tm、tr、MTBFS、MTTRS可通過裝備研制要求中獲取,本文將其視為已知量。文獻[1]指出,國外航空機載設備和系統統計數據表明k一般取值不小于0.4,據此本文取
k=0.4
(19)
去掉已知量后,剩下未知量γD、γFA、β,顯然僅由式(17)無法求解。對此常見的方法有2種:一是基于經驗假設某些參數已知,再去求解剩余參數;二是引入其他參數構建優化目標,采用尋優算法得到最佳的指標組合。擬采取不同的解決方法,即尋找與上述未知參數均相關的公共因子及其關系式,將3個未知量消減至1個,求解后代入式(17)求解出目標量。
分析發現,γD、γFA、β之間存在一定的內在關系,將它們關聯起來是一個隱含的中間變量,即BIT的數量,不妨記為n。下面依次分析3個變量與n的關系。
3.4.1γD與n的關系
γD的高低取決于BIT的診斷能力,一個裝備的診斷能力等于它所有BIT診斷能力的疊加。假設每個BIT的診斷能力相同,那么γD將取決于BIT的數量n,換言之,γD與n存在單調遞增關系。根據γD的定義式(2),γD取值區間為[0,1],且當γD較低,如趨于0時,隨著n的增加,它的增長速度較快;當γD增加到一定階段,如趨近1時,隨著n的增加,它的增速減緩直至不再增加,可以用一個反正切函數[24]描述γD與n之間的關系:
(20)
式中:α1為一個待定的未知量,反映了單個BIT的平均診斷能力,α1越大,γD隨n增長的速度越快。繪制函數γD的曲線如圖5所示。
圖5 函數γD=f(α1,n=0~100)的曲線
可以看出,α1的取值對γD的影響非常大,所以必須確定α1的取值,方法詳見4.1節。
3.4.2γFA與n的關系
根據γFA的定義式(3),可知γFA不僅與λFA有關,還與λD有關。雖然γFA與n無直接關系,但是λD、λFA均與n有關,下面分別展開討論。
首先,綜合式(2)、式(20),有
(21)
其次,λFA取決于BIT設計中是否采取有效的防虛警措施,這存在一定的隨機性,但從統計學角度來,假設每個BIT都采取了相同或相近的防虛警措施,那么單個BIT在單位時間內發生虛警次數近似相等,也就是說λFA與n成正比例關系,即
λFA=α2n
(22)
式中:α2為一個待定的未知量,它反映了單個BIT的平均防虛警能力,α2越小,說明防虛警能力越好,虛警次數越少。
將式(21)、式(22)代入式(3),可得
(23)
圖6 函數γFA=f(α2,n=0~100)的曲線
可以看出,λFA隨n近似線性遞增,且隨α2的增大而遞增速度(斜率)變大。顯然α2的取值對λFA的影響非常大,所以必須確定α2的取值,方法詳見4.2節。
3.4.3β與n的關系
β定義為BIT故障率與裝備自身(不含BIT)故障率的比值,假設每個BIT的故障率相同,則BIT故障率λB將正比于n,即
λB=α3n
(24)
式中:α3為一個待定的未知量,表示單個BIT的平均故障率。
令λS=1/150,連同式(24)代入式(15)中的β=λB/λS,繪制β曲線如圖7所示。
圖7 函數β=f(α3,n=0~100)的曲線
可以看出,β隨n線性遞增,且隨α3的增大而遞增速度(斜率)變大。顯然α3的取值對β的影響非常大,所以必須確定α3的取值,方法詳見4.3節。
將式(18)、式(20)、式(23)、式(24)代入式(17),得到OSB=f(α1,α2,α3,k,n)。取MTBFS=150 h,MTTRS=30 min,tm=240 h,tr=20 min,繪制出不同α1、α2、α3、k取值下的OSB曲線,如圖8所示。
圖8 函數OSB= f(α1, α2, α3, k, n)的曲線
可以看出在不同參數取值下,OSB曲線均表現出先升后降的特點。這是因為:① 當BIT數量較少時,其對提升診斷能力的貢獻大,這導致戰備完好率快速提升;② 當BIT數量接近可更換單元以后,進一步增加BIT數量對提升診斷能力的貢獻減弱,同時BIT的負面因素(BIT虛警和BIT故障)逐漸凸顯出來,并對可靠性、維修性造成不利影響,導致戰備完好率緩慢下降。
進一步分析不難發現,γD不僅與BIT的數量n有關,還與裝備的可更換單元(Line Replaceable Unit, LRU)數量m有關。為簡化分析且不失一般性,先作如下假設:① 各LRU故障率相同;② 把故障隔離到1個LRU視為有效診斷;③ 每 個BIT均檢測LRU的全部故障,不存在檢測LRU部分故障的情況;④ 每個BIT兩兩不冗余,即任意2個BIT所檢測LRU不完全相同。顯然,當n=1時最多可有效診斷1個LRU的故障,當n=2時最多可有效診斷3個LRU的故障。以此類推,可知n個BIT最多可有效診斷2n-1個LRU的故障,即只要BIT超過LRU半數,則理論上可以實現100%的有效診斷。當然實際中很難達到這樣的效果,將條件放寬,假設每個LRU各有1個BIT,且每個BIT均只檢測本LRU的故障,那么理論上故障檢測到即實現隔離,即n=m時,將以極大概率C(0≤C≤1)實現有效診斷,將其代入式(20),有
(25)
依次取C=0.95,0.85,0.75,0.65,0.55,再取m=10~100,繪制α1曲線如圖9所示。
圖9 函數α1= f(C, m)的曲線
可以發現以下規律:①α1隨m單調遞減,且隨概率C的減小而減??;②α1在早期(m≤30)快速減小,后期(m≥70)減速逐漸變緩;③ 當C≤0.85,曲線相較接近。這為確定α1提供了參考依據。
α2反映了單個BIT的平均防虛警能力,不妨令n=1,即假設裝備僅有1個BIT,下面采用文獻[25]中的方法來討論其虛警率。
令在某個狀態下BIT觀測值x服從正態分布,即x~N(μ,σ2),一旦估計出某BIT在某狀態下觀測值的分布函數,則進一步根據測試容差理論來估計該BIT的虛警率。BIT虛警示意圖如圖10所示。
圖10 BIT虛警率示意
判斷觀測值是否正常時,需要先設定容差,不妨將容差設定為(χ1,χ2)。規定χ1≤x≤χ2時判斷觀測值x為正常,否則判斷觀測值為異常。于是,BIT的虛警率即為x的分布函數落在容差范圍之外的面積,則虛警率計算公式為
γFA=1-P(χ1≤x≤χ2)=
(26)
式中:函數Φ(·)可以通過查閱正態分布表得到。一旦給定BIT觀測值的概率密度函數及容差,就可以根據式(26)計算得到虛警率。
α3表示單個BIT的平均故障率。已有的經驗表明:① BIT中的軟件成分占比越高,則BIT的可靠性越高,反之硬件占比越高,則可靠性越低;② 電 子產品BIT設計技術成熟度較高,BIT可靠性較高,而機械、液壓等非電子產品的BIT設計難度較大,成熟度也略低于電子產品,因此其BIT的可靠性較低;③ 設計BIT所需的元器件通常要求比設計功能電路的同類元器件可靠性高一個數量級,而實際情況是處于同一個量級。綜上把α3取值范圍定為(10~100)×10-6。
已知某光電一體化設備,要求根據以下已知數據論證其測試性指標:①由57個LRU構成;②MTBF≥150 h,該設備以電子器件為主,可視故障為指數分布;③MTTR≤0.5 h;④持續任務時長240 h,可將其視為工作時長tm;⑤任務后收尾時長20 min,可將其視為外場的維修時長tr,據此有
(27)
由于ROM模型在前面章節已構建完畢,下面開始解算測試性指標。
步驟1確定參數α1、α2、α3。
依據4.1節,需要確定參數m和C才能計算α1。根據圖16,當m=57時,5條曲線總體趨于平緩,且相差不大,據此不妨令C=0.85,將其代入式(25)可得α1=0.073 1。
γFA=1-P(χ1≤x≤χ2)=
1-0.954 5=0.045 5
(28)
再將式(28)和n=1代入式(23),可得α2=1.476 3×10-5。
依據4.3節,該設備主要為電子器件,不妨取中間值α3=20×10-6。
步驟2將以上計算出的參數α1=0.073 1、α2=1.476 3×10-5、α3=20×10-6依次代入式(20)、式(23)、式(24),然后將這3式連同式(19)、式(18)代入式(17),繪制OSB(ta)曲線如圖11所示。
可見這是一條上凸的曲線,曲線峰值坐標為(39,0.714 4)。
由于該設備并未規定戰備完好率要求,從圖11中取極大值點,得到最佳BIT數量為n=39,再將其代入式(20)、式(23),得到γD=0.785 2,γFA=0.099 1。
圖11 函數OSB= f(α1=0.073 1, α2=1.476 3×10-5, α3=2×10-5, k=0.4, n)的曲線
步驟3計算故障檢測率和故障隔離率。根據式(2)可知γFD與γFI成反比,由于這2個指標均存在邊界條件0≤γFD、γFI≤1,因此當給定γD=0.785 2時,必然有0.785 2≤γFD、γFI≤1。由于故障隔離率定義為隔離的故障數與檢測的故障數之比,也就是說要先檢測再隔離,所以先確定γFD,再根據式(2)確定γFI。目前各類裝備故障檢測率一般要求不低于0.9,據此不妨取γFD=0.9,可得γFI=0.87(隔離到1個LRU)。
若給定戰備完好率,則存在2種情形。
情形1給定的戰備完好率大于曲線中的最大值,說明已有的參數不能達到要求的戰備完好率,對此需修改參數,如提升α1或降低k、α2、α3、λS,直到滿足要求值,此時測試性指標也相應地發生改變。例如要求戰備完好率不低于0.75,顯然0.75高于圖11中的峰值點,根據圖8可發現,圖8(a)中k=0.3對應曲線(其他參數取值與圖11相同)的峰值點恰為0.75,圖8(b)中α2=0.2對應曲線(其他參數取值與圖11相同)的峰值點超過了0.75,圖8(d)中α3=1×10-6對應曲線(其他參數取值與圖11相同)的峰值點恰為0.75,因此可從圖8(a)、圖8(b)和圖8(d)中選取合適的參數取值,然后找到其峰值對應的n,再代入式(20)、式(23)求解出對應的γD、γFA。其中圖8(b)中α2=0.2對應曲線有一段區間超過了0.75,可以取其峰值點來確定n的取值,也可以采用情形2中的方法來確定n的取值。
情形2給定的戰備完好率小于曲線中的最大值,此時有2種選擇:一是進一步考慮成本因素,以最小BIT設計成本的目標,在曲線中取恰好滿足要求戰備完好率的最小n點;二是不計成本,仍以最高戰備完好率為目標,選擇曲線中的峰值點。例如要求的戰備完好率為0.7,顯然圖11中的曲線有一段超過了0.7,若以節約成本為目標,則最佳的目標點為(23,0.700 6);若以最高戰備完好率為目標,則最佳目標點為(39,0.714 4)。
對現有的測試性指標論證方法進行了對比分析,選擇科學性與實施性均較好的權衡法作為研究對象,對其存在的問題進行了剖析,提出了一種基于ROM模型的測試性指標論證方法。主要工作和結論如下:
1)對“四性”基本關系式進行了修正,將基本式中的可靠度和可維修度分別用MTBF和MTTR替換,再把基本式中的測試性指標挪到MTBF和MTTR模型中,使四性邏輯關系更加清晰,隸屬關系更加明確,由于在MTBF和MTTR模型中綜合考慮了BIT的各種利弊,使得ROM模型更加科學合理。
2)考慮到故障檢測率與故障隔離隔離率之間的聯系,將其合二為一提出了故障診斷率指標,并將其納入后續的MTBF和MTTR建模,其物理關系更清晰,推導過程更簡潔。
3)針對ROM模型求解時面臨待解參數多、難以直接求解的問題,引入中間參數n,建立起待解參數與n的關系式,起到了消減參數的目的。
4)在模型構建和參數求解過程中進行了較為充分的仿真分析,得到了大量與經驗相符的規律性結論,如:故障診斷率隨BIT數量n的增加呈現拋物線式的增加,戰備完好率隨BIT數量n的增加先升后降,等等,這些規律為不同對象應用該方法進行參數設置提供了較為充分的參考。
應用本文方法對某光電一體化設備進行了指標論證,驗證了本文方法的有效性和可實施性。