李根成
(中國空空導彈研究院,河南 洛陽 471009)
武器裝備既要求功能強大、性能優良,又要求安全可靠地工作,故障時能及時發現并方便維修,使用時盡量少依賴其他設備保障。前者被稱為裝備的專用質量特性,后者被稱為通用質量特性[1]。
可靠性作為裝備重要的通用質量特性指標,是裝備的固有屬性,不但要靠研制階段的設計來實現,也與生產階段的工藝控制密切相關[1]。設計定型時研制的用于靶場外試驗和靶場試驗的產品數量常常有限,但研制單位對設計定型比較重視,所以該時期生產出的產品往往質量較好。批生產時需交付的產品數量多,若批產工藝不完善或控制不到位,生產出的產品質量水平則會波動較大[2]。為避免此類問題發生,軍方要求對產品進行生產定型,以檢驗設計定型后的批產工藝是否完善和穩定。
該產品研制總要求中規定的平均故障間隔掛飛時間MTBF指標為:最低可接受值87 h,置信度0.70;規定值150 h,置信度0.80。在設計定型時選取GJB899A《可靠性鑒定和驗收試驗》中的定時試驗方案,對MTBF的最低可接受值進行了實驗室可靠性鑒定試驗,即總有效試驗時間T為檢驗下限θ1的2.44倍,若期間出現的責任故障數不大于1,則認為產品通過了鑒定試驗。按GJB899A等文獻,θ1取值為最低可接受值87 h[3-6]。
軍方要求,批量生產前應對小批試生產出的產品進行功能性能試驗、環境鑒定試驗、電磁兼容試驗、供電特性試驗、可靠性鑒定試驗等靶場外試驗,之后進行靶場試驗。通過這一系列的生產定型試驗后才能批量生產和交付,其中生產定型試驗中需對MTBF進行實驗室可靠性鑒定試驗。
在選取可靠性試驗方案時,使用方主要關注檢驗下限及相應風險。在滿足使用方要求的前提下,生產方希望確定的試驗方案應使好產品高概率通過鑒定試驗。在設計試驗方案時,使用方提出既然生產定型后要大批量生產,生產定型階段應檢驗產品可靠性是否達到150 h,并取θ1=150 h。
雖然國家軍工產品定型委員會在1992年就提出了裝備生產定型程序和要求[7],但嚴格按GJB1362開展生產定型試驗的裝備很少。經查閱相關文獻,涉及生產定型可靠性鑒定試驗研究的論文也很少,有限的文獻沒有涉及壽命型指標的驗證方案[8-13]。陶勇[8]基于可接收質量水平和過程平均值這兩個參數,給出了確定抽樣及定型時機的兩種方法;府大興等[9]總結了某機載雷達生產定型中的工藝技術及工藝實踐,提出通過完善工藝文件、加強過程控制來維持產品質量穩定;楊策、董理等[10-11]針對魚雷生產定型試驗樣本量小的問題,提出了基于先驗信息的Bayes可靠性評估方法;文獻[12]重點對生產定型鑒定試驗中的下限如何選取進行了詳細闡述;文獻[13]對生產定型時成敗型產品的靶試方案進行了可靠性分析。
下面從方案設計、生產定型、接收概率等方面對產品生產定型可靠性試驗的方案進行設計與分析。
可靠性試驗有工程試驗和統計試驗之分。前者主要目的是發現產品可靠性薄弱環節,為設計改進提供信息,如可靠性研制試驗、可靠性強化試驗;后者主要用于評估產品可靠性水平,為產品是否達到要求提供判斷依據,如定型階段的可靠性鑒定試驗、生產階段的可靠性驗收試驗,以及適用于研制、使用中測試產品可靠性的測定試驗[14-16]。本文是評定產品可靠性水平,為能否生產定型提供依據,故為統計試驗。
GJB899A將統計試驗中的可靠性鑒定試驗和可靠性驗收試驗統稱為可靠性驗證試驗,并提供了故障服從指數分布時序貫、定時、全數三類統計試驗方案[3]。該類產品的可靠性鑒定試驗通常選用定時試驗方案。
GJB899A明確,產品在定時截尾試驗中的接收概率如下[3]:
(1)
式中:θ為產品的MTBF真值;r為接收產品時試驗中允許的責任故障數;T為總有效試驗時間。
式(1)描述的抽樣特性函數實際上是近似表達式,這可以從以下推導看出。
隨機抽取樣本量為n的一個樣本進行可靠性試驗,當累計試驗時間達到預定時間T時結束。設試驗中共出現k次故障,若k≤r,認為批產品可靠性合格,做出接收判決;若k>r,認為批產品可靠性不合格,做出拒收判決。
設試驗進行到t時刻產品可靠度為R(t),不可靠度為F(t),產品可靠性服從指數分布,且指數分布參數為λ,則R(t)=e-λt,F(t)=1-e-λt,到t時刻,n個產品出現k次故障的概率為
(2)
組合表達式為
(3)
故到t時刻,產品故障次數k≤r,被接收的概率為
(4)
由于一般情況下產品的λ值都很低,故

1-λt
(5)
F(t)=1-R(t)≈1-(1-λt)=λt
(6)
即接收概率為
(7)
在nλt≤5,F(t)≤0.1的條件下,式(7)的二項概率可用泊松概率近似[4, 6],即
(8)
一般情況下,n比較小,T≈nt,從而有
(9)
指數分布中θ=1/λ,故式(9)可寫為式(1)。
試驗方案應能保證可靠性不大于檢驗下限θ1的產品被低概率接收,可靠性不小于檢驗上限θ0的產品被高概率接收。一般要求P(θ1)=β(β為使用方風險),P(θ0)=1-α(α為生產方風險),即
(10)
(11)
將α,β,θ0,θ1代入式(10)~(11),可得定時試驗方案中的T和r。由于r為整數,故T和r通常是近似解。將近似值T和r再代入式(10)~(11),可得定時試驗方案(T,r)中實際的生產方風險α′和使用方風險β′。GJB899A中的表A.6標準型定時試驗統計方案簡表和表A.7高風險定時試驗統計方案簡表就是這樣設計的。
以GJB899A中表A.7中的定時試驗方案20為例,方案中生產方風險和使用方風險的名義值α=β=30%,鑒別比d=θ0/θ1=2。將α,β和d代入式(10)~(11),可得近似解T=3.7θ1,r=2。將T和r代入式(10),可得α′=28.28%,約等于表A.7中的28.3%;將T和r代入式(11),可得β′=28.54%,約等于表A.7中28.5%[3]。
GJB899A僅給出鑒別比d分別為1.5,2和3時的定時試驗方案,當直接選GJB899A的試驗方案不符合產品實際時,可由式(10)~(11)設計定時試驗方案[5]。
受到試驗時間、產品數量等限制,有時無法采用同時滿足式(10)~(11)的試驗方案。對武器裝備的鑒定是軍方要求,保證使用方風險排在第一位,即設計試驗方案時首先要滿足P(θ1)=β。在此基礎上,生產方考慮準許的試驗時間、受試產品數量、能承受的最大風險等,再設計鑒定試驗方案。GJB899A中圖A.22~A.24分別給出了使用方風險β分別為10%,20%,30%時的定時試驗統計方案,這些方案就是依據式(11)設計的[3, 5]。
以GJB899A中圖A.23中的方案20-2為例,將β=20%,r=1代入式(11),可得T/θ1=2.99,即有效試驗時間為θ1的2.99倍。將T/θ1=2.99,d=2.73,r=1代入式(10),可得α=29.92%,約等于圖A.23中的30%;將T/θ1=2.99,d=3.63,r=1代入式(10),可得α=19.97%,約等于圖A.23中的20%;將T/θ1=2.99,d=5.63,r=1代入式(10),可得α=9.977%,約等于圖A.23中的10%[3, 5]。
該型產品設計定型時的方案30-2是依據β=30%,θ1=87 h直接從GJB899A中選定的,能保證通過可靠性鑒定試驗時產品MTBF小于87 h的概率不大于30%,即保證了使用方風險。如上所述,生產方希望好產品高概率通過試驗,事實是這樣嗎?
GJB899A明確規定,可靠性驗證試驗中檢驗下限應取MTBF的最低可接受值[3],即無論是設計定型時的可靠性鑒定試驗、生產定型時的可靠性鑒定試驗,或是適用于生產與使用階段的可靠性驗收試驗,檢驗下限都取最低可接受值。設計定型時可靠性鑒定試驗的檢驗下限取最低可接受值不被質疑,但生產定型時檢驗下限是否應比最低可接受值高一些? 這種質疑的主要理由如下:
一是產品一旦通過生產定型,其可靠性就不再增長了,所以生產定型可靠性鑒定試驗的檢驗下限應比設計定型時的檢驗下限適當提高,否則生產定型后批量生產的產品可靠性不高。實際上,隨著對產品使用中發現問題的不斷改進,特別是隨著生產工藝的不斷完善和成熟,即使在設計定型后,產品可靠性也會不斷提高[6, 14-18]。如GJB450A《裝備可靠性工作通用要求》明確,要對使用時的可靠性工作充分重視,特別是剛投入使用的初期,產品的使用可靠性不高,一方面是由于產品使用維護說明書不完善、使用者操作不熟練、技能未達到要求等引起,另一方面也暴露了導致產品固有可靠性不高的設計、工藝制造等方面的薄弱環節。因此,應對使用中發現的問題盡可能進行改進,同時完善使用維護說明書,加強對使用操作者的技能培訓,從而使產品的固有可靠性盡快達到規定值,使用可靠性盡快達到成熟期目標值[19]。
另外,GJB899A明確“本標準適用于GJB450A規定的可靠性鑒定試驗(工作項目404)和可靠性驗收試驗(工作項目405)”[3],而GJB450A中明確可靠性驗收試驗的目的是“驗證批生產產品的可靠性是否保持在規定的水平”[19]。在產品壽命周期中,生產定型介于設計定型之后、批生產及使用之前,所以介于設計定型與生產使用之間的生產定型,該時期進行的可靠性鑒定試驗的檢驗下限不應比最低可接受值高。
另一個錯誤觀點是可靠性只要達到最低可接受值,產品就能順利通過鑒定試驗,基于此推斷出通過設計定型的產品可靠性離規定值尚有不少差距。這是對設計定型時產品可靠性應至少達到最低可接受值的錯誤理解。從可靠性驗證試驗方案設計公式P(θ1)=β可知,若產品可靠性僅達到最低可接受值,則通過驗證試驗的概率為β,即通過可靠性鑒定試驗的概率低。事實上,只有產品可靠性真值約等于鑒定試驗中選取的檢驗上限時才能大概率通過試驗,而可靠性鑒定試驗中的檢驗上限一般應約等于規定值[5, 17-18]。從GJB899A中任意一個定時試驗方案的抽樣特性曲線也可以直觀看出:θ在檢驗下限θ1附近時,接收概率約為β;θ在檢驗上限θ0附近時,接收概率約為1-α[3]。
GJB1909A《裝備可靠性維修性保障性要求論證》中定義,規定值是“用戶期望裝備達到的合同指標”[20]。事實上,生產方常將規定值作為設計指標,并通過元器件、原材料、標準件的選用,以及可靠性設計分析、可靠性試驗等,盡可能使產品的可靠性達到、甚至超過規定值。如通過可靠性預計從不同的設計方案中選優,預計值大于規定值(通常要求為規定值的1.1~1.2倍)的方案常被選用[21];通過可靠性強化試驗暴露產品的可靠性薄弱環節并盡可能改進,以快速提高產品可靠性至規定值附近。
當產品可靠性達到規定值時,說明產品可靠性好,應大概率接收產品。若選用的檢驗上限大于規定值,則勢必使生產方承受較大風險,因為可靠性真值接近檢驗上限時才大概率被接收。所以GJB899A明確,不能僅為快速做出試驗判決而選擇過大的鑒別比。檢驗上限=檢驗下限×鑒別比,鑒別比過大會導致檢驗上限大,若檢驗上限大于可靠性的規定值,將導致可靠性達到規定值的好產品通過可靠性鑒定試驗的概率不會高[3, 22]。
查GJB899A可知,設計定型時選擇的方案30-2在α=30%時,鑒別比d=2.22[3],對應的檢驗上限θ0=d×θ1=2.22×87=193.14 h,即MTBF達到193.14 h的產品通過方案30-2的概率為1-α=70%。由式(10)計算的結果為
(12)
若設計定型時MTBF已達到規定值150 h,由式(1)可得,通過鑒定試驗的概率為
(13)
即MTBF達到規定值的好產品通不過設計定型可靠性鑒定試驗的概率約為1-0.588 2=0.411 8=41.18%,其根源在于選擇的鑒別比d。
由GJB899A中圖A.24可知,d取2.22時,生產方風險名義值為30%;d=2.96時,α=20%;d=4.59時,α=10%。鑒別比越大,檢驗上限越高,對應的生產方風險名義值越小。如前所述,檢驗上限應約等于可靠性的規定值,這樣方案中的生產方風險名義值才與實際的生產方風險相近。對于本文中的產品,d=4.59時,檢驗上限θ0=d·θ1=4.59×87=399.33 h,即產品可靠性達到399.33 h時,通過方案30-2的鑒定試驗的概率為1-10%,而399.33 h遠高于150 h這一設計指標,故d=4.59時的名義值α=10%與實際的生產方風險41.18%差別很大。
所以可靠性驗證試驗的檢驗上限θ0雖不取決于規定值,但應參照規定值選取,即θ0應約等于規定值。本文中取α=β=30%,θ1=87,θ0=150,按式(10)~(11)設計試驗方案,得出近似值r=3,T=4.76θ1,將T和r再代入式(10),可得
(14)
將T和r再代入式(11),可得
(15)
即該方案中的實際風險為:α′=0.299 4,β′=0.300 3。
按產品可靠性參數設計的方案與GJB899A中方案30-2的對比如表1所示。

表1 兩種方案的對比
從表1可以看出,兩種方案中使用方風險實際值幾乎相同,生產方風險實際值差別很大,這可以從設計的方案中允許故障數為方案30-2的3倍、而試驗時間不足其2倍直觀地理解。
使用方初始提出生產定型可靠性鑒定試驗仍采用方案30-2,只不過將規定值及其置信度作為確定θ1及β的依據,即θ1=150 h,β=1-置信度=20%。由以上分析知,P(150)=P(θ1)=β≈20%,即可靠性達到規定值的產品通過該試驗的概率約為20%,這顯然違背初衷。原因在于將檢驗生產定型階段是否達到規定值錯誤地理解為θ1=150 h,β=20%。
如上所述,生產定型試驗方案仍應保證θ1=87 h,β=30%。為對生產定型時產品可靠性是否達到規定值150 h(置信度0.80)進行摸底,可以按照定時截尾可靠性評估確定可靠性鑒定試驗的最少試驗時間:
(16)

將r=0,p=0.80,θL=150 h代入式(16),可得最少試驗時間T=241.42 h。設計定型時方案30-2對應的試驗時間為2.44θ1=2.44×87 h=212.28 h,小于最少試驗時間241.42 h,故方案30-2不能對產品是否達到規定值150 h(置信度0.80)進行摸底。
從GJB899A圖A.24可知,方案30-3(r=2,T=3.62θ1)和方案30-4(r=3,T=4.76θ1)的試驗時間分別為3.62×87=314.94 h和4.76×87=414.12 h,都大于241.42,即在滿足θ1=87 h,β=30%的基礎上,這兩個試驗方案都能對規定值150 h(置信度0.80)進行摸底。
由式(1)可知,可靠性達到150 h的產品,通過方案30-3的概率為
(17)
通過方案30-4的概率為
(18)
與方案30-4相比,方案30-3的試驗時間較短,但MTBF達到150 h的產品通過試驗的概率比方案30-4低約5%。
經生產方權衡并征得使用方及承試方同意,最終確定的生產定型可靠性鑒定試驗方案為:對產品進行314.94 h的定時截尾試驗,若試驗未進行至314.94 h時產品已出現3個責任故障,則提前結束試驗,并做出未通過鑒定試驗的結論;若314.94 h的試驗中產品責任故障數不大于3,則做出通過鑒定試驗的結論,并評估產品的實際可靠性水平。
(1)若產品在314.94 h的試驗中出現3個責任故障,由式(16)可知,置信度0.70時,θL=66.13 h,小于87 h的最低可接受值。若尚未進行到314.94 h時已經出現3個責任故障,產品MTBF不會大于66.13 h,故可做出提前結束試驗的判決,并給出未通過生產定型可靠性鑒定試驗的結論。
(2)若產品在314.94 h的試驗中出現2個責任故障,則置信度0.70時,θL=87.11 h,大于最低可接受值87 h(置信度0.70),可做出通過可靠性鑒定試驗的結論;置信度0.80時,θL=73.60 h,遠小于規定值150 h(置信度0.80),即雖然產品通過了可靠性鑒定試驗,但其MTBF離規定值差距很大。
(3)若產品在314.94 h的試驗中出現1個責任故障,置信度0.70時,θL=129.12 h>87 h;置信度0.80時,θL=105.18 h<150 h,即可做出通過可靠性鑒定試驗的結論,產品MTBF離規定值尚有距離。
(4)若產品在314.94 h的試驗中無責任故障,置信度0.70時,θL=261.58 h>87 h;置信度0.80時,θL=195.68 h,超過了規定值150 h(置信度0.80),即可做出如下結論:產品通過可靠性鑒定試驗,且MTBF已達到并超過規定值。
因此,314.94 h的試驗時間能對產品是否達到規定值進行摸底。試驗中不同責任故障數對應的可靠性評估值如表2所示。
當時,1發產品經歷了314.94 h的生產定型可靠性鑒定試驗,試驗中出現1次責任故障(導引部件不截獲故障),從表2可看出,置信度0.70時掛飛MTBF下限值為129.12 h,大于最低可接受值87 h,故判定產品順利通過試驗;置信度0.80時掛飛MTBF下限值為105.18 h,離規定值150 h仍有差距,可通過持續改進促進可靠性的不斷提高。

表2 不同責任故障數的可靠性試驗結果
本文基于壽命型產品定時試驗中的接收概率,對某產品原設計定型可靠性鑒定試驗中的方案進行了剖析。雖然設計定型時產品通過了可靠性鑒定試驗,但實際的生產風險為41.8%,遠高于名義值10%。通過對兩種錯誤觀點的分析,設計出既能考核掛飛MTBF不低于最低可接受值,又能對MTBF是否達到規定值進行摸底的生產定型可靠性鑒定試驗方案。