陳 鵬,劉 博
(國家廣播電視產品質量監督檢驗中心,北京 100015)
可靠性是指產品在規定的條件下,規定的時間內,完成其規定功能的能力。對數字電視來說,可靠性就是數字電視可以正常的收聽、收看電視節目,要求“功能可靠”。
平均故障前時間MTTF是指不可修復產品的一種基本可靠性參數。其度量方法為:在規定的條件下和規定的期間內,產品壽命單位總數與故障產品總數之比。
平均失效間隔時間MTBF是指可修復產品的一種基本可靠性參數。其度量方法為:在規定的條件下和規定的期間內,產品壽命單位總數與在該時間間隔內故障產品總數之比。
失效率λ(t)是可靠性工程應用廣泛的特征量。解釋為:在規定的條件下和規定的時間內,產品失效總數與壽命單位數之比。在產品壽命服從指數分布的情況下,產品失效率λ(t)與平均故障間隔時間MTBF成倒數關系,即

任務可靠性是指產品在規定的任務剖面內,完成規定功能的能力。所謂任務剖面是指產品在完成規定任務這段時間內所經歷的事件和環境時序描述,任務可靠性的定量參數之一,任務可靠度僅描述影響完成任務的那些事件。因此,任務可靠度分析必須包含完成任務基本功能的定義。例如:彩色電視接收機的任務和基本功能是接收圖像和伴音,更進一步的要求可能是圖像和伴音的清晰度、色度等。
基本可靠性是指產品在規定的條件下,無故障的持續時間或概率。基本可靠性反映產品對維修人力的要求。確定基本可靠性的特征量時,應該統計產品的所有壽命單位和所有故障,而不局限于發生在任務期間的故障,也不局限于只危及任務成功的故障。
按技術設計階段擬定的技術文件進行樣機的研制、試驗、評價和改進。驗證可靠性技術措施和關鍵工藝的適用性,使樣機可靠性增長達到預定計劃要求。
對重要的元器件、部件和設備單元進行必要的可靠性篩選試驗。篩選項目、應力等級和合格標準視產品的特點和要求而定。
在樣機性能試驗通過后,進行環境試驗和可靠性增長試驗。通過失效分析,及時暴露和排除系統性缺陷,使樣機可靠性達到預定增長計劃要求。
采用貝葉斯統計分析,將以往的歷史數據、工程經驗以及對產品可靠性的認識水平等這些驗前信息放到評價產品可靠性試驗方案中去,稱這種可靠性驗證試驗方法為貝葉斯驗證試驗。貝葉斯試驗方法主要應用于彩色電視機(CRT),數字電視機檢測方法已較少采用,所以本文只進行簡單介紹,以作參考。
貝葉斯方法的核心是貝葉斯公式,考察一個隨機試驗,在這個試驗中,幾個互不相容的事件A1,A2,…,An中必有一個發生。假如記P(Ai)為事件Ai的概率,則有

又設為任一個事件,則根據事件概率定義和全概率公式,可以推得,在發生的條件下,事件Ai發生的概率為

式(3)表明,假如事先知道諸事件Ai發生的概率P(Ai),還能通過實驗獲得在諸Ai發生的條件下,事件Ai發生的概率,那就可求得在事件Ai發生的條件下,事件Ai發生的條件概率。
貝葉斯分析方法的基本特點有:1)貝葉斯統計分析強調使用驗前信息;2)把感興趣的未知參數,比如平均壽命θ看作一個隨機變量;3)對所有未知的量最好用一個概率分布去描述,這個分布就是驗前分布。
貝葉斯統計方法作推斷工作時,利用3種信息:1)總體信息:如產品壽命分布類型所含有的信息;2)樣本信息:如試驗樣本中所含未知參數的信息;3)驗前信息:在試驗以前對未知參數了解到的信息。
驗前信息可以是準確的數據,也可以是工程判斷。在實際工作中,工程師們不斷地在各方面使用其以往的經驗——先驗知識,并不斷地通過實踐做出正確與否的判斷。如果不是那樣的話,很多工作只能在原地踏步,不會有所前進。有經驗的工程師們對其開發的新產品的可靠性是有所估計和考慮的。所以說,先驗知識廣泛存在,而貝葉斯方法只是對它主動地認識并加以利用罷了。
在很多場合都存有不同程度的先驗信息,其實每個人都在用過去的經驗(先驗信息)進行推斷和決策。免檢產品就是根據產品的過去質量情況而定的。這種做法就是利用了過去的經驗。
這一點是貝葉斯統計方法與經典統計方法之間一個主要的區別。經典方法認為未知參數θ是一個未知常數,是不變化的。但貝葉斯方法認為未知參數θ不僅是變化的,而且是隨機變化的。以產品的廢品率θ為例,每天的廢品率都是在變化的,有時變好,有時變壞,每天都在隨機波動。所以把“一天廢品率θ”看作一個隨機變量是妥當的,從當天產品中抽取一個樣本是為了估計當天的廢品率,這相當于估計隨機變量θ的一個觀察值。
貝葉斯統計方法對所有未知的東西最好都用一個概率分布去描述,這個分布就是驗前分布。
譬如某種電容器的失效率是未知的,但根據過去的試驗數據,此種電容器的失效率是一個偏態分布,頻率直方圖表明很像一個伽馬分布,因此就可用伽瑪分布來描述其失效率。
采用貝葉斯驗證試驗[2]方案,如考核的可靠性指標為q,令:q0為合格質量水平(AQL);q1為極限質量水平(LTPD)。
驗證試驗是采用定時截尾有替換壽命試驗,即取n個產品進行壽命試驗,到t時試驗截止,總試驗時間T=nt,其間共失效r次,則規定:r≤c時,判定產品合格,接收這批產品;r>c時,判定產品不合格,拒收這批產品。這種抽樣方案稱(T,c)方案。
古典的生產方風險為:a=P(r>c|Q0)即產品合格。
而求被拒收的概率,使用方風險為:β=P(r≤c|Q1)
即產品不合格,而求被接收的概率。
用貝葉斯方法制訂可靠性驗證試驗方案時,將參數Q看成是一個隨機變量,它的驗前信息,集中體現在它的驗前分布密度P(Q)中,常用的風險類型有驗后風險、平均風險和接收概率等3種。
1)后驗風險
后驗生產風險,是指產品經驗證試驗沒有通過的條件下,而質量是合格的概率,即

式中:Q0是參數q合格的取值范圍。
后驗使用方風險,是指產品已通過驗證試驗的條件下,而質量是不合格的概率,即

式中:Q0是參數q不合格的取值范圍。
2)平均風險
平均風險的概念類似于經典風險,它是經典風險對于驗前分布的平均。生產方平均風險為

3)接受概率
在經典抽樣方案中,接受概率是參數Q取定時產品被接受的概率,所以它是q的函數,即

而在貝葉斯抽樣方案中,接受概率是表示參數q的驗前分布為P(Q)時,產品被接受的無條件概率,即為

彩色電視機的貝葉斯方案(BRDT),在制定彩色電視接收機的貝葉斯可靠性驗證試驗方案中,需要充分考慮到經過多年實踐經驗業已成熟的試驗條件。為了實行科學管理,將產品的MTBF分成三級,分別記為P,Q和R。然后根據管理經驗和歷史數據確定MTBF的質量控制范圍θ1和θ2取值。
令θ1為可接受的MTBF的下限。按標準對數字電視可靠性指標的要求,分別確定P,Q和R三級的θ2為15000 h,20000 h和30000 h,見表1和表2。

表1 彩色電視機MTBF方案
根據以往的經驗和歷史數據,取EΘ=3θ1;并分別取θL為0.75θ1、0.90θ1和0.95θ1。

表2 P級產品的BRDT方案
從統計試驗所采用的方法而言,可靠性統計試驗可分為可靠性驗證試驗和可靠性測定試驗,這兩種試驗在技術標準或合同中的作用不完全相同。
可靠性驗證試驗,是承制方和訂購方在選定的風險水平下,通過試驗來驗證產品是否符合其規定的可靠性要求,所以,驗證試驗常常是訂購方接收產品的條件之一。
可靠性測定試驗,只是測定可靠性特征量,并就試驗結果作出報告,在產品沒有專門規定可靠性要求時,測定試驗通常是用來提供分析數據的。在本章內容中暫不做考慮。
可靠性驗證試驗在產品標準或技術經濟合同中又分為可靠性鑒定試驗和可靠性驗收試驗。
鑒定試驗和演示試驗一般包括:抽樣檢驗(包括定時截尾試驗和定數截尾試驗)和序貫試驗。
可靠性驗收試驗即為驗證批次生產產品是否達到規定的可靠性要求,在規定條件下所進行的試驗。產品可靠性驗收試驗PRAT(Product Reliability Acceptance Test?ing)發生在設備或系統的生產階段,用來監測原始設計中的可靠性降低。PRAT可以在整個生產階段定期的或持續的進行,并且可以是針對所有設備的或是個別樣本的。PRAT的使用可以為一些矯正和預防性措施提供必要的數據和反饋。
1)序貫試驗計劃
序貫試驗[4]的優點具有最低的期望整體試驗成本,一般來說該計劃作出結論的期望故障數較其他試驗計劃少,可用最少的期望試驗時間(平均起來)做出判斷。
序貫試驗的不利之處包括試驗成本是隨機的。與定時截尾試驗相比,序貫試驗故障數及由此引起的試驗時間最大可能是截尾試驗時間的3倍。
2)定時截尾試驗
定時截尾試驗[4]的優點是知道試驗完成時間以及試驗所需的最大樣本數量。相對序貫試驗來說,定時截尾的缺點為:包括達到某一固定值失效數是隨機的,更多的失效數和等待時間。雖然所需最大時間較短,但平均時間較長。
3)定數截尾試驗
這類試驗的優點是,即使試驗樣機更改,也知道試驗所需的樣本的最大數量。這類試驗必須要發生失效,并可對失效進行失效模式和失效機理分析。
4)試驗總結
一般來說,PRAT做出判斷所需的綜合成本和時間較少。當試驗對象的大多數相對需求較好或較壞時,這一特點尤其突出。
5)相關試驗比較
(1)定時截尾壽命試驗,就是實現規定一個試驗的截止時間,當試驗進行到規定的截止試驗時,不論是否發生失效,或失效多少,都停止試驗。這種試驗的優點是已知試驗時間,從而便于管理。
故障分析和分類:試驗過程中應監測受試設備的功能性能參數,當被觀察的任何一個參數永久地或間斷地超出規定極限范圍時,就應認為發生了故障。無論是可靠性鑒定試驗或可靠性試驗驗收試驗,對試驗中所發生的故障應通過分析確定每一個故障的原因,分析工作的深度要能足以用有效的證據確切地將故障劃分為關聯或非關聯故障。
對關鍵故障又可進一步分為責任和非責任故障。只有那些相關的獨立的責任故障才用來確定是否符合規定的接收、拒收判據。
當使用截尾抽樣方案時,如果在規定的試驗時間內發生的責任故障數超過了接收數時,就可以做出拒收判決;如果在方案規定的時間內,沒有發生比接收數更多的責任故障次數,則可以做出接收判決。
(2)定時截尾抽樣試驗的基本思想是觀察試驗到規定時間出現的失效數是否符合規定的要求,如果失效數超過了規定的次數則說明產品的壽命不長,認為產品不合格;如果到規定的時間失效次數少于或等于規定的失效數,說明產品的平均壽命較長,則認為產品合格。在這里可以看到,產品被判為合格與不合格之間只有一個失效數之差。這樣似乎太絕對化了,于是提出一種修正的方法——序貫規則。
(3)序貫規則對發生的每個故障都規定兩個時間,即合格的下線時間A與不合格的上限時間B,當總試驗時間T超過或達到合格的下限時間A,認為產品合格;當總試驗時間T小于或等于不合格上限時間B,認為產品不合格;當總試驗時間T在A和B之間,認為不足以作判斷,則繼續進行試驗。顯然合格下限時間A與不合格上限時間B都是故障數r的函數。這種試驗稱為序貫試驗。
任何一項工程,任何一個系統或設備,其設計和開發階段,就應當確立其可靠性要求。同時,應當制訂一個為達到這個要求的可靠性保證規劃。其工作重點應放在防止、發現和糾正可靠性設計中的缺陷、生產過程中的薄弱環節和可靠性管理中的漏洞上。標準是工程的語言,只有少數標準是滿足不了各種復雜工程的需要的。由于可靠性工程涉及可靠性數學、可靠性物理、管理學以及各種專門技術這樣廣泛的理論和實踐問題,因此,需要有一系列的標準,建立起一個完整的可靠性基礎標準體系,才能適應各種不同復雜程度的產品[3-4]。
[1]蘇德清.可靠性技術標準手冊[M].北京:中國標準出版社,1994.
[2]安永成.彩色電視機檢測技術[M].北京:電子工業出版社,1997.
[3]溫熙森,陳循,張春華,等.可靠性強化試驗理論與應用[M].北京:科學出版社,2007.
[4]SJ/T 11325,數字電視可靠性試驗方法[S].2006.