王化祥
(天津大學電氣自動化與信息工程學院,天津 300072)
伴隨科技的迅猛發展,世界各工業國家均投入了大量人力、物力和財力進行可靠性系統研究及推廣應用,有效推動了經濟發展,并帶來巨大的經濟效益。國外可靠性工程研究較早,尤其是以美國為代表的西方發達國家。20世紀40年代,隨著復雜電子設備相繼出現,電子產品的可靠性越來越重要,直接影響美國的武器裝備效能。1943年,美國成立了電子管研究委員會,專門研究電子管可靠性問題。20世紀50年代,美國國防部組織成立了電子設備可靠性咨詢組(advisory group on reliability of electronic equipment,AGREE),開始研究可靠性預計的基本理論和預計模型,收集并處理大量現場數據和試驗數據,并于1957年推出MIL-HDBK-217《電子設備可靠性預計手冊》。該《手冊》制定和修訂了一系列有關可靠性軍標、國標及國際標準,開展了產品壽命試驗和快速篩選試驗,發展了失效模式影響及危害分析(failure mode effect and criticality analysis,FMECA)及故障樹分析(fault tree analysis,FTA)方法,有效促進了可靠性技術的不斷發展。繼而,日本、英國、德國、法國等發達國家相繼開展可靠性研究工作,并取得較好進展。20世紀90年代后,可靠性逐漸步入標準化、規范化、系統化時期??煽啃怨こ滩粌H在國防軍工裝備領域發揮了重大作用,而且廣泛用于民用工業,尤其電子產品行業。
我國于20世紀50年代在廣州籌建了亞熱帶環境適應試驗基地,主要從事產品環境試驗和亞熱帶防護措施研究,并于1972年成立了電子產品可靠性與環境試驗研究所。20世紀60年代,我國開始在雷達、通信、電子計算機領域進行可靠性研究。20世紀70年代,基于國家重大工程需要,開始進行電子元器件“七專”產品及元器件驗證試驗。經過十年努力,軍用電子元器件可靠性明顯提高。“兩彈一星”工程以及航空航天工程均取得巨大成功。與此同時,我國的儀器儀表應用范圍也越來越廣:從試驗室到工廠、野外;從地面到高空,海洋;從熱帶到寒帶,到極地。其應用環境日趨復雜、惡劣,常常處于高溫、輻射、腐蝕、振動等工作環境,使儀表故障頻繁發生。如20世紀80年代某化工廠初步統計,投入使用的國產儀表中,指示記錄儀每1 000 h平均故障率高達50%以上,變送器及調節器故障率約為3%;而同期日本的電子儀表使用壽命為10~20年。其中,橫河I系列儀表故障率僅為0.03%/1 000 h。如此之大的差距表明,提高儀器儀表可靠性已成為我國儀表行業當務之急。
儀器儀表的可靠性評估是根據儀表可靠性設計結構、壽命模型、試驗和現場運行數據,對其可靠性指標作出估計的過程??煽啃栽u估是在一定規定條件下,如工作環境、工作應力以及規定時間內,驗證其能否完成所要求功能的過程。該過程主要考核其組成的元、部件在試驗室或工作現場條件下運行時,其設計的固有性能是否滿足可靠性要求,從而進行必要的分析、計算、測試試驗或可靠性增長試驗。
可靠性評估根據試驗數據來源可分為3類。
①試驗室可靠性試驗數據統計分析評估。其工作環境條件、工作程序以及負荷均為可控,但與實際工作狀況有所不同,因此可通過試驗室測試數據進行數理統計,進而評估其可靠性水平。
②可靠性分析及計算評估。分析數據主要來源于試驗室各種性能測試,現場收集的數據或者可靠性預計數據等。這些數據通常較為龐雜,一般通過FTA、統計等方法評估其可靠性水平。
③可靠性增長試驗統計分析法。其數據來源主要是儀器儀表研制階段,通過施加各種環境應力試驗獲得的數據,并通過試驗-改進-再試驗的不斷循環,然后基于可靠性增長模型分析、計算儀表可靠性增長的實際水平。
①可靠度R(t)。
儀器的可靠度表示在儀器儀表工作在規定的條件下和規定的時間內,完成規定功能的概率。其數學表達式為:
R(t)=P(T>t)
(1)
式中:T為儀器儀表使用壽命。
②失效率λ(t) 。
(2)
式中:F(t)為儀器的失效分布函數。
于是有:
(3)
③平均壽命E(t)。

(4)
對于可修復產品(儀器儀表一般屬于可修復產品),稱為平均無故障時間(mean time between failure,MTBF)。
④維修度M(τ)和修復率μ(τ)。
M(τ)=P(T?τ)
(5)
式中:M(τ) 為儀器儀表在規定時間內修復其功能的概率;μ(τ)為修復率,表示單位時間修復的概率。
⑤有效度A(t)。
儀表在規定的使用條件下,在某個觀察時間t內,保持其規定功能的能力。
(6)
式中:TMTTR為儀表的平均修復時間(mean time to repair,MTTR);TMTBF為儀表的MTBF。
(1)指數分布。
在可靠性理論中,指數分布函數是最為基本、常用的分布函數,適用于失效率λ(t)為常數的情況。一般地,儀器儀表整機或系統失效模型服從指數分布。
①失效概率密度函數為f(t)。
f(t)=λe-λt,t≥0
(7)
式中:λ為指數分布函數的失效率,為常數。
②累積失效分布函數F(t)。
(8)
③可靠度函數R(t)。
R(t)=1-F(t)=e-λt,t≥0
(9)
④平均壽命E(t)。
(10)
指數分布的重要性質是“無記憶性”,即當產品在t時刻正常工作時,其在t刻以后的剩余壽命與新產品一樣,與t無關。
(2)威布爾分布。
威布爾分布在可靠性理論中是適應范圍較廣的一種分布,可全面描述產品浴盆失效率曲線的各階段。威布分布也稱為“最弱環模型”。一般地,機械元器件疲勞損傷模型服從威布爾分布或對數正態分布。筆者曾研究過儀表彈性敏感元件(金屬波紋管)失效壽命分布,試驗結果表明,其壽命分布屬于威布爾分布模型[1,3]。
①失效概率密度函數f(t)。
(11)
式中:m為形狀參數;t0為尺度參數。
② 累積失效概率函數F(t)。
(12)
式中:γ為位置參數。
③可靠度R(t)。

(13)
④平均壽命E(t)。
(14)
對于威布爾分布,當形狀參數m>3后,趨于正態分布;當m=1時,為指數分布。
(3) 對數正態分布。
對數正態分布常用于機械元部件由于裂紋擴展而引起失效的分布模型,也可用于恒應力加速壽命試驗后對樣品失效時間進行統計分析。
①對數正態分布概率密度函數f(t)。
(15)
式中:μ、σ分別為均值和方差。
②對數正態分布失效概率函數F(t)。

(16)
③對數正態可靠度函數R(t)。

(17)
(4)平均壽命E(t)。
(18)
為了確保設計的儀器儀表穩定、可靠,首先對產品進行可靠性預計和分配,然后進行可靠性設計??煽啃栽O計技術包括可靠性預計和分配、元器件降額設計、冗余設計、環境防護設計(所謂防潮濕、防煙霧、防霉菌三防設計)、故障分析、維修性設計以及可靠性增長技術等。
可靠性預計表示儀器在設計階段,根據其使用的元器件、功能、應用環境等對儀器可靠度進行初步預測,判斷所設計的裝置是否達到預期要求的可靠性指標,并找出設計中的薄弱環節加以改進、提高。
根據所設計的儀表系統,繪制其可靠性邏輯框圖,并建立相應可靠性數學模型。首先確定元器件的可靠度,然后預計部件的可靠度,經逐級預計,最后預計儀器裝置的可靠度。預計方法包括電子元器件使用失效率預計(參考美國軍用《電子設備可靠性預計手冊》以及國內《電子設備可靠性預計手冊》)。系統(或整機)預計方法一般根據可靠性框圖及模型進行,包括快速預計法、數學模型法及邊值法。在此基礎上進行可靠性分配,即將要求的儀器儀表可靠性指標合理地分配給整機中的每個元部件,為可靠性預計的逆過程。通過可靠性分配,可使設計人員明確所設計的各部件乃至所選用的元器件應達到的可靠性水平,并與預計結果進行比較,找出設計時考慮不足部分進行改進,以提高系統(或整機)的固有可靠度??煽啃苑峙浞椒ㄖ饕ǖ确峙浞ā⑾鄬κ史ā⒋鷶捣峙浞ㄒ约凹s束條件下系統可靠性分配方法等。
以最新研發的液固兩相流量計為例,說明可靠性預計和分配方法。該流量計采用相關測速方法進行紙漿體積流量測量,主要由傳感器和互相關器兩部分組成。傳感器獲取隨機相關測量信號,互相關器則完成相關流速測量。
這里暫不考慮機械零部件失效率(與電子元器件相比,其失效率可忽略),主要考慮由8單元串聯組成的液固兩相流量計系統的可靠度及平均壽命。
(19)
(20)
式中:λpi為第i個單元使用失效率。
考慮工藝性失效等影響因素,取補償系數α,則可得:
(21)
其次,考慮到部分元器件失效并不會導致儀表系統失效,取修正系數β。則第i個單元使用失效率為:
(22)
式中:ni為第i個單元元器件數。
于是,儀表系統的MTBF 預估為:
(23)
液固兩相流量計可靠性如圖1所示。

圖1 液固兩相流量計可靠性框圖Fig.1 Liquid-solid two-phase flowmeter reliability block diagram
該傳感器單元安裝在紙漿工藝管道上,最高溫度為45 ℃,互相關器安裝在控制室,最高溫度35 ℃?;谠骷氖褂铆h境及失效率模型,可求得各元器件使用失效率λij以及修正系數βij。由式(22)可計算各單元的使用失效率。信號檢測及前置放大器單元的使用失效率λp1為 36.175 0×10-6/h。極性化處理單元的使用失效率λp2為2.832 0×10-6/h。延時電路單元的使用失效率λp3為1.577 6×10-6/h。微處理器單元的使用失效率λp4為14.004 2×10-6/h。D/A 轉換單元的使用失效率λp5為5.160 3×10-6/h。基準電壓單元的使用失效率λp6為0.991 8×10-6/h。電源的使用失效率λp7為2.537 8×10-6/h。 其他單元的使用失效率λp8為5.127 3×10-6/h。
取補償系數α=0.05 (具體情況因使用環境條件而定),根據式(23)計算液固兩相流量計整機的MTBF,為:
其中,由于部分元器件失效模式不引起系統故障,故取βij為1。
在上述預計的基礎上,可對液固兩相流量計各單元進行可靠性分配。這里將TMTBFs值適當放寬為20 000 h。于是,根據相對失效率分配法,有:
(24)

λp1= 26.441 6×10-6/h;λp2= 2.070 0×10-6/h;
λp3= 1.153 1×10-6/h;λp4= 10.236 1×10-6/h;
λp5= 3.771 8×10-6/h;λp6= 0.724 9×10-6/h;
λp7= 1.854 9×10-6/h;λp8= 3.747 7×10-6/h。
電子元器件篩選分為應力強度篩選和老練篩選。應在規定時間內對儀表施加各種應力條件后進行測試篩選,如高溫老練篩選、功率篩選以及離心老練篩選等。降額首先考慮溫度、應力初值的選擇,以及降額等級和降額準則。對此,可參考《電子設備可靠性預測手冊》規定實行。
例如,常用的模擬電路放大器降額參數和降額因子如表1所示。

表1 放大器降額參數和降額因子
表1中,運算范大器參數如下,并要求Ⅰ級降額。正電源電壓VCC為+22 V; 最高結溫Tjm為150 ℃;負電源電壓VCC為-22 V; 總功率Ptot為500 mW; 輸入差動電壓Vid為±20 V;熱阻vJC為160 ℃/W;輸出短路電流Ios為20 mA。
根據表1中Ⅰ級降額對應的降額因子,則計算器件各參數降額值如下。 正電源電壓VCC為+15.4 V (降額因子0.7);負電源電壓VCC為-15.4 V(降額因子0.7); 輸入差動電壓Vid為±12 V(降額因子0.6);輸出短路電流Ios為14 mA (降額因子0.7);最高結溫Tjm為80 ℃;總功率Ptot為350 mW(降額因子0.7);熱阻vJC為160 ℃/W。
從而推導出此運算放大器降額曲線,如圖2所示。

圖2 運算放大器降額曲線Fig.2 Derating curves of operational amplifier
冗余設計[1](或余度設計)是系統或儀器儀表裝置的關鍵元部件通過并聯冗余、表決冗余或儲備冗余,以提高整機可靠性指標,適用于復雜的高可靠性系統或儀器儀表裝置。
①并聯冗余。
并聯冗余包括工作冗余和非工作冗余。
對于二重工作冗余系統,可靠度為:
Rs=1-(1-R)2=2e-λt-e-2λt
(25)
式中:單元的可靠度一般設為指數分布R=e-λt。
對于非工作冗余,即系統只有一個單元工作,發生故障后立即切換到另一個備份單元。為保證系統繼續工作,系統可靠度為:
Rs=e-λt(1+λt)
(26)
幾種冗余系統可靠度如圖3所示。

圖3 幾種冗余系統可靠度Fig.3 Reliability of several redundant systems
圖3中:曲線1為無并聯冗余系統可靠度,Rs=e-λt;曲線2為兩個單元并聯冗余系統可靠度,Rs=1-(1-R)2=2e-λt-e-2λt;曲線3為兩個單元非工作冗余系統可靠度,Rs=e-λt(1+λt) 。
顯然,兩個單元非工作冗余系統的可靠度最高。
②表決系統。
表決系統大多采用[2/3]表決系統,簡單且實用。 [2/3]表決系統可靠性如圖4所示。

圖4 [2/3]表決系統可靠性框圖Fig.4 Reliability block diagram of [2/3] voting system
表決系統可靠度為:
Rs=3e-2λt-2e-3λt
(27)
其MTBF為:
(28)
對于多數表決系統(m取n系統)一般稱為(n+1)/(2n+1) 系統。其可靠度為:
(29)
多數表決系統可靠度曲線如圖5所示。

圖5 多數表決系統可靠度曲線Fig.5 Reliability curves of major voting systems
構成儀表系統電子元器件由于環境條件以及退化效應而導致其性能產生漂移,故應采取相應措施加以修正和補償。一般采取控制質量法和容差電路設計法。前者嚴格控制材料及加工工藝過程,后者主要考慮電子線路設計方法,包括反饋及補償技術。其中,常用方法稱為最壞情況分析法(一種非統計方法)。基于元器件參數的變化極限,預測系統性能參數變化是否超過允許范圍,是一種十分有效的方法。
電子設備中功率損失通常表現為熱能耗散。其中,電阻元件即為一個內部熱源。當儀表運行時,不僅本身溫度升高,而且向周圍輻射熱量;同時,周圍的環境溫度也將影響設備內部溫度。一般而言,元器件使用環境溫度每提高10 ℃,元器件的壽命會縮短二分之一到三分之一。因此,必須采用熱設計方法保證產品的可靠性。通常采用的措施為:①將設備和元器件溫度限定在一定的范圍內,并保持其各點間的溫差盡量小;②進行散熱設計(必要時安裝散熱器)和致冷設計,使設備工作在低溫環境下,以減少參數漂移,保持儀表性能穩定。
電子線路受電磁干擾的三要素為存在干擾源、噪聲敏感的接收電路、噪聲源到接收電路之間的耦合通道。因此,只要消除其中一個環節,便可防止電磁干擾。例如,信號輸入端設計濾波和隔離單元;地線設計采用公共地并一點接地,防止寄生耦合造成干擾;加裝屏蔽罩并采用屏蔽線,也可采取浮空加保護屏蔽措施。
為提高儀器儀表有效性,不僅需要提高固有的可靠性設計,還應進行維修性設計[2]。
維修性設計一般準則如下。
①簡化設計:盡可能簡化儀表功能,采用最簡單的結構設計,以減少元、部件品種及數量。
②可達性:對于故障率較高且需要一定維修空間的部件,盡可能安排在易接近的部位,各元部件(特別是易損及常用件)的拆裝應簡便,產品的檢查點、測試點等應設置在方便接近的位置,檢查或維修時盡量不拆或少拆其他元部件。
③標準化、模塊化:優先選用標準件,對于故障率較高的易損件,應具有良好的互換性及通用性,可按功能設計為易于互換的模塊,便于單獨進行測試。
④自檢和自診斷:儀器盡可能具有自檢及故障自診斷顯示功能,以便迅速識別故障,指導維修人員實現快速維修,恢復儀器功能。
⑤維修安全性:設計時應保護維修人員免受機械損傷,以及高溫、有毒及放射性物質的傷害。
例如,儀表中鍵盤接口板可能存在干擾問題,通常是鍵盤電路和數據傳輸線設計問題。鍵盤接口板設計如圖6所示。

圖6 鍵盤接口板設計圖Fig.6 Keyboard interface board design diagram
圖6中,定義硬件接口Pin1~Pin2為VCC、GND;Pin3~Pin5 為鍵盤輸入( MCU 輸出的掃描信號接口板)的L1、L2、L3;Pin6~Pin8為鍵盤列掃描輸出(MCU 讀出接口板信號)的C1、C2、C3。
軟件接口為L1=1,讀取C1、C2、C3的值。若C1通路為“1”電平,表明L1-C1對應按鍵按下,以此類推。電路板的四個安裝孔V1~V4為機械安裝孔,板卡機械接口。經改進設計,需要增大電路板面積,并考慮可維修性,設計改進時需要考慮接口兼容性,即Pin1~Pin8 引腳功能和電平以及軟件協議不能改動。結構上,因實際需要改變其面積大小,所以即使V1、V2、V5、V6滿足板卡固定要求,需要仍保留V3、V4安裝孔,如圖6(b)所示。以新版本的板卡作為備件,可實現老版本替換性維修。
可靠性增長試驗是通過設計改進,以期提高儀器的可靠性??煽啃栽鲩L周期如圖7所示。通過試驗-分析-改進-再試驗,逐漸提高儀表的可靠性??煽啃栽囼炌ǔ0ōh境適應性試驗,如:溫、濕度試驗,振動、沖擊試驗,腐蝕、侵蝕影響以及電磁兼容性(electromagnetic compatibility,EMC)試驗等。本文對此不作詳細討論,具體可參閱參考文獻[1]和參考文獻[2]。

圖7 可靠性增長周期Fig.7 Reliability growth cycle
仍以上述液固兩相流量計為例。由于該流量計是較為復雜的新型流量計,比較適合的增長模型為陸軍器材系統分析(army material system analysis activity,AMSAA)模型。該模型是對杜安(Duane)模型改進后提出的,可直接基于原始數據計算。
基于AMSAA模型的液固兩相流量計數據處理流程如圖8所示。

圖8 基于AMSAA模型的液固兩相流量計數據處理流程圖Fig.8 Data processing flowchart of liquid-solid two-phaseflowmeter based on AMSAA model
通過計算表明,液固兩相流量計的可靠度獲得明顯的增長效果。
儀器儀表涉及光學、機械、電子、計算機和材料等多學科領域。伴隨著自動化水平不斷提高,自動化設備結構越加復雜,所用元器件種類繁多,而應用的環境條件日趨惡劣,發生系統故障的幾率增大,因此提高儀表可靠性設計技術十分重要和迫切[5-7]。為此,提出以下建議。
①研究機構以及生產企業應高度重視可靠性工作在產業發展中的戰略地位,不斷加大投入并加以政策引導,認真抓好儀器儀表產品可靠性使用試驗與評價,推動儀器儀表產業發展和升級。
②根據企業研發、生產、銷售情況,建立企業的可靠性工作流程。在產品可靠性目標的制定基礎上,根據產品使用環境條件,開展可靠性設計以及產品的失效分析,并進行相應的環境試驗,以及可靠性增長試驗,瞄準世界先進水平,不斷提高產品質量。
③建立可靠性試驗及可靠性國家標準、行業標準、企業標準,不斷跟蹤國際可靠性標準修訂和標準的解讀,使我國的相應標準不斷完善。