武堅 孫東旭 武健



摘要:在電子產品的設計、生產和使用階段,故障樹可幫助完成產品的可靠性分析,并根據分析結果改進設計方案。該文通過對FC總線接口模塊進行基于故障樹模型的可靠性定性和定量分析,形成了FC總線接口模塊的故障樹建模,并通過建模發現了潛在的失效模式及設計中的薄弱環節,提升了產品的可靠性。
關鍵詞:故障樹;FC總線接口模塊;可靠性分析
中圖分類號:TP393? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)10-0046-02
1 引言
可靠性是指產品在規定條件下和規定時間內,完成規定功能的能力[1],它是通過系統設計賦予的一種產品特性??煽啃愿拍钭蕴岢鲆詠?,可靠性理論、可靠性建模以及可靠性統計等分析方法已大量應用于航空航天、兵器船舶等多種技術部門中。其中對于硬件產品的可靠性分析主要通過機理模型分析和統計分析,具體方法包括故障樹、FMEA、因果框圖等[2]。隨著科學技術的發展,硬件產品變得復雜起來,通常會出現電源電路、時鐘電路、協議處理電路等多種電路交聯的情況,設計者需要從設計初期就開展產品的可靠性分析工作,對可靠性差的功能電路進行改進和完善。本文選取故障樹分析法,對圍繞FPGA設計的FC總線接口模塊開展可靠性建模及分析,通過定性和定量分析,找到了設計中的薄弱環節,提升了接口模塊的可靠性。
2 可靠性定性與定量分析
故障樹分析方法是由貝爾實驗室H.A.waston于1961年提出的一種自頂向下識別系統故障的方法,它把所研究的系統最不希望發生的頂層失效事件作為分析的目標, 然后系統地找出能夠導致該失效事件發生的所有單個失效和失效組合,并將其列于該頂層失效事件的下一層[3]。這些可能導致頂層失效事件發生的所有失效事件的集合被稱為割集[4],若該集合中的所有單元是導致頂事件發生的最低限度,則該割集被稱為最小割集。故障樹的定性分析就是建立在最小割集的基礎上的,定性分析的目的是找到導致頂事件發生的所有割集,通過故障樹建模,可以對產品的各級功能電路進行分析,從而獲取割集信息,同時判斷割集的階數及性質。因此,故障樹的建立將直接影響到產品的可靠性分析準確程度。
當通過定性分析獲取產品的割集信息后,面對多個割集通常并不知道哪個割集對于頂事件發生的關聯程度較大,此時需要對各個集合的重要程度進行研究。可靠性的定量分析就可以獲取各個底事件的發生概率,從而計算出頂事件的發生概率,再去確定每個最小割集的發生概率,最終確定該類割集的重要度,即對頂事件發生的貢獻度,以便改進設計、提高系統的可靠性和安全性水平。本文采取Fussell-Vesely重要度參數作為衡量割集重要程度的指標,能夠考察割集對于頂事件發生的關聯程度,其指標值越大,說明該割集內的事件越不可靠。
3 FC總線接口模塊可靠性建模
本文研究對象為一種基于FPGA設計的FC總線接口模塊,
在接口模塊硬件設計中,圍繞FPGA,搭建電源、時鐘、存儲和光電轉換等功能電路,總體結構框圖見圖1。
該FC總線接口采用5V供電,在模塊內部通過DC/DC芯片及功能電路將5V轉換為芯片所需的3.3V、1.8V和1.2V等電源電壓。為了確保FC總線的正常通信,產品使用40MHz和212.5MHz兩種時鐘,分別為系統時鐘和FC工作時鐘,由兩個晶體振蕩器提供,在FPGA外圍搭建了存儲電路,使用SRAM芯片用來存儲維護程序、應用固件等信息,FLASH芯片用來存儲FPGA工作用的邏輯文件,NVRAM用于存儲故障信息或其他系統要求的關鍵信息,便于系統綜合過程中的故障排查。FC總線電信號與光信號的轉換則通過光電收發器件實現,通過FPGA的高速串行接口,使用交流耦合方式,連接到光電收發器,轉換為光信號之后,通過MT接口形式引出到接口模塊外。
該接口模塊對外提供高速差分串行數據接口和FC總線通信接口,通過高速差分串行數據接口接收內部數據,通過FC總線通信接口實現與外部系統之間的點到點單向數據傳輸。結合接口模塊功能,其關鍵失效模式為模塊不工作,對外通信中斷,因此選擇FC總線接口模塊不工作作為故障樹分析的頂事件,根據模塊硬件電路結構,其電源、協議處理、時鐘等功能電路失效時,均有可能導致FC接口模塊無法正常工作。采用Isograph軟件對頂事件繪制故障樹,其中頂事件FC總線接口模塊不工作的故障樹如圖2所示。
其每一個中間事件均能繼續展開,如GT8展開時故障樹建模如圖3所示。
根據對FC總線接口模塊的故障樹建模,可以確定最小割集事件描述,包括“電源濾波電容短路”“邏輯存儲芯片失效”“電源無輸出”“時鐘接口不工作”“復位芯片輸出異?!薄罢{節電阻參數漂移”等。從最小割集的分析結果可知,所有的最小割集為一階最小割集,即任意的底事件均會導致頂事件的發生,需盡量降低每個底事件發生的概率。由于所有的最小割集的重要度均為一階最小割集,因此底事件重要度與最小割集重要度相同。經過計算,部分底事件的Fussell-Vesely重要度如表1所示。
根據故障樹定性和定量分析結果,FC總線接口模塊電源濾波電容短路,邏輯存儲芯片存儲錯誤,FPGA電源接口故障、電源芯片無輸出或輸出錯誤對頂事件FC總線接口模塊不工作貢獻較大,具有較大的重要度。在對濾波性能進行充分驗證的前提下,可適當減少濾波電容數量,降低頂事件發生的概率,經設計改進后,頂事件發生的概率有了顯著降低,提高了接口模塊的可靠性。
4 結束語
本文提出了一種基于故障樹的FC總線接口模塊的可靠性分析方法,通過原理分析,確認了故障樹的頂事件,并根據模塊結構進行了故障樹分析建模,結合故障樹對接口模塊開展了可靠性定性分析和定量分析,通過分析找到了接口模塊設計中的薄弱環節,對這些薄弱環節整改后,頂事件發生的概率有了顯著降低,提高了FC總線接口模塊的可靠性。
參考文獻:
[1] 李良巧,等.可靠性工程師手冊[M].中國人民大學出版社,2012.
[2] 郭強,王秋芳,劉樹林,等.系統可靠性理論:模型、統計方法及應用[M].國防工業出版社,2011.
[3] SAE International. ARP4761 Guidelines and Methods for Conducting the Safety Assessment Process on Civil Airborne Systems and Equipment [G].1996.
[4] 楊承剛,朝格圖胡日都,李茂林,等.汽輪機故障樹診斷方法研究及應用[J].裝備制造技術,2014(11):50-54.
【通聯編輯:代影】