陳 榮,劉 富
(北京衛星導航中心,北京 100088)
?
芯片信息加載故障診斷的故障樹分析法
陳榮,劉富
(北京衛星導航中心,北京100088)
針對導航接收機芯片信息加載故障診斷中出現的依賴技術人員經驗、診斷效率低下等問題,采用故障樹分析法對芯片信息加載故障進行分析;通過芯片信息加載故障特性分析,建立故障樹;進行定性、定量分析,根據故障統計結果給出各底事件的發生概率,計算得出頂事件發生的概率;并給出芯片信息加載故障的預防和診斷方法。結果表明該方法能夠有效提高故障診斷效率,并減少故障發生率。
導航接收機;故障樹分析法;芯片信息加載;故障診斷;故障預防
導航接收機芯片信息加載涉及到眾多的環節。一方面導航接收機生產廠家較多較雜,部分廠家未嚴格按照協議實現;另一方面由于信息加載設備不夠完善,芯片狀態多變等原因,芯片信息加載過程時有故障發生,輕則無法加載,影響正常使用,重則造成芯片損壞,接收機返廠。特別是對異地接收機的芯片信息加載故障往往需要多次往返,不僅影響正常使用,而且會造成人員、經費、時間的極大浪費:因此對芯片信息加載的故障診斷顯得尤為重要。
目前對芯片信息加載的故障診斷主要依靠技術人員的經驗,診斷效率較低且依賴少數有經驗的技術人員。本文采用故障樹分析法對芯片信息加載故障進行定性和定量分析,以期提高故障診斷效率,并且找出容易造成芯片信息加載故障的薄弱環節,減少故障發生的概率。
故障樹分析(fault tree analysis,FTA )法是故障診斷技術中的一種有效方法。FTA法是將系統的各種故障原因(包括硬件、環境、人為因素)由總體至部分、按樹枝狀結構自上而下逐層細化的分析方法,是用于大型復雜系統可靠性、安全性分析和風險評價的一種普遍、有效的方法[1-4]。20 世紀 60 年代初,文獻[5]首先使用故障樹分析方法,對民兵式導彈發射控制系統的隨機失效問題成功地做出了預測。基于故障樹的可靠性分析主要是通過定性和定量分析找出系統的薄弱環節,及時確定故障源。
對故障樹進行定性和定量分析的目的是找出其所有最小割集,確定頂事件和底事件的發生概率。故障樹的1個最小割集代表系統的1個故障模式,只要有1個最小割集存在,系統就處于故障狀態。在對故障樹進行可靠性分析之前,作以下假設:1)底事件之間相互獨立;2)底事件和頂事件只考慮2種狀態,即正常或故障。
設系統有K個最小割集K=(K1,K2,…,Kk),在K個最小割集中,只要有1個最小割集發生,頂事件就發生。為了便于對故障樹作定性和定量分析,常采用結構函數對故障樹進行數學描述。故障樹的結構函數可表示為

(1)
式中每個最小割集Kj(1≤j≤k)是底事件Xi(1≤i≤n)(n:底事件數目)的積事件。通過結構函數可以分析故障樹頂事件的發生概率 (系統不可靠度為FS,頂事件為T)為
P(T)=P(T)=p(k1+k2+...+kk)=
F1-F2+…+(-1)k-1Fk。
(2)
當每個底事件發生概率<0.01時,可近似地認為
FS≈F1-F2/2,
(3)
或者

(4)
影響芯片信息加載成敗的環節共有4個,分別是信息管理系統、便攜式信息加載設備、接收機、芯片。任何一個環節出問題都會導致芯片信息加載失敗,如圖1所示。
信息管理系統會導致信息加載失敗的問題,包括系統內部錯誤和人為操作失誤:系統內部錯誤指系統由于考慮不周、測試不充分導致的程序漏洞;人為操作失誤指各種會導致信息加載失敗的人為操作失誤,包括提交數據錯誤、錯下數據和漏下數據。

圖1 芯片信息加載流程
便攜式信息加載設備會導致信息加載失敗的問題,包括設備硬件故障、設備軟件故障和人為操作失誤(設備電量低導致設備無法開機);設備內部數據錯誤的原因應該歸因于信息管理系統,不屬于便攜式信息加載設備的錯誤。安全存儲介質在信息加載時通常和便攜式信息加載設備配合使用,會導致失敗的原因包括安全存儲介質硬件故障和人為操作失誤(安全存儲介質和便攜式信息加載設備不匹配)。
接收機會導致信息加載失敗的原因包括接收機硬件故障、接收機未按標準協議實現(使用舊協議導致信息加載報錯、使用舊軟件導致接收機顯示錯誤、使用舊協議導致串口不通、未停止串口發送數據導致報錯)。
芯片會導致加注失敗的原因包括原發性芯片硬件故障、芯片軟件出廠缺陷。
芯片信息加載不是一個像汽車發動機、運載火箭之類的硬件系統,芯片信息加載涉及到4種硬件設備、1種軟件信息加載,以及一系列的人工操作。芯片信息加載成功的標志是:信息成功加載,同時接收機能夠利用相關信息正常工作。由于芯片信息加載過程和一般硬件系統的差別,某些特定故障診斷方法,如基于物理化學現象的方法、基于信號處理的方法、基于傳感器的方法,明顯不適用于芯片信息加載的故障診斷。適合對其進行故障診斷的方法主要包括基于神經網絡的方法、基于案例推理機制(case-based reasoning,CBR)的方法、模糊診斷法、基于故障樹的方法。
基于神經網絡的方法能夠實現故障診斷的自動化和智能化;但是該診斷方法屬于“黑箱”方法,不能揭示出系統內部的一些潛在關系,無法對診斷過程給予明確解釋,無法給予清晰和一目了然的實踐指導,無法利用工程師的經驗和技術,網絡訓練時間較長,并且對未在訓練樣本中出現的故障無診斷能力[6-11]。
基于案例推理機制的方法是通過訪問知識庫中過去同類問題的求解從而獲得當前問題解決的一種推理模式。該方法應用于故障診斷有廣闊的前景,對曾出現過的故障的診斷有較高的效率;但是應用該方法需要積累起大量的故障診斷實例,同時對新機理的故障難以給出正確診斷:因此需要和其他故障診斷方法結合進行[12]。
模糊診斷法認為復雜系統的故障原因和相應癥狀之間的相互關系一般沒有明確的規律可循,很難甚至不可能用精確的數學模型來描述;只能利用模糊數學分析方法來分析和處理。模糊診斷法一般和其他故障診斷方法結合使用。
基于故障樹的方法的優點是:能夠實現快速診斷;知識庫很容易動態修改,并能保持一致性;概率推理可在一定程度上被用于選擇規則的搜尋通道,提高診斷效率;診斷技術與領域無關,便于將工程師在工作和科研實踐中獲取的經驗和技術應用起來;建立的故障樹可以給人清晰直觀的感受,便于指導實際的故障診斷。
基于各種故障診斷方法的分析比較,本文采用基于故障樹的方法對芯片信息加載進行故障診斷。
4.1建立故障樹
根據故障樹頂事件的定義,確定“芯片信息加載失敗”作為頂事件。根據芯片信息加載故障特性,按照建立故障樹的基本規則和方法,依次列出中間事件,用或門連接各事件后從上而下推理出底事件,建立故障樹圖,如圖2所示。可以看出我們建立的故障樹是單調關聯故障樹。

圖2 芯片信息加載故障樹圖
圖2中各符號含義如表1所示,共有 9 項中間事件、17 項底事件。根據芯片信息加載故障記錄,得出各底事件概率。
4.2故障樹分析
利用故障樹定性分析法中的上行法來求解故障樹的最小割集,經簡化、吸收,得到全部17 個最小割集分別為17個底事件{X1}、{X2}、{X3}、{X4}、{X5}、 {X6}、{X7}、{X8}、{X9}、{X10}、{X11}、{X12}、{X13}、{X14}、{X15}、{X16}、{X17}。
由式(2)可以計算出頂事件概率P(T)=20.625%。頂事件概率偏大主要是由2項底事件“芯片軟件出廠缺陷”和“使用舊軟件導致顯示錯誤”概率偏大造成的。其他各項底事件概率均在可接受范圍內。
從各中間事件、底事件概率中可以看到,中間事件“接收機未按標準協議實現”概率最高,這是符合目前芯片信息加載實際情況的。由于接收機廠家繁多,總會有部分廠家由于溝通原因未按標準協議實現,或者錯誤地使用了舊版本的協議和軟件,這些都會導致芯片信息加載故障。

表1 芯片信息加載故障樹圖含義 (%)
“芯片軟件出廠缺陷”概率較高,該事件雖是偶發事件,經過整改后可以解決;但是生產廠家必須要注意生產質量,否則影響范圍會很大。
“信息管理系統內部錯誤”故障概率雖不高,但一旦出錯,影響就是全局性的;生產廠家要提高責任心,加強測試力度,保證提交產品的質量。
4.3芯片信息加載故障預防與診斷方法
芯片信息加載故障預防措施:1)加強宣貫力度,保證新版本的協議及時下發到每一家接收機廠家;2)在接收機測試環節增加接收機協議一致性測試,確保接收機嚴格按照協議實現;3)芯片和信息管理系統生產廠家要加強測試,保證提交產品的質量。
芯片信息加載故障診斷方法:參照芯片信息加載故障樹圖,結合具體故障現象,逐項排查故障。排查順序為接收機、芯片、安全存儲介質、便攜式信息加載設備、信息管理系統。
通過為期半年的實際應用,結果表明上述故障預防和診斷方法可以有效降低故障率、縮短故障診斷時間。通過實施故障診斷辦法,業務人員可以更快速地實施故障診斷,故障診斷從動輒數小時乃至數天,到平均耗時控制在1 h以內;通過實施改進措施,故障率畸高的2項底事件“芯片軟件出廠缺陷”和“使用舊軟件導致顯示錯誤”的概率大大降低;通過實施故障預防措施,底事件“未停止發送串口數據導致報錯”和“使用舊協議舊軟件導致串口不通”的概率也得以降低,頂事件的概率從而得以顯著降低,達到了降低故障率的目的。
本文采用故障樹法對芯片信息加載故障進行分析,通過對芯片信息加載故障特性的分析,建立了芯片信息加載故障樹圖,并進行了定性和定量分析,給出了芯片信息加載故障預防和診斷的方法。經過為期半年的實際應用證明,本文提出的故障診斷和故障預防措施是有效的,可以較好提高故障診斷效率,減少故障出現概率。下一步將開展故障樹和模糊診斷、基于案例推理機制方法相融合的故障診斷方法的研究。
[1]王東,郭永,胡經民,等.基于故障樹分析法火箭測量系統故障診斷研究[J].北華航天工業學院學報,2014,24(3):20-23.
[2]陳春俊,王雪梅.測控系統故障檢測與診斷[M].成都:西南交通大學出版社,2008:21-22.
[3]國防科學技術工業委員會.GJB/Z 768A-1998:故障樹分析指南[S].北京:國防工業出版社,1998:1-2.
[4]梁芬,姜宏偉,郭亞男,等.基于FTA的焊接機器人故障診斷技術研究[J].機電工程,2014,31(8):1067-1070.
[5]王玉剛,王海東.基于故障樹的某型裝備故障診斷專家系統[J].儀器儀表用戶,2012,19(2):3-5.
[6]欽勁,董豆豆,孫權,等.基于故障樹的導彈故障快速診斷決策支持系統[J].裝備學院學報,2006,17(1):107-110.
[7]郭博.基于神經網絡和故障樹的運載火箭故障診斷系統的研究[D].成都:電子科技大學,2010:45-47.
[8]閆劍平.一種故障樹模塊的劃分方法[J].北方交通大學學報,2000,24(5):63-66.
[9]蔡偉,王瑞林,李濤.基于模糊故障樹的某型步槍卡彈故障機理分析[J].科技通報,2013,29(6):50-52.
[10]何桂青,陳英,范麗云,等.運載火箭故障診斷專家系統[J].北京理工大學學報,1998,18(6):685-688.
[11]王英,沙云東.航空發動機故障診斷技術綜述[J].沈陽航空工業學院學報,2007,24(2):11-14.
[12]李曉輝,劉妍秀.基于實例推理機制(CBR)綜述[J].長春大學學報,2006,16(4):68-70.
Fault tree analysis on fault-diagnosis of chip information loading
CHEN Rong,LIU Fu
(Beijing Satellite Navigation Center,Beijing100088,China)
Aiming at the problem of the experience dependency and diagnostic inefficiency in the process of the fault-diagnosis of chip information loading by the navigation receiver,this paper studied the fault-diagnosis of information loading based on the fault tree analysis:building the fault tree was built through analyzing the fault characteristics of chip information loading;the qualitative and quantitative analysis was carried out for fault-diagnosis,the bottom-event occurrence rate was given with the statistical results of faults and the top-event occurrence rate was calculated then;meanwhile,the prevention measure and diagnosis method were presented finally.Result showed that the proposed method could increase the fault diagnostic efficiency and decrease the fault incidence rate.
navigation receiver;fault tree analysis;chip information loading;fault-diagnosis;trouble-saving
2015-10-29
陳榮(1978—),女,江蘇南通人,工程師,研究方向為衛星導航和裝備可靠性及維修性。
10.16547/j.cnki.10-1096.20160302.
P228
A
2095-4999(2016)03-0006-04
引文格式:陳榮,劉富.芯片信息加載故障診斷的故障樹分析法[J].導航定位學報,2016,4(3):6-9.(CHEN Rong,LIU Fu.Fault tree analysis on fault-diagnosis of chip information loading[J].Journal of Navigation and Positioning,2016,4(3):6-9.)