陶聰凌,牛建超 ,鄺志禮 ,吳 棟 ,趙 靖
(1.工業和信息化部電子第五研究所, 廣州 510610;2.廣東省電子信息產品可靠性技術重點實驗室,廣州 510610;3.廣東省電子信息產品可靠性與環境工程技術研究開發中心,廣州 510610;4.電子信息產品可靠性分析與測試技術國家地方聯合工程中心,廣州 510610)
高速隧道監控系統結構復雜,故障頻發且安裝在偏遠地區,檢測與維修定位較為困難,因此行業內對提高其故障診斷能力有著迫切的需求。良好的故障診斷能力有助于使用方及時掌握設備的狀態,方便進行維修活動,從而降低壽命周期費用。
目前國內也有一些學者對高速隧道監控系統的設計優化進行了研究。文獻[1]設計優化監控系統的軟件,實現在上位機中對隧道系統進行監控;文獻[2]采用全新組網方式并通過數據篩選器篩選有效數據將分布式光纖感溫火災報警系統集成到隧道監控系統中;文獻[3]采用“互聯網+高速公路”方式,優化隧道控制系統,構建隧道智能管控平臺;以上文章為監控系統的故障診斷軟件改進提供了參考。但是,國內對監控系統的故障診斷分析方法和設計優化方面的研究尚屬空白。在設備故障診斷分析方法和設計優化這方面,軍用產品開展了大量的研究與應用。文獻[4]通過軍用產品飛行采集器開展測試性分析,得出故障診斷信息分析表,為高速隧道監控系統故障診斷方法提供了借鑒思路。文獻[5]通過介紹軍用產品雷達的測試性設計優化,為高速隧道監控系統故障診斷設計優化提供了借鑒思路。本文結合軍用產品測試性分析流程提出一套針對高速隧道監控系統的故障診斷分析方法,并通過分析后的結果對其進行故障診斷設計改進,為高速隧道監控系統的故障診斷研究提供參考。
測試性是指系統或設備能夠及時、準確地確定其狀態(可工作,不可工作或性能下降)并隔離其內部故障的一種設計特性[6]。測試性的概念最先應用于軍用產品之中,美國最先將測試性分析及設計應用于空軍的一代綜合航電系統中,實現了對整個航電系統的狀態監測、故障診斷和故障隔離,極大提高了整個系統的測試性能力。近年來國內軍工領域掀起了測試性技術應用的熱潮,很多裝備在設計過程中應用測試性分析、仿真、試驗等手段,大大提高了裝備的故障診斷能力,從而減少對維修保障資源的依賴,降低全壽命周期費用。
本文結合軍用產品的測試性工作流程方法[7],針對高速隧道監控系統,提出了故障診斷設計分析及改進的流程如圖1所示。整個流程是:
1)明確系統的物理結構和功能,為系統任務可靠性分析奠定基礎;
2)完成系統任務可靠性分析,為系統按照故障診斷層次劃分提供條件;
3)劃分清晰明確的系統故障診斷層次,為各層級進行故障模式分析及故障嚴酷度劃分提供條件;
4)進行故障模式及影響分析、故障嚴酷度劃分,為設計改進提供指導和幫助;
5)依據故障診斷分析結果對系統進行設計改進,提升系統故障診斷能力。

圖1 高速隧道監控系統故障診斷設計分析及改進流程圖
高速隧道監控系統主要由信息收集模塊(攝像頭、車檢器、聲音傳感器)、控制模塊(控制電路、屏顯器、PC機)、執行模塊(燈具、報警器)和電纜等部分組成。整個高速隧道監控系統中核心的部分為控制模塊,該模塊主要由收集信息電路、電源電路、控制電路組成。其中,收集信息電路通過信息收集部件采集各類高速公路上的車輛狀態信息,電源電路為系統內各個模塊供電,控制電路通過收集模塊傳遞的相關信息對執行部件進行管理。整個監控系統功能是通過信息收集模塊接收到車輛駛入隧道信息后,發送至控制模塊,控制模塊收集電路接收到相關信息,傳送至PC機、屏顯器,控制模塊控制電路根據PC機下發的指令或內部編制好的指令控制執行模塊完成一系列開關燈、火災報警等操作。
對監控系統的結構及功能分析后,下一步故障診斷分析是把監控系統劃分為具有獨立功能的模塊并做出整個系統及各個模塊的任務可靠性框圖。由于任何一個模塊失效都將引起整個監控系統的失效,所以監控系統的任務可靠性框圖為串聯關系。以控制模塊為例,整個任務可靠性框圖流程依次是電源電路板(201)→收集電路板(202)→控制電路板(203)→PC機(204)→屏顯器組件(205)。監控系統任務可靠性框圖如圖2所示。控制模塊任務可靠性框圖如圖3所示。

圖2 高速隧道監控系統任務可靠性框圖

圖3 控制模塊任務可靠性框圖
對高速隧道監控系統進行功能結構及任務可靠性分析后,其工作原理和影響任務完成的因素得以提煉出來。在此基礎上,對其進行故障診斷層次劃分。整個系統的故障診斷層次劃分是確保故障診斷分析的正確性和有效性的關鍵,直接影響到高速隧道監控系統的故障診斷和隔離。
故障診斷層次的劃分遵循一定的原則。這些原則[8]是:
1)采用自頂向下的原則,依次進行劃分;
2)適應故障診斷分析的要求;
3)各層級根據功能和結構特性分別定義故障模式;
4)符合系統各部分功能結構之間邏輯關系。
依照故障診斷層次劃分原則,將高速隧道監控系統劃分為5個層次。即初始約定層次(系統層級):高速隧道監控系統;約定層次3(模塊層級):信息收集模塊、控制模塊、執行模塊;約定層次2(電路板層級):控制電路板等;約定層次1(功能電路層級):電源濾波、轉換電路等;最低約定層次(元器件層級):電阻、電容等。高速隧道監控系統故障診斷層次劃分如圖4所示。故障診斷層次劃分的技術難點和關鍵點就在于對整個系統的故障發生層級的定位和對各層級影響的歸類,只有明確劃分清楚才能為各層級故障模式及影響分析提供良好的支撐。

圖4 高速隧道監控系統故障診斷層次劃分
高速隧道監控系統完成故障診斷層次的劃分之后,下一步就是要得出元器件層、功能電路層、電路板層、模塊層以及系統層的故障模式及影響分析并對故障模式進行嚴酷度劃分。系統故障模式及影響分析可參照GJB/Z 1391-2006《故障模式、影響及危害性分析指南》[9],結合實際情況開展。
2.4.1 故障模式故障率計算及傳遞
對各個層級故障模式故障率具體計算原則如下:
1)根據系統劃分框圖,依據從下至上的原則進行各層級產品的故障率計算;
2)元器件級各個故障模式故障率計算參照GJB/Z 299C-2006《電子設備可靠性預計手冊》[10]進行。
3)若選用的供應商提供了元器件故障模式信息,可不參照GJB/Z 299C-2006《電子設備可靠性預計手冊》進行故障率計算;
4)根據GJB/Z 299C-2006《電子設備可靠性預計手冊》對各個元器件進行元器件失效模式及其頻數比分析;
5)完成元器件級各個故障模式分析后,依據故障模式的分類,分析對上一層功能電路級的影響,形成故障模式的收斂與傳遞,得出功能電路級的故障模式。后續電路板級、模塊級以及系統層級的故障模式依據這一方法逐步得到。以電源電路功能層級為例,如表1所示。
6)完善整個層級鏈路的功能輸入輸出關系表,從而得出整個高速隧道監控系統更加具體清晰的輸入輸出分析。以模塊層級功能輸入輸出為例,如表2所示。
2.4.2 故障模式嚴酷度分類
完成故障模式及影響分析后,需要對故障模式嚴酷度進行劃分。故障模式嚴酷度分類具體的定義如下:

表1 控制模塊電源電路故障模式表

表2 模塊級功能輸入輸出關系表
1)Ⅰ類(災難的):引起系統的主要或關鍵功能全部喪失,或對空間環境、工作環境或工作人員造成危害的故障模式;
2)Ⅱ類(致命的):喪失系統部分主要功能或部分關鍵功能;
3)Ⅲ類(臨界的):引起系統部分功能喪失,但不影響主要功能的執行;
4)Ⅳ類(輕度的):引起系統的性能降低及設備的非計劃性維護或維修。
按照上面嚴酷度劃分準則,結合系統層級故障模式,將整個單元的故障嚴酷度等級統計如表3所示。

表3 故障嚴酷度分類表
通過上述的故障診斷設計分析,得出清晰明確的系統層次、各層次的故障模式故障率、影響以及嚴酷度等級。為系統故障診斷設計改進提供了依據,具有重大意義。在高速隧道監控系統中,考慮到工程的成本以及難易程度等問題,并不是所有的故障都需要進行故障診斷的設計,因此其故障診斷設計改進應綜合權衡故障模式故障率、影響和嚴酷度來進行。
通過對高速隧道監控系統故障診斷分析,得知控制模塊中控制電路的電源故障、采集數據故障和控制執行部件故障的故障率較高且對系統的影響巨大,涵蓋了所有的Ⅰ、Ⅱ類嚴酷度的故障模式。因此,針對這三方面的故障進行故障診斷的設計改進。
目前故障診斷設計的測試方式分為自動測試設備(ATE)和機內測試(BIT)。自動測試設備是指通過外部測試儀器、工具或設備對被測對象進行檢測和隔離的測試;機內測試又叫嵌入式測試,是指系統或設備能夠自己完成對系統、組件或功能模塊的狀態檢測、故障診斷以及性能測試。對高速隧道監控系統故障診斷的改進主要通過對系統增加BIT功能來完成。BIT按照測試時機,一般分為上電BIT、周期BIT和維護BIT。上電BIT為系統接通電源后自動按規定的測試內容,進行檢測不需要外部提供信號;周期BIT為系統周期或持續地檢測關鍵功能特性;維護BIT為維護人員通過按鈕啟動系統進行的檢測。
由故障診斷分析得知:電源故障模式有無輸出,輸出超差;采集數據的故障模式有數據無輸出,輸出錯誤;執行部件的故障模式有執行部件不受控制。控制模塊在之前的設計中并沒有對這些故障進行檢測,監控系統也沒有相應的措施處理。下面對這些故障檢測進行BIT電路設計,提高系統故障診斷能力。
針對電源故障模式的BIT電路設計如圖5所示。控制模塊中的電源是12 V的直流電源,通過利用LM393比較器搭建一個信號電壓比較電路,主控STM32F4實時檢測LM393輸出信號Vo,判斷控制模塊的電源電壓是否正常。

圖5 電源BIT電路改進設計圖
針對采集數據故障模式BIT電路設計如圖6所示。采集數據進入控制電路后,使同樣的數據分成兩路處理。一路數據通過光耦和阻容網絡隔離濾波電路處理,另一路數據采用開關去抖電路處理。主控STM32F4先檢測濾波電路數據信息輸出信號Vo,然后檢測去抖電路數據信息輸出信號Vo,進行一致性對比,判斷是否發生數據故障。

圖6 采集數據BIT電路改進設計圖
針對執行部件故障模式BIT電路設計如圖7所示。主控STM32F4對執行部件的電流回采電路輸出信號Vo進行實時監控,通過電路電流回采值與設定的閾值偏差,判斷執行部件是否受控。

圖7 電流回采BIT電路改進設計圖

圖8 故障診斷BIT邏輯設計改進流程圖
表4 系統故障診斷能力對比

故障模式對系統影響嚴酷度類別原系統是否可檢改進后系統是否可檢12V電源無輸出系統停止工作Ⅰ否上電BIT/周期BIT/維護BIT可檢12V電源輸出超差±10%系統停止工作Ⅰ否上電BIT/周期BIT/維護BIT可檢采集數據無輸出系統采集信息數據功能完全喪失Ⅱ否上電BIT/周期BIT/維護BIT可檢采集數據錯誤系統采集信息數據功能完全喪失Ⅱ否上電BIT/周期BIT/維護BIT可檢執行部件不受控系統喪失控制執行部件能力Ⅱ否上電BIT/周期BIT/維護BIT可檢
在BIT電路設計完成的基礎上,對其進行上電BIT、周期BIT和維護BIT邏輯設計。上電BIT(周期BIT或維護BIT)流程是:系統上電穩定后(系統每運行1小時或PC機下發巡檢指令),主控STM32F4巡檢電壓,并將收集到的電壓與設計好的門限值進行比對,如發現電壓超出設定門限的10%,則判定為電壓發生超差故障。如發現電壓超出設定門限的50%,則判定電壓發生無輸出故障。主控STM32F4巡檢數據,將兩路數據進行對比,如發現兩路數據不一致,則判定采集數據故障。主控STM32F4巡檢回采電流,并將收集到的電流與設計好的門限值進行比對,如發現超出20%,則判定發生執行部件不受控故障。各項數值狀態存入指定狀態寄存器,供上級PC機查詢,同時向PC機報送巡檢結果。PC機設計故障狀態和故障發生點報警機制,若巡檢發現異常狀態,PC機迅速得知發生故障的狀態和故障發生點。PC機還設計有查調主控模塊信息機制,隨時可以巡視主控模塊中的狀態寄存器,為后續維修保障工作開展提供支撐。
整個上電BIT、周期BIT和維護BIT邏輯設計的流程圖如圖8所示。
通過上述的設計改進,故障診斷BIT設計覆蓋了故障率較高且嚴酷度為Ⅰ、Ⅱ類的故障模式,提高了整個系統的故障診斷能力。系統故障診斷能力對比如表4所示,設計改進后系統對故障率較高且嚴酷度為Ⅰ、Ⅱ類的故障模式超過了80%,滿足了現階段對監控系統的故障定位和維修的主要需求。
本文對高速隧道監控系統進行了故障診斷設計分析,提出一套針對高速隧道監控系統故障診斷設計分析方法,理清了高速隧道監控系統的功能結構、任務可靠性框圖、故障診斷層次、故障模式、影響以及故障嚴酷度,并以此開展相應故障診斷設計改進,提高了整個系統的故障檢測和隔離能力,滿足高速隧道監控系統故障定位和維修的主要需求,可為類似產品開展故障診斷設計研究提供參考。