楊文棟 趙剛
一、引言
軌道交通裝備的服役期往往達10年以上,由于系統復雜度高、應用環境惡劣、使用維護不當等原因會產生形式多樣的故障。無論是責任或非責任故障,都會對運營造成不良影響,軌道交通裝備滿足良好的RAMS特性,即可靠性(Reliability)、可用性(Availability)、可維修性(Maintainability)和安全性(Safety)的同時,仍然需要考慮故障的預防和故障處理技術服務。
根據軌道交通裝備的特點,故障預防和故障處理應納入統一的失效模式管理,以形成知識沉淀,使裝備制造企業能夠根據故障發生概率、故障原因,有針對性的提高產品可靠性、優化修程,并且幫助用戶快速的應急處置、正確的處理故障,更進一步的價值是根據數據統計和故障機理進行裝備的狀態監控、故障診斷和故障預測。本文從知識沉淀和分類管理角度探討軌道交通裝備的失效模式管理方法。
二、失效模式管理的知識沉淀過程
失效模式知識沉淀的過程主要包括面向故障預防的失效模式分析,面向故障機理的故障樹分析和面向故障處理的閉環管理三個過程。
(一)失效模式分析
失效模式及后果分析(Failure Mode and Effects Analysis,簡稱FMEA),是在產品設計階段和過程設計階段,對構成產品的子系統、零件,對構成過程的各個工序逐一進行分析,找出所有潛在的失效模式,并分析其可能的后果,從而預先采取必要的措施,以提高產品的質量和可靠性的活動。
(二)故障樹分析
故障樹分析(Fault Tree Analysis,簡稱FTA)是系統分析的一種技術,它從單個的潛在失效模式來識別所有的可能原因,分析系統失誤。FTA考慮的是相互關聯的原因以及獨立原因。除了故障樹結構和所有的邏輯關聯,通常FTA還包括了失效可能性的識別,從而可以從零部件的可靠性來計算系統可靠性。故障樹的建立步驟如下:
1. 選擇和確定頂事件(可以為故障模式、系統故障代碼)
2. 分析頂事件,尋找引起頂事件發生的直接、必要和充分的原因,將頂事件作為輸出事件,將所有直接原因作為輸入事件,并根據這些事件實際的邏輯關系用適當的邏輯門相聯系。
3. 逐級向下分解,直到所有的輸入事件不能再分解或不必再分解為止。
(三)基于失效模式知識庫的故障閉環管理
故障閉環管理為現場處理閉環和管理閉環兩個過程,根據故障等級,輕微故障僅需要現場處理閉環,重點故障進行管理閉環,重點故障閉環過程需完善如下內容:
D1:小組成員,確定故障提交、診斷、處理及制定措施的相關部門及人員。
D2:問題描述,檢索功能對象、失效模式,明確是否為新的失效模式,新故障模式則D2至D7內容全部需要制定并納入知識庫。
D3:即日糾正措施,檢索失效模式相應的即日糾正措施并執行,必要時完善即日糾正措施。
D4:明確和核實根本原因,檢索失效模式相應的故障樹及可能的原因,進行診斷分析,若發現新的原因,納入知識庫。
D5:永久性糾正措施,檢索失效模式相應的既有永久性糾正措施,必要時進行更新完善。
D6:糾正措施效果驗證,跟蹤監控,確保故障隱患消除。
D7:預防再現措施,檢索失效模式相應的既有預防再現措施,必要時進行完善。
D8:客戶確認及評價。
三、軌道交通裝備的失效模式分類方法
對失效模式分類是進行裝備可靠性分析的基礎,傳統的故障分類是根據嚴重度、責任方、系統及部件進行分類,較前沿的做法是運用機器學習技術進行數據認知(例如季節規律、地域規律)。
(一)失效模式的人工分類方法
1.嚴重度分級管理
基于失效模式嚴重度的分級,根據軌道交通行業的特點將FMEA的10級簡化對應到5級(輕微、一般功能故障、影響旅客舒適、影響行車秩序、影響行車安全)便于現場操作,故障等級將影響故障的閉環管理流程,輕微故障僅需現場閉環管理,重點故障需進行管理閉環。
2.責任分類管理
結合“人、機、料、法、環”的原則,按責任方進行分類,如設計問題、工藝問題、施工質量問題、合作方施工問題、配件質量問題、軟件升級問題、使用維護問題、外部環境問題。故障分類也將影響故障的閉環管理流程,如果是責任問題,由相應責任方進行進一步分析處理。
3.按系統及部件分類管理
根據裝備構型信息,提供按照系統、子系統、部件進行分類,實現故障定位到系統、子系統和部件,便于故障進行查詢和統計分析。
(二)失效模式的機器學習分類方法
機器學習通過大數據可以發現許多有價值的規律,例如失效模式的季節規律、地域分布規律、用戶規律、產品在不同壽命階段的故障規律等,進行有效的預測分析,并且提供相應決策支持。
四、結語
通過知識沉淀過程管理和分類管理有助于有效的進行失效模式管理,從而將質量問題數據轉變為可用信息并驅動質量提升,更進一步的價值是根據數據統計和故障機理進行裝備的狀態監控、故障診斷和故障預測。