馬元,王鵬,孫瑞
轉轍機是影響鐵路行車安全的重要信號設備,由于其結構復雜,影響因素多,故障數據有限,且具有非線性、關聯性、隨機性等特點,因此出現故障后常常不易判斷,還可能會造成較為嚴重的后果,威脅行車安全,一直是現場電務檢修的重點。
為了更好地保障設備穩定運行,若能分析出轉轍機故障的影響因素,并以此為基礎,建立系統健康度評估模型,再結合轉轍機設備關鍵特征狀態的實時信息,進行模型分析與評估,進而制定有針對性的安全控制措施,則可變被動維修為主動維護[1]。因此,本文根據轉轍機特性,引入一種基于馬爾科夫狀態轉移的動態權值評估方法[2],通過對樣本進行歸納,將各個指標不同程度的故障影響動態關聯起來,深入分析系統故障模式、機理及其影響,建立動態退化分布指標體系,使狀態預測結果更加貼近實際[3];并在此基礎上,針對轉轍機設備進行仿真試驗,驗證了該方法的有效性。
對于轉轍機設備,本文定義的健康度HI(Health Index)是指設備在規定的時間及條件下,完成規定功能的能力。該能力越強,其健康度也就越高[4]。將信號設備在t時刻的特定性能,規定為影響其狀況的健康指標,用x1(t)、x2(t)、…、xn(t)表示。具體定義為

式中:x為健康度評估因子;F為健康函數;HI的取值范圍為0~100。
轉轍機設備的健康度評估因子所占權重不是一個恒定的值,會隨著時間不斷變化,是一個時變的指標。因此,每隔一段時間,需要對轉轍機的運行狀態和各個健康度評估因子進行重新評估。但是,在轉轍機實際運行過程中,很多低權重指標在設備狀態惡化的情況下,其重要性才越發突顯。為了克服傳統設備健康度評估方法不能反映復雜系統非線性特征的缺陷,引入了基于馬爾可夫狀態轉移的動態權值,將各個指標不同程度的影響動態關聯起來,通過退化模型,有效而準確地描述轉轍機退化過程的狀態轉移和故障規律的演化。
將健康等級或對應的健康度HI作為綜合評估健康狀態變化的定量指標,以此掌握轉轍機的大致健康程度。HI值越大、越接近100,表明轉轍機的健康程度越高,轉轍機的狀態運行參數越符合正常范圍,轉轍機的各項功能均正常工作,發生故障的可能性越低;HI值越低,則表明轉轍機的健康程度越低,轉轍機的某個狀態運行參數已經或正偏離正常范圍或斷崖式變化,系統呈現性能退化趨勢,發生故障概率逐步變大。
根據相關研究,參考相似系統的設備健康度等級劃分,將轉轍機設備的健康狀態劃分為健康、亞健康、異常、病態和故障5個等級[5],并由此建立轉轍機健康度定量指標與健康狀態定性評估等級的對應關系,進而對評估對象的維保提出建議,如關注、加強維保、立即檢修、更換等。轉轍機健康等級劃分見表1。
根據現場調查分析,總結出轉轍機設備故障原因,進而映射出相應的健康度評估因子[6],見表2。

表2 轉轍機故障原因與設備健康度評估因子關系
根據上述關系,總結出轉轍機健康度評估因子,即影響轉轍機運行狀態的評估因素,主要可以分為3類,見圖1。

圖1 轉轍機健康度評估因子
第1類是運行數據,包括檢修記錄和電氣特性曲線等。檢修記錄反映的是設備歷史健康狀態,是對每個設備故障檢修或日常檢修后的記錄。當同一個轉轍機在其檢修周期內進行多次檢修后,依據指數遞增的規律,將降低其健康度評分。電氣特性曲線反映的是設備實時健康狀態,與設備的標準參考曲線進行對比,偏離度越大,其評分越低。
第2類是設備基本參數,主要包括生產日期(運行年限)、家族質量史等。設備在使用壽命期內,其健康度與生產日期有關,近似地滿足單調遞減的線性關系,需采用單調均勻遞減的函數,描述其對轉轍機運行狀況的影響。通過查閱專業資料或專家打分的方式獲取家族質量史。
第3類是運行工況,包括環境溫度、濕度、大氣壓力等,該類因素要依據每個站實時或歷史的運行環境,對設備的運行環境做綜合評估。
通過以上分析,建立各類影響因素對轉轍機運行狀態影響的模型。動態評估初始時,按照設定的權重,對各個健康度指標進行加權計算,建立設備處于不同狀態下的隸屬度函數,計算求得轉轍機的綜合健康度。
使用順序關系分析法,求取轉轍機在各個階段,各項屬性對健康度影響的權重。通常采用以下步驟[7]:屬性選取→確定屬性序關系→比較判斷評估指標→計算權重。
設impn為按照屬性在評估因子中的重要程度,給出的第n個屬性的重要性權值,impn∈[0,1]。
轉轍機各個指標確定順序關系的方法如下:決策人員根據專家經驗,從包含n個指標的集合{x1,x2,...,xn}中,選出其中最重要的一個指標記為imp1,次重要的一個指標記為imp2;重復n次上述步驟的操作,此時剩下的最后一個指標的屬性記為impn。如此,按照重要性對n個元素建立了排序:imp1>imp2>...>impn。當各個指標的關系序列完成之后,再根據給定的評估準則,求取每個指標在轉轍機健康度評估過程中所占的權重。
定義rn為比較判斷評估指標xn-1和xn的重要性程度比值:①若rn=1.0,說明屬性xn-1與屬性xn的重要性相同;②若rn=1.2,說明屬性xn-1比屬性xn略微重要;③若rn=1.4,說明屬性xn-1比屬性xn明顯重要;④若rn=1.6,說明屬性xn-1比屬性xn強烈重要;⑤若rn=1.8,說明屬性xn-1比屬性xn極端重要。
定義wm為各影響因子的權值,假設根據專家經驗,選出其中最重要的一個指標定義為ri,則權值wm為

通過分析轉轍機設備構造和故障機理,結合故障數據和專家意見,分析故障演化規律并劃分退化模式[8],見圖2。將轉轍機設備全生命周期的退化狀態劃分為4種:正常狀態、退化狀態Ⅰ、退化狀態Ⅱ和退化狀態Ⅲ。

圖2 轉轍機退化狀態變化
正常狀態:轉轍機各個部位運行情況良好,故障的發生概率很低。
退化狀態Ⅰ:轉轍機設備能基本準確執行操作,故障發生的概率在可控范圍內。
退化狀態II:轉轍機出現故障趨勢,可能會發生故障,不能精確地執行操作。
退化狀態III:轉轍機性能惡化,故障趨勢嚴重,故障特征明顯,故障概率很高,必須及時檢修。
設備可以從正常狀態到退化狀態Ⅲ逐級退化和逐級進化,但不能越級退化。當設備處于退化狀態Ⅲ或者退化狀態Ⅱ時,考慮到設備經歷維修養護等情況可以越級進化。根據通常的檢修流程,設備經過維修、確認之后才會再次投入使用,所以定義設備的運行狀態可能發生跳級現象。
設備的退化狀態等級高,不代表設備的綜合健康度就一定會低;在不同的退化等級下,設備的各單項健康度指標的權值會產生變化[9],設備綜合健康度指標也會產生相應的變化。根據式(2),計算出轉轍機健康度動態變化權值列表[10],見表3。

表3 轉轍機健康度指標權值
1)正常狀態。在對所有設備進行初次健康度評估之后,默認設置所有設備的穩定運行狀態為正常狀態,計算出初始狀態下設備健康度指標權值。偶然性的轉轍機設備電氣特性曲線異常,運行環境變化不會導致設備運行狀態的變化,更不會導致設備健康度的急劇下降。正常狀態的轉轍機如果發生多次曲線異常報警,或連續多天運行環境惡劣,則該轉轍機設備的運行狀態會從正常狀態轉移到退化狀態Ⅰ,如圖2中路徑①。
2)退化狀態Ⅰ。設備處于不穩定狀態,檢修記錄和運行年限重要性有所上升,權值會增大,達到0.305,而曲線數據、運行環境指標將會減少,家族質量史指標保持不變。
如果正常狀態的設備連續發生3次異常報警,或者一天之內有超過6次異常,或者設備連續3天運行環境超過設備額定工作環境臨界值,則設備的運行狀態會從正常狀態退化到退化狀態Ⅰ,如圖2中路徑①。
對于退化狀態Ⅰ的設備,如果連續1周運行狀態良好,沒有出現異常曲線且運行環境不超過設備額定工作環境臨界值,則轉轍機的運行狀態從退化狀態Ⅰ恢復到正常狀態,如圖2中路徑②。
若該設備退化到退化狀態Ⅰ之后,仍然連續檢測到實時電氣特性曲線異常,或連續幾天運行環境惡劣,則其運行狀態將從退化狀態Ⅰ退化到退化狀態Ⅱ,如圖2中路徑③。
3)退化狀態Ⅱ。設備故障概率較高,處于高度關注狀態,曲線數據和運行環境重要性提高,權值增大。其中,曲線數據和設備故障高度相關,其權值達到0.452,而家族質量史、運行年限、檢修記錄重要性降低,權值將會減少。
對于退化到退化狀態Ⅰ的設備,在該設備退化到退化狀態Ⅰ之后的第2天,如果連續發生5次曲線異常報警,或者一天之內有超過8次曲線發生異常,并且設備運行環境超過額定工作環境臨界值,則該設備的運行狀態會從退化狀態Ⅰ退化到退化狀態Ⅱ,如圖2中路徑③。
對于退化狀態Ⅱ的設備,如果連續5天運行狀態良好,沒有出現異常曲線且運行環境不超過設備額定工作環境臨界值,則設備會從退化狀態Ⅱ恢復到退化狀態Ⅰ,如圖2中路徑④;或者進行設備清理維護之后連續3天運行狀況良好,曲線均正常,則設備的運行狀態會從退化狀態Ⅱ恢復到正常狀態,如圖2中路徑⑤。
4)退化狀態Ⅲ。設備處于危險狀態,曲線數據、檢修記錄和運行環境重要性持續較高,權值會增大,而運行年限的權值將會極大減少,降為0.057,同時家族質量史將不被考慮,權值降為0。
對于退化到退化狀態Ⅱ的設備,在退化到退化狀態Ⅱ之后的第2天,一天之內有超過15次曲線發生異常,或者運行年限超過設備使用生命周期,則設備的運行狀態會從退化狀態Ⅱ退化到退化狀態Ⅲ,如圖2中路徑⑥。
對于退化狀態Ⅲ的設備,如果連續半個月運行狀態良好,沒有出現異常曲線且運行環境不超過設備額定工作環境臨界值,則可以從退化狀態Ⅲ恢復到退化狀態Ⅱ,如圖2中路徑⑦;或者進行更換元器件返廠維修之后,連續半個月運行狀況良好,曲線均正常,還會從退化狀態Ⅲ恢復到退化狀態Ⅰ,如圖2中路徑⑧。
根據上述方法設計轉轍機設備健康度評估的計算流程,為驗證健康度評估算法的有效性,本文采用控制變量法,將取自現場環境下的轉轍機各評估因子對設備健康度的影響進行了仿真分析。
1)轉轍機設備正常工作下的健康度變化。試驗中導入該設備連續600天內產生的動作曲線數據,共有1 393條。在日常的工作環境下進行試驗,其中故障曲線有16條,屬于設備使用過程中的偶然性故障,保持其他評估因子不變,設備產生的健康度曲線變化見圖3(橫軸表示運行天數,縱軸表示健康度值,圖4、圖5同)。從圖3可以看到,當設備運行時,設備健康度隨著設備的運行年限不斷降低,并且仍有下降的趨勢。

圖3 轉轍機設備正常工作下健康度變化

圖4 惡劣天氣影響下的轉轍機設備健康度變化

圖5 實時故障曲線影響下轉轍機設備健康度變化
2)惡劣天氣影響下轉轍機設備的健康度變化。選取了連續600天沒有發生故障的設備數據進行測試,確認該設備在某一段時間處在嚴寒環境下,另一時間段處在酷暑環境下,其中設備動作曲線數據共有1 375條,其健康度曲線變化見圖4。由于本試驗不包含故障曲線,設備運行在較為惡劣環境下時健康度會產生明顯的下降趨勢,設備的運行環境評分下降,最終導致設備綜合健康度下降。之后,在模擬正常設備運行環境時,可以觀察到設備的健康度在正常范圍內波動,說明設備工作在惡劣工作環境之中,符合預期。
3)實時故障曲線影響下轉轍機設備健康度變化。提取600天試驗中設備動作曲線數據共1 495條,在正常的工作環境下進行試驗,模擬了轉轍機設備偶然發生的故障,設備健康度曲線變化見圖5。
由試驗數據看出,設備在短時間內連續產生多條故障的電氣特性曲線時,健康度評估算法會判定設備進入了退化狀態,此時,其實時電氣特性曲線評估因子占比會提升,便于維修人員注意到設備發生了故障,對設備進行維修。維修后,設備在很長一段時間內工作正常,評估算法會判定設備由退化狀態恢復到了正常狀態,設備健康度分值提高,此時設備的實時電氣特性曲線評估因子占比會下降。
經過仿真試驗證明,本文提出的基于動態權值的轉轍機健康度評估算法,能夠較好地評估設備實時運行健康狀態。
基于動態權值的轉轍機健康度評估方法,可以準確地評估設備健康度;根據評估結果對維修活動的決策做出優化,可以提高設備管理工作的效率和質量。通過構建科學合理的設備狀態綜合評估模型,為電務設備檢修、維護、管理等提供輔助決策支撐。