潘 潼 俞軍燕 魏秀琨,3** 魏 倩 劉廣澤
(1.北京交通大學交通運輸學院,100044,北京;2.廣州地鐵集團有限公司,510330,廣州;3.北京交通大學軌道交通控制與安全國家重點實驗室,100044,北京∥第一作者,碩士研究生)
安全是城市軌道交通運輸永恒的主題。城市軌道交通信號系統主要依靠高新技術裝備保障安全,提高其服役能力。隨著信號系統車載設備的逐年老化,許多電子設備和機械部件性能下降,會導致信號系統車載設備故障增多。針對目前地鐵實際運營過程中由于信號系統車載設備故障導致的列車晚點、抽線和清客等嚴重影響列車運營的情況,在維保方面,一般是列車回庫后進行故障設備或板件的更換,有的故障件更換后還要做靜態或動態測試,不僅增加了維修成本,還有停機的時間成本,因而會造成很多浪費;在維修周期方面,一般按照信號系統車載設備維修規程進行周期性檢修,但在實際運營中,有的信號系統車載設備故障頻發,有的故障頻率較低,不同的信號系統車載設備壽命長短具有較大差異性。因此,本文通過基于故障樹的貝葉斯網絡分析,識別出信號系統車載設備的重要度高低,有針對性地建立基于狀態的維修模型進行維保策略優化,以在降低風險、保證安全的同時減少維修成本。
為了繪制故障樹,首先要了解信號系統車載設備組成。信號系統車載設備主要由車載ATP/ATO(列車自動保護/列車自動運行)子系統、DCS(數據通信系統)和HMI(人機界面)構成。
DCS由網絡數據傳輸和交換設備、光纜、車地數據通信設備(包括AP(無線接入點)等)組成。主要設備包括MR(車載無線電臺)和MR天線,MR安裝于OBCU(車載控制器)機柜內,每個MR需安裝兩副MR天線,安裝在列車兩端的駕駛室上方,沿車體中軸線對稱布置。
HMI是列車駕駛員與ATP/ATO設備交互的接口,一方面用于向司機提供來自ATP/ATO的信息,包括運行模式、故障等信息,以字符、數字及圖形等方式顯示列車運行速度、允許速度、目標速度和目標距離,實時給出列車超速、制動和允許緩解等表示設備故障狀態的報警;另一方面具有標準的列車數據輸入界面,用于接收司機的輸入操作,可根據運營和安全控制要求對輸入數據進行有效性檢查。
車載ATP/ATO子系統的功能是接收軌旁設備傳送的ATP/ATO信息,計算列車運行曲線,測量列車運行速度和走行距離,實行列車運行超速防護以及列車自動運行,保證行車安全和為列車提供最佳運行方式。主要由OBCU(車載控制器單元)、OPG(速度傳感器)、雷達和應答器讀取裝置(信標天線)組成,示意圖如圖1所示。

圖1 地鐵信號系統車載設備組成
根據信號系統車載設備結構及其與故障設備的結構關系,選取最不希望發生的故障狀態作為頂事件;從頂事件開始,向下逐級推溯事件的直接原因。在這個過程中,準確寫出故障事件方框中的說明,分析清楚各事件的邏輯關系和條件,直到找出所有底事件。底事件就是故障分布已知的隨機故障事件,或是不需要或者暫時不能進一步查找其發生原因的事件[1]。信號系統車載設備的故障樹如圖2所示(故障代碼含義見表2)。

圖2 地鐵信號系統車載設備故障樹
從故障狀態的描述和推理機制來看,貝葉斯網絡分析與故障樹分析具有很大的相似性。但故障樹分析可以雙向推理,是在不完全信息條件下決策支持和因果發現的工具,因此將故障樹向貝葉斯網絡轉化,并對轉化后的貝葉斯網絡進行條件概率求解及后驗概率推理,進而進行重要度的識別和分析。
貝葉斯推理的實質是后驗概率推理問題,通過將拓撲結構和上述求得的條件概率表相結合,在已知系統發生故障的情況下,對各元部件發生故障的概率進行診斷推理,進一步進行重要度評估并找出系統的薄弱環節。貝葉斯網絡的網絡拓撲結構是一個有向無環圖。有向無環圖的節點是從實際問題中抽象出來的隨機變量[2],對應于故障樹的事件名稱,其對應關系如表1所示。

表1 故障樹與貝葉斯網絡的對應關系
2.2.1 確定貝葉斯網絡節點的先驗概率
貝葉斯網絡中各節點表示的含義及其編碼如表2所示。

表2 地鐵信號系統車載設備貝葉斯網絡節點名稱及編碼
貝葉斯網絡的根節點是不具有父節點的節點,擁有先驗概率,對應于故障樹底事件的失效概率qj,其計算公式為:
(1)
式中:
hj(t)——第j個單元的失效率,單位為次/年,可根據實際故障數據記錄算出;
Tj——第j個單元的故障修復時間,單位為h。
根據故障數據,由式(1)計算得到根節點的先驗概率表如表3所示。

表3 根節點的先驗概率
2.2.2 構造貝葉斯網絡并確定條件概率表
中間節點是非根節點,擁有條件概率;葉節點是不具有子節點的節點,同樣擁有條件概率。節點的有向邊表示條件獨立關系,代表節點間的關聯關系。條件概率表中,用0表示正常狀態,用1表示故障狀態,用P表示與每個節點相關的條件概率分布,如圖3所示。

圖3 貝葉斯網絡及條件概率表示
基于上述故障樹向貝葉斯網絡轉化的規則,得到如圖4所示的貝葉斯網絡及如表4所示的條件概率表。

圖4 地鐵信號系統車載設備貝葉斯網絡

表4 部分非根節點的條件概率表
2.2.3 聯結樹算法進行貝葉斯網絡診斷推理
聯結樹算法的基本思想是:首先把貝葉斯網絡轉換成聯合樹,它是一種二次結構(Second Structure, SS);接著為其所有節點指定概率,即對聯結樹進行初始化,從而得到一個帶有能力函數的聯結樹;再通過各團節點之間的消息傳遞,傳遍每一個節點,使其滿足全局一致性,即達到穩態,在這種狀態下,可計算任意節點的概率分布。當加入新的證據時,重新進行證據收集和證據擴散(即消息傳遞)的過程,最終每個節點包含的所有變量的分布函數即團節點的能量函數[3]。
根據上述算法思想,用MATLAB軟件中的BNT工具箱編程計算得到貝葉斯網絡各單元的后驗概率如表5所示。

表5 根節點的后驗概率
很多地鐵公司在實際運營中仍采用傳統的基于年齡的維修策略(Time-based Maintenance, TBM),這種策略更容易實施,只要記錄一個單元的正常工作時間即可。然而,當執行這種預防性更換的時候,如果該設備仍處于合乎情理的狀態,那么其實質的剩余壽命將會被浪費[4]。因此,本文針對信號系統車載的關鍵設備和單元,建立基于狀態的維修模型(Condition-based Maintenance,CBM),從而進行維保策略優化。
CBM模型有連續監測、定期檢查和不定期檢查三種主要的檢查班期。在連續監測中,連續報警系統持續監測機器的狀態并在監測到問題時觸發警報;定期檢查為目前常用的策略;不定期檢查策略可以導向潛在的成本節約,因為在系統運行的早期會執行較低頻率的檢查,而隨著系統使用時間的增長會執行更頻繁的檢查,也就意味著系統處于較差狀態時會執行更多的檢查[5]。
基于上述理論基礎,為了對檢查間隔進行優化,獲得最佳維修策略,需要通過建立比例風險模型和成本函數模型實現風險和成本最低的雙目標最優決策模型,如圖5所示。

圖5 風險與成本雙目標最優決策模型示意圖
3.1.1 比例風險模型
在CBM模型中,機器的狀態是通過風險測量,該風險取決于機器的使用時間和監測的變量[6]。基于歷史故障數據進行統計分析,通過威布爾回歸模型建模,也叫做比例風險模型(Proportional Hazards Model,PHM),計算最優更換決策。系統的失效率服從PHM模型。在PHM模型中,系統的失效率是兩個獨立函數的產物,其中一個是設備年齡的函數,另一個則是診斷過程的函數[7]。
風險函數可以用來以數學函數的形式表示統計模型。對于每個時間點,某工作件已持續到該時間點,將在下一個瞬間失效的概率h(t)為:
(2)
式中:
t——工作使用壽命,計算這點的風險;
Z1(t),Z2(t),…——工作時間點的協變量值;
η——比例參數;
β——形狀參數,與工作時間相關。
3.1.2 成本函數模型
成本函數計算為:單次更換的預期成本與更換之間的預期時間(工作時間)的比率。在所有情況下,模型做出更新假設,即所有工作件將作為新的,工作時長為0。
(3)
式中:
CE——成本率;
W——工作時間;
C——預防性維修成本;
K——由于單元失效所產生的額外的費用;
Q——失效概率;
C+K——故障更換成本,可能包括直接更換或大修成本、損壞成本、運行停機時間成本,以及其他超過計劃或定期維護成本的成本。
在信號系統車載設備中識別出的具有較高重要度的故障模式中,軟件故障可通過軟件升級解決,因此重點研究硬件故障。選取車載控制器中的ITF通信板作為案例進行建模與維保策略優化。
利用故障源數據進行預處理,利用Access軟件構建Events事件記錄表和Inspections檢查記錄表,建立如下字段映射關系:
“故障列車”——“Ident”;“故障日期”——“Date”;“檢查間隔”——“WorkingAge”;“Events”——“EF”(何時因故障維修或更換)/“B”(何時開始服役)。經過預處理后的數據表如圖6所示。

圖6 部分車載設備故障源數據預處理結果截屏圖
基于圖6所示的預處理后數據,由式(2)和式(3)建立統計模型和決策模型,決策策略由更換成本C和C+K以及固定的“風險警告級別”d決定。成本參數C(d)顯示了由風險等級d定義的策略的單位時間的預期成本。決策策略情況如下:
1)立即更換(t時的風險函數高于警告級別)。
2)在下一次檢查之前的某個計劃時間更換(t時的風險函數接近警告級別)。
3)暫不更換(t時的風險函數遠低于警告級別)。
根據實際調研情況,決策模型參數C設為65 000元,即預防性更換費用;而失效后更換費用C+K設為600 000元,時間單位為d。
根據ITF板卡的實際故障數據建模優化后得到如圖7所示的決策報告。

圖7 車載控制器ITF通信板卡案例分析報告截屏圖
由圖7可知,最佳失效風險等級約為34 d。當更換成本率(C+K)/C=9.230 77時,最優成本率達到100%。失效后再更換的費用為11 342.9元/d,優化后的更換費用為10 393.6元/d,經過模型優化后可節約950元/d的成本,即節約大約8.4%的費用。
本文主要針對地鐵運營中故障頻發的信號系統車載設備故障的問題進行維保策略優化。在簡要介紹信號系統車載設備構造后繪制相應的故障樹,并基于該故障樹構造信號系統車載設備貝葉斯網絡,從而進行貝葉斯網絡推理。通過聯結樹算法進行貝葉斯網絡后驗概率推理對信號系統車載設備的重要度進行評估,識別該系統的薄弱環節。選取車載控制器的ITF板卡進行維保策略優化的案例分析。在CBM模型建模過程中,考慮對故障風險和維保成本進行雙目標優化,通過PHM風險函數模型和成本函數模型,推測出案例板件的最佳維保時間間隔。本文研究成果為地鐵維保部門提供更換備件的合理建議,提高地鐵運營安全性的同時可實現降低運維成本的目的。