白廣爭 鄭澤熙 馮浩楠 許展瑛 劉海祥 范 楷
(中國鐵道科學研究院集團有限公司通信信號研究所,100081,北京)
CBTC(基于通信的列車控制)系統(tǒng)由ATS(列車自動監(jiān)控)系統(tǒng)、CI(計算機聯(lián)鎖)系統(tǒng)、ZC(區(qū)域控制器)系統(tǒng)、VOBC(車載控制器)系統(tǒng)和DCS(數(shù)據通信子系統(tǒng))共同構成,系統(tǒng)構成相對復雜。在運行過程中,若有某一模塊發(fā)生故障,往往會有多個子系統(tǒng)報警,僅從系統(tǒng)表現(xiàn)出來的故障現(xiàn)象較難確定故障問題來源。不同子系統(tǒng)通過自身邏輯判斷提供一定的報警信息,此時需要有經驗的維護人員歸納這些信息,同時結合子系統(tǒng)之間實時傳輸?shù)慕涌跀?shù)據信息進行綜合判斷,才能確定故障發(fā)生的來源。這不僅需要維護人員耗費較長的時間進行問題分析,而且其自身也需具有較高的技術水平。因此,設計一套針對CBTC系統(tǒng)進行實時故障診斷定位的分析系統(tǒng)具有重要的應用價值。
將模式匹配應用在故障定位領域是一種有效的方法。文獻[1]研究了在設備資源受限情況下,基于云服務器輔助計算策略,完成對模式端和數(shù)據庫端兩方的安全模式匹配協(xié)議設計,并通過設計功能函數(shù)實現(xiàn)對模式的檢測。文獻[2]通過對文本關鍵信息進行模糊化預處理,基于WM(Wu-Manber)算法進行中文信息的初步匹配,最后進行多模式匹配。文獻[3]將模糊理論應用于網絡故障的實時故障監(jiān)測,結合模糊理論與數(shù)據挖掘方法,建立關聯(lián)規(guī)則知識庫,再利用模糊匹配對告警信息進行模糊推理,以達到定位故障的目的。
在進行故障模式匹配過程中,現(xiàn)有文獻研究均沒有考慮時間約束對故障模式匹配的影響。而在實際應用中,從通信網絡上采集到的多方實時數(shù)據需要考慮其時間要求,即滿足時間要求的數(shù)據才能參與模式匹配,傳統(tǒng)的字符串模糊匹配算法難以解決該問題。鑒于此,針對系統(tǒng)網絡監(jiān)測數(shù)據,本文提出一種基于時間約束的實時故障監(jiān)測定位方法,以實現(xiàn)城市軌道交通基于CBTC系統(tǒng)的快速故障診斷和定位。本文研究可為CBTC系統(tǒng)的集成測試、故障運維等提供借鑒。
假設在某一時刻,CBTC系統(tǒng)突發(fā)故障,針對各子系統(tǒng)的報警信息分別構建數(shù)據序列,例如ZC報警數(shù)據序列、VOBC報警數(shù)據序列、CI報警數(shù)據序列、各子系統(tǒng)之間實時通信數(shù)據序列等。當特定故障發(fā)生時,故障診斷系統(tǒng)結合預先制定好的故障模式庫中的不同故障模式,利用故障識別定位算法進行故障模式匹配。在設計模式匹配算法過程中,需要考慮時間約束的問題:
1) 同一數(shù)據序列內信息之間的時間約束性。對于同一數(shù)據序列,將其中的數(shù)據信息與故障的對應子模式進行匹配時,模式中各字符的出現(xiàn)時機與順序只有滿足給定的時間約束,才被認為該故障子模式匹配成功;不滿足時間約束的字符,認為其并不處于同一故障狀態(tài)下,則不滿足模式匹配規(guī)則。通信周期越長、通信數(shù)據量越大,則待匹配字符之間的干擾字符數(shù)量越大,數(shù)據序列與故障模式之間的ED(編輯距離)越大[4-5];反之,則數(shù)據序列與故障模式之間的ED越小。
2) 不同數(shù)據序列之間相關信息的同步性。對于CBTC系統(tǒng),當從不同子系統(tǒng)分別獲得數(shù)據信息后,會形成多個數(shù)據序列。不同數(shù)據序列內的信息在參與某一特定故障模式匹配時,只有同一時期內出現(xiàn)的信息才能進行匹配。不同時期產生的信息,即使能夠匹配成功,但不具有實際意義。“同一時期”的定義是由系統(tǒng)的響應周期、通信周期等參數(shù)共同決定的。例如,當其中一個子系統(tǒng)發(fā)生故障后,另一個子系統(tǒng)的響應時間為t,則進行該故障模式匹配時,t時間域內的信息均屬于“同一時期”。
根據以上分析,設計基于時間約束的故障識別定位算法,以提高CBTC系統(tǒng)的實時故障快速監(jiān)測定位與現(xiàn)場恢復能力。
根據實際問題,對模式定義及匹配規(guī)則進行說明。
2.1.1 總模式和子模式
1次完整的匹配對應1個總模式,總模式匹配成功,即完成了模式對象的匹配過程。1個總模式由K個子模式組合而成,第n個總模式的第j個子模式稱為sn,j(1≤n≤N,1≤j≤K),該子模式對應一個實時數(shù)據序列,每個總模式的K個子模式對應K個實時數(shù)據序列。子模式sn,j中的字符在數(shù)據序列中出現(xiàn)時均具有時間屬性,出現(xiàn)的時機和順序受時間約束。多個總模式共同構成模式庫。
2.1.2 子模式sn,j匹配規(guī)則
子模式sn,j匹配規(guī)則為:①sn,j由xn,j個報警信息組成;②sn,j中的各報警信息在數(shù)據序列中可以不相鄰;③sn,j中的各報警信息在數(shù)據序列中必須按順序且全部出現(xiàn);④sn,j中的第m個報警信息sn,j,m與第m+1個報警信息sn,j,m+1之間的時間間隔不超過規(guī)定時間t0,則有:
tn,j,m+1-tn,j,m≤t0
(1)
1≤m 式中: tn,j,m+1——報警信息sn,j,m+1出現(xiàn)的時刻。 同時滿足上述4個規(guī)則,該子模式sn,j匹配成功。 2.1.3 總模式匹配規(guī)則 總模式匹配規(guī)則為:①對于某一確定的總模式n,其所包含的各個子模式sn,j均匹配成功;②對于總模式n,sn,j的第1個字符sn,j,1出現(xiàn)的時刻必須分布在某一確定的時間圍欄T內,即tn,j,1∈T(tn,j,1為sn,j的第1個報警信息sn,j,1的出現(xiàn)時刻)。時間圍欄T=[tn,j0,1-t1,tn,j0,1+t1],其中:tn,j0,1為總模式n第j0個子模式sn,j0的第1個報警信息sn,j0,1的出現(xiàn)時刻;t1為設定常數(shù)。 同時滿足上述2個規(guī)則,總模式n匹配成功。 2.1.4 相似度 假設總模式n1中所包含的報警字符在總模式n2中均按順序出現(xiàn),則稱n1包含于n2,記為n1?n2。通過定義相似度R提高故障模式的識別準確度。故障模式n發(fā)生的相似度Rn表示總模式n在與實時報警字符序列進行匹配時,所能夠實現(xiàn)匹配的字符數(shù)。根據定義,若在實時獲取的報警字符序列中同時出現(xiàn)了故障模式n1和n2,且Rn2≥Rn1,即所發(fā)生的故障與模式n2的相似度更高,故認為發(fā)生的是故障模式n2。 根據模式定義及匹配規(guī)則,設計模式匹配算法。 步驟1 將故障模式庫中所有總模式的相似度初始化為0;選定第1個子模式對應的數(shù)據序列作為第1個待匹配對象;選取該數(shù)據序列的第1個字符,假定該字符為γstr1,1,則該字符的發(fā)生時刻為t1,1。 步驟2 根據γstr1,1,在模式庫中搜索所有總模式中第1個子模式sn,1的首字符,選出sn,1的首字符sn,1,1與γstr1,1匹配成功的所有總模式,進而初步篩選出第1個子模式的首字符匹配成功的總模式集合A。若集合A非空,A={a1,a2,…,ap}(1≤p≤N),則返回該集合,并轉至步驟3;否則,刪除步驟1中所選數(shù)據序列中的第1個報警信息,并轉至步驟1。 步驟3 根據t1,1計算時間圍欄T,T=[t1,1-t1,t1,1+t1]。 步驟4 在時間圍欄T內,針對集合A中的總模式集合,任意選取一個總模式ai(1≤i≤p),在除第1個子模式外的ai中的其他各子模式所對應的數(shù)據序列中逐個搜索sai,j,1(1≤j≤K且j≠1),其中sai,j,1為總模式ai的第j個子模式的首字符。若在時間圍欄T內,存在任意j使得sai,j,1搜索失敗,則從集合A中刪除ai;否則,將ai加入集合B。遍歷集合A中所有ai。 步驟5 若集合B非空,B={b1,b2,…,bq}(1≤q≤p),則返回該集合,并轉至步驟6;否則,刪除步驟1所選的數(shù)據序列中的第1個字符,并轉至步驟1。 步驟6 對集合B中的總模式b1按以下過程進行匹配:在[tb1,j,m-1,tb1,j,m-1+t0](1 步驟7 在集合B中繼續(xù)搜索“包含”步驟6中已完成匹配字符sb1,j,m(1≤j≤j1,1≤m 步驟8 若C不為空集,則選取其中相似度最大的故障模式作為匹配成功的模式進行報警,并將各實時數(shù)據序列中已參與匹配的字符刪除,轉至步驟1;否則,表示沒有完成匹配,則刪除步驟1所選的數(shù)據序列中的第1個字符,并轉至步驟1。 在步驟6—步驟8中,通過有效利用每一次匹配成功部分的信息,避免了算法的回溯搜索。當模式庫中的一個總模式n與數(shù)據序列中的數(shù)據進行匹配時,若匹配過程中的某個字符sn,j,ml(1≤n≤N,1≤j≤K,1≤ml CBTC數(shù)據監(jiān)測系統(tǒng)架構示意圖如圖1所示。CBTC系統(tǒng)的各子系統(tǒng)之間通過骨干網交換機交互接口應用數(shù)據,各子系統(tǒng)內的不同模塊(或終端)之間,通過子系統(tǒng)交換機實時交互報警數(shù)據等信息。利用交換機的端口鏡像技術,設計交換機級聯(lián)方案,將骨干網交換機內的數(shù)據和各子系統(tǒng)內部交換機上的通信數(shù)據分別鏡像到抓包交換機,再對抓包交換機做端口鏡像,將所有數(shù)據匯總至上層數(shù)據處理服務器,并以此作為故障檢測模型的原始輸入數(shù)據。 注:圖中將CBTC系統(tǒng)的所有終端均以PC(個人計算機)終端作為示意代替;ATS為列車自動監(jiān)控;TIU為車載接口單元。 CBTC數(shù)據監(jiān)測系統(tǒng)架構設計從物理上保證了數(shù)據獲取通道的暢通性。在此基礎上,設計CBTC數(shù)據監(jiān)測系統(tǒng)的軟件部分,包括抓包模塊[6]和故障識別模塊。故障識別模塊識別流程示意圖如圖2所示。 圖2 故障識別模塊識別流程示意圖 利用所提故障定位算法及CBTC數(shù)據監(jiān)測系統(tǒng),在重慶軌道交通9號線的CBTC系統(tǒng)上進行算法驗證。所提故障定位算法在CPU(中央處理器)為Intel? Xeon? Silver 4116,主頻為2.2 GHz,24線程12核心,內存為16 GiB的服務器上連續(xù)運行,內存及CPU占用率始終維持在較低水平。 CBTC數(shù)據監(jiān)測系統(tǒng)的故障標簽庫規(guī)模為2 046條,隨機選取故障標簽庫中的5條故障,作為待測案例。通過人工對CBTC數(shù)據監(jiān)測系統(tǒng)植入相應的故障狀態(tài),使得所提故障定位算法能夠實時識別出系統(tǒng)內發(fā)生的故障,并提供正確的故障定位報警提示。故障定位耗時記錄如表1所示。 表1 故障定位耗時記錄 根據CBTC系統(tǒng)的系統(tǒng)架構、應用數(shù)據傳輸原理及系統(tǒng)參數(shù),結合測試經驗,設計了一套能夠進行實時快速故障定位的方法。所提CBTC系統(tǒng)實時故障定位方法在針對具有時間約束的故障診斷定位方面具有普適性,尤其適用于大型分布式軟件多點監(jiān)測控制系統(tǒng)的故障檢測及智能故障診斷。根據模式匹配規(guī)則設計了故障定位算法,運用了已完成有效匹配信息的繼承方法,能夠有效避免故障模式的回溯搜索過程。經CBTC數(shù)據監(jiān)測系統(tǒng)驗證,所提算法能夠快速完成CBTC系統(tǒng)的故障定位功能。所提CBTC系統(tǒng)實時故障定位方法無論在測試階段還是在現(xiàn)場運營階段均能發(fā)揮重要作用,其不僅降低了系統(tǒng)測試和故障運維的技術難度,通過快速故障定位,大大減少了故障恢復時間。2.2 故障定位算法設計
3 CBTC數(shù)據監(jiān)測系統(tǒng)構建與算法驗證
3.1 CBTC數(shù)據監(jiān)測系統(tǒng)構建


3.2 算法驗證

4 結語