閆友為 李達明(北京全路通信信號研究設計院有限公司,北京 100073)

閆友為,男,碩士畢業于清華大學,助理工程師。主要研究方向為鐵路通信信號,曾參與“CTCS-3級列控系統綜合設計集成平臺測試”、“C3綜合測評系統”等項目工作。
隨著中國高速鐵路的快速發展,信號安全網的安全性對列車的行車安全至關重要。因此,搭建一套基于鐵路安全通信協議規范的故障診斷系統,對由安全設備之間的通信組成的客運專線信號安全網中的數據進行分析和評判,可以輔助作業人員快速定位設備通信故障并及時解決,以保障列車行車安全。
傳統的通信數據分析方法主要依靠人工參照協議規范,逐字段解析數據以判斷數據的有效性和正確性,并通過人為觀察數據的通信邏輯來判斷數據的邏輯是否正確。這種完全依靠人的經驗來檢驗數據故障的方法,誤判率、錯判率和漏判率都會相當高,因此,在本文中,搭建了一套不依賴于人工的基于鐵路信號安全通信協議規范的故障診斷系統,用于對通信數據的有效性和邏輯性進行評判,不但可以大大節約人力成本,而且可以提高故障診斷的效率和準確性。
本文介紹的故障診斷系統主要采用的是基于通信協議規范的知識推理技術,它根據一定的原則(公理或規則),從已知的事實(或判斷)推出新的事實(或另外的判斷)的思維過程。專家系統的推理是建立在知識庫中存儲的大量領域知識的基礎之上,即是基于知識的。使用專家系統的過程就是對知識庫中的知識進行選擇和運用的思維過程[1]。
傳統的知識推理機綜合考慮了各種前提和可能發生的情況,采用傳統的模式匹配算法。這樣的設計使系統獲得了很大的通用性,但也帶來了推理效率不高等缺陷。本系統為了提高推理機的效率,依據鐵路信號通信協議規范,提取了其中的專家知識,針對不同設備的診斷需求,設計了對應于不同規則集的各種精簡高效的狀態機,用于對客運專線信號安全網的大量復雜來源數據進行診斷和分析。
本通信協議故障診斷系統所處理的數據來源于既有客運專線中各種安全通信設備之間的通信數據。
既有客運專線通信信號系統主要包含以下安全設備:列控中心(TCC)、聯鎖(C I)、無線閉塞中心(RBC)、臨時限速服務器(TSRS)、車載設備(ATP)。其中,TCC與TCC、TCC與CI、TCC與TSRS之間采用RSSP-1協議規范[2],RBC與CI、RBC與TSRS之間采用RSSP-2協議規范[3],RBC與A TP之間采用037協議規范[4]。對于從安全設備之間采集到的原始數據,首先通過數據預處理模塊,對輸入數據進行預處理,解決數據丟失、數據不完整、數據間不一致、數據錯誤等問題,提高輸入數據的質量,使推理過程更加有效和容易。
本故障診斷系統針對不同設備之間的通信數據,分別設計了基于上述通信協議的3類規則集:RSSP-1通信協議規則集、RSSP-2通信協議規則集和037通信協議規則集。根據不同設備之間的通信數據故障診斷需求,選擇相應的規則集,通過比較監測數據與本地存儲或計算的數據來校驗數據的有效性,并且通過基于通信協議的狀態機來校驗數據的邏輯性。下面將分別對三類規則集以及它們所包含的狀態機進行詳細介紹。
RSSP-1通信協議[2]規定了信號安全設備之間通過封閉式傳輸系統進行安全相關信息交互的功能結構和協議。封閉式傳輸系統可能存在以下威脅:數據幀重復、丟失、插入、次序混亂、錯誤或傳輸超時,為了降低上述威脅風險,RSSP-1通信協議采用從接收端角度設計的保護算法,要求接收端必須對接收到的信息做出以下檢查:發送端的源信息真實性、信息幀的正確性、信息幀的時效性和信息幀序列的正確性。具體來說,它介紹了SSE幀、SSR幀和RSD幀消息安全層的消息格式并對安全連接建立的過程以及錯誤消息和邏輯的處理方式進行了詳細描述。
RSSP-1通信協議狀態機共有如下幾種狀態:IN IT,當故障診斷系統剛啟動時,狀態機處于初始狀態;W FSSR,當接收到時序校正請求消息SSE幀、RSD幀超時或RSD幀的時序錯誤,則狀態機跳轉至請求安全連接狀態,在此狀態下,安全連接尚未建立成功;SEQDATA,當安全連接建立成功后,狀態機跳轉到數據狀態,在該狀態下,規則集對數據字段的有效性和時序邏輯都進行校驗;W FSVC,若狀態機在IN IT狀態下收到RSD幀,則進入等待校驗SVC狀態,在此狀態下,規則集對數據不進行時序性校驗,只校驗數據字段的有效性,當安全連接建立成功后,狀態機跳轉到SEQDATA。

RSSP-2通信協議規范[3]規定了信號安全設備之間通過封閉式傳輸系統或開放式傳輸系統進行安全相關信息交互的功能結構和協議。對于一般的傳輸系統而言,所有可能的威脅如下:重復、刪除、插入、重排序、損壞、延遲或偽裝,為了降低上述威脅風險,RSSP-2通信協議的MASL層和SA I層主要實現以下安全相關的傳輸功能:消息的真實性、消息的序列完整性、消息的時效性、消息的完整性、安全錯誤報告、配置管理和訪問保護。A LE層則提供M ASL層和傳輸層之間的適配和冗余處理。具體來說,它主要介紹了適配及冗余管理層(A LE)、消息鑒定安全層(M A SL)和安全應用中間子層(SA I)的消息格式,并對安全連接建立的過程以及錯誤消息的處理方法進行了詳細的描述。本規則集分別對A LE層的CC、CR和DT消息,M ASL層的AU 1、AU 2、AU 3、AR、DT、D I消息以及SA I層的ECSTART、ECAPP消息的字段有效性進行校驗。并且通過圖2、3和圖4所示的狀態機分別對A LE層、M ASL層和SA I層的安全連接的建立過程進行邏輯判斷。
ALE層狀態機共有如下幾種狀態:INIT,初始狀態;W FAU 2,當接收到CC消息,狀態機跳轉到等待CR消息狀態;DATA為數據狀態,當接收到有效的CR消息,ALE層的安全連接建立成功。

M ASL層狀態機共有如下幾種狀態:IN IT,初始狀態;W FAU 3,當接收到有效的AU 1消息,狀態機跳轉到等待AU 3消息狀態;W FTC,當接收到有效的AU 2消息,狀態機跳轉到等待TC消息狀態;W FRESP,當狀態機按照正常邏輯順序,先收到AU 2消息,然后收到有效的AU 3消息,則狀態機跳轉到等待RESP消息狀態。當出現數據采集不同步的情況時,在收到A U 1消息之后,緊接著收到AU 3消息,此時,應該設定一個短暫的等待時間,若在該等待時間之內,收到AU 2消息,則首先校驗AU 2消息是否有效,然后校驗之前收到的AU 3消息,若消息有效,則狀態機跳轉到等待RESP消息狀態;DA TA為數據狀態,當接收到有效的AR消息,MASL層的安全連接建立成功。

SA I層狀態機共有如下幾種狀態:IN IT,初始狀態;W FECSTART,當接收到ECSTART消息,狀態機跳轉到等待ECSTART消息狀態;DATA為數據狀態,當接收到有效的ECSTART消息,SA I層的安全連接建立成功。

037通信協議規范[4]為使用開放網絡進行安全相關的應用處理的無線通信系統提供通信服務,保證數據的安全傳送。它主要實現了以下功能:數據的傳輸功能,用以保證數據的安全性和可靠性;密鑰管理功能;對連接進行維護(連接建立、維持、釋放)。具體來說,它主要介紹了鏈路層(DL)、網絡層(NET)、傳輸層(TRANS)和安全層(SA)的消息格式,并對安全連接建立的過程以及錯誤消息的處理方法進行了詳細描述。本規則集分別對DL層的RR幀、RNR幀、REJ幀和I幀,NET層的NPDU消息,TRANS層的AK消息、CC消息、CR消息、DC消息、DR消息和DT消息以及SA層的AU 1、AU 2、AU 3、AR、DT、D I消息的字段有效性進行校驗,并且通過圖3、5、6、7所示的狀態機分別對SA層、NET層、TRA NS層和DL層的安全連接的建立過程進行邏輯判斷。
SA層狀態機與RSSP-2通信協議的MASL層狀態機相同。
NET層狀態機共有如下兩種狀態:IN IT為初始狀態,當故障診斷系統剛啟動時,狀態機處于IN IT狀態;DA TA為數據狀態,當接收到有效的數據,則跳轉到此狀態。

TRANS層[5]狀態機共有如下幾種狀態:IN IT,初始狀態;W FCC,當接收到連接請求CR消息,狀態機跳轉到等待CC消息狀態;W FAK,當接收到連接應答CC消息,狀態機跳轉到等待AK消息狀態;DATA,當接收到AK消息,狀態機跳轉到數據狀態;W FDC,當接收到斷開請求DR消息,狀態機跳轉到等待DR消息狀態;當消息超時或在WFDC狀態下接收到斷開應答DC消息,狀態機跳轉到INIT狀態。

DL層[6]狀態機共有如下幾種狀態:IN IT,初始狀態;RR,當接收到RR消息,狀態機跳轉到準備接收數據狀態;RNR,當接收到RNR消息,狀態機跳轉到未準備接收數據狀態;REJ,當接收到REJ消息,狀態機跳轉到數據重傳狀態。

上述狀態機對于有效的數據和邏輯,會向系統外輸出系統運行正常的狀態提示。而對于錯誤的數據和邏輯,對外輸出錯誤提示分以下幾種情況。
1)若消息字段有錯誤,則狀態機保持原狀態,對外輸出“某消息某字段錯誤”的提示信息;
2)若等待消息超時,即狀態機在某一段時間內沒有收到任何消息,則狀態機跳轉到IN IT狀態,對外輸出“某設備無數據”;
3)若在安全連接的建立過程中,連接請求和應答消息的邏輯錯誤,則狀態機跳轉到IN IT狀態,對外輸出“安全連接未建立成功”。
通過上述故障診斷過程,便能準確快速定位系統故障,方便研究人員及時發現并解決問題。
本文所提出的通信協議故障診斷系統盡可能全面地考慮了數據的復雜性,但由于從不同終端采集到的數據可能不同步,致使消息的時序性有一定的偏差,在這種情況下,可能會影響到系統的正常運行,因為在安全連接建立的過程中,收到消息的先后順序是通信協議中規定的,若消息時序有誤,會使得設備的安全連接無法建立。接下來的研究工作可能從以下兩個方面來開展:一方面,從數據采集源頭確保檢測消息的時序性,比如在采集前端增加時間同步模塊或者對采集到的數據按照時間戳排序;另一方面,將數據順序的各種可能性都考慮到,通過增加狀態機的狀態,確保系統能夠處理任意復雜的數據,這種方法使得狀態機由線性一階升級為非線性二階,將大大增加系統的數據處理能力、容錯能力和辨識能力。
本系統針對客運專線信號安全網中,基于RSSP-1協議、RSSP-2協議和037協議規范進行通信的安全設備之間的通信數據的有效性和邏輯性進行校驗和分析。這種全自動實時的通信協議故障診斷系統可以代替傳統的人工數據分析方式,不但可以提高效率,而且可以通過數據錯誤準確定位系統故障,從而快速解決系統問題,保證行車安全。
[1] Giarratano J., Joseph c,Riley,et al. Expert Systems Principles and Programming[M]. 北京: 機械工業出版社, 2006.
[2] 運基信號[2010]267號 鐵路信號安全通信協議[S].
[3] SubSet-098 V1.0.0. RBC-RBC Safe Communication Interface[S].
[4] SubSet-037 Version 2.3.0[S].
[5] ITU-T Rec.X.224(1995E)[S].
[6] ISO/IEC 7776:1995/AMD.1:1996(E)[S].