婁正良
(北京全路通信信號研究設計院集團有限公司,北京 100070)
基于知識庫的鐵路行車風險自動檢測系統
婁正良
(北京全路通信信號研究設計院集團有限公司,北京 100070)
在現有的行車設備基礎上,建立安全風險檢測知識庫,實時追蹤行車作業的各類信息,構建一個車站行車作業安全風險檢測的知識庫體系,并通過知識庫推理方法實現車站行車風險預警與提示功能。此系統彌補了當前各類系統分別建設,信息獨立的不足,有效提升了運輸生產過程中的安全。在實際應用中取得了良好的效果。
知識庫;控制系統;鐵路運輸生產
鐵路車務安全在運輸安全中問題最為突出,車務部門的安全直接關系到人民的生命財產及行車一線職工的生命安全,是各項安全生產中的重中之重。而鐵路行車安全在運輸安全中問題最為突出,因為人員傷亡、貨物損毀、設備破壞等損失都是在行車作業中發生事故造成的。車站是辦理行車作業的主要場所,也就不難理解為什么車站發生的事故占行車事故總數的三分之二以上[1]。因此加強鐵路車站行車作業安全研究分析,對查找安全隱患,有針對性地制訂安全措施,夯實安全基礎具有重要意義。
我國鐵路的裝備這些年來飛速發展,目前各類車站裝備的過程控制系統有聯鎖、駝峰、停車器、調機、脫軌器等;信息處理系統有行車、現車、統計、班計劃、貨運制票、貨運計劃、貨運保價、貨檢、集裝箱、接發車通知、機務段、平調燈顯等;監測或探測系統有車號識別、超偏載、車輛限界、視頻監視、電務監測、燃軸、車輛跟蹤、輪緣破損等。這些單元控制、監測與信息子系統按照鐵路信號的控制邏輯與運算提供了直接安全保障,但操作合理性不在保障范圍,為了更好地提高安全性,制定了很多作業規范,比如技規、行規、站細等規章制度,通過人的規范化操作來提高安全。然而人的操作受到人的情緒、疲勞程度、技能等很多因素影響,也不可能永不出錯,因此鐵路上每年都有安全事故發生,而且有很多同樣原因、同樣類型的事故發生。這就是將安全依賴于人的缺陷。
其實很多事故的發生,都有一系列錯誤的操作,或者錯誤的執行次序等產生,這些在事故發生之前的特征稱為預兆。隨著鐵路裝備的發展,這些預兆或多或少地存在于各類系統記錄的信息中,并且互相印證,形成預兆鏈。本文就是采取知識庫的方式,通過系統自動分析、檢測這些預兆;并且在事故發生前,通過聲音、閃爍燈光明顯地通知現場作業人員,達到將事故消滅在萌芽中。
鐵路行車風險自動檢測系統框架如圖1所示,圍繞知識庫可以將系統分成4個部分。分別是外部系統、知識庫維護、知識庫應用、系統交互等。
2.1外部系統
鐵路行車風險主要利用車站現有的裝備系統,具體到車站應用而言,可能略有不同,比如應用于客運站的行車風險自動檢測系統就不需要駝峰、停車器等系統。而有些車站,可能還有貨運系統,AEI、電力管理信息等。本文所設計的系統,所接受的外部信息越全,能夠檢測的知識庫范圍就越寬。這在下文會詳細敘述到。目前系統是在編組站綜合管控一體化CIPS系統中實施的,因此上述的凡是與CIPS系統作接口的系統都納入到本系統的信息采集范圍。但在本文中,為了系統適應性更廣,將鐵路行車風險自動檢測系統單獨作為一個系統來敘述。
2.2知識庫維護
知識需要按照一定的結構和順序存儲在數據庫中從而形成知識庫,根據存儲的內容,知識庫可以劃分成3個部分,即動態知識、靜態知識和字典數據。
字典數據包括知識庫的結構、元數據定義、解析規則以及一些資源數據等。靜態知識是一些普遍使用的,固化在系統內的知識,也包括一些重要的預定義函數。動態知識主要用來闡述事故的預兆特征,這些預兆可能發生的場景特征、時間等,這些知識和具體的車站站型、運輸組織模式等都有很大關系,因此可以隨著區域內的運輸任務、組織模式變化而變化。這部分知識是動態的,可以根據需求隨時進行增刪改操作。
2.3知識庫應用
知識庫應用是系統的核心環節,在知識庫應用環節中,需要采集各類外部數據,并進行適當分類和整理,同時還需要做一些必要數據驗證,以防止外部系統異常而發送錯誤和不合法數據。如何驗證數據有錯誤,根據知識庫內設置,需要作出報警或者暫停采集這個外部系統數據或者忽略錯誤數據,繼續采集等不同處置措施。數據驗證通過后,需要按照知識庫要求、規范化的方式標準化數據并存儲。
采集完數據后,需要根據知識庫內的知識,進行推理是否含有事故預兆,如果有,那么就進行預警輸出,否則系統沒有輸出。

圖1 鐵路行車風險自動檢測系統示意圖
2.4交互
交互層主要有兩個部分,一個是知識庫維護的部分,還有一個是知識庫的推理輸出。其實還有一些比如回放、數據查詢、統計等輔助的功能在本系統中不再敘述。
用戶交互是根據設計一個用戶可以看懂的,同時機器也可以理解執行的知識表達體系。因此系統的用戶交互的知識庫基本上是以自然語言為基礎的,錄入時可以通過一些標準化的語法提示、語法檢查來輔助用戶錄入正確的知識庫,系統對錄入的知識進行標準化后,反轉生成通俗、易懂的自然語言供用戶查看、學習。
預警輸出主要有聲音輸出、燈光輸出和可視化屏幕圖形輸出等3種。預警輸出的設備會裝在運轉室內。會有一個音箱、一個色燈和一塊顯示屏。
聲音輸出類型有3種分別為:
合成語音提示,需要在知識庫內定義語音內容、播放次數、間隔時間、延遲時間等;
警告語音,需要在知識庫內說明播放的語音文件編號;
緊急報警,需要在知識庫內說明播放的語音文件編號。系統在輸出緊急報警語音時,將會帶上適當的顫音,以達到警示的目的。
燈光輸出定義如下:
藍色燈光,表示按照預兆分析,需要提示用戶注意,屬于輕微的事故預兆;
紅色燈光,表示中等程序的警告,提醒用戶小心,否則,可能會產生損失不大的事故;
紅色閃爍,特別嚴重的警告,用戶必須立即處理,否則,會發生重大事故。
可視化屏幕是指圖形化的方式顯示事故發生的示意圖。
通常對于某個具體的車站而言,事故發生的頻率是很低的,通常一年也就兩三起事故。但一旦發生就需要以明確、醒目的方式向用戶報警。需要用戶及時處理。因此預警輸出也是按照這種要求,通過聲音、燈光、圖像等多種方式提醒用戶。
本文采用一階謂詞的形式描述行車中用于安全監測的知識庫。行車風險檢測中涉及的信息量大,類別多,需要用合適的表達方式將行車中安全事故的預兆明確地表示出來,達到用戶能看明白,機器也能正確識別[2]。
3.1詞匯表
詞匯表是組成知識庫的基本元素,也是知識推理的基礎。同時詞匯表也確定了知識庫的表達范圍。行車風險知識庫的詞匯表主要包括以下內容。
站場設備,包括所有具體的股道、道岔、區段、停車器、各種類型的信號燈以及這些設備的屬性(長度、坡度、類型、型號等)和他們之間的相互位置關系。
設備表示,指聯鎖的站場表示內容以及TDCS的鄰站表示及區間表示。包括設備的占用、信號燈的顏色、脫軌器和停車器等狀態描述,均作為知識的常量元素。
列車信息,列車的車次、到發時間、等級、總重、換長等屬性。
車輛信息,包括車輛的位置、車號、自重、換長等。
本務機和調機信息,包括機車型號、機車牽引定數,是否是電力機車等。
運輸和行車中常用術語,比如接近區段、離去區段等。
補充信息,主要指從一些外部系統采集到的,不在上述范圍內的一些實體信息。
3.2函數
將一組關聯約定俗成的知識,通過函數來表達,可以大大簡化知識的表達與閱讀。比如站場追蹤、進路巡檢、機車運行速度等。
行車中,有些術語,雖然可以用一組知識來表達,但為了表達簡便,可以設計一個函數來和這些術語對應起來,比如進路。實際上是檢查一組連續設備的鎖閉狀態,防護這些設備的信號機開放狀態、反向信號機狀態等。
還有一類需要使用高階謂詞敘述的知識,可以用函數來表示,這樣在提高知識庫表達能力的基礎上,簡化了知識的表達和推理。
3.3謂詞
在知識庫設計中,有如下所述的3類謂詞。
表達設備關系、屬性、特征、位置等。比如:“信號機外方區段”,就是表示特定的知識陳述中所述的信號機和區段的關系。3443的定位區段,就是表示為3443的道岔與區段的關系。
表達設備狀態變化、或者場景變換。比如“443DG由出清轉占用”,實際上是個三元謂詞。
函數輸出與函數輸出、或者與設備之間的關系。比如:進路的接近區段。
3.4事故預兆陳述
在進行校內外實訓的時候,學校方面應該注意對校內外的實訓環境進行整合。在進行校內實訓的時候,應該對校內相關資源進行豐富,并且對校內設施進行完善,從而保證校內實訓的整體效果。學校應該根據實訓的實際需要對已有資源進行彈性改變,對現階段行業市場的整體運行大趨勢進行較為詳細的了解,并且對現階段行業的人才需求情況進行研究,從而使校內實訓的展開變得盡量社會化,更加貼近社會實訓的效果。
在確定了知識庫的詞匯表后,剩下的工作就是用這些詞匯表構造事故預兆的真值表。就是告訴系統,在那些場景下,或者過程中,可能會產生事故。
事故預兆描述包括3個部分內容,事故預兆的描述,事故的分類,以及事故的處理方式,如示例1所示。其中事故的處理方式就是系統的輸出。請參照本文的前面部分。
示例1:
預兆:信號機外方區段紅光帶,信號機滅燈,信號機內方區段由出清轉占用。
分類:機車冒進信號機、車輛溜逸
輸出:A、色燈紅色閃爍
B、緊急報警,報警音(音頻編號0521)
示例1用符號可以表述為:
符號表達[3]是計算機內部的存儲方式,但對于用戶,特別是車站的普通用戶,閱讀是不方便的,因此系統需要將符號表達方式轉化為上述通俗的文字表達方式。這樣的輸出,用戶可以查閱、比較和學習。本文后面采用同樣的方式來敘述知識,有興趣請參見參考文獻。
知識庫建立以后,需要通過合適的推理算法[3],將知識和采集的數據結合起來,實現風險檢測和預警的功能,本文在這里不介紹推理算法,只闡述知識推理的相關功能。
4.1數據采集
知識庫內的知識建立后,需要和實際的數據結合起來才可以預警。因此數據采集至關重要。而數據采集涉及到的系統眾多,也是故障頻發點。系統設計的時候,考慮到系統的伸縮性和魯棒性,對于接口數據采集的原則是,如果某個接口的數據無效,則凡是依賴該接口數據的知識全部無效。這樣確保系統不會因為某各接口、或者某個外部系統故障而導致整個預警系統失效。
對于接口失效的處理是按照知識庫庫內的接口知識來處理。比如在預警系統的外部系統中,聯鎖數據是主要的源數據,如果聯鎖數據失效,那么就有可能出現一些重大安全事故而不能預警。因此用戶可以添加相應的知識如示例2所示。
示例2:
預兆:聯鎖接口機A,聯鎖接口機B在1 min內同時無數據。
分類:接口故障
輸出:A、色燈紅色閃爍
B、緊急報警,報警音(音頻編號0521)
這樣,通過知識靈活地制定接口的處理規則,預警系統既可以順利地降級使用,也可以確保一些重要外源系統非正常運行的報警處理。
4.2標準化
預警系統在采集完外部數據后,需要掃描知識庫內的知識,逐條驗證,如果沒有滿足條件的,說明一切正常,沒有故障的預兆。這是一個比較低效的做法,特別是當知識庫內包含一些追蹤函數時,因此系統需要預先將知識進行拆分最小合取范式。也就是將知識拆分成單個獨立的知識單元,然后將知識庫內的知識用這些知識單元重新組合起來。這個過程稱為知識的標準化。在知識錄入時就需要完成。
4.3知識有效性驗證
預警系統對輸入的知識在標準化后進行驗證,主要驗證知識的相容性、互斥性。并對永真和永假的知識進行過濾。防止不正確的知識干擾其他知識的正常推理。
假定知識庫內有兩條預兆陳述分別為P1和P2,如下面公式所示,公式中的α、β、γ、δ都是指單個的命題符號。

如果α蘊涵γ,而β蘊涵?δ,那么P1和P2就是一個不相容的命題:

對于互斥的,不相容的,最終都可以推理出永真或永假命題。而系統在預兆偵查時,采用反向鏈接算法就會獲取一個不確定的值作為系統輸出,進而導致系統失效。
4.4預兆偵查
在每次采集完數據時,系統首先根據采集到的數據,對每個知識單元進行代入計算。在計算完值后,再參與后繼的邏輯運算。
對知識庫內的預兆陳述,根據其知識單元組成,從確定的知識單元集合中搜索其正負命題相應的蘊含式并判斷預兆陳述是否成立。采用這種反向鏈接的算法,可以有效提高搜索速度。
4.5輸出
系統正常工作時,根據預兆偵查的結果輸出前述的聲音、燈光和可視化屏幕輸出等。這種正常的輸出,對于某個具體車站而言,基本上一個月不到一次。而用戶需要確切地知道該系統是否正常工作,因此系統除了這個主要的輸出外,還有輔助輸出。
輔助輸出主要是在運行過程中,輸出推理日志和自檢日志。用戶可查看推理日志,了解系統的工作方式和原理,同時也可以發現系統知識庫內有無遺漏的預警知識。而自檢日志是按照設定的周期定期檢查系統自身的軟件是否存在故障(包含接口、知識單元運算服務是否正常等),報警裝置是否正常。
5.1應用
基于知識庫的鐵路車站行車風險檢測系統已經研制完成并于2015年4月應用于蘇家屯車站的CIPS系統。作為CIPS管控一體化系統安全防范的一部分。目前蘇家屯的行車風險預警知識庫內,由用戶和廠家整理的知識有173條。包括分路不良、脫軌器、錯辦接發車進路、車輛溜逸等15個方面的報警。
5.2指標
用戶對系統比較關注的性能主要包含兩個方面,一個是能檢測出多少個風險點,第二是檢出風險預警輸出的時間提前量。
系統能檢測出的風險點主要和采集到數據的完整性和真實性有關系。比如:脫軌器的信息采集不到,那么和脫軌器相關的風險就無法檢測。而在數據能夠采集到的情況下,檢測的風險點沒有上限,用戶可以根據需要向知識庫內添加知識。
風險預警輸出的時間提前量,即風險預警和實際事故發生之間的時間間隔。很顯然,時間越長,留給用戶采取措施挽救的時間就越富裕。但該時間系統無法控制,系統只能縮小風險預兆的出現時間與預警時間之間間隔。這個時間稱為預警檢測時間。預警檢測時間主要由3個部分組成,分別為外部系統的延遲時間,通道時間,預警系統的運算時間。前面兩個方面時間,只能通過管理和設備來縮短,屬于外部因素。因此預警只能控制自身的運算時間。
目前預警檢測時間在1 s以內。其中外部系統延遲和通道時間大概在600 ms左右,而預警系統的運算時間(包含調度和推理)的時間小于400 ms。
5.3示例
下面例舉蘇家屯數據庫內的關于分路不良的一組知識說明系統的應用。現場使用的分路不良的知識共有23條,這里篇幅所限,例舉3條,如示例3所示。
示例3:
預兆:機車以高于70 km/h的速度通過分路不良區段。
分類:分路不良
輸出: A、色燈紅色閃爍
B、緊急報警,報警音(音頻編號0521)
預兆:機車在分路不良區段折返時間小于2 min。
分類:分路不良
輸出: A、色燈紅色閃爍
B、緊急報警,報警音(音頻編號0521)
預兆:機車在分路不良區段無表示。
分類:分路不良
輸出: A、色燈紅色閃爍
B、緊急報警,報警音(音頻編號0521)
系統對于分路不良的檢測如果能夠取到準確的機車位置信息,那么自然可以準確的預警,但目前并不是所有的機車(包括調機和本務機)都裝備定位和通訊設備,即使裝備了,定位也不一定準確。上述3個示例是通過巡檢區段表示檢測分路不良的事故預兆。首先3條規則都將檢測區段限制在電務登記過的分路不良區段來減少誤報的可能性。第一條規則中機車速度是系統通過分路不良區段的壓紅時間和下一個區段的壓紅時間以及區段的長度來計算機車的走行速度。第二條規則中,系統自動識別折返進路,根據分路不良區段的占用時間計算機車的調頭時間。第三條規則表示機車在分路不良區段沒有表示,同時進路的下一個區段也沒有表示。
很顯然,上述的3條知識是不完備的,但是分析了2010年至2015年全路出現的分路不良事故7起,通過上述的知識檢測,都可以檢測到。
5.4風險報警后處理
本文主要是研究風險如何檢查、報警,那么,報警后的處理就由用戶來處理。大致有3類情況:
1)需要用戶處理,并且用戶在風險報警后有充裕的時間來處理的,比如發車方向報警,系統根據值班員排列的發車進路和股道內的車次來檢測列車有無發錯方向 。這樣的預兆報警,用戶就有時間來消除故障。
2)用戶不需要做任何操作,比如上述的分路不良,當系統檢測到分路不良并預兆報警后,用戶只要不排敵對進路,就可以確保不會發生掉道、擠岔等事故。
3)需要用戶立即做處理的,處理越快,損失越小,比如車輛溜逸,當系統報警后,值班員一方面要在溜逸方向上順道岔,另一方面要組織現場內的人員進行車輛制動。
基于知識庫的鐵路車站行車風險檢測系統,在國內國際鐵路界首次采用知識庫及相關技術來檢測和防范事故。目前在蘇家屯實施,取得了良好的效果。隨著用戶使用體驗的加深和對系統的熟悉,知識庫會得到的進一步擴充和細化,效果會更好。
1)鐵路車站的值班員崗位長期依靠規章制度及安全意識進行安全保障、預防行車事故,無法避免人為差錯帶來不可扭轉的人身和經濟損失,能夠在行車安全保障方面研究一套保障系統,有效的總結和組織安全生產規章制度和知識,很好的解決這個由來已久的問題。
2)預警知識表達方式通俗易懂,靈活性大,適應性廣。隨著系統的推廣應用,可以逐步將技規、行規相應的行車安全措施用知識表達出來,由系統來監督執行。
[1]王大光.鐵路中間站行車安全問題與對策[J].黑龍江交通科技,2010(8):239-241.
[2]Edward A.Feigenbaum.Knowledge Engineering in the 1980s.Dept. Of Computer Science,Stanford University, Stanford,CA,1982.
[3]修春波.人工智能原理[M].北京:機械工業出版社,2011.
On the basis of existing railway equipment, a station train operation safety detection system is established based on setting a safety risk detection knowledge base, in order to trace various train operation messages in real time and fulfi l station train operation risk alert and warning functions through the knowledge base reasoning method. The system can remedy shortages of existing isolated systems, and it can improve effectively the train operaiton safety and has good effects in practical applications.
knowledge base; control system; railway transportation and production
10.3969/j.issn.1673-4440.2016.04.014
2015-12-29)