唐忠江
隨著高速鐵路在中國的快速發展,作為信號系統的核心技術代表計算機聯鎖系統的重要作用愈發凸顯。根據計算機聯鎖系統的設計科學性以及現場實際應用情況來看,雖然同樣會發生故障,但在有效運用 “故障-安全”技術,使系統不發生危險側故障的基礎上,盡可能減少出現故障隱患,是現場設備維修管理單位面臨的首要問題。
計算機聯鎖設備的正常使用需經歷設計、生產集成、運輸、安裝、驗收調試、正式開通使用、日常維護等七大步驟,每一步驟都可能由于人的失誤造成故障隱患的形成,最終導致設備故障。因此正確分析人因失誤問題,是設備安全使用的重要保證。
根據對成都鐵路局近4年計算機聯鎖設備運用質量的統計,與計算機聯鎖設備相關的故障信息共有280件。其中驅動采集板、上位機、切換板等硬件設備故障74件;聯鎖機不同步或脫機、黑屏或死屏等隱性故障191件;輕車跳動、雷擊等外界影響96件。根據更深層次的分析發現,硬件設備故障和隱性故障的最終原因都是由操作人員在運輸、安裝、驗收調試、正式開通使用、日常維護等方面的失誤造成。通過對計算機聯鎖系統在成都鐵路局運用分析歸類,人的失誤因素分為八大類:差的驗收質量、差的作業管理、差的施工能力、模糊作業標準、設計偏差、用戶操作不當、使用環境隱患、運輸過程隱患等。
近年來,安全風險管理在鐵路行業得到了極廣泛的運用。鐵路安全系列標準都描述了系統從科研、設計、制造 (施工)、集成、測試、驗收、直至運營實施風險管理的程序。《風險管理 風險評估技術》 (ISO/IEC 31010)推薦了一系列適合于高速鐵路運營安全風險識別的風險識別工具和技術,如頭腦風暴法 (Brainstorming)、檢查表法(Check-lists)、人因可靠性分析法 (Human Reliability Analysis,簡稱HRA)等。其中人因可靠性分析法看似復雜,但對于鐵路運營安全風險識別來說最奏效。
HRA事件樹描述參與人員在操作過程中的所有操作時間序列,該序列是以時間為順序,所以在某個作業中的HRA事件樹,就可以描述出本作業過程中的一切可能出現人的失誤模式及造成的效果。對事件樹的每個分支賦予了發生的概率,由此可以最終導出該事件成功或者失敗的概率。因此,對計算機聯鎖運用質量分析,建立一個相對簡單的HRA事件樹,如圖1所示。

圖1 HRA事件樹
圖中S表示作業成功,F表示作業失敗,M、N表示執行正確,m、n表示執行失敗,則作業人員作業成功的概率P(S)以及作業失敗的概率P(F)表達式分別為
P (S)=M· (N/M)
P (F)=M·n/M+m· (N/m)+m· (n/m)
在該項HRA事件樹中,每一項的子任務作業成功或者失敗的概率由基本HEP(每個任務的人因失誤概率值)表示,它可以由該項子任務的作業類型,根據相關的THERP(人因失誤概率預測法)表格查找得出,如表1所示。

表1 作業人員人為差錯概率
對于人因失誤概率分析HEP值,標準容許值在0.05以下,如果超出0.1,需要高度關注,加強風險研判,找出防人因對策,如表1中的第2、3、4、5、6項工作內容。
在HRA事件樹描述的任務中,人的失誤概率由于作業人員的自身素質、發生事件的背景等方面存在相當大的差異,如計算機聯鎖設備在運輸過程中司機開行汽車速度的快慢、小站公路路面環境差抖動大,都會影響設備質量。要得出HRA事件樹各個子任務實際的概率HEP,需要使用PSF(行為形成因子)對得出的結果進行修正,即HEP大于0.05的值都需要進行修正,HEP的修正公式為:
BHEP=HEP×PSF1×PSF2
其中,PSF1表示第1個行為因子,PSF2表示第2個行為因子。各種應力水平的PSF值如表2所示。
例6:Although he never sees her again, he does receive a letter, the contents of which remain unknown

表2 各種應力水平的PSF值
在考慮相關修正性的同時,也要考慮作業人員之間的關系,如計算機聯鎖設備廠家人員、設計人員、施工人員、設備驗收人員、設備日常維護人員之間的相關性,否則嚴重低估作業人員的失誤概率。兩兩之間的相關程度定為P(B|A),它表示在A任務完成情況下B任務完成的概率。該相關程度分為五級:完全相關 (CD)、高相關 (HD)、中相關 (MD)、低相關 (LD)、零相關 (ZD)。
相關系數的計算公式為:
CD P (B|A)=1
HD P (B|A)= [1+P (B)]/2
MD P (B|A)= [1+6P (B)]/7
LD P (B|A)= [1+19P (B)]/20
ZD P (B|A)=P (B)
HRA事件樹分析一般也可以結合計算機軟件輔助完成,本次分析采用了ISOGRAPH-ETA軟件,分析結果如圖2。

圖2 ISOGRAPH-ETA軟件分析結果
在圖2中,根據故障的概率高低,3個頻率分為F1、F2、F3。F1的概率取值在0.01以下,即為比較安全;F2的概率取值在0.01至0.1之間,即為比較危險;F3的概率取值在0.1以上,即為高度危險。分析結果顯示,計算機聯鎖故障人因處于高度危險區域的是施工 (含運輸)以及日常維護過程,處于比較安全的步驟為調研設計。
凈化計算機聯鎖系統的使用環境,極大消除人的失誤對設備的影響,提高設備的使用效率,不僅需要設備供應商提高產品質量,還需從施工質量、維護管理、設計流程等方面著手。
首先,有效提高工程施工質量。在設備運輸過程及入室安裝過程中,需時刻對設備進行 “防塵防水防曬”工作,盡可能減少外界因素對設備的干擾作用。在設備驗收過程中,設備管理單位需提前介入,從站后工程開始時全程跟蹤,特別對于地線等隱蔽工程進行重點驗收、測試,最大限度減少設備使用隱患。
其次,提高現場作業人員的維護保養以及應急處理能力。作業人員需熟練掌握計算機聯鎖系統的結構原理以及簡單故障的處理,明白計算機聯鎖系統各個指示燈所代表的含義,能在最快時間找出設備故障原因并進行故障處理。在維護作業中,需嚴格遵循 《鐵路信號維護規則》具體要求執行,特別對于影響板卡正常使用的溫度測試、灰塵清理、濕度檢查、地線測試檢查4項工作認真執行。在故障處理過程中,嚴格執行故障處理流程,最大限度有效壓縮處理時間。
第三,加強故障后維修機的回放調閱工作。據統計,在發生計算機聯鎖系統故障后,只有20%的應急處理人員會首先進行維修機的回放調閱工作,根據回放的相關數據進行故障處理,剩余80%的應急處理人員完全按照自身經驗或者運轉室值班員的描述等不可靠依據進行故障處理,忽略了維修機的重要性。從設備的可靠性出發,只有依靠維修機的回放數據,才能找到故障處理的捷徑。
最后,加強設計與設備管理單位聯鎖試驗的統籌工作。設計單位需全程跟進設備管理單位軟件仿真試驗、室內模擬試驗、現場倒替校核試驗等一系列聯鎖試驗過程,對于設備管理單位發現的問題需及時更正,避免聯鎖設備長期帶病工作。
通過計算機聯鎖設備設計、施工、驗收、維護多方面統籌兼顧,使得信號系統核心設備穩定運用,確保鐵路運輸高效、安全。
[1] 張萍,趙陽.鐵路車站計算機聯鎖控制系統的可靠性和安全性分析[J].中國安全科學學報,2003(4):48-50.
[2] Rirwan B,Kennedy R.Taylor-Adams S and Lamber B.The validation of three human reliability quantification techniques—THERP,HEART and JHEDI:Part II—results on validation exercise[J].Applied Ergonomics,1997,28(1):17-25.
[3] 鄭州鐵路局職工教育處.車站聯鎖系統原理與維護[M].北京:中國鐵道出版社,2012.
[4] 戢曉峰,崔梅,陳方.關于高速鐵路人因安全保障體系的研究.北京:鐵道運輸與經濟[J].2013,35:15-19.
[5] Edkins G Pollock C M.Pro-active Safety Management:Application and Evaluation within A Rail Context[J].Safety Science.1996,24(3):83-93.