曾小清,林海香,2,王奕曾,袁騰飛,何 喬,黃繼成
(1.同濟大學 道路與交通工程教育部重點實驗室,上海 201804;2.蘭州交通大學自動化與電氣工程學院,甘肅 蘭州 730070;3.香港城市大學計算機科學系,香港 999077;4.上海大學 悉尼工商學院,上海 01800;5.貝爾福-蒙貝利亞技術大學信息學院,貝爾福法國 90000;6.上海軌道交通十四號線發展有限公司,上海 201103)
安全是軌道交通事業永恒的主題。軌道交通信號系統作為保障軌道交通安全運行的大腦指揮系統,其安全運行水平至關重要。美國鐵路事故統計數據表明,與信號設備有關的事故關聯度達到0.683,信號系統故障成為美國鐵路事故的主原因之一[1]。我國鐵路自“7.23”特大事故后再未發生與信號相關的較大事故,然而在故障率方面,信號故障仍然高居首位。據統計,我國高鐵自開通以來至2014年,僅京廣、鄭西兩條高鐵線就發生故障1 095起,其中電務(信號)677起,工務105起,供電176起,車輛132起,其他故障5起[2],信號故障占總故障的61.8%,故障率高導致發生事故的概率相應升高。根據鐵總運[2015]26號《鐵路電務安全規則》對信號系統故障和事故的定義,“當設備故障因處理不當、器材老化、外界不可預見影響等升級為鐵路交通事故時,按《鐵路交通事故調查處理規則》定性為鐵路事故。”因此,從事故出發尋找風險源,是提高軌道交通信號系統安全風險預防管控水平的根本途徑。
鐵路信號系統事故主因素的辨識是安全風險分析的基礎,也是事故致因溯源的首要條件。傳統辨識方法有頭腦風暴法、專家經驗分析法、安全檢查表法(SCL)[3]、失效模式與影響分析方法(FMEA)[4-5]、風險與操作性分析法(HAZOP)[6]、預先危險性分析法(PHA)[3]和故障樹分析方法(FTA)[7-8]等經典風險辨識方法。近年來又出現了一些新的、定性的、基于事故致因系統論的因素識別方法,有分層危險起因和傳播研究法(HiP-HOPS)[9]、事故因果分析方法(CAST)[10]、功能共振分析方法(FRAM)[11]等。定量辨識方法是日本鐵道技術研究所針對鐵路信號系統提出的一種將組件故障發生概率、功能失效概率和控制措施等相關聯的風險分析方法[12]。上述除故障率統計法、FTA法屬于定量辨識方法外,其余方法均為定性辨識或系統論定性辨識方法,較多依賴專家經驗,受到個人專業技能的限制,主觀性較強,缺少數據的支持,需定量分析以加強安全分析的客觀性和提高后續安全管控的效果。對于系統安全分析模型,有多種形式,其中5M模型(Management-Machine-Man-Media-Mission factor,管理-設備-人員-環境-功能要素模型)是要素分析模型,作為分析調查事故性質的有效工具,是美國聯邦航空管理局(FAA)內部航空安全計劃的一部分。20世紀40年代康奈爾大學的TP Wright將人-機-環境(Men-Machine-Media)三合一引入航空安全,1965年第四個“M”(管理Management)加入,1976年“任務”(Mission)加入到整體模型中[13]。通過5M要素識別和分析,有助于確定安全隱患原因、隱患以及安全風險緩解策略。近年來5M模型在我國軌道交通信號領域,也得到了初步的應用[14-15]。
通過新聞報道、中國鐵道年鑒、國家鐵路局數據、各鐵路局公開典型事故案例等方式收集信息,剔除與電務無關的303起典型事故樣本,以余下254起與電務相關的2000—2017年典型事故案例作為數據樣本1,將全年220起與電務相關的事故案例作為參考對比數據樣本2。
數據樣本1中,有人員死亡、重傷案例40件,輕傷案例2件,無傷亡案例212件,按照海因里希法則[16]中事故傷亡比例1∶29∶300來判別,數據樣本1屬于較大傷亡事故數據。數據樣本2中,有人員傷亡案例2件,輕傷案例0件,無傷亡案例218件,屬于較小傷亡事故數據。對數據樣本1和數據樣本2的分析是對較大和較小傷亡事故數據進行分析,基本涵蓋導致鐵路信號系統的主要事故因素和事故特征,且覆蓋全國各鐵路局和各個年份,能夠較為全面反映信號系統事故影響因素和發生環境。
我國普速鐵路、高速鐵路的信號系統事故分級和定性以2007年鐵道部頒布的《鐵路交通事故調查處理規則》和《鐵路交通事故應急救援和調查處理條例》(國務院令第501號)為主,依據事故造成的人員傷亡、直接經濟損失、列車脫軌輛數、中斷鐵路行車時間等情形分為特大、重大、較大和一般事故4個等級,以此作為信號系統事故類型特征統計依據。
本論文研究以同濟大學軌道交通運行控制實驗室為實驗數據支撐平臺,利用Python軟件和SPSS軟件對較大和較小傷亡事故數據進行處理,分別提取事故類型、事故原因等特征,并對事故類型的數量進行統計分析,得到如圖1所示的分布柱形和占比曲線。

圖1 信號系統傷亡數據與事故類型分布及占比Fig.1 Accident type distribution and proportion of larger and minor casualty data in signaling systems
對比較大傷亡事故和較小傷亡事故,二者柱形波動趨勢和占比曲線趨勢相近,且基本呈正態分布,說明較大傷亡事故與較小傷亡事故樣本數據選取得當,包含各種事故類型。但較大傷亡事故數據的各事故類型特征更加明顯,能更加全面反映信號系統事故特征,而較小傷亡事故樣本在分析單事故類型、單因素時較有優勢。二者均在一般D類事故上波動較大,整體呈現大事故稀少而一般D類事故顯著居多的特點。因此,現階段我國鐵路信號系統事故具有如下規律,與信號系統相關的鐵路交通特大、重大、大事故較為稀少,而小事故或一般事故數量較多。
根據鐵總運[2015]26號《鐵路電務安全規則》所定義的28種電務事故原因,逐條對較大傷亡事故和較小傷亡事故數據進行特征數據提取。造成信號系統發生事故的直接原因雖然很多,但在以事故數量作為唯一識別尺度的條件下,根據事故原因與事故總量的相對比例,對其中事故數量≥10的事故原因識別為事故主因素,較大傷亡事故識別出主因素7個,較小傷亡事故識別出主因素6個。不論較大傷亡事故還是較小傷亡事故,最主要原因是材質不良、外界施工、檢修不良及自然災害(雷害)。
以信號系統安全分析5M模型作為事故主因素的分類依據,將定義的28種事故原因細化擴充為32種事故因素,構建成事故5M數據模型。結合前述事故原因特征分析工具,基于5M模型統計較大、較小傷亡事故數據的事故原因數量。根據事故原因與事故總量的相對比例,將其中事故數量≥9的事故原因識別為事故主因素,如圖2、圖3所示。

圖2 基于統計識別法的較大傷亡事故主因素分析Fig.2 Major factors of larger-casualty accidents identified by statistic identification method

圖3 基于統計識別法的較小傷亡事故主因素分析Fig.3 Major factors of minor-casualty accidents identified by statistic identification method
統計識別法識別出較大傷亡事故主因素10個,較小傷亡事故識別主因素8個,較大傷亡事故最主要事故原因是外界人員施工,較小傷亡事故最主要事故原因是材質不良。
比較上述一般統計法和統計識別法,當以事故數量作為主因素唯一識別尺度時,事故原因總量增加,則所識別的主因素也增加,反映了這種事故數量尺度的單一籠統性,不夠全面,未考慮事故后果、人員傷亡情況、事故形態等多指標尺度綜合影響,所識別的主因素是否具有導致事故發生影響面大、造成后果損失大的特點仍未可知。由此,為了深入挖掘各事故因素對事故嚴重程度的影響,進一步提高安全風險源識別和安全控制的高效性和針對性,擬通過數據挖掘方法,建立多指標下的事故主因素模型。
2.3.1 建模方法
數據挖掘方法有方差分析、相關與回歸分析、因子分析、判別分析、關聯規則挖掘等,由于傳統方差分析主要進行均值比較,并不能解決數據復雜性問題;回歸分析要求各事故因素變量有非常明確的實際意義和影響機制,而本次事故因素多變量的影響機制尚不明確,不適于采用回歸分析;因子分析法在數據分析中對多變量起到降維的作用,降低了數據處理的難度,減少了工作量,此外,因子分析處理后的新變量各不相關,避免了信息重疊帶來的混亂,具有不受數據原本的相連性限制的優點。關聯規則挖掘針對事故因素之間的關系進行分析,不適用事故主因素的挖掘。因此,針對信號系統事故主因素分析采用因子分析法建模[17],數學模型[18]如下:
設原始變量Xi(i=1,2,…,p),如果表示為

式中:A為因子載荷矩陣;F為公共因子變量;ε為殘差向量;aij為因子載荷系數
使用因子分析模型的任務就是求出因子載荷系數矩陣A和殘差ε,若殘差影響很小可忽略,且F公因子各分量互不相關,F的期望為0、方差為1,則式(2)變為

式中:Z為主成分向量;X為原始變量;B為主成分相關矩陣(特征向量)

因子分析的目的是求出矩陣B,而主成分Z1、Z2、Z3…在總方差中的比重依次遞減,一般根據方差大于70%確定出主要主成分,達到降維的目的。
2.3.2 基于5M的事故主因素建模
選取220條較小傷亡事故數據和254條較大傷亡事故數據作為因子分析對象,按照5M模型的因素分類提取事故數量、耽誤行車數、脫軌車廂數、傷亡人數等統計量,對其進行Z-score標準化,截選部分標準化數據如表1所示。
采用因子分析法,計算求得較小傷亡事故矩陣的特征值和方差貢獻率,選取累積方差貢獻率>70%的成分作為主成分,其特征值分別為λ1=2.405,λ2=1.571。由式(2)~(4)計算所得載荷矩陣如表2所示。
由表2計算可得到主成分的特征向量B=(0.69 0.68 0.61-0.84),則較小傷亡事故主因素計算模型為

表2 較小傷亡事故數據的載荷矩陣Tab.2 Load matrix for minor-casualty data

根據基于5M的事故主因素建模方法計算各因素的主成分值F,將表1中數據依次代入式(5)中可計算得到較小傷亡事故各因素的主成分值,同理根據式(6)可得到較大傷亡事故各因素的主成分值。將較大傷亡事故和較小傷亡事故中主成分值F≥1的事故因素識別為主因素,如圖4、5所示。

表1 鐵路信號系統較小傷亡事故標準化數據Tab.1 Standardized data for minor-casualty accident in a railway signaling system
由圖4、5可得,綜合考慮事故數量、耽誤行車數、脫軌車廂數、傷亡人數等多種識別尺度時,較大傷亡事故識別出主因素9個,較小傷亡事故識別主因素5個。不論較大傷亡事故還是較小傷亡事故,最主要原因都是自然災害、材質不良、施工管理不善、防護不力造成電務人員死亡。

圖4 較大傷亡事故主因素Fig.4 Major factors for larger-casualty accidents

圖5 較小傷亡事故主因素Fig.5 Major factors for minor-casualty accidents
將上述主因素識別結果按數值大小取前18位作為影響力強的主因素排序,即為事故因素重要性排序。
較小傷亡事故因素重要性排序:材質不良>施工管理不善>防護不力責任死亡>人為破壞和砸盜燒>雷害>處理延時>線纜破損>意外砸損>其他自然災害影響>外界人員施工>人員檢修不良>人員處理延時>器材失效/超期>電化干擾>施工延時>設備缺陷>廠家責任>供電影響。
較大傷亡事故因素重要性排序:外界人員施工>其他自然災害影響>材質不良>施工管理不善>防護不力責任死亡>電務人員施工>漏檢缺修管理不力>違章作業>設計缺陷>施工隱患>人為破壞和砸盜燒>施工配合不力>路外施工干擾>機務影響>車務影響>設備缺陷>供電影響。
事故因素重要性排序反映了事故因素對信號系統事故的影響力強弱,可為信號系統安全風險分析和風險評價提供風險權重值的數據支持。
一般統計法、統計識別法和基于5M的因子分析法雖然都能識別信號系統事故主因素,但識別效果不同,即不同方法識別的主因素略有不同,識別主因素數量也不盡相同。
考慮識別方法與事故原因數量、識別的事故主因素覆蓋率、事故影響率之間的關系,對方法識別效果進行度量,則事故主因素覆蓋率計算公式如下:

式中:C為主因素覆蓋率,表示識別的鐵路事故主因素占整個事故原因集合的比率;I為整個鐵路事故原因的集合;i?I表示i是鐵路事故原因集合I中的一個事故主因素;Rn(i)為識別的事故主因素集合;K為整個鐵路事故原因的數量。
主因素事故影響率Ir是指主因素的事故影響力占整個事故原因數量的比率,計算公式如下:

式中:f(Zscore(i))為主因素事故影響力,表示在整個事故原因集合中由主因素所導致的事故后果經Zscore標準化后的函數值;i為衡量事故后果的指標數量,包括事故數量、傷亡人數、耽誤行車數、脫軌車廂數等,當前最大取值為5,如公式(6)所示。
一般統計法和統計識別法只考慮事故數量的單一指標,其f(Zscore(i))=Z-score(1);基于5M的因子分析法是求取多指標尺度下的主因素函數,分別將Zscore值代入式(5)、(6)可得f(Zscore(i))。針對較大、較小傷亡事故數據,在不同的事故原因數量K值下,將f(Zscore(i))代入式(7)、(8)中,可得3種方法識別效果度量表,如表3所示。

表3 3種方法效果度量Tab.3 Comparison of three methods to measure effectiveness
表3分析表明,針對較大、較小傷亡事故數據,當識別方法采用單一尺度指標時,隨著K值的增大,其覆蓋率會有所增加,而影響率與K值無關;當識別方法采用多尺度指標時,相對單一尺度指標,覆蓋率略有減小,而影響率大幅增加。單一尺度“事故數量”反映了事故發生頻度,多尺度指標“事故數量、傷亡人數、耽誤行車數、脫軌車廂數”等反映了事故頻度、事故后果和損失嚴重程度。因此需選擇影響率相對較高而覆蓋率適中的方法,此時,K=32,較小傷亡事故數據的覆蓋率為0.156 3,相較一般統計法降低了27%,而影響率為0.459 7,相較另兩種方法,分別提高了56%和61%;較大傷亡事故數據的覆蓋率為0.281 3,相較一般統計法提高了13%,而影響率為0.754 0,相較另兩種方法,分別提高了106%和91%。由此,基于5M的因子分析法識別效果最佳。
相較單一尺度的數據統計識別方法,本文提出了一種基于事故數據的5M因子分析法。該方法將5M模型與數據挖掘方法有機融合,先統計鐵路信號系統多種事故指標并進行事故因素5M分類,再采用因子分析法建立主因素數學模型,綜合考慮事故數、耽誤行車起數、脫軌車廂數、傷亡人數等多尺度計量事故損失方式,對影響信號系統安全性的多種風險因素進行了全方位辨識和定量計算。該方法能應用于軌道交通信號系統安全風險辨識,計算得到辨識因素的重要性排序,能夠為安全分析、風險辨識、安全管控提供有力的數據支持。
該方法對于軌道交通信號系統的安全施工建設和運營管理提出如下建議:雷害和其他自然災害仍對當前我國軌道交通信號系統有較大影響,環境要素是信號系統事故致因的重要一環,應當加強防范;較大傷亡事故區別于較小傷亡事故的主因素有外界人員施工、人員檢修不良、人員違章作業、電務人員施工、漏檢缺修管理不力等,說明從長期來看,不論在施工建設還是日常維護中,人員要素仍然對鐵路信號系統事故有著較大影響力,需要在事故預防管理中加以重視;較小傷亡事故的主因素以設備材質不良、電務施工管理不善為主,數據表現偏重于設備要素和管理要素,因此在多因素考慮,多管齊下的基礎上,突出重點,對于鐵路電務日常維護要重點抓設備安全和日常管理。
作者貢獻聲明:
曾小清:建模思路,5M算法分類。
林海香:數據收集,數據挖掘與建模。
王奕曾:數據收集。
袁騰飛:風險辨識。
何 喬:算法測試。
黃繼成:數據收集。