李亞群,包云,韓霈然,楊建偉,陳中雷
(1.北京經(jīng)緯信息技術(shù)有限公司,北京 100081;2.中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081;3.北京交通大學(xué) 交通運(yùn)輸學(xué)院,北京 100044;4.中國(guó)鐵路北京局集團(tuán)有限公司 工務(wù)部,北京 100860)
高速鐵路災(zāi)害監(jiān)測(cè)系統(tǒng)(簡(jiǎn)稱:災(zāi)害監(jiān)測(cè)系統(tǒng))實(shí)時(shí)監(jiān)測(cè)鐵路沿線風(fēng)、雪、雨等自然災(zāi)害及異物侵限,當(dāng)監(jiān)測(cè)值超過(guò)報(bào)警預(yù)警閾值時(shí)進(jìn)行報(bào)警和預(yù)警,發(fā)生異物侵限和地震報(bào)警時(shí),進(jìn)行緊急處置,保障列車運(yùn)行安全[1-2]。災(zāi)害監(jiān)測(cè)系統(tǒng)為高速列車在災(zāi)害性天氣和突發(fā)事件下的運(yùn)行發(fā)揮了重要的安全技術(shù)保障作用。災(zāi)害監(jiān)測(cè)系統(tǒng)由現(xiàn)場(chǎng)監(jiān)測(cè)設(shè)備和中心系統(tǒng)組成,現(xiàn)場(chǎng)監(jiān)測(cè)設(shè)備包括風(fēng)速風(fēng)向計(jì)、雨量計(jì)、雪深計(jì)、數(shù)據(jù)傳輸單元等現(xiàn)場(chǎng)采集設(shè)備和監(jiān)控單元,部署于鐵路沿線接觸網(wǎng)桿、基站等處所;中心系統(tǒng)包括信息處理平臺(tái)、監(jiān)測(cè)業(yè)務(wù)終端、網(wǎng)絡(luò)設(shè)備、網(wǎng)絡(luò)安全設(shè)備,時(shí)間同步設(shè)備及其軟件等,部署于鐵路局機(jī)房。災(zāi)害監(jiān)測(cè)系統(tǒng)構(gòu)成復(fù)雜,任何一個(gè)環(huán)節(jié)均可能導(dǎo)致系統(tǒng)故障的產(chǎn)生。
目前,已開展的高速鐵路災(zāi)害監(jiān)測(cè)故障、可靠性分析工作中,張翠兵[3]運(yùn)用故障樹分析法對(duì)異物侵限監(jiān)測(cè)子系統(tǒng)故障進(jìn)行了分析;周紹華[4]重點(diǎn)對(duì)異物侵限監(jiān)測(cè)子系統(tǒng)產(chǎn)生紅光帶故障處置措施進(jìn)行了研究;劉巖、李曉宇等人[5-6]對(duì)災(zāi)害監(jiān)測(cè)系統(tǒng)可靠性進(jìn)行了研究;王嬌嬌等人[7]對(duì)災(zāi)害監(jiān)測(cè)系統(tǒng)脫離監(jiān)控故障數(shù)據(jù)進(jìn)行了分析,并提出了改進(jìn)措施與建議;周小明[8]對(duì)滬寧城際災(zāi)害監(jiān)測(cè)系統(tǒng)電源故障進(jìn)行了分析;李亞群等人[9-10]對(duì)監(jiān)控單元設(shè)備可靠性進(jìn)行了試驗(yàn)研究,并建立了時(shí)齊泊松過(guò)程模型對(duì)異物侵限監(jiān)測(cè)系統(tǒng)可靠性進(jìn)行了試驗(yàn)。以上研究多是對(duì)災(zāi)害監(jiān)測(cè)系統(tǒng)故障、可靠性的分析,而關(guān)于災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷方法的研究尚不多見。開展災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷方法研究,可及時(shí)解決災(zāi)害監(jiān)測(cè)系統(tǒng)出現(xiàn)的問(wèn)題,降低故障影響程度。目前,常用的故障診斷方法有回歸分析、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林等算法[11-13],本文結(jié)合災(zāi)害監(jiān)測(cè)系統(tǒng)設(shè)備狀態(tài)及故障監(jiān)測(cè)數(shù)據(jù)特點(diǎn),采用隨機(jī)森林算法對(duì)災(zāi)害監(jiān)測(cè)系統(tǒng)進(jìn)行故障診斷,輔助故障快速定位和處置。
災(zāi)害監(jiān)測(cè)系統(tǒng)是一個(gè)復(fù)雜的系統(tǒng),設(shè)備管理涉及多個(gè)專業(yè),包括工務(wù)、電務(wù)、信息等;設(shè)備類型多、環(huán)節(jié)多、管理部門多,一旦發(fā)生故障,排查困難,各部門協(xié)調(diào)工作量大,嚴(yán)重時(shí)會(huì)影響線路正常運(yùn)行。災(zāi)害監(jiān)測(cè)系統(tǒng)設(shè)備管理分工,如圖1 所示。

圖1 高速鐵路災(zāi)害監(jiān)測(cè)系統(tǒng)設(shè)備管理分工
(1)信息專業(yè)設(shè)備有鐵路局集團(tuán)公司中心系統(tǒng)軟/硬件設(shè)備,包括信息處理平臺(tái)、監(jiān)測(cè)業(yè)務(wù)終端、網(wǎng)絡(luò)設(shè)備和網(wǎng)絡(luò)安全設(shè)備,時(shí)間同步設(shè)備等;
(2)信號(hào)專業(yè)設(shè)備有監(jiān)控單元至信號(hào)機(jī)房之間的電纜、電務(wù)段監(jiān)測(cè)維護(hù)終端及信號(hào)系統(tǒng)側(cè)的災(zāi)害監(jiān)測(cè)系統(tǒng)接口設(shè)備;
(3)通信專業(yè)設(shè)備有監(jiān)控單元及配套網(wǎng)絡(luò)設(shè)備、現(xiàn)場(chǎng)采集設(shè)備至監(jiān)控單元之間的光纜或電纜、災(zāi)害監(jiān)測(cè)系統(tǒng)專用配電箱、通信段監(jiān)測(cè)維護(hù)終端等;
(4)工務(wù)專業(yè)設(shè)備有現(xiàn)場(chǎng)采集設(shè)備、工務(wù)段監(jiān)測(cè)維護(hù)終端等;
(5)供電專業(yè)設(shè)備有監(jiān)控單元端子排(不含)至變電系統(tǒng)之間的設(shè)備。
目前,災(zāi)害監(jiān)測(cè)系統(tǒng)對(duì)設(shè)備狀態(tài)監(jiān)測(cè)的數(shù)據(jù)是離散的,監(jiān)測(cè)設(shè)備是否正常工作一般采用0 或1 變量表示,因此,無(wú)法采用回歸分析方法開展對(duì)設(shè)備狀態(tài)的分析。本研究基于失效模式與影響分析(FMEA,F(xiàn)ailure Mode and Effects Analysis)對(duì)設(shè)備故障數(shù)據(jù)進(jìn)行分析,在此基礎(chǔ)上,研究設(shè)備故障診斷的方法。根據(jù)對(duì)災(zāi)害監(jiān)測(cè)系統(tǒng)故障的調(diào)研結(jié)果,構(gòu)建了基于FMEA 的災(zāi)害監(jiān)測(cè)系統(tǒng)故障分析表,故障分析表包含12 類設(shè)備,45 種故障原因。以監(jiān)控單元為例,基于FMEA 的監(jiān)控單元故障分析,如圖2 所示。

圖2 基于FMEA 的設(shè)備監(jiān)控單元故障分析
監(jiān)控單元故障分為嚴(yán)重故障和一般故障。嚴(yán)重故障會(huì)導(dǎo)致監(jiān)測(cè)點(diǎn)失效,需派人進(jìn)行人工值守并安排天窗點(diǎn)維修,一般故障需等待天窗點(diǎn)維修。
本文采用隨機(jī)森林算法對(duì)災(zāi)害監(jiān)測(cè)系統(tǒng)進(jìn)行設(shè)備故障診斷。其原理為:采用Bootstrap 重抽樣方法[14]從原始樣本中抽取多個(gè)樣本,對(duì)每一個(gè)樣本建立分類和回歸樹(CART,Classification And Regression Tree)(統(tǒng)稱:決策樹),將這些決策樹進(jìn)行整合,構(gòu)成隨機(jī)森林模型。基于隨機(jī)森林算法的災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷流程,如圖3 所示。

圖3 基于隨機(jī)森林算法的災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷流程
(1)對(duì)災(zāi)害監(jiān)測(cè)系統(tǒng)故障數(shù)據(jù)進(jìn)行預(yù)處理,通過(guò)設(shè)備狀態(tài)、故障數(shù)據(jù)、故障表現(xiàn)和故障原因,結(jié)合故障分析表進(jìn)行故障分析。其中,災(zāi)害監(jiān)測(cè)系統(tǒng)故障原因是決策類別,故障現(xiàn)象是特征屬性。
(2)通過(guò)Bootstrap 重抽樣方法抽取災(zāi)害監(jiān)測(cè)系統(tǒng)故障數(shù)據(jù)。采用訓(xùn)練節(jié)點(diǎn)分裂規(guī)則對(duì)故障現(xiàn)象進(jìn)行排序,得到各個(gè)節(jié)點(diǎn)的特征屬性;再根據(jù)特征屬性的不同值,從該節(jié)點(diǎn)向下分支,選擇最優(yōu)決策樹(分支)個(gè)數(shù),最終構(gòu)成故障診斷隨機(jī)森林模型。
(3)采用構(gòu)成的隨機(jī)森林模型對(duì)新的故障數(shù)據(jù)進(jìn)行分類和診斷,得出故障原因,輔助設(shè)備管理部門快速定位故障。
本研究共收集到多條線路災(zāi)害監(jiān)測(cè)系統(tǒng)故障樣本403 條,將所有數(shù)據(jù)的70% 作為訓(xùn)練集,其余30%作為測(cè)試集,采用python 編程語(yǔ)言構(gòu)建基于隨機(jī)森林算法的災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷模型,同時(shí),設(shè)計(jì)基于傳統(tǒng)決策樹(C4.5 決策樹)算法的災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷模型,將其作為對(duì)比方案。診斷結(jié)果,如表1 所示。由表1 可知,基于隨機(jī)森林算法的故障診斷效果明顯優(yōu)于基于C4.5 決策樹算法的故障診斷效果,可減少人工排查設(shè)備故障的工作量,提高工作效率。

表1 故障綜合診斷結(jié)果
對(duì)災(zāi)害監(jiān)測(cè)系統(tǒng)具體構(gòu)成部分進(jìn)行故障診斷,以監(jiān)控單元和風(fēng)采集設(shè)備的故障診斷為例,獲得監(jiān)控單元樣本225 條,故障原因10 種,故障表現(xiàn)13 類;風(fēng)采集設(shè)備樣本59 條,故障原因11 種,故障表現(xiàn)4 類。對(duì)監(jiān)控單元和風(fēng)采集設(shè)備2 個(gè)數(shù)據(jù)集的分類器個(gè)數(shù)進(jìn)行判斷,以監(jiān)控單元的數(shù)據(jù)為例,基于訓(xùn)練集構(gòu)建的決策樹個(gè)數(shù)與判斷準(zhǔn)確率關(guān)系,如圖4 所示,可以看出,最優(yōu)決策樹棵數(shù)在10 以內(nèi)達(dá)到最優(yōu)的準(zhǔn)確性,基于此,構(gòu)建災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷隨機(jī)森林模型。

圖4 監(jiān)控單元隨機(jī)森林決策樹個(gè)數(shù)與判斷準(zhǔn)確率關(guān)系
對(duì)監(jiān)控單元和風(fēng)采集設(shè)備的基于隨機(jī)森林算法和基于C4.5 決策樹算法的故障診斷方法分別進(jìn)行k折交叉驗(yàn)證,即將全部樣本劃分成k個(gè)大小相等的樣本子集,依次遍歷這k個(gè)子集,每次把當(dāng)前子集作為驗(yàn)證集,其余所有樣本作為訓(xùn)練集,進(jìn)行模型的評(píng)估,評(píng)估結(jié)果如圖5 所示,從圖5 中可以看出,隨機(jī)森林算法的表現(xiàn)明顯優(yōu)于C4.5 決策樹算法,診斷結(jié)果如表2 和表3 所示。

表2 監(jiān)控單元故障診斷結(jié)果

表3 風(fēng)采集設(shè)備故障診斷結(jié)果

圖5 監(jiān)控單元和風(fēng)采集設(shè)備故障診斷k 折交叉驗(yàn)證結(jié)果
由表2、表3 可以看出,對(duì)災(zāi)害監(jiān)測(cè)系統(tǒng)構(gòu)成局部設(shè)備故障的診斷效果優(yōu)于對(duì)系統(tǒng)整體故障的診斷,原因在于災(zāi)害監(jiān)測(cè)系統(tǒng)故障成因和現(xiàn)象復(fù)雜,一個(gè)故障現(xiàn)象可能由多種原因?qū)е拢鐬?zāi)害監(jiān)測(cè)系統(tǒng)脫離監(jiān)控故障,可能是由網(wǎng)絡(luò)、硬件故障(電源、服務(wù)器、終端等)、軟件故障等多種原因?qū)е耓7];一個(gè)故障原因也可能出現(xiàn)多個(gè)故障現(xiàn)象,如風(fēng)速風(fēng)向計(jì)故障可能導(dǎo)致設(shè)備故障報(bào)警、監(jiān)測(cè)終端無(wú)采集數(shù)據(jù)等;而風(fēng)采集設(shè)備的故障及故障原因相對(duì)系統(tǒng)整體故障成因和現(xiàn)象較簡(jiǎn)單。
針對(duì)災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷問(wèn)題,構(gòu)建了基于FMEA 的災(zāi)害監(jiān)測(cè)系統(tǒng)故障分析表;在此基礎(chǔ)上,提出了基于隨機(jī)森林算法的災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷方法。
(1)實(shí)際數(shù)據(jù)分析表明,基于隨機(jī)森林算法的災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷方法對(duì)系統(tǒng)故障的診斷準(zhǔn)確率為67.3%,優(yōu)于基于傳統(tǒng)決策樹的故障診斷準(zhǔn)確率(48.5%);
(2)基于隨機(jī)森林算法的災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷方法對(duì)監(jiān)控單元和風(fēng)采集設(shè)備的診斷準(zhǔn)確率為80.6%和86.7%,優(yōu)于基于傳統(tǒng)決策樹的故障診斷準(zhǔn)確率(48.2%和66.4%);
(3)基于隨機(jī)森林算法的災(zāi)害監(jiān)測(cè)系統(tǒng)故障診斷方法可有效提高災(zāi)害監(jiān)測(cè)系統(tǒng)設(shè)備故障診斷準(zhǔn)確率,有助于災(zāi)害監(jiān)測(cè)系統(tǒng)設(shè)備故障的快速定位和處置,大幅減少人工排查設(shè)備故障的工作量,為災(zāi)害監(jiān)測(cè)系統(tǒng)的運(yùn)營(yíng)維護(hù)提供技術(shù)支持。