寧鑫
隨著我國城市軌道交通的大規(guī)模建設(shè)與發(fā)展,以及交通強(qiáng)國戰(zhàn)略的提出與智慧城市的部署,傳統(tǒng)的實(shí)現(xiàn)信號(hào)系統(tǒng)運(yùn)營的維護(hù)支持子系統(tǒng)已難以滿足當(dāng)前城市軌道交通的發(fā)展需求。2020年3月,由中國城市軌道交通協(xié)會(huì)發(fā)布的《中國城市軌道交通智慧城軌發(fā)展綱要》,明確提出要建立完善的全生命周期智能運(yùn)維體系,建設(shè)車輛、能源、通信、信號(hào)等專業(yè)的智能運(yùn)維系統(tǒng),并在全行業(yè)推廣[1]。
當(dāng)前既有信號(hào)維護(hù)支持子系統(tǒng)主要存在以下問題:①數(shù)據(jù)采集效率低,傳輸速度慢,板卡級(jí)監(jiān)測(cè)數(shù)據(jù)匱乏,缺少車載等設(shè)備的日志數(shù)據(jù)采集[2];②數(shù)據(jù)離線分析功能較少,對(duì)歷史數(shù)據(jù)深度挖掘的能力不足[3],缺少故障診斷和故障預(yù)測(cè)手段[4];③設(shè)備臺(tái)賬沒有實(shí)現(xiàn)全生命周期管理[5],缺少對(duì)在線、在庫設(shè)備的健康評(píng)價(jià)[6]。基于以上問題,本文結(jié)合大數(shù)據(jù)、云計(jì)算、人工智能、5G和物聯(lián)網(wǎng)等技術(shù)[7],提出一種軌道交通信號(hào)智能運(yùn)維系統(tǒng)(簡(jiǎn)稱“智能運(yùn)維系統(tǒng)”),從結(jié)構(gòu)組成、技術(shù)原理、關(guān)鍵特點(diǎn)等方面展開研究與分析[8]。
智能運(yùn)維系統(tǒng)采用“平臺(tái)+應(yīng)用”的設(shè)計(jì)思路,其核心為一個(gè)軌道交通大數(shù)據(jù)分析平臺(tái),支持軌道交通信號(hào)系統(tǒng)的各種業(yè)務(wù)應(yīng)用。同時(shí),采用“分層+模塊化”的設(shè)計(jì)理念,在構(gòu)建軌道交通大數(shù)據(jù)分析平臺(tái)時(shí),將系統(tǒng)實(shí)現(xiàn)分為數(shù)據(jù)采集層、數(shù)據(jù)存儲(chǔ)層、邏輯計(jì)算層、基礎(chǔ)服務(wù)層和應(yīng)用業(yè)務(wù)層,每層均采用模塊化編程,從而極大地降低軟件內(nèi)部邏輯的耦合性,實(shí)現(xiàn)故障隔離,提高軟件的可維護(hù)性。智能運(yùn)維系統(tǒng)架構(gòu)見圖1。

圖1 智能運(yùn)維系統(tǒng)架構(gòu)
1)數(shù)據(jù)采集層。設(shè)計(jì)滿足多源、異構(gòu)和多站的數(shù)據(jù)采集需求架構(gòu),采用無擾、抗擾的數(shù)據(jù)采集技術(shù),解決信號(hào)監(jiān)測(cè)數(shù)據(jù)的高可信性、數(shù)據(jù)采集過程的高安全性等關(guān)鍵問題。采集對(duì)象包括信號(hào)系統(tǒng)設(shè)備和信號(hào)基礎(chǔ)設(shè)備。其中,信號(hào)系統(tǒng)設(shè)備包括車載ATP/ATO,ZC、CI、ATS和DCS等;信號(hào)基礎(chǔ)設(shè)備包括信號(hào)機(jī)、道岔/轉(zhuǎn)轍機(jī)、計(jì)軸、站臺(tái)門、應(yīng)答器、LEU、電源、信號(hào)按鈕、外電網(wǎng)、發(fā)車表示器、與聯(lián)鎖設(shè)備接口的繼電器、機(jī)房環(huán)境及其他設(shè)備等。
2)數(shù)據(jù)存儲(chǔ)層。采用HBase、HDFS、MySQL等多種數(shù)據(jù)庫存儲(chǔ)技術(shù)[9],滿足海量數(shù)據(jù)存儲(chǔ)、快速查詢、容災(zāi)和冗余備份等要求。設(shè)計(jì)滿足多種數(shù)據(jù)類型的存儲(chǔ)服務(wù),包括各種結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)存儲(chǔ),如通信報(bào)文數(shù)據(jù)、日志數(shù)據(jù)、圖片、音頻、視頻、各種分析結(jié)果數(shù)據(jù),以及適用于故障診斷和健康評(píng)價(jià)的各類規(guī)則文件等。
3)邏輯計(jì)算層。使用各種大數(shù)據(jù)組件技術(shù),如Hadoop、Kafka、MapReduce和Spark等[10],結(jié)合專家知識(shí)庫、智能算法、數(shù)據(jù)檢索技術(shù)和可視化技術(shù)等,設(shè)計(jì)實(shí)現(xiàn)一個(gè)軌道交通大數(shù)據(jù)分析平臺(tái)。
4)基礎(chǔ)服務(wù)層。由功能相對(duì)獨(dú)立的底層業(yè)務(wù)模塊構(gòu)成。系統(tǒng)的上層應(yīng)用通過調(diào)用不同的底層服務(wù),實(shí)現(xiàn)不同的業(yè)務(wù)功能。例如,設(shè)備運(yùn)行狀態(tài)實(shí)時(shí)監(jiān)測(cè)功能需調(diào)用基礎(chǔ)數(shù)據(jù)管理服務(wù)、實(shí)時(shí)數(shù)據(jù)監(jiān)測(cè)服務(wù)和數(shù)據(jù)可視化服務(wù)等;故障診斷和健康評(píng)價(jià)功能需調(diào)用基礎(chǔ)數(shù)據(jù)管理服務(wù)、離線數(shù)據(jù)分析服務(wù)、分析任務(wù)管理服務(wù)、智能分析算法庫和數(shù)據(jù)可視化服務(wù)等。
5)應(yīng)用業(yè)務(wù)層。分為四大業(yè)務(wù)方向,每個(gè)業(yè)務(wù)設(shè)計(jì)實(shí)現(xiàn)不同的業(yè)務(wù)應(yīng)用。其中,運(yùn)行監(jiān)測(cè)業(yè)務(wù)包括線路、集中站、信號(hào)系統(tǒng)設(shè)備和信號(hào)基礎(chǔ)設(shè)備等不同層級(jí)的運(yùn)行狀態(tài)、通信狀態(tài)和故障報(bào)警的實(shí)時(shí)監(jiān)測(cè)功能;分析決策業(yè)務(wù)包括多維度統(tǒng)計(jì)分析、歷史回放、關(guān)鍵設(shè)備運(yùn)行日志分析、工況分析、緊急制動(dòng)分析和停站精度分析等功能;健康管理業(yè)務(wù)包括設(shè)備的故障診斷、健康度評(píng)價(jià)、壽命預(yù)測(cè)、專家知識(shí)庫管理、算法模型管理等功能;應(yīng)急管理業(yè)務(wù)包括設(shè)備臺(tái)賬、庫存管理、檢修規(guī)程、維修計(jì)劃、維修工單和應(yīng)急預(yù)案管理等功能。
智能運(yùn)維系統(tǒng)具有強(qiáng)大的數(shù)據(jù)處理能力和功能易擴(kuò)展性。根據(jù)不同的實(shí)際工程業(yè)務(wù)需求,系統(tǒng)既可以進(jìn)行線路級(jí)運(yùn)維部署,也可以進(jìn)行線網(wǎng)級(jí)運(yùn)維部署。
線路級(jí)信號(hào)智能運(yùn)維系統(tǒng)由維修中心、正線設(shè)備集中站、控制中心(備用控制中心)、車輛段/停車場(chǎng)的維護(hù)監(jiān)測(cè)設(shè)備組成,部署方案見圖2。在線路級(jí)維修中心主要部署智能運(yùn)維服務(wù)器集群和智能運(yùn)維工作站,實(shí)現(xiàn)全線路信號(hào)系統(tǒng)設(shè)備運(yùn)維數(shù)據(jù)的采集和存儲(chǔ)、運(yùn)行狀態(tài)監(jiān)測(cè)、分析決策、健康管理和應(yīng)急管理等業(yè)務(wù)功能;在集中站、控制中心(備用控制中心)、車輛段/停車場(chǎng)等,主要部署智能運(yùn)維工作站、各個(gè)信號(hào)設(shè)備的維護(hù)機(jī)和集中監(jiān)測(cè)工作站,實(shí)現(xiàn)本區(qū)域各種信號(hào)設(shè)備維護(hù)數(shù)據(jù)的采集、存儲(chǔ)、監(jiān)測(cè)、分析和管理等功能。

圖2 線路級(jí)智能運(yùn)維系統(tǒng)部署方案
線路級(jí)信號(hào)智能運(yùn)維系統(tǒng)可實(shí)現(xiàn)對(duì)本線路信號(hào)系統(tǒng)設(shè)備和信號(hào)基礎(chǔ)設(shè)備等的維護(hù)監(jiān)測(cè),提供對(duì)全線信號(hào)系統(tǒng)設(shè)備的運(yùn)行狀態(tài)監(jiān)測(cè)及報(bào)警、智能分析、健康評(píng)價(jià)、故障診斷和維護(hù)管理等功能。
在線路級(jí)信號(hào)智能運(yùn)維系統(tǒng)部署方案的基礎(chǔ)上,增加防火墻設(shè)備和網(wǎng)絡(luò)通信設(shè)備。同時(shí),在線網(wǎng)運(yùn)營中心部署智能運(yùn)維中心設(shè)備,包括大數(shù)據(jù)集群服務(wù)器、智能運(yùn)維工作站和各種控顯設(shè)備(如大屏等)。線網(wǎng)級(jí)信號(hào)智能運(yùn)維系統(tǒng)部署方案見圖3。

圖3 線網(wǎng)級(jí)智能運(yùn)維系統(tǒng)部署方案
線網(wǎng)運(yùn)營中心實(shí)現(xiàn)對(duì)所有線路信號(hào)系統(tǒng)設(shè)備的運(yùn)維管理,用戶既可以查看整個(gè)線網(wǎng)信號(hào)系統(tǒng)設(shè)備的總體運(yùn)行狀態(tài),還可以實(shí)現(xiàn)各種線網(wǎng)級(jí)統(tǒng)計(jì)分析和維護(hù)管理等業(yè)務(wù)功能。
智能運(yùn)維系統(tǒng)中包含多個(gè)智能分析、智能故障診斷、健康評(píng)價(jià)等功能業(yè)務(wù),這些業(yè)務(wù)在設(shè)計(jì)實(shí)現(xiàn)時(shí)均需要算法模型的支持。為此,設(shè)計(jì)了適用于軌道交通信號(hào)設(shè)備維護(hù)數(shù)據(jù)分析的數(shù)據(jù)挖掘算法庫,見圖4。將數(shù)據(jù)進(jìn)行合理的分階段處理,每個(gè)階段應(yīng)用多種標(biāo)準(zhǔn)化接口的算法,使系統(tǒng)具有良好的可擴(kuò)展性。根據(jù)信號(hào)設(shè)備維護(hù)數(shù)據(jù)的特點(diǎn),可將數(shù)據(jù)處理分為以下4個(gè)階段。

圖4 算法庫
1)數(shù)據(jù)智能清洗階段。對(duì)所采集的數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)校驗(yàn)、數(shù)據(jù)過濾、數(shù)據(jù)變換和數(shù)據(jù)歸一等。
2)數(shù)據(jù)集成融合階段。對(duì)數(shù)據(jù)進(jìn)行整合分析,包括數(shù)據(jù)信息共享、語義分析、邏輯分析和特征分析等。
3)數(shù)據(jù)分析挖掘階段。對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)價(jià)值分析、關(guān)聯(lián)規(guī)則分析、因果分析和業(yè)務(wù)分析等。
4)高維數(shù)據(jù)可視化階段。對(duì)數(shù)據(jù)進(jìn)行降維處理和預(yù)測(cè)分析,包括根據(jù)數(shù)據(jù)的因果關(guān)系,降低既有維度,減少數(shù)據(jù)運(yùn)算量;或使用預(yù)測(cè)分析得到熱點(diǎn)數(shù)據(jù),加快數(shù)據(jù)處理速度等。
在實(shí)際應(yīng)用中,根據(jù)業(yè)務(wù)的需求,可在數(shù)據(jù)處理的不同階段選擇某種具體算法。如,在數(shù)據(jù)采集階段,當(dāng)報(bào)文(如ATS報(bào)文等)或日志(ATP或計(jì)軸日志)數(shù)據(jù)出現(xiàn)CRC校驗(yàn)錯(cuò)誤、報(bào)文中字節(jié)定義與協(xié)議不符合、報(bào)文長(zhǎng)度異常等現(xiàn)象時(shí),系統(tǒng)可調(diào)用分類算法(如支持向量機(jī)),對(duì)異常數(shù)據(jù)進(jìn)行過濾;當(dāng)需要處理文本數(shù)據(jù)(如專家知識(shí)庫中的知識(shí)描述,或者Log文件中的中文詞語),或?qū)崿F(xiàn)模糊查詢等功能時(shí),可采用自然語言處理相關(guān)算法,對(duì)數(shù)據(jù)進(jìn)行詞法分析、語義分析等,而前端業(yè)務(wù)可直接調(diào)用分析結(jié)果進(jìn)行下一步處理;當(dāng)需要實(shí)現(xiàn)故障原因分析,或推薦故障關(guān)聯(lián)的維修建議等功能時(shí),可采用關(guān)聯(lián)規(guī)則算法(如Apriori算法)分析推斷出結(jié)果數(shù)據(jù);當(dāng)需要實(shí)現(xiàn)多維數(shù)據(jù)控顯或計(jì)算(如結(jié)合ATP、ZC、CI相關(guān)報(bào)文數(shù)據(jù)分析列車折返失敗的原因,并同時(shí)在界面上顯示出故障的原因、時(shí)間和列車位置信息)時(shí),可采用決策樹(如迭代算法)對(duì)折返過程相關(guān)數(shù)據(jù)進(jìn)行熱點(diǎn)分析,使得系統(tǒng)集中計(jì)算關(guān)鍵字節(jié)數(shù)據(jù),然后再通過探索性可視化(如增量算法)對(duì)需要展示的多維數(shù)據(jù)進(jìn)行處理,并最終在界面上完成結(jié)果展示。
智能運(yùn)維系統(tǒng)結(jié)合設(shè)備的運(yùn)行指標(biāo)和維修數(shù)據(jù),通過構(gòu)建關(guān)鍵設(shè)備的故障診斷模型,可實(shí)現(xiàn)對(duì)關(guān)鍵設(shè)備的智能故障診斷,定位故障位置,分析故障類型和故障原因等,降低因未及時(shí)發(fā)現(xiàn)故障導(dǎo)致的安全風(fēng)險(xiǎn),縮短設(shè)備修復(fù)時(shí)間,提高維護(hù)人員的維護(hù)效率。
系統(tǒng)周期性地對(duì)在線軌道交通信號(hào)系統(tǒng)設(shè)備和信號(hào)基礎(chǔ)設(shè)備進(jìn)行故障診斷,采用智能故障診斷技術(shù)可以極大地提高設(shè)備故障報(bào)警的準(zhǔn)確性和及時(shí)性。同時(shí),采用規(guī)則關(guān)聯(lián)算法和推薦算法,為每個(gè)監(jiān)測(cè)到的故障推薦最優(yōu)的維修方案。故障診斷的具體流程見圖5。

圖5 故障診斷流程
Step 1利用各種專家知識(shí)、運(yùn)維作業(yè)指導(dǎo)書等構(gòu)建知識(shí)圖譜,主要包括知識(shí)實(shí)體及相關(guān)屬性參數(shù),實(shí)現(xiàn)從普通文本知識(shí)到信號(hào)設(shè)備專業(yè)知識(shí)的轉(zhuǎn)換。
Step 2設(shè)備發(fā)生故障后,系統(tǒng)對(duì)故障數(shù)據(jù)進(jìn)行采集和解析,通過知識(shí)圖譜的知識(shí)邏輯關(guān)聯(lián),實(shí)現(xiàn)故障原因的快速定位。
Step 3結(jié)合因果邏輯鏈,推理故障的潛在原因;結(jié)合業(yè)務(wù)規(guī)則,推薦概率最高的故障原因。
Step 4根據(jù)故障發(fā)生的時(shí)間,展示故障因果鏈和故障樹,并給出對(duì)應(yīng)的維修方案。
由于軌道交通信號(hào)系統(tǒng)由多個(gè)子系統(tǒng)組成,當(dāng)列車在運(yùn)行過程中發(fā)生故障時(shí),故障定位難度大,需各子系統(tǒng)的相關(guān)維護(hù)人員協(xié)作處理,因此排查過程繁瑣復(fù)雜,工作量大,效率低下,無法在短時(shí)間內(nèi)快速處理。而智能運(yùn)維系統(tǒng)是基于信號(hào)系統(tǒng)運(yùn)行機(jī)制原理、運(yùn)行日志和子系統(tǒng)間通信報(bào)文數(shù)據(jù),結(jié)合專家知識(shí)、故障樹分析、故障模式與影響分析方法等,采用故障推理機(jī)技術(shù),構(gòu)建包含故障原因、故障發(fā)生路徑和故障模式的完整故障鏈模型,可實(shí)現(xiàn)信號(hào)系統(tǒng)故障發(fā)生時(shí)對(duì)故障的快速溯源。故障溯源技術(shù)架構(gòu)見圖6。

圖6 故障溯源技術(shù)架構(gòu)
1)信號(hào)設(shè)備的運(yùn)行日志、子系統(tǒng)間通信報(bào)文數(shù)據(jù),以及業(yè)務(wù)相關(guān)的規(guī)則文件,均可以利用信號(hào)系統(tǒng)運(yùn)行機(jī)制原理(各種業(yè)務(wù)流程邏輯信息數(shù)據(jù))生成;采用專家知識(shí)庫構(gòu)建故障模型,結(jié)合系統(tǒng)運(yùn)行規(guī)則文件和故障特征,構(gòu)建故障模式;采用支持向量機(jī)、根因分析和故障樹分析等推理機(jī)技術(shù),定位故障發(fā)生的位置,識(shí)別故障發(fā)生的原因。
以列車折返自動(dòng)換端過程中故障溯源為例,列車在自動(dòng)換端時(shí),控制列車運(yùn)行的設(shè)備主要包括首尾端ATP/ATO、ZC和ATS等,設(shè)備間通信,先以列車首尾端通信協(xié)議、ATP與ATO通信協(xié)議、ZC與ATP/ATO通信協(xié)議、ATS與ATP/ATO通信協(xié)議、ZC與ATS通信協(xié)議為基礎(chǔ),再結(jié)合專家知識(shí),建立設(shè)備狀態(tài)切換規(guī)則和故障監(jiān)測(cè)規(guī)則,共5類。
2)以設(shè)備間實(shí)際生成的報(bào)文數(shù)據(jù)和日志數(shù)據(jù)為輸入,采用設(shè)備狀態(tài)切換規(guī)則和故障監(jiān)測(cè)規(guī)則,對(duì)數(shù)據(jù)進(jìn)行分析和處理。若本條日志或報(bào)文數(shù)據(jù)中存在故障樹,則遍歷整個(gè)故障樹,記錄相關(guān)報(bào)警信息。
3)當(dāng)整個(gè)列車折返自動(dòng)換端過程結(jié)束后,根據(jù)記錄的診斷結(jié)果,進(jìn)行故障識(shí)別和故障定位,推理故障發(fā)生的原因。
故障溯源技術(shù)可以快速分析多個(gè)信號(hào)子系統(tǒng)的關(guān)聯(lián)故障,定位故障的位置,識(shí)別故障的原因,從而極大地提升維護(hù)效率。
目前,該智能運(yùn)維系統(tǒng)已經(jīng)完成了系統(tǒng)設(shè)計(jì)與研發(fā),并在天津某地鐵線路完成了現(xiàn)場(chǎng)功能測(cè)試,后續(xù)還將在更多的工程化現(xiàn)場(chǎng)進(jìn)行部署和應(yīng)用。隨著信號(hào)智能運(yùn)維系統(tǒng)的逐步應(yīng)用,不但可以滿足既有維護(hù)人員的現(xiàn)場(chǎng)作業(yè)需求,還可以極大地提升信號(hào)設(shè)備的運(yùn)營效率和維護(hù)效率,為未來軌道交通運(yùn)營發(fā)揮重要的作用。