李 君,徐春婕
(1.北京經緯信息技術有限公司,北京 100081;2.中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081)
隨著高速鐵路的快速發展和信息化水平的顯著提升,全國高速鐵路網已基本形成。鐵路客運車站(簡稱:客站)作為鐵路客流運輸及承載的場所,其目標已從提供基本的旅客服務轉變為提升客運服務質量和信息化水平。隨著人工智能時代的到來,作為客運服務的核心業務,設備運維管理從最初的事后維修[1]、預防維修、生產維修、可靠性維修及管理,發展到結合了設備綜合工程學和全員生產維修(TPM,Total Productive Maintenance)機制的全面規范化生產維護(TnPM,Total Normalized Productive Maintenance)機制。TnPM 機制在智能客站的設備管理中起著舉足輕重的作用。相比于TPM 機制,TnPM 機制以全系統的預防維修體系為載體,以員工的行為規范為過程,以設備的綜合效率和完全有效生產為追求目標,是一種鼓勵全員參與生產及設備維護、保養和維修的機制。
我國高速鐵路發展至今,智能化、信息化、現代化的設備對購票、安檢、進站、候車、乘降、問詢、查驗等客運服務起著舉足輕重的作用。隨著客運服務功能的智能化發展,以及服務品質需求的提高,配套客站設備種類和數量在逐年上升的同時,其運維管理和運行質量的作用也日趨顯著,以事后維修、故障維修為主的設備運維管理模式早已無法滿足智能客站的設備運維管理需求[2]。
目前,我國客站設備運維管理存在以下問題。
對于日常的設備運維管理模式,客站基本依靠現場盯控、定期巡檢、計劃內維護保養等方式。大多數客站尚未建立預測性設備維修機制,僅根據實時數據來維護設備,基本為“救火式”維修,并未結合設備運維的歷史數據來對當前的運行狀態進行實時分析和判斷。同時,設備運維管理模式還缺乏設備預維修和保養措施等相關專業技術,導致設備老化速度加快,使用壽命縮短。
設備的日常維保及維修管理是確保客運設備運行質量和安全的重要環節,然而大多數車站由于建站較早,其設備設施和管理方式都較為陳舊,很多客站仍然存在“重故障輕保養”的情況,僅對日常巡檢中發現的危害等級高的故障問題進行記錄,并派發工單,進行維修。對于危害等級低的故障問題,客站沒有給予足夠的重視,僅記錄設備臺賬和選擇性地下發工單;又或者響應速度慢,進行選擇性維修,從而導致隱患增多,甚至由量變突發為質變,影響設備的穩定運行。設備故障上報大多采取人工上報的形式,因而存在設備故障發現不及時、處置效率低、恢復周期較長等問題,同時客站也缺乏預防性維修和遠程控制手段。
客站在設備信息的采集、管理、使用等方面存在監管系統重復和信息孤立的情況。例如,設備機房和通信機械室分別采集各自機房的環境數據,并使用各自的監管系統。這些監管系統獨立運行,并未進行數據共享,因而導致客站設備監管系統之間缺乏數據互聯互通。
車站智能化水平的提升將使設備更加智能化、信息化、數字化,但其運維和保養難度也明顯增大,需要配套的智能運維管理技術。而很多客站并未對運維管理人員進行相關的技術培訓,致使其在客站的日常巡檢和設備的維護保養過程中,無法準確判斷設備的故障,做到“對癥下藥”,導致出現返工、誤判、錯判、漏檢等情況。另外,客站應對設備運維知識進行完善或更新,以符合智能客站設備運維管理需求。
根據智能客站設備的運維管理現狀,結合用戶職責及現場設備的使用情況,在保證全面提高客運設備安全性、穩定性、可靠性的基礎上,本文搭建了智能客站設備大數據運維服務平臺(簡稱:智能客站運維平臺)。該平臺能夠對設備運行狀態進行實時監控,對設備運行數據進行定量化和差異化分析,實現設備智能化運維和全生命周期管理。智能客站運維平臺能夠全面提升設備的安全性、穩定性、可靠性,以及客運服務質量[3-4],實現設備的數字化、智能化、可視化管理。
在設備的全生命周期管理中,維護管理是重要的一環。預防性分析和預警在提前采取重要預防維修措施的同時,也可為設備的升級和更新進行充分準備。智能客站運維平臺依托物聯網等環境,定期采集設備運行的相關數據(如溫度、亮度、濕度、CO2濃度、PM2.5 濃度等環境數據),對設備及相關部件的運行狀態進行檢測,統計設備運行狀態和生命周期使用壽命。同時,智能客站運維平臺還結合視頻監控、列車調度命令、生產作業計劃等,通過大數據技術來進行智能客站設備運行動態分析和態勢推演(如人群密度、車站能耗、站內舒適度、設備工作環境等),并根據同比/環比等分析報告為工作人員提供智能客站設備的運維策略和輔助決策依據[5],以遠程控制或適當人為干預設備運維管理的全過程。
在智能客站中,大量的設備傳感器產生的實時數據為構建設備管理全程可追溯機制提供了可能性。通過分析智能客站設備資產狀況、維保信息、動靜態履歷等數據,智能客站運維平臺結合客運生產組織業務、現場作業情況、設備維護保養周期、設備巡檢保養和維修計劃等,采用卷積神經網絡等人工智能理論和算法,對設備運行數據進行分析。在此基礎上,智能客站運維平臺根據設備運行特點制訂個性化的巡檢保養計劃,并實現智能化下發。從數據的采集到故障閉環反饋,到客站的健康狀況評估、合理的設備運維策略,甚至設備健康狀況的影響因素、過程參數和環境參數等狀態類信息,智能客站運維平臺實現了設備管理的全程可追溯。
設備運維服務平臺的可視化主要針對設備建模、設備臺賬、設備巡檢管理等內容,通過數據倉庫技術(ETL,Extract Transform Load)、Hadoop 等大數據分析、處理技術對設備運行數據進行分析,采用圖、表、線等多種表現形式對設備運維情況進行多維度、多角度、多粒度的統計展示。可視化為后期的設備采購、設備保養、庫存管理、能源調控、供應商管理、設備健康評價等提供重要參考依據和決策支持。
根據對客站設備運維管理現狀和運維需求的分析,借鑒信息技術基礎架構庫(ITIL,Information Technology Infrastructure Library)標準,智能客站運維平臺融合了云計算、物聯網等技術,采用多層架構和模塊化的設計模式。該平臺由數據采集層、數據傳輸層、數據處理層、數據存儲層、平臺支撐層、系統應用層、服務展現層等組成,實現了設備從運行狀態數據采集、傳輸、分析存儲到應用、展現的全過程運維管理,為設備全生命周期管理和智能化運維提供了一體化的處置方案。智能客站運維平臺的架構如圖1 所示。

圖1 智能客站運維平臺架構
數據采集層負責采集智能客站的客票、機電、旅服相關設備的狀態數據和實時運行數據。狀態數據指智能客站設備設施空間布局、地理位置等靜態信息(如設備設施所在具體物理位置、所屬樓層等)。實時運行數據指智能客站設備設施在運行及維保過程中所產生的信息。這些數據將作為后續分析的基礎數據,以用于各類算法和相關應用。
數據傳輸層采用射頻識別(RFID,Radio Frequency Identification)、超 寬 帶(UWB,Ultra Wide Band)、ZigBee、Wi-Fi、藍牙等物聯網技術,經過無線傳感器網絡將數據采集層得到的設備狀態數據和實時運行數據數據傳輸至智能客站運維平臺。
數據處理層對數據傳輸層傳輸的數據進行清洗、集成、規約、轉換、加工等預處理[6-7],將這些數據轉變成格式統一且具有統一接口的規范化數據,并按照元數據、模型庫和業務庫對處理后的數據進行分類。智能客站運維平臺的大數據分析服務對數據進行數據挖掘和分析,并采用機器學習相關算法,形成初步的統計分析結果。
智能客站運維平臺將處理后的數據存儲至配置管理數據庫(CMDB,Configuration Management Database)。CMDB 又分為設備緩存數據庫、用戶管理數據庫和運維管理數據庫。這三大數據庫分別存儲設備緩存信息、基礎用戶信息和設備運維信息,為后續納入平臺及支撐系統的應用提供統一的存放和調用機制。
智能客站運維平臺根據人工智能的相關算法,結合具體業務需要和應用場景,從節能控制、故障預測、智能運維、資產管理、健康評價等方面對CMDB的相關數據進行分析,并將分析結果統一接入智能客站旅客服務與生產管控平臺,為后續系統應用提供數據支撐。
智能客站運維平臺結合平臺支撐層的設備運維大數據分析結果,按照知識庫管理、故障管理、供應商管理、人員管理、履歷管理、狀態管理、運維管理、備品備件管理等應用和智能客站實際客運作業需要,進行智能報表和工單的智能化下發、故障預測、趨勢推演等,并通過三維地理信息系統(3D GIS, 3D Geographic Information System)展示、數字孿生車站、智能駕駛艙等方式進行直觀展示和可視化配置,為智能客站設備主動運維提供多維度、多角度的應用和展現方式。
智能客站運維平臺的功能架構如圖2 所示,具有設備管理、運維管理、履歷管理、配置管理、系統管理、智能監測、能效管理、健康評價八大功能。綜合考慮智能客站設備運維業務等級、重要程度和對智能客站健康狀況的影響程度,這八大功能可劃分為基本功能和擴展功能。基本功能主要包括設備管理、人員管理、履歷管理、系統管理等4 個功能模塊,實現基礎數據的前期錄入和管理。擴展功能在基本功能的基礎上,按照業務場景進行了針對性的拓展和衍生,主要包括故障管理、能效管理、健康評價、狀態監測等4 個功能模塊,實現設備的全生命周期管理、設備運維工單的智能化派發、設備故障預測預警、車站能耗統一管理、狀態及環境的主動感知測控、設備智能運維的圖形化界面操作等功能。

圖2 智能客站設備大數據運維服務平臺功能架構
智能客站運維平臺的基本功能提供設備臺賬、設備導入、排班管理、考勤管理、履歷管理、故障登記、操作日志、數據字典、倉庫字典等功能,主要實現設備臺賬錄入、基本信息導入、排班計劃制訂和自動生成、日常考勤管理、基本履歷管理、設備故障登記、故障字典維護、數據字典及數據倉庫維護、日志管理等功能,滿足智能客站設備運維的一般業務需求。
智能客站運維平臺的擴展功能以基本功能為支撐,結合業務和具體應用需要,提供設備全生命周期管理、工單智能派發、運行狀態監測、運行環境監測、故障預警告警、設備能耗管控、設備運行狀況評價、設備庫存能力評估、供應綜合評價等延伸服務,以滿足智能客站設備健康狀況整體評估和智能化輔助運維需求。在保證設備安全、穩定運行的前提下,擴展功能為客運工作人員提供多元化、智能化的輔助決策手段。
為實現智能客站運維平臺的各項功能,本文采用了多種新技術。智能客站運維平臺的關鍵技術有特征主動識別和狀態智能監測技術、規范化數據集成技術、故障趨勢推演技術、全方位多屬性健康評價技術。
依托物聯網技術,智能客站在主要區域的設備上加裝探測點,為車站巡檢人員配備可穿戴的智能探測設備,為巡更機器人配置高清攝像頭、激光雷達等智能感知設備,以實現客站的智能巡檢。當客站設備發生故障時,智能巡檢設備通過高速互聯的網絡環境,將相關信息傳輸至智能客站運維平臺,使客站工作人員可通過遠程客戶端及時獲得故障設備的圖像和音頻信息。智能客站運維平臺可以對現場運維進行遠程指導和安全防護,能夠有效預防和及時處置突發事件,保障設備穩定運行。同時,設備維修數據可用傳輸至大數據運維服務平臺,以完成數據的預處理和進一步分析總結,完善管理故障知識庫。
智能客站設備實時運行數據的獲取需要建立規范化的數據接口、統一的通信協議和接入方式,數據采集模塊借助藍牙、RFID、Wi-Fi、ZigBee 等通信技術實時采集平均運行時長、故障次數等設備運行狀態數據和溫度、濕度、亮度等設備運行環境數據,以及設備基礎配置信息、履歷信息和物理信息。對無法接入或協議不匹配的設備,智能客站運維平臺通過現場盯控、人工記錄的方式解決。此外,智能客站運維平臺還統一建立適應各類設備的故障編碼規范和入庫機制,為后續設備接入提供一體化的接入方式,方便設備信息集中管理。
依托智能客站各類設備參數、設備實時運行數據、設備履歷、運行維保信息及實驗數據[8],結合設備歷史數據、故障數據、巡檢保養記錄等,采用設備狀態聚類算法和檢修方案等輔助決策算法根據事先設定的狀態評判規則統計、分析、判斷設備運行狀態,統計和預測設備零部件使用情況、故障發生情況、故障點運維狀況等,推演出設備剩余使用壽命、未來健康狀況、預計故障點及預計發生原因,對運維成本和客運服務影響程度進行預估,并給出對應維修案的輔助決策建議等。以上預測或預估結果先經模型、算法初篩、人工確認后,再向運維人員派發運維工單,最終經現場復驗確認后處理。對于預測的故障趨勢和故障點、故障起因等,客運工作人員可提前制訂針對性的運維計劃,提前安排巡檢時間節點,做到全員參與、全程把控、事前預防。具體故障推演邏輯,如圖3 所示。

圖3 設備故障推演邏輯
根據設備屬性、運行時長等因素建立遞階層級結構的指標體系,智能客站設備健康狀況評價體系分為目標層、準則層、指標層和方案層。目標層對所有類別的智能客站設備進行健康狀態評價。準則層是各類智能客站設備健康狀況的評判準則(包括安全性、維修性、測試性、監測性、技術性、經濟性、預測性),是針對設備自身屬性、運行特點、功能和效用,提煉出的健康狀況評價的主要評價要素。指標層則用于判定客運車站設備運行健康準則的詳細指標,分別對應各評判準則,通過指標層可獲得影響設備運行健康狀態評價的評價指標集。方案層則給出用于解決具體指標的措施或方案,即實現對應指標擬提出的具體解決方案。智能客站設備健康狀況評價體系具體架構如圖4 所示。

圖4 智能客站設備健康狀況評價體系
全方位多屬性健康狀況評價技術運用主觀和客觀相結合的思想確定指標權重,結合德爾菲法、層次分析法、模糊評價法等方法,將高斯模型、馬爾可夫模型、BP 遺傳算法等人工智能算法和模型作為主觀和客觀權重的確定方法,并對權重進行修正。最后,全方位多屬性健康狀況評價技術運用線性加權法得到各屬性及底層評價指標元素的綜合權重值,實現智能客站設備的綜合評估。
本文圍繞智能客站設備運維管理,分析了客站設備運維現狀和需求,搭建了智能客站運維平臺。該平臺提升數據資源的共享水平,滿足了智能客站設備運維的基本業務和智能化輔助運維需求,提升了設備管理綜合效率。本文將采用更先進的人工智能算法,對智能客站設備進行多維度、多角度綜合運維管控,并通過多種開發工具的組合運用來實現應用軟件的開發,為設備運維提供新的管理方式和技術思路,以對智能客站設備運維做出更客觀、可信的評估。