馬志明
(中車大連電力牽引研發中心有限公司,遼寧 大連 116085)
工業大數據的數據挖掘模式是指在工業及制造業中,應用數據產生數據價值的過程。而伴隨著網絡信息、數據融合、數據挖掘等技術的發展,以及復雜大系統運營維護的日趨精準化、智能化的需求,大數據的應用將具有重要意義。
我國的高鐵技術同樣也是制造業應用的關鍵點,高速鐵路建設以及運行里程均為世界第一。列車運行維護中,產生了海量的數據內容,這些數據成為了動車組大數據運維的基礎數據。動車組列車運行維護是一個復雜的系統工程,目前我國對動車組列車運行維護策略主要有計劃性的檢修維護、反應式維護、基于狀態數據的維護等,這幾種方式會造成維護過度、成本高等缺點。而結合運維大數據應用技術,不但會降低成本,避免過度維護,同時會使維護精準化、高效化,這將為動車組的精準維護和健康管理提供準確的依據。
相比較于傳統的運行維護技術,智能運維技術運用數據融合、數據挖掘、網絡信息平臺等技術實現數據分析和決策輸出,進而達到系統健康預測和管理的目的。從智能運維平臺架構上來說,智能運維平臺主要可以抽象成數據采集層、數據匯聚層、數據存儲層、建模應用層、分析學習層、應用反饋層。這是目前理想的層次劃分,但在實際的智能運維實踐過程中,需要依據硬件設備條件及時地做出調整。智能運維平臺的數據維度主要涵蓋時間維度、空間維度以及系統級別維度等。運維數據時效性較強,并且往往出現多維度數據之間出現割裂采集的現狀。如何在后續的建模過程中體現多維數據之間的高度關聯,成為了智能數據運維平臺的應用關鍵點。
對于動車組的運行維護來說數據挖掘技術主要是在基礎運維平臺的數據挖掘過程涵蓋數據清洗、數據集成和轉換,以及數據歸納。通過數據預處理,能夠有效去掉數據中的噪音,糾正不一致的數據;數據歸納可以通過合并、刪除冗余特征或聚類來壓縮數據。
圖1 動車組運維大數據平臺多層級技術結構
在智能運維的算法集成系統中,依據不同的算法場景來適配不同的場合,依據不同的特征模式選擇合適的算法。在這個過程中主要是根據閾值來判斷數據模型的準確性,來達到實際的最優效果。算法的集成水平成為了挖掘內容的重要依據,智能運維是一項系統性的工程化過程,需要結合算法、算力、數據,以及平臺自身與業務系統之間的回饋過程。
通過對動車組進行分段處理,能夠結合各種接口技術實現數據的無縫銜接和處理。并在能夠在動車組的運行和檢修的過程中,構建好動車組運行和維護的基本數據庫。并且結合已有的數據平臺內容,充分發揮動車組大數據分析的基礎性應用和基本作用。主要涵蓋:歷史能耗數據的動態分析、動車組的故障分布情況以及能耗影響因素的相關性分析。最終依據數據內容對動車組的綜合質量進行評價實現典型故障的分析。并且依據預測數據分析內容實現動車組運行數據的綜合質量評定。進而為動車組的智慧化運維提供有效的數據依據。平臺的設計主要涵蓋以下幾方面的內容:
(1)數據收集。在這個過程中需要全面的收集動車組實際運行的基本故障數據以及車輛的信息數據。并且為故障數據的評定提供統一的數據標準。為全生命周期內的管理故障評定設定底層標準。
(2)數據挖掘分析。根據各個板塊的數據內容,使用多層次、多維度的故障診斷信息對數據進行綜合評定。并且實現數據分析的動態化結果。
(3)數據建模。通過數據挖掘實現動車組運行數據的綜合建模。進而建立故障數據的動態模型庫。能夠實現閾值預警和過保預警等內容,進而對動車組的突變型故障以及隱性故障進行綜合評定。
(4)大數據應用。以動車組為基本單位,能夠對動車組的運行故障進行縱向的綜合評定。進而量化了動車組的運行狀態。尤其是對動車組在運行的過程中,可能出現的基本問題進行預警分析。實現動車組健康大數據的綜合評定。其大數據平臺的耦合層級結構如圖1所示。
同時從數據層面上來說,數據架構的層次結構主要有以下幾個內容為主:
(1)數據獲取層。在這個層面中主要是根據動車組的工業運行大數據進行綜合采集。這些數據的來源主要是根據關鍵的運行部件、以及設備的運行狀態參數。這個過程可以由檢修的工作人員或者是隨車的機械師進行手工錄入,也可以是由數據采集設備對各類部件的運行參數進行采集而來的。
(2)數據存儲層。主要是根據各項采集來的數據內容進行統一標準和統一管理的形式進行存儲。
(3)數據處理層。主要是根據采集得到的數據進行分析總結和歸納,并且在這個過程中依據故障的規律得分析預測的結果。傳感器數據是依據智能運維的物聯網平臺進行數據傳輸和數據計算得到的。在這個過程中可以是有線的數據平臺也可以通過局域網絡進行數據傳輸。尤其是對于數據的在線抽取和數據轉換之間,能夠有很好的數據特征提取關系。實現多元數據的相關性擬合。
(4)運維決策層(數據展示層)。這部分層面需要有效的將得到的數據進行可視化的展示。供向管理人員進行科學的決策。結合歷史數據和相關性數據(天氣數據、地理位置參數數據以及結構特點)。基于統計學模型的方法和基于數據驅動的方法來建立故障診斷和預測模型。對故障診斷層面的數據量化和故障水平進行預測。
(5)健康狀態評估層。通過對故障診斷預測完成之后,對于剩余壽命進行評估。綜合的評判部件、設備以及車輛的基本參數。尤其是對于計算量較小的參數需要在綜合系統內進行綜合評估。對于計算量較大、復雜的體系需要在地面評估系統中依據云平臺進行綜合評估。
(6)可視化層。根據評估的數據結果,通過EChart平臺展示在web圖表中。有效的轉化成為二維的靜態圖像。數據結果展現形式更加直觀。
(7)維修決策層。通過數據展示情況,基于專家組以及有經驗的工程師的經驗對部件的使用壽命進行聯合預測。并且依據故障水平程度和健康登記聯合提出能夠實現的維修計劃。
綜合以上,數據平臺搭建、數據采集與傳輸、數據匯聚、存儲與建模、數據計算、AI體系化、場景與工程化融合等方面均提出了極其苛刻的要求,需要更專業的、更高質量標準的運維數據庫,還需要一支強有力的分析、架構和開發團隊支撐,才能真正實現智能運維中大數據的應用價值。
目前,我國正線運營的動車組形式非常多,同時與之相匹配的動車組檢修技術非常全面。其間產生了許多寶貴的監測和檢修數據,而我們對數據資源的應用還僅僅處于探索階段。本文針對動車組運維大數據的相關應用考慮了一些能夠實現的基本形式,給出了一些設計思路,以實現數據診斷分析和故障預測,為動車組的故障預測和健康管理提供有效的技術基礎。