李恒
摘 要:動車組故障檢修過程中積累大量數據資源,若能將其充分開發,可輔助動車組故障預警、維修工作的高效開展。為此本文分析大數據環境下動車組故障數據挖掘分析技術,通過數據分析挖掘,從中總結故障發生規律及原因,制定故障風險防控方案,實現故障的事前管理。
關鍵詞:大數據;動車組故障;數據挖掘
引言:國內現役動車組車型較多,加之不同運行環境、運行壓力的影響,使動車組故障類型及引發原因趨于復雜化,給故障預防和檢修維護工作帶來不小難度。大數據背景下,利用數據挖掘分析技術完成動車組故障信息的采集、篩選、分類和挖掘,即可為故障原因確定及預防維修方案制定提供可靠的理論依據,幫助提高故障預防及檢修水平,因此有必要對故障數據挖掘分析技術進行分析。
一、數據挖掘分析技術
(一)數據挖掘的內容
數據挖掘主要完成關聯分析、聚類分析、數據分類、規律預測、損失模型、偏差分析等任務。其中,關聯分析對兩個及以上變量間存在的相互影響管理進行分析,常用分析方法包括簡單關聯、因果關聯以及時序關聯,影響關聯分析結果的主要參數為置信度和支持度。聚類分析將帶有相同或類似特征的數據聚集到一起,命名為同一類別,以此來突出不同類別間的差異程度,聚類分析在圖像處理、客戶分析、模式識別等領域有廣泛應用。
(二)數據挖掘的步驟
第一,數據清洗。數據清洗可剔除動車組故障數據中的噪聲數據、冗余數據或無用數據。由于數據來源較廣,因此存在一定異常數據不可避免,但這部分數據會對數據挖掘分析結果產生一定干擾,因此在挖掘分析之前需將其剔除[1]。第二,數據集成。數據集成將不同數據源的數據相互組合,當描述相同概念的屬性處于不同數據庫中時,其有不同的命名方式,若進行數據集成易引發數據冗余或不一致的現象。數據體系中的冗余數據過多,會給挖掘分析速度帶來負面影響,因此需將冗余數據重點清除。第三,數據轉換。數據轉換將原始數據轉變為可被挖掘的形式后進行存儲,主要操作步驟為數據格式化,即將原本連續的數據轉化為離散型數據,易于符號歸納;或將離散型數據轉化為連續型,方便神經網絡計算。第四,數據挖掘。該步驟為數據挖掘分析的核心,從數據集或數據體系中挖掘潛在的規律或模式,用以指導實際工作。數據挖掘開展于數據預處理之后,可根據挖掘任務特點選擇相適應的數據處理技術。常見的數據挖掘任務有數據特征分析、數據分類、關聯性分析等。第五,評估與表現。評估與表現對數據挖掘結果進行評價和篩選,找出最具價值的規律或模模式,經可視化處理后,將最終的結果以知識形式呈現給用戶。
二、數據環境下動車組故障數據挖掘分析技術
(一)故障數據模型設計
動車組故障數據模型可大致劃分為四個層級:(1)狀態信息層。該層級包括故障發生時的動車狀態信息,如故障時間、車次、型號、運行區間、運行距離、運行環境等。(2)故障現象層。該層用以描述故障本身的狀態,如故障位置、故障形式、發生程度、影響范圍、具體描述等。(3)解決方案層。解決方案層可被視為專家庫,用以存儲動車組常見故障類型、故障誘發原因、常用處理方案等,結合解決方案層的數據,可對動車組實際故障做定性分析,并結合歷史數據找到最佳的故障排除方案。(4)故障處理層。該層包括故障處理時間、操作人員、具體措施、處理結果等信息。
(二)故障數據庫搭建
動車組故障數據挖掘分析基于大量準確、有效的故障數據,為方便數據采集和存儲,確保故障數據的規范性,需搭建相應的故障數據庫,并完成網絡配置。數據庫系統軟件設計可由計算機技術、網絡技術、數據庫技術完成。考慮到鐵路系統現有資源配置情況及數據庫搭建效率,以OA網作為數據庫運行網絡平臺,動車組故障數據庫系統架構包括OA網絡、數據庫服務器、Web服務器、挖掘分析終端、用戶端等模塊。故障數據庫在Visual Studio2008環境下開發,使用B/S架構,并以C#為編程語言,硬件服務器和軟件服務器分別為DELL_R720 PC和Windows Server 2008 R2 Standard。
(三)數據庫功能實現
動車組故障數據庫包含如下功能模塊:(1)數據錄入:完成動車組故障表單的填寫、上傳及故障數據的批量化導入;表單中部分信息為選擇式填入,以確保錄入數據、名稱的規范性;從動車組上下載的故障數據在批量化導入之前,需對其進行篩選,清除操作提示、狀態提醒等與動車故障無關的數據。(2)信息查詢:提供多條件組合查詢方式。(3)故障統計:包括時間、里程和車型三種統計標準。(4)故障跟蹤:跟蹤對象為待處理故障和運行觀察故障。(5)故障分析:分為車載故障、遠程故障數據分析和部件平均壽命計算[2]。(6)標準數據:該模塊可實現用戶權限管理、故障模式配置、計算參數設定等功能。
(四)成果檢驗
將動車組故障數據挖掘分析技術應用至某鐵路局CRH1A型動車組的故障分析工作中,采集其在2018年9~12月的故障數據信息,發現其在12月運行里程達到320~360萬公里時,發生轉向架故障的概率要更高,該結果與動車組故障處理經驗判斷結果保持一致。經檢測驗證,該動車組轉向架的齒輪箱、軸向軸承等節點度過高,因此建議在日常維修保養中,加強節點處零部件的檢查。
三、結論
大數據時代,動車組故障分析、處理的信息化水平顯著提高,借助數據挖掘分析技術,可有效降低動車組故障處理的難度和時間成本,同時強化故障風險的可預見、可預防性,確保動車組安全、高效運行。
參考文獻:
[1]黃凌云.大數據環境下動車組故障數據挖掘分析技術研究[D].中國鐵道科學研究院,2019.
[2]何騰翔.Flink平臺下Eclat算法的研究及在動車組故障關聯關系挖掘中的應用[D].北京交通大學,2019.