王川 張珍文 安帥
摘 要:隨著高鐵的快速發展,人們對乘車環境的要求也越來越高。列車空調系統運行于列車高速振動環境下,性能極易下降且定期檢修成本巨大,高效準確的空調故障檢測尤為重要。本文用K-means聚類對空調數據進行分類,找到明顯異常的類別并與業務部門確認后找到真正的空調系統故障數據,并對故障數據進行標記,利用CART決策樹建立空調故障檢測模型。
關鍵詞:K-means;CART;空調故障檢測
中圖分類號:U266 文獻標志碼:A
0 引言
根據鐵道部《客車空調三機檢修及運用管理規程》規定:空調機組必須定時檢修。但是定時檢修耗費大量的人力物力,因此需要對空調數據進行分析,建立空調故障檢測模型進行故障檢測,進行針對性的檢修,節約運營成本。
對于空調故障檢測,潘文海等針對廣州地鐵3號線在運營期間頻繁出現的客室悶熱現象進行故障數據分析,最終確定故障點并據此進行整改,效果顯著。羅浩在列車性能試驗臺采集到空調機組在正常及故障狀態下的數據樣本,建立幾種常見故障的判斷規則,依據故障規則判定表,利用MATLAB建立了SVM多分類器。
但是目前并沒有有效的故障檢測模型在線運行。本文針對列車運行狀態空調數據,利用K-means聚類結合CART決策樹算法進行空調故障建模,并用實際數據進行驗證。
1 數據預處理
1.1 數據過濾
剔除掉NULL、異常、無效等數據。
1.2 指標篩選
目前所取數據指標較多,包括多個衍生指標,需要對指標進行相關性分析,選取與業務目標最相關的指標進行建模。
因為空調運行時,各個參數變化都與目標溫度有關,此處計算各個參數與目標溫度的相關性系數,結果見表1。
前6個指標的相關性系數大于0.6,與目標溫度相關性較強。
1.3 數據標準化
溫度與壓力值量綱不同,數值相差很大,用Z-Score方法對數據進行標準化。
2 算法簡介
由于目前沒有空調故障樣本,所以用無監督學習方法進行建模。空調運行正常與異常時,壓力值以及溫度表現出的規律不同,可以通過聚類發現空調數據內在的模式或者空調故障類的特點。
首先對空調數據進行聚類,分析各類的聚類中心,找出異常類別,與業務部門確認故障數據并對其進行標記,然后用分類算法進行分類,建立空調故障檢測模型。
3 空調異常檢測
3.1 模型訓練
選取標準化后的某段時間的全量數據,共20列車608355條記錄。
聚類效果可以通過肘部法則進行評估,肘部法則會把不同k值的成本函數值畫出來。空調數據對應的聚類模型平均畸變程度隨聚類個數k的變化趨勢圖如圖1所示。
從圖1可以看出,k值為5~6時,平均畸變程度變化最大。k超過6以后,平均畸變程度變化顯著降低,因此肘部就是k=6。因此最終選擇的模型為k=6對應的聚類模型。聚類模型的中心點見表2。
從聚類中心點可以看出,第5類的制冷系統2低壓壓力值明顯異常,經與業務部門確認該類為壓力傳感器故障。
將第5類標記為1,其余類別標記為0,利用CART決策樹進行分類,通過決策樹模型結果可以看出,只要變量X[6]<=2720,就把空調歸為正常數據,X[6]代表變量“制冷系統2低壓壓力”,由此抽象出空調故障檢測的規則:
制冷系統2低壓壓力>2720kPa,則報出“空調壓力異常”。
3.2 效果驗證
將模型部署到PHM系統中,運行一段時間后確實檢測到異常數據。與業務部門確認后,證實該數據確實為空調系統故障,但是是壓力傳感器故障,更換壓力傳感器,后期跟蹤發現,該列車該車廂不再出現壓力異常。
4 結論與展望
本文針對空調實際數據,利用K-means聚類算法找到異常類,對異常類別進行標記后,利用CART決策樹進行分類,建立空調故障檢測模型。本文建立的模型簡單易實現,且效果良好,具有很強的實際意義。
由于沒有真實空調系統故障數據,目前僅發現并建立了空調系統壓力傳感器故障模型,對于壓縮機故障,濾網臟堵等空調系統故障,需要對數據進一步分析,建立全面可靠的空調故障檢測模型,保證空調系統正常運行。
參考文獻
[1]潘文海,蘇錦華,李許磊,等.廣州地鐵3號線列車空調無制冷故障調查分析及解決[J].機車電傳動,2013(3):56-57.
[2]羅浩.列車空調機組故障檢修中SVM的應用[D].華中科技大學,2008:1-61.
[3]羅浩.列車空調機組故障檢修中SVM的應用[D].湖北:華中科技大學,2008.