陶新民 李晨曦 李青



摘要: 針對不均衡數據下的軸承故障檢測問題,提出一種最大軟間隔支持向量域描述(Maximum Soft Margin Support Vector Domain Description,MSM-SVDD)故障檢測模型。該模型通過引入最大軟間隔正則項,將傳統支持向量域描述(SVDD)算法的分類邊界向故障類偏移,進而提高算法的故障檢測性能,同時對正則化項系數的取值范圍進行了理論分析。實驗部分討論了正則化項系數、高斯核參數以及正常類樣本數目對模型故障檢測性能的影響,并給出了正則化項系數與高斯核參數的取值建議。實驗結果表明,新提出的MSM-SVDD模型非常適合處理小樣本不均衡數據下的故障檢測問題。最后通過實測數據的對比實驗,表明MSM-SVDD模型在不均衡數據下的故障檢測性能較其他方法有較大幅度提升。
關鍵詞: 故障檢測; 軸承; 不均衡數據; 最大軟間隔; 支持向量域描述
中圖分類號: TH163+.3; TH133.3 ?文獻標志碼: A ?文章編號: 1004-4523(2019)04-0718-12
DOI:10.16385/j.cnki.issn.1004-4523.2019.04.020
引 言
在工業領域中,旋轉機械是應用最為廣泛的一類機械設備,例如:汽輪機、壓縮機和傳送帶等。軸承作為旋轉機械設備的重要組成部分,其工況直接影響整個旋轉機械設備的運行狀態。因此開展軸承早期故障檢測研究具有十分重要的現實意義[1]。
振動信號分析方法[2]由于操作簡單,設備研發耗費成本較低且優于其他方法,因此在當前大型旋轉機械設備軸承故障檢測中得到廣泛采用。在振動信號分析方法中,包絡分析[3]是一種常用的振動信號處理技術,其主要包括HHT[4],EMD[5]和 EEMD[6]等方法。但是受振源復雜、背景噪聲隨機以及頻譜混疊等因素的影響,上述方法的檢測效果并不理想[7]。近年來,隨著人工智能技術的迅速發展,智能化已成為故障檢測技術的重要發展方向,而機器學習是提高故障檢測系統智能水平的主要途徑[8]。其中,作為機器學習方法典型代表的支持向量機(Support Vector Machine, SVM)算法,因其良好的非線性區分能力被廣泛應用于機械系統的故障檢測[9]。但是在實際大型旋轉機械設備故障檢測應用中故障類訓練樣本是不易獲取的,從而導致正常類訓練樣本與故障類訓練樣本間數目不均衡。受不均衡數據的影響,SVM算法的檢測性能嚴重下降[10]。因此如何在不均衡數據下提高SVM算法的故障檢測性能成為了眾多學者關注的重點。近些年,相繼提出了各種處理不均衡數據故障檢測的SVM改進算法。其中,代價敏感(Cost-sensitivity SVM, CSSVM)學習方法[11]通過把各類不同錯分代價應用到分類決策中去對SVM進行改造,盡可能地降低了錯誤分類的整體代價;然而因受等式約束限制,算法性能的提升并不明顯[12]。后來提出的基于邊界人工少數類過取樣技術(Border Synthetic Minority Over-sampling Technique, BSMOTE)的代價敏感SVM[13]算法和基于BSMOTE過取樣集成SVM (Ensemble SVM, ESVM)[14]算法雖在一定程度上降低了樣本數據的非平衡度,但是上述算法均是利用已有正常類樣本信息增加規模,容易導致在樣本增加的同時決策域減小,算法過度擬合,從而降低故障檢測精度[15]。為此,學者們將目光投向與SVM原理相似的支持向量域描述(Support Vector Domain Description, SVDD)[16]算法。由于SVDD訓練時不需要故障類樣本,因此較SVM更適合不均衡數據下的軸承故障檢測問題[17]。然而正是因為SVDD沒能考慮到少數故障類樣本信息對決策邊界的影響,使得優化后的決策邊界緊靠正常類樣本一側,導致算法的故障檢測性能不高。事實上,在實際不均衡數據故障檢測應用中,雖然難獲取,但仍可以收集到少數故障類樣本。為了能利用少數故障樣本改善分類界面,學者們提出帶故障類樣本信息的支持向量域描述(Support Vector Domain Description with Negative Samples, SVDD –NEG)[18]算法,該算法通過對正常類和少數故障類中的錯分樣本增加懲罰項來提高算法的泛化性能。然而正如上文所述,故障樣本雖然存在但數量較少,在這種極端不均衡情況下,故障類樣本與正常類樣本混疊概率較低,因此,在實際故障檢測應用中通常要解決的是不均衡數據的可分問題。由于SVDD-NEG采用的是對兩類樣本集的錯分總和進行懲罰來調整分類邊界,當面對可分問題時,兩類樣本集錯分總和通常為零,這時懲罰項將無法起到調整分類邊界的作用。
為此,本文在借鑒傳統SVM算法分類間隔最大化思想基礎上,對SVDD的優化目標進行改進,通過增加正常類與故障類樣本間的最大軟間隔正則項[19],實現調整分類邊界的作用。在此基礎上提出一種基于最大軟間隔SVDD軸承故障檢測模型。該模型通過充分利用少數故障類樣本信息,將分類邊界向故障類偏移,進而提高模型處理不均衡數據的故障檢測性能。實驗部分將本文方法同其他方法進行比較,結果表明本文方法在數據不均衡情況下的軸承故障檢測性能較其他方法有較大幅度提高。