摘 要: 齒輪箱是風電機組的關鍵設備,其性能一旦退化至失效狀態,會造成嚴重的安全隱患。為動態掌握齒輪箱的退化過程,提出一種基于核熵成分分析與維納過程的剩余壽命預測方法。數據預處理時,使用隨機森林算法剔除離群點和異常值,并通過皮爾遜算法選取與齒輪箱退化相關度高的多個特征。通過核熵成分分析方法在高維空間中進行主元分析,選取信息保有量較大的主元,達到數據降維的目的。隨后,使用維納過程對風電齒輪箱的剩余壽命進行預測。以河北某風場實際數據為例,結果表明:分別使用3 000、4 000、5 000 個點進行預測時,提出方法的預測誤差分別為12.72%、10.52%、6.05%,顯著優于對比方法。
關鍵詞: 風電齒輪箱; 剩余壽命預測; 核熵成分分析; 維納過程; 隨機森林算法
中圖分類號: TB9; TK83 文獻標志碼: A 文章編號: 1674–5124(2024)12–0156–07
0 引 言
風力發電是新能源發電的重要組成部分,大力發展風電產業是完成碳達峰、碳中和任務的重要途徑之一。然而,隨著風電裝機容量的提升,風電機組齒輪箱已成為影響風電機組安全運行的重要因素,其故障率在主要設備中排在第四位[1],造成了巨大的經濟損失。齒輪箱作為風電機組傳動鏈的重要設備,其故障頻率與維護成本較高,且發生故障后通常只能進行大修或整體更換,停機時間相對較長。為動態掌握風電齒輪箱的可靠性,有必要對其剩余壽命進行準確預測,預防嚴重事故,降低維護成本[2]。
針對上述問題,國內外學者做了大量研究與實驗。當前風電齒輪箱壽命預測方法主要分為兩類:基于物理模型的方法和基于數據驅動的方法。隨著風電機組的發展,機組規模逐漸大型化、機組之間的聯系逐漸復雜化,而精準的物理模型需要較為專業的技術支持,并且具有泛化性差的缺點,因此基于物理模型的壽命預測方法變得愈加困難。數據采集與監視控制系統(supervisory control and dataacquisition,SCADA) 可以對風電機組整體狀態進行實時監測[3],基于數據驅動的壽命預測方法因具有不需要被檢測對象的先驗知識和良好的泛化性的特點,近些年來受到普遍關注[4-6]。
但風電機組SCADA 數據較為龐雜,為了降低算法的空間復雜度,部分學者對SCADA 數據進行降維處理。文獻[7] 和文獻[8] 基于核主成分分析(kernel principal component analysis, KPCA)對風電機組數據進行降維,但風電機組SCADA 數據有較強的非線性特征,KPCA 方法無法提取有效特征;文獻[9] 將核熵成分分析 (kernel entropy componentanalysis, KECA) 引入到風電機組狀態檢測中,并且使用SPE 統計量來對故障進行預警,之后使用廣義回歸神經網絡(general regression neural network,GRNN) 進行預測,但GRNN 計算較為復雜,空間復雜度高,內存占用較多,在線使用時難以發揮優勢;文獻[10] 使用KECA 算法、改進灰狼算法以及核極限學習機來對間歇過程故障進行診斷,實驗證明KECA 擁有較強的深度特征提取能力和非線性特征提取能力。
在退化模型方面,維納過程由于其優秀的預測性能被廣泛應用于其他工業設備退化研究方面。并且由于退化過程大多具有一致性,近年來維納過程也在風電機組設備剩余壽命預測中取得一定成果。文獻[11] 使用PCA 方法對軸承數據進行特征提取,通過維納過程對風電軸承剩余壽命進行預測,并且使用貝葉斯方法在線修改模型參數,但針對數據量較大、非線性特征較強的SCADA 數據,PCA 方法并不能完全表征其特征。文獻[12] 將維納過程和粒子濾波結合,增強了模型的非線性表達能力,但針對軸承使用的震動數據與SCADA 數據相比耦合度低,非線性特征少,不適合風電機組齒輪箱的壽命預測。
針對上述問題,本文首次將KECA 和維納過程結合,提出了基于KECA 和維納過程的風電機組齒輪箱剩余壽命預測算法。以河北某風電場實際SCADA 數據為算例,對風電齒輪箱進行了壽命預測研究,并根據實際故障驗證了提出方法的有效性。