劉帥 劉長良 曾華清



摘要:風電機組運行環境惡劣、機組設備衰退是近年來齒輪箱故障頻發的主要原因,其設備狀態與機組安全性、運營成本息息相關。面對這一挑戰,利用監控與數據采集系統數據,提出一種將保局投影、核極限學習機和信息熵相結合的風電機組齒輪箱故障預警方法。采用保局投影對風電機組狀態參數進行特征提取后,使用核極限學習機建立狀態參數預測模型,最后輔以改進的加入信息熵概念,可準確預警異常工況。以河北省張家口某一風電場的運行數據作為實例進行研究,仿真結果表明,所提算法至少能提前2天預警潛在故障,驗證該預警方法的有效性與實效性。關鍵詞:風電機組;故障預警;保局投影;核極限學習機;信息熵
中圖分類號:TH17
文獻標志碼:A
文章編號:1674–5124(2019)02–0121–07
0 引言
風機的運行和維護問題已經成為制約風電產業發展的關鍵因素[1-2]。我國風能資源大多分布在人跡罕至的高山、荒漠、草原或海邊,極其惡劣的環境嚴重影響風電機組的安全可靠運行,導致運行維護成本居高不下。據歐洲風電協會統計,運行維護成本占風電總生產成本的20%~25%,其中海上風電的運行維護成本更高達35%[3]。
監控與數據采集(supervisory control and data acquisition,SCADA)系統作為風電機組狀態監測系統的重要組成部分,它能夠全面記錄含有風電機組故障信息的狀態參數,且獲取較為便捷。因此,目前有很多學者通過對SCADA數據的分析來檢測風電機組的故障。Bangalore等[4]基于SCADA數據建立了檢修計劃模型,其模型依據風電機組的在役年限與機組運行狀態評估故障概率。Antonino等[5]建立3種機器學習模型來監測風電機組的功率曲線;Christopher等[6]根據熱力學第一定律的原理建立了風電機組齒輪箱的故障預警模型,通過齒輪箱溫度的變化數據來估計齒輪箱損傷程度;Edzel等[7]提出多機制建模所得殘差可以有效地預測故障發生前風電機組運行狀況的變化;Qiu等[8]提出了一種基于熱物理學的風電機組傳動系故障診斷方法;Dao等[9]提出了一種基于SCADA數據協整分析的故障預警方法,可以有效分析非線性數據趨勢;Borchersen[10]等通過應用擴展卡爾曼濾波對來自43個渦輪3年的歷史數據發現了15/16個故障。
國內方面:曹夢楠[11]使用SCADA數據,提出一種基于無跡卡爾曼方法的風電機組故障診斷策略;張永輝[12]根據風電場SCADA數據之間的相關程度,實現對風力發電機的潛在故障預警;董玉亮等[13]利用自組織映射網絡檢測機組的早期故障;顏永龍等[14]選擇BP神經網絡和最小二乘支持向量機的組合模型判斷機組健康狀態;劉帥等[15]使用動態時間規整算法提前預警齒輪箱故障,其預警時間可長達數周。
從以上文獻可以看出,其預警方法多采用建立研究對象模型后對比參數殘差確定機組故障[5-7,11-14],引入的不同模型對風電機組故障預警研究有促進作用,但其研究成果在特征提取方面不夠深入;而基于統計學[9]方法對數據的選取要求較高、專業性較強,基于熱物理學[8]方法需要加裝實驗設備,都有現場應用的不便理性。
保局投影[16](locality preserving projections,LPP)是一種由He等人于2003年提出的用于流形學習的算法,具有保持數據集空間結構不變的非線性特點,可用于提取風電機組SCADA數據中高維信息的特征信號。Ding等[17]基于保局投影算法有效完成了滾動軸承分類;Soldera等[18]改進了保局投影算法并應用于人臉識別,取得了更高的識別精度;He等[19]提出了統計學保局投影算法,有效檢測了潛在故障。
核極限學習機(kernel extreme learning machine,KELM)是將原極限學習機[20](extreme learning machine,ELM)中隱含層替換為核函數,使其在速度優勢上進一步提高了精度。Zeng等[21]使用核極限學習機對交通標志進行識別,其結果優于其他方法;Bouzgou等[22]提出了一種結合互信息測量和極限學習機的輻照時間序列的新預測方法,能夠提高太陽輻射預測的準確性;Mouatadid等[23]建立了基于ELM的更高精度的城市用水需求模型。
本文針對風電機組狀態參數具有高維、非線性等特征,通過保局投影提取風電機組狀態參數中代表本征結構的特征向量,再利用核極限學習機對目標狀態參數建立預測模型,最后通過加入信息熵的檢測方法分析目標狀態參數的殘差變化趨勢,監測機組的健康狀況,從而實現機組故障預警的目的。
1 算法基礎
1.1 保局投影算法
保局投影算法可以很好地發掘嵌入在高維數據中隱藏的低維流形信息。
假設高維空間Rn中存在數據點集:X={x1,x2,···,xm},xi∈Rn(i=1,2,···,m),在低維空間Rl(l< 其中,Sij為近鄰的第i個樣本和第j個樣本之間的相似性程度??梢匀∮胟近鄰或ε近鄰的高斯權或均勻權作為相似性度量。 1.2 核極限學習機 極限學習機算法是一種簡單、有效的單隱含層前饋神經網絡(single-hidden-layerfeedforwardneuralnetworks,SLFNs),該方法具有學習速度快、泛化性能好等優點。 對于任意的N個訓練樣本(xj,tj),其中xj=(xj1,xj2,···,xjn)T∈Rn,tj=(tj1,tj2,···,tjm)T∈Rm,含有l個隱含層節點,數學上,激勵函數為g(x)的SLFNs的模型為 式中:wi——wi=(wi1,wi2,···,win)T連接輸入層和第i個隱含層節點的權值向量; βi——βi=(βi1,βi2,···,βim)T連接輸出層和第i個隱含層節點的權值向量; bi——第i個隱含層節點的閾值; yj——與tj相對應的SLFNs輸出節點的計算輸出值。 若模型能夠零誤差地逼近上述N個樣本(xj,tj),可得: 其中,H被稱為神經網絡隱含層的輸出矩陣,其第i列對應第i個隱含層單元的輸出向量;T表示期望模型輸出值。 極限學習機的核心假設為:當激勵函數g(x)是無限可微且參數wi和bi任意指定時,求解線性系統Hβ=T的最小二乘解,即為0誤差逼近樣本解的等價,即 因此,根據廣義逆的相關定理得,需要求解線性系統Hβ=T的最小范數最小二乘解為 其中,H?是隱含層輸出矩陣H的Moore–Penrose廣義逆。 由于ELM中的隱含層映射h(x)和SVM中的核函數映射極為相似,所以可以直接將核函數映射代替ELM中的隱含層映射h(x),此時即為核極限學習機。當h(x)未知時,滿足Mercer條件的核函數主要包括:線性核函數、多項式核函數、RBF核函數、小波核函數等,RBF核函數表達式如下: 其中,σ為核函數的寬度系數。 2 基于LPP-KELM和信息熵的風電機組故障預警方法 本文提出的風電機組故障預警方法有效地結合了LPP算法、KELM算法、信息熵方法,從多屬性、多耦合關系的SCADA數據中預警潛在故障,為現場運維計劃提供有效支撐。 若離散隨機變量X的取值概率用p(x)來表示,則信息熵H(x)可用式(7)來定量表示其不確定程度;同時,信息熵的概念在不同領域應用時,需要改進信息熵[15,24],改進后可得到式(8)。 式中:dom(X)——X的取值范圍; Hd——以統計區間時間長度為單位的信息熵; N——等間隔溫度區間的數目; ni——在統計區間時間長度內的第i個等間隔溫度區間的殘差數目; Td——以統計區間時間長度為單位的總殘差數目。 特別地,當ni=0時不進行統計計算,若存在ni=Td時,熵值為0。 本文所提出的風電機組在線故障預警方法可分為兩部分,如圖1所示。1)離線預警模型生成部分(圖1左側):首先利用健康風電機組的狀態參數數據建立基于LPP-KELM的風電機組狀態參數預測模型,在分析狀態參數預測模型的殘差變化趨勢基礎上,確定預測模型均方根誤差(root mean square error,RMSE)和預測模型殘差的熵值的預警閾值;2)監測預警部分(圖1右側):將已獲取機組SCADA數據輸入到離線時已訓練好的預測模型中,獲得機組當前的目標狀態參數預測值,然后利用RMSE、信息熵方法雙重檢驗,基于RMSE和殘差熵值閾值判斷機組的狀態是否異常。其中,雙重檢驗中兩種方法的時間尺度可不一致,以滿足不同時間尺度預警需求。其中,監測預警部分具體算法實施步驟為: 1)將風電機組SCADA數據按LPP算法步驟進行特征提取。 2)將特征向量輸入到離線時已訓練好的KELM預測模型,得到監測狀態參數預測值。 3)將監測狀態參數預測值與實測值對比,獲取殘差的變化趨勢。 4)以連續相同長度時間段為統計區間,計算目標狀態參數預測模型的均方根誤差及殘差的熵值。 5)當均方根誤差大于離線時確定的均方根誤差閾值,且殘差熵值大于離線時確定的熵值閾值時,判定機組運行異常;反之則說明目標狀態參數預測模型的監測狀態參數變化不劇烈,返回步驟1)繼續監測。 3 實例分析 3.1 案例背景及算法設定 本節選取河北省張家口某變速變槳恒頻風力發電機組在2017年的實際運行數據,對風電機組故障預警方法分別在機組健康狀態下和異常狀態下的應用進行仿真研究。該機組額定功率為1.5MW,切入風速為3m/s,切出風速為25m/s,SCADA系統每隔10min記錄一次采樣數據。 數據預處理:根據一定時間間隔選取合適數據數目,確定所選數據包含風電機組各類運行工況,并剔除機組輸出功率為0或者負值、風速小于切入風速(3m/s)和風速大于切出風速(25m/s)以及風速小時對應的機組輸出功率大等的樣本點,認為這些數據點為機組非正常運行狀態下的數據點。 LPP-KELM模型生成部分,輸入盡可能選取與監測目標相關的測點,本例中選取風速、發電機轉速、葉輪轉速、風向角、環境溫度、機艙溫度、發電機溫度、功率、齒輪油溫度作為輸入。 異常預警方面,RMSE、信息熵方法雙重檢驗的時間尺度都采用為1d。當兩個監測狀態參數經處理后都超出閾值時,才判定有潛在故障;否則,當有一種預警方法超出預警時,異常處于不明朗狀態,可作為預警前兆,保持持續關注即可。 3.2 生成離線預警模型 選取機組連續正常運行20d的1775組風電機組狀態參數數據作為測試數據樣本(見圖2),生成所提預警方法在機組正常狀態下的預警模型。 由圖可知,齒輪箱軸承溫度在50~69°C之間變化,未超出風電場監控系統的報警閾值,并且風電機組正常運行條件下的齒輪箱溫度波動劇烈,由于其變化影響因素較多,無法直接總結其變化規律。 將健康狀態測試數據樣本代入預測模型中,獲得齒輪箱軸承溫度預測模型的殘差曲線。齒輪箱軸承溫度殘差曲線如圖3所示。大部分殘差集中在–2~2°C,最大值不超過6°C。通過對照圖2,可得知:LPP-KELM模型在氣象波動劇烈處殘差比氣象穩定時大。將殘差曲線轉化殘差數據對應的直方圖,如圖4所示。溫度殘差直方圖反映了殘差在各個溫度區間的分布情況,可知其分布基本符合正態分布情況。 圖5為齒輪箱軸承溫度的RMSE變化趨勢,機組正常狀態下,齒輪箱軸承溫度預測模型的RMSE在0.2~0.6°C之間變化,RMSE的變化劇烈程度較小;熵值變化趨勢如圖6所示,這表示機組正常狀態下的殘差熵值在0~1.7之間變化,主要集中于0附近。因此,風電機組在正常狀態下,參數預測模型的RMSE和殘差熵值都變化較小。 通過以上分析,可以得到風電機組在健康狀態下監測機組的異常預警值:殘差預警閾值為6°C,RMSE預警閾值為0.6°C,熵值預警閾值為1.7。至此完成離線預警模型的生成部分。 3.3 異常狀態監測預警 選取同一機組發生故障前連續運行16d的1000組風電機組狀態參數數據,驗證基于LPP-KELM和信息熵的風電機組故障預警方法在機組異常狀態下的有效性。其齒輪箱軸承溫度的變化情況見圖7。 由圖可知齒輪箱軸承溫度隨機組狀態變化而變化,但變化幅值均沒達到報警值,也無明確規律。將圖7與圖2相對比可得,無論機組狀態如何,齒輪箱軸承溫度的變化趨勢大致相同,這說明通過直接觀察齒輪箱軸承溫度的變化趨勢無法判斷機組狀態是否出現異常。 根據LPP-KELM預測模型獲得預測模型殘差的變化曲線如圖8所示,可看到數據樣本點越接近故障發生點(圖8中紅色星點,第991個數據樣本),齒輪箱軸承溫度預測模型的殘差變化幅值就越大,超越了正常狀態下的殘差閾值6°C,但卻只存在個別數據樣本點,這很難判斷這些個別數據樣本點是否是異常點還是干擾點。 圖9、圖10分別為齒輪箱軸承溫度預測模型的RMSE變化趨勢圖,以及齒輪箱軸承溫度預測模型的殘差熵值變化趨勢圖。由圖9可知,RMSE值已經在第9d超過了RMSE的閾值0.6°C,對照查看圖10,發現熵值處于增大趨勢,但熵值并未超出預警閾值,可作為故障預警前兆,故而繼續保持監測。在第10d、11d,RMSE值與熵值都回歸至正常水平,無超出預警值;第12d,熵值接近報警閾值1.7,但并未超越,RMSE值正常。經歷第13d的平穩期后,第14dRMSE值、熵值全部超出預警閾值,正式預警。至此,本文所提LPP-KELM與信息熵結合的故障預警方法得到驗證。 若單獨分析圖9、圖10,可知RMSE值在故障發生前3天變化較劇烈,這表明,在機組發生故障前2天,RMSE值的變化趨勢已與機組正常狀態的產生差異。從圖10觀察出殘差熵值出現波峰愈加增大的趨勢。故而可印證上述故障預警的正確性,即當前機組即將發生齒輪箱故障。 4 結束語 本文研究了保局投影、核極限學習機、信息熵相結合的風電機組故障預警方法,建立了風電機組狀態參數預測模型,并基于歷史SCADA數據確定了故障預警閾值。采用保局投影方法提取機組特征向量,可削弱無關特征和非線性對風電機組狀態參數預測結果的影響;基于LPP-KELM的風電機組狀態參數預測模型及添加信息熵后的雙重檢驗方法保證了風電機組故障預警的準確性。仿真結果表明,所提方法能夠有效地挖掘出風電機組SCADA數據變化趨勢中隱藏的機組狀態信息,達到了風電機組故障預警的目的。 參考文獻 [1]DAWOUDSM, LINX, OKBAMI.Hybridrenewablemicrogridoptimizationtechniques: Areview[J].RenewableandSustainableEnergyReviews, 2017, 82(3): 2039-2052. [2]ALHMOUDL, WANGB.Areviewofthestate-of-the-artinwind-energyreliabilityanalysis[J].RenewableandSustainableEnergyReviews, 2017, 81(2): 1643-1651. [3]HAMEEDZ, HONGY, CHOY, etal.Conditionmonitoringandfaultdetectionofwindturbinesandrelatedalgorithms: Areview[J].RenewableandSustainableEnergyReviews, 2010, 13(1): 1-39. [4]BANGALOREP, PATRIKSSONM.AnalysisofSCADAdataforearlyfaultdetection, withapplicationtothemaintenancemanagementofwindturbines[J].RenewableEnergy, 2018, 115(1): 521-532. [5]MARVUGLIAA, MESSINEOA.Monitoringofwindfarmspowercurvesusingmachinelearningtechniques[J].AppliedEnergy, 2012, 98(10): 574-83. [6]GRAYCS, WATSONSJ.Physicsoffailureapproachtowindturbineconditionbasedmaintenance[J].WindEnergy, 2010, 13(5): 395-405. [7]LAPIRAE, BRISSETD, ARDAKANIHD, etal.Windturbineperformanceassessmentusingmulti-regimemodelingapproach[J].RenewEnergy, 2012, 45(9): 86-95. [8]QIUY, FENGY, SUNJ, etal.ApplyingthermophysicsforwindturbinedrivetrainfaultdiagnosisusingSCADAdata[J].IETRenewablePowerGeneration, 2016, 10(5): 661-668. [9]DAOPB, STASZEWSKIWJ, BARSZCZT, etal.ConditionmonitoringandfaultdetectioninwindturbinesbasedoncointegrationanalysisofSCADAdata[J].RenewableEnergy, 2018, 116(2): 107-122. [10]BORCHERSENAB, KINNAERTM.Model‐basedfaultdetectionforgeneratorcoolingsysteminwindturbinesusingSCADAdata[J].WindEnergy, 2016, 19(4): 593-606. [11]曹夢楠,邱穎寧,馮延暉,等.基于無跡卡爾曼方法的風電機組齒輪箱故障診斷[J].太陽能學報,2017,38(1):32-38. [12]張永輝.基于監測數據的風力發電機故障預警研究[D].沈陽:沈陽工程學院,2017. [13]董玉亮,顧煜炯.基于保局投影與自組織映射的風電機組故障預警方法[J].太陽能學報,2015,36(5):1123-1129. [14]顏永龍,李劍,李輝,等.采用信息熵和組合模型的風電機組異常檢測方法[J].電網技術,2015,39(3):737-743. [15]劉帥,劉長良,甄成剛,等.基于群體多維相似性的風機齒輪箱預警策略[J].儀器儀表學報,2018,39(1):180-189. [16]HEXF, NIYOGIP.Localitypreservingprojections[A].In: ProceedingofNeuralInformationProcessingSystem[C],Vancouver, Canada, 2003: 153-160. [17]DINGX, HEQ, LUON.Afusionfeatureanditsimprovementbasedonlocalitypreservingprojectionsforrollingelementbearingfaultclassification[J].JournalofSoundandVibration, 2015, 335(20): 367-383. [18]SOLDERAJ, BEHAINECAR, SCHARCANSKIJ.Customizedorthogonallocalitypreservingprojectionswithsoft-marginmaximizationforfacerecognition[J].IEEETransactionsonInstrumentationandMeasurement, 2015, 64(9): 2417-2426. [19]HEF, XUJ.Anovelprocessmonitoringandfaultdetectionapproachbasedonstatisticslocalitypreservingprojections[J].JournalofProcessControl, 2016, 37(1): 46-57. [20]HUANGGB, ZHUQY, SIEWCK.Extremelearningmachine: theoryandapplications[J].Neurocomputing, 2006, 70(1/3): 489-501. [21]ZENGY, XUX, SHEND, etal.Trafficsignrecognitionusingkernelextremelearningmachineswithdeepperceptualfeatures[J].IEEETransactionsonIntelligentTransportationSystems, 2017, 18(6): 1647-1653. [22]BOUZGOUH, GUEYMARDCA.Minimumredundancy-Maximumrelevancewithextremelearningmachinesforglobalsolarradiationforecasting: Towardanoptimizeddimensionalityreductionforsolartimeseries[J].SolarEnergy, 2017, 158: 595-609. [23]MOUATADIDS, ADAMOWSKIJ.Usingextremelearningmachinesforshort-termurbanwaterdemandforecasting[J].UrbanWaterJournal, 2017, 14(6): 630-638. [24]LIUXL, XUXL, JIANGZL, etal.Applicationofthestatedeteriorationevolutionbasedonbi-spectrumentropyandHMMinwindturbine[J].Chaos, Solitons&Fractals, 2016, 89(8): 160-168.