
中圖分類號:TP399;TK83 文獻標志碼:A
Abstract:With therapid development of thewind power industry,the proportion of wind turbine failures resulting in downtime is also increasing,particularlyyaw system failures,which account for nearlyone-third 0 28.7% )of total downtime. To reduce downtime and operational costs,this paper proposes a deep learning model based on SCADA data,named CNN-smart_Linformer(CNN-SLinformer),for predicting the occurrence time of yaw system failures in wind turbines.This model introduces dynamic self-atention weight calculations for the linear projection matrix,alowing it to adaptively capture changes in the input sequence and significantly enhancing the model'sgeneralization abilityin differentoperating environments.Itcombines the advantages ofconvolutional neural networks(CNN)in local feature extraction with the capability of SLinformer to capture long-term dependencies. Experimental results usingactual SCADA data from wind farms show that the CNN-SLinformer model significantly improvesprediction accuracyforyaw failure tasks,reducing the score to144.5O,while italso hasashorterruntime providing an effective predictive tool for wind farms.
Key words:wind turbine;yaw system; convolutional neural networks (CNN); SLinformer; fault prediction
隨著可持續發展理念深人人心,風電等新能源行業逐漸發展為主流,成為“雙碳”目標實現以及推動綠色發展的重要因素.“雙碳”發展目標與行動方案的落地使得風電產業迎來歷史性機遇.風能作為一種清潔、可再生的能源形式,其重要性正日益凸顯.風能資源分布廣泛、清潔無污染和取用不盡等特點使其發展前景具有巨大空間.相較于其他新能源,風能資源更容易獲取,生產成本低,運行維護簡單,因此,風電成為支持電力系統率先脫碳進而推動能源系統與全社會實現碳中和的主力軍1.然而隨著風電機組單機容量的不斷增加及結構越來越復雜,故障率明顯上升.
風電機組作為風能利用的關鍵設備之一,其穩定運行影響著供電網絡的可靠性和效率.風電機組主要包括葉片、齒輪箱、發電機、變槳系統、偏航系統等關鍵部件.其中,偏航系統是實現風電機組快速、精準對風,捕獲最大風能的關鍵執行機構之一.本文研究以永磁同步電機(PMSM)作為偏航系統的驅動電機,構建包含電流環、速度環和位置環的三閉環控制系統來模擬偏航伺服系統[3],如圖1所示.將風向信號和機艙位置信號之間的誤差送人位置調節器,輸出速度環給定信號,并與機艙轉速做差送入速度調節器,輸出電流環給定信號,再與電機定子電流做差送入電流調節器,最后通過電流控制器輸出三相定子電壓來控制偏航電機進行偏航操作.
圖1偏航系統控制結構
Fig.1 Yaw system control structure

風電機組偏航系統具有連接機艙與塔筒的作用,主要功能是使風輪對準風向及機組自動解纜,其與風電機組運行的經濟性和安全性有極大關聯.風電機組偏航系統承受多重載荷,具有故障頻率高的特點,其產生的故障具有難以排除與修復、更換難度大和費用高等特點[2.4].
隨著機器學習、人工智能等技術的迅速發展,基于風電機組正常行為的預測模型已被廣泛應用于運行狀況監測和故障預測研究5.近年來,針對風電機組偏航故障的預測與診斷問題,基于SCADA(監控和數據采集)數據的方法逐漸成為研究的熱點[4.6-8].SCADA系統作為風電機組中常用的實時監控系統,能夠采集和記錄風機運行時的數據.利用這些豐富的SCADA數據,結合先進的數據分析技術,可以實現對風電機組偏航故障的預測,為風電機組偏航管理提供科學參考和決策支持[8-9].如Kusiak等[10]通過分析SCADA數據,挖掘出了與風電機組軸承、電機等關鍵零部件故障相關的信息:構建數據模型用于揭示主軸和塔架的振動與風電機組運行參量間的關聯特性;利用神經網絡算法,成功診斷出風電機組軸承故障且故障診斷精度高達 96% ,并提早 1.5h 預測到軸承失效.Zhang等[1提出基于信號處理和深度學習理論的EMD-LSTM方法,預測風電機組故障停機發生時間, Wu 等7針對風電機組偏航系統故障處理難度大和危害嚴重,基于SCADA數據開發出了偏航齒輪箱神經網絡故障診斷模型.Bi等[12]將人工智能應用于SCADA數據,并將風力發電機組的預測功率輸出同實際輸出進行比較,以預測誤差作為故障檢測的指標.段圣猛等13提出了一種狀態異常程度指標以識別風電機組狀態的方法,并以同一風電場的2臺同型號機組的SCADA數據進行分析,結果表明能實現機組異常運行狀態識別及早期預警.風電機組故障預測雖引起了業界學者的重視,但現階段針對風電機組偏航系統故障預測的研究還相對較少.
本文旨在基于SCADA數據,探索風電機組偏航故障的預測方法,以進一步提升風電機組偏航故障預測的準確性和可靠性.在構建預測模型時結合機器學習算法和特征工程技術,從SCADA數據中提取關鍵特征,建立能夠準確預測風電機組偏航故障的模型.本研究的主要貢獻如下:
1)從風電場SCADA系統中導出包含多種測量參數的原始運行數據,如葉片轉速、發電機功率、軸承溫度等.針對每臺風機,采用滑動窗口法對這些時間序列數據進行特征抽取,生成包含均值、標準差、最大值、最小值等統計指標的特征向量.同時,將這些SCADA數據樣本與該時段內的風機故障記錄進行時間對齊和關聯,為每個SCADA數據樣本標記“發生故障\"和\"未發生故障\"的標簽.
2)引入動態自注意力權重計算線性投影矩陣,自適應動態地關注輸入序列中不同部分的重要性,增強模型對關鍵信息的提取能力,更準確地提取序列特征,提高模型的性能.
3)將訓練好的模型代人其他不同風機,訓練效果良好,預測發生偏航故障的時間較為精確,表明該模型具有優秀的遷移學習能力,能夠在不同類型、不同環境的風機上發揮出色的性能.
1理論基礎
1.1CNN神經網絡
卷積神經網絡(convolutionalneuralnetworks,CNN)是一種常見的深度學習模型.它使用滑動窗口的方式將卷積核應用到輸入數據的不同局部區域,每次滑動,卷積核都會與局部區域進行一次卷積運算,從而提取出該區域的特征信息.通過這種方式,CNN能夠有效地捕捉局部感知域中的重要特征,最終形成新的特征表示,卷積核遍歷原數據所有特征,卷積運算后求和.通過卷積運算,可以捕獲數據中的局部模式和結構,幫助模型學習到更高層次的抽象特征,從而降低運算成本,提高學習效率[14.改變卷積核與步長大小,可以得到不同大小、樣式的新特征,從而滿足不同網絡的運算需求.通過卷積操作,CNN可以在保留有用信息的同時減少特征的維度,更好地處理輸入數據中的局部關聯性.
1.2Transformer模型
為了應對傳統神經網絡在處理序列數據時存在的長期依賴難以捕捉、計算效率較低等問題,研究者們提出了LSTM、注意力機制、CNN結合RNN等手段,但對于長序列數據,內存限制仍阻礙對訓練樣本的批量處理.2017年提出的Transformer神經網絡架構以一種避免循環的模型結構,完全依賴于Atten-tion機制對輸入輸出的全局依賴關系進行建模,拋棄了傳統的循環或卷積神經網絡結構[5.近年來,在時間序列預測問題上,許多學者嘗試引入Transformer模型以提高預測效果,李川等15基于Transformer模型構建了時間序列預測模型,并以流感病患數量預測作為案例研究,所提模型效果優于其他深度學習模型;楊國亮等[16將Transformer模型應用于實時交通狀況預測中,高效地實現了良好的交通預測;Li等[17]將Transformer模型改進后應用于時間序列預測問題上,實驗結果表明其優于ARIMA、DeepAR和DeepState等許多模型;Nascimento等8改進了時間序列Transformer模型,有效提高了在長時間間隔中預測風速與風能的準確性,同時降低了計算復雜度.
Transformer模型的多頭自注意力機制如圖2所示,多頭自注意力能讓模型的不同位置互相注意到不同子空間的表征信息,它的計算如式(1)所示:
headi=Attention(QWiq,KWiK,VWiV)=

式中: Q,K,V 代表輸入的嵌入矩陣; WiQ
為三個待訓練學習的參數.計算時需要把序列中每個位置的token都兩兩組合,即需要將兩個 n×d 的矩陣相乘,時間復雜度和空間復雜度都是(204號 O(n2)[18]
1.3皮爾遜相關系數
皮爾遜相關系數(Pearsoncorrelationcoefficient)
圖2多頭自注意力機制
Fig.2Multi-headattentionmechanism

是由卡爾·皮爾遜在19世紀80年代提出的,用于度量兩個變量之間的線性相關程度,其值介于-1和1之間,接近-1表示負相關,接近1表示正相關,接近0表示無相關[9].兩個變量的皮爾遜相關系數用它們的協方差與方差的商表示.其定義如式(2)所示:



式(2)估算樣本的協方差和標準差,可得到皮爾遜相關系數 r ,其中
和
分別代表變量 x 和變量 y 的樣本均值.
1.4評價指標
本文使用平均絕對誤差、均方根誤差和評分函數Score三個指標評價模型預測效果.
1)平均絕對誤差(meanabsoluteerror,MAE)用于衡量回歸模型預測誤差的指標,它表示平均預測誤差的大小;MAE的值越小,說明模型的預測誤差越小.其定義如式(5)所示:

式中: yi 為實際值;
為模型的預測值; n 為樣本個數.
2)均方根誤差(rootmean squared error,RMSE)用于衡量預測模型在連續性數據上的預測精度,表示預測值與真實值之間的平均偏差程度.其定義如式(6)所示:

式中: yi 和 f(xi) 分別表示第 i 個樣本的真實值與預測值; m 為樣本個數.
3)剩余使用壽命的評分函數Score,定義為對預測誤差的指數懲罰,通過計算測試數據集中M個單元的所有預測的總得分Score[20].Score評價函數對提前預測的真實值比滯后預測的懲罰程度要小,Score分數越低,預測效果越好.在實際應用中,對核心設備實現故障提前預測,可以及時規避嚴重生產事故,因此 Score 函數更符合預測的實際需求.其定義如式(7)所示:

式中: ?m=1,2,3,…,M;rm 表示機械設備的真實壽命;
rm* 表示模型的預測值.
2基于CNN-SLinformer的風電機組偏航故障預測模型
為了降低多頭自注意力在空間與時間復雜度的開銷,本文使用線性Transformer,即Linformer[21],與CNN結合起來建立風電機組偏航預測模型.其中Linformer通過引入線性投影,將原始的縮放點積注意力機制近似為多個更小規模的注意力計算,使這些操作的組合形成原始注意力的低秩因數分解.在計算 K 和V時添加兩個線性投影矩陣 Ei?Fi ,投影原始的 (n×d) 維鍵 KWiK 和值層 VWiV 分成 (k×d) 維投影鍵和值層,然后使用線性投影的縮放點積注意力計算 (n×k) 維下的映射矩陣 
在計算 K 和 V 之前,使用多頭自注意力機制對輸入序列 X 進行處理,得到動態的注意力權重A,A分別與線性投影矩陣 Ei 和 Fi 相乘得到 Ei′ 和 Fi′ ,解決原始固定的線性投影矩陣 Ei 和 Fi 無法自適應捕捉輸入序列變化的問題.通過引入動態的自注意力權重A,可以讓 Ei 和 Fi 的計算過程受到輸入數據的影響,充分結合動態注意力機制和高效的線性投影的優勢,捕捉輸入序列中的重要信息和依賴關系,讓模型更好地提取關鍵特征,提高模型的動態適應性.其注意力計算如式(8)所示:
通過對模型進行優化,SLinformer預測模型的時間復雜度和空間復雜度都從 O(n2) 降低為 O(n) .空間復雜度的降低,可讓SLinformer模型訓練時所需的參數量更少,從而使模型體積更小.時間復雜度的降低,使得SLinformer在實際應用中可以提供更快的推理速度[22],這對于本文中需要實時預測故障的發生時間非常有利;SLinformer模型不僅提升長序列預測的性能,也降低了內存使用.這樣做可以在保留Linformer原有的線性時間復雜度 O(n) 的基礎上大幅減少參數量,從而降低模型復雜度,提高模型的泛化能力和魯棒性.
針對CNN神經網絡全局信息的建模能力相對較弱和SLinformer捕捉局部特征之間依賴關系不敏感導致預測效果較差的問題,本文提出的基于CNN-SLinformer的風電機組偏航系統故障預測模型,能夠將CNN在局部特征提取方面的優勢與SLinformer在全局信息建模方面的優勢結合起來.CNN-SLinformer的模型結構如圖3所示.
圖3CNN-SLinformer模型結構圖Fig.3 CNN-SLinformer model structure diagram

使用CNN通過滑動窗口的方式在時間維度上對輸人數據進行掃描,通過卷積操作提取多個相鄰時刻的特征,局部特征被組合成一個新的一維特征圖.這些新的一維特征圖整合多個時刻和多個變量在時間維度和空間維度的特征.接著,這些一維特征圖分別被輸入到SLinformer模型中提取通道注意力和時間注意力,通道注意力用于學習不同通道之間的相關性和重要性,而時間注意力則用于建模特征圖中不同時間步長之間的相關性.SLinformer可以有效地捕捉序列數據中的長距離依賴關系.在通道注意力和時間注意力之后,門控機制根據不同特征的重要性,動態地調整它們的權重,更好地整合多個時刻和多個變量的特征信息.最后,通過一個多層感知器(MLP)模型,將融合后的特征映射到目標任務的輸出,即預測下次偏航故障的發生時間.
如圖4所示,風電機組偏航系統故障預測流程主要由5個步驟組成:
步驟1:根據輸人SCADA數據故障樣本標簽采用皮爾遜相關系數法進行特征選擇,對特征選擇完成的數據做窗口滑動和歸一化處理.
步驟2:將處理后的數據輸人CNN-SLinformer模型預測,通過CNN對輸人進行卷積核大小為5、步長為3的多層次特征提取.捕捉不同抽象級別的特征,然后將提取的特征傳入SLinformer模型進行整合建模預測,輸出預測的故障發生時間.
步驟3:計算模型輸出的預測時間與真實時間的誤差值,誤差較大則反向傳播重新開始訓練.根據MAE、RMSE以及Score評價指標對CNN-SLinformer模型的整體預測性能進行評估.
步驟4:對相同故障風機的運行數據進行特征選擇、窗口滑動和歸一化處理.
步驟5:導入處理完成的相同故障風機數據,輸人模型進行預測,然后對比不同機器學習模型的性能與精確度.
實驗數據以“日”為單位進行時間步長切分,并作為模型輸人層的輸入.隨后,一維卷積層在時間維度上提取特征,生成輸出張量.第三層Lambda層從卷積層輸出中提取三個通道的張量,并將每個通道的張量應用于全連接層.通過計算注意力權重,用于對不同時間步的特征進行加權處理,以便模型更關注重要的時間步.接著,拼接層將三個注意力權重張量在第二個維度上進行拼接,隨后重塑層將拼接層輸出的形狀重新調整為三維.將重塑層的輸出與卷積層的輸出進行逐元素相乘,以更好地融合卷積層的特征和注意力權重.通過多頭自注意力對元素相乘層的輸出進行計算,幫助模型自動學習輸入數據中的相關性和重要性.然后,展平層將自注意力層的輸出展平為一維向量.最后,通過全連接層逐漸減少維度并進行特征轉換,生成模型預測的結果.
圖4基于CNN-SLinformer的風電機組偏航系統故障預測流程圖
Fig.4Fault prediction flowchart for wind turbine yaw systembased on CNN-SLinformer

這樣的模型結構能夠充分利用卷積層提取的特征和注意力權重,通過自注意力捕捉輸入數據中的相關性,并生成預測模型的結果.CNN-SLinformer模型涵蓋了對時間步長特征的提取、注意力機制的應用以及特征轉換的操作,能夠更好地理解輸入數據并實現預測.
3實驗驗證
3.1數據來源
本文使用配置為InterI73.0GHzCPU,16GBRAM,GTX1050TiGPU以及系統為Windows1064位操作系統的PC,以TensorFlow為深度學習框架編制Python程序.采用西北某風電場記錄的2021年5月19日至2022年5月18日連續365天的機組運行SCADA數據作為原始訓練數據集,該數據集能夠覆蓋風機在不同運行狀態下的特征,詳細地記錄了機組的運行狀態參數,包括時間、風速、總發電量、環境溫度、發電機轉速、風向角、槳葉片角度、電流信號等57項有效參量,采樣間隔為 10min ,具體示例見表1.
表1SCADA數據實例Tab.1 SCADAdataexample

3.2數據處理與特征選擇
原始數據包含了一些無效數據,如機組啟停、空值記錄等.為了得到好的模型預測效果,需對原始數據進行預處理.按照以下原則剔除無效數據:
1)發電機輸出功率小于零的點;
2)風速小于切入風速,以及大于切出風速的點;
3)發電機轉速小于零的點[23].
剔除無效數據后,為了實現故障預測的目的,需要根據風機運行狀態跟蹤表對SCADA數據進行標記,在SCADA數據中增加狀態列,根據運行狀態跟蹤表對狀態列進行打標,0為正常運行數據,1為偏航系統故障數據.然后使用fillna方法將缺失值使用前一個非缺失值填充[24].填充后,03號風機停機時段如圖5所示,其中2021年8月11日0時至2021年8月14日16時因斷電維修未采集到SCADA數據,其余時間段綠色表示正常運行,藍色為其他故障導致停機,紅色為偏航故障導致停機.
SCADA系統采集的特征眾多,而這些高維度特征中存在著一些冗余和無關特征.數據決定了模型預測效果的上限,當模型輸入維度超過某一界限時,會對模型的預測效果產生一定的影響,降低模型運算效率.因此有必要對原始數據進行特征選擇,提取出對研究目標有用的數據信息[25.為了降低計算成本、提高模型正確率,根據專家知識和現場運維人員的經驗,刪除與偏航故障無關聯的部分特征.
對原始數據進行數據標記和人工特征選擇后,數據特征包含47項.采用皮爾遜相關系數法進行特征篩選,經過兩次計算后得到與偏航系統故障關聯度較高的特征與相關性絕對值,如表2所示,其中1槳葉片角度、2槳葉片角度和 3# 槳葉片角度相關性絕對值相同,可任選其一.選取相關性絕對值較大的總扭纜角度、機艙位置、齒輪箱油池溫度、無功用電量總計和 2* 槳葉片角度五項特征,可以發現所選特征中并非全部都與偏航系統運行狀態有直接關聯,一些特征間接地影響著偏航系統的運行,如果忽略這些特征,模型預測效果可能會出現一定的偏差[26].
表2特征相關性分析
Tab.2Featurecorrelationanalysis

圖6為經過特征選擇的總扭纜角度、機艙位置和皮爾遜相關系數法選擇的齒輪箱油池溫度、2槳葉片角度和無功用電量總計五項特征按時間序列的折線圖.如圖6(a)所示,總扭纜角度波動過大,說明偏航系統無法有效地跟蹤風向變化,可能導致偏航故障發生;如圖6(b)所示,機艙位置的變化直接反映了偏航系統的工作狀態,如果機艙位置波動較大,說明偏航系統無法有效地穩定機艙方向或偏航系統出現故障或磨損;如圖6(c)所示,齒輪箱油池溫度的異常變化可能導致偏航齒輪箱運行狀態惡化,進而影響整個風機的偏航性能;如圖6(d)所示,若槳葉片角度發生大幅波動,則會影響風機的氣動平衡,增加偏航系統的負荷和工作難度;如圖6(e)所示,無功用電量總計的異常變化也可以反映出偏航系統存在潛在問題,當偏航系統出現故障時,若無法有效控制機艙方向,則會導致風機氣動性能下降,從而增加系統的無功消耗.綜合分析這些特征的變化規律,不僅有助于及時發現和診斷偏航故障,還可以為預防偏航系統故障提供依據.
圖503號風機偏航故障停機圖Fig.5Yawfaultshutdowndiagram ofwindturbine


圖6不同特征的時間序列圖

3.3實驗結果及分析
采用CNN-SLinformer模型進行訓練,實驗參數 設置如表3所示.
表3實驗參數設置Tab.3 Experimental parameter settings

圖7為CNN-SLinformer模型損失曲線圖.損失曲線展示了模型在訓練過程中在訓練集和驗證集上的損失表現.通過分析損失曲線,可以評估CNN-SLinformer模型的學習性能,并對其架構或超參數進行必要的調整,以提高模型的有效性.
圖7CNN-SLinformer模型損失曲線圖Fig.7 CNN-SLinformer ModelLossCurve

觀察圖8,在因故障停機前的運行過程中,CNN-SLinformer模型可以提前預測出風機的故障時間,且預測精度在穩步提升.對訓練好的CNN-SLinformer模型進行測試,得到第2次到第14次的風電機組偏航系統預計的故障發生時間,見表4.
從表4可以計算本文所提模型預測的故障發生時間與實際故障發生時間之差,平均相差1.5922d.
圖8CNN-SLinformer模型預測結果Fig.8 CNN-SLinformer model prediction results

表4風電機組偏航系統故障發生時間預測分析
Tab.4 Predictionanalysisoffaultoccurrencetimeofwind turbineyawsystem

從預測精度看,第5次、第8次和第12次故障發生時間預測結果較為精確,時間相差在5小時以內,除去第6次、第10次和第14次故障外,其余的預測差值均在24小時之內.這對于檢修計劃的制訂,適時開展風機的檢修,減少風電機組停機時間,增加風電場效益具有一定的現實意義.
3.4不同模型的預測性能比較
為了驗證本文所提出模型的性能優勢,分別選取CNN-LSTM模型、CNN-BiLSTM模型以及CNN-
Linformer模型進行比較,選用的數據集同上.其中,激活函數選擇ReLU,優化器選擇Adam,迭代次數同樣設定為200次.CNN-SLinformer的參數設置與3.3小節中相同,4種模型的預測結果如圖9所示.
可以直觀地看出,在四種預測模型中,基于CNN-SLinformer預測模型的預測效果穩定且各預測值均在實際值以下,可以實現提前預測.相比較而言,雖然CNN-Linformer模型在前期1O00個樣本點的預測值與實際值走勢比較接近,第1000個樣本點以后偏差要更大,前600個樣本點可以實現對于偏航故障的提前預測,在第600個樣本點之后預測結果在真實值上方,無法實現提前預測,而基于CNN-LSTM和CNN-BiLSTM模型的預測效果較差.通過觀察細節圖9(b),在預測時間段內,CNN-LSTM模型在訓練初期的參數更新不穩定,使得模型無法快速收斂到最優解,預測點估計值偏離實際剩余壽命值較大.觀察細節圖9(c),在預測時間段內,CNN-SLinformer模型的預測值在逐步靠近真實值,而CNN-LSTM、CNN-BiLSTM與CNN-Linformer模型的預測值均高于真實值,且預測精度越來越低.表5列出了四種預測模型的MAE值、RMSE值和Score值,可以更清楚地看出它們預測性能的差異.
圖9模型預測結果對比
Fig.9Comparison of model prediction results

表5實驗結果對比
Fig.5Comparisonofexperimentalresults

從MAE誤差來看,四個模型由小到大的順序為CNN-SLinformer、CNN-Linformer、CNN-BiLSTM和CNN-LSTM,這說明采用先進的深度學習模型以及對數據進行合適的預處理,有助于預測精度的提升,對于Score評價指標,CNN-SLinformer模型得分最低,根據提前預測比滯后預測的懲罰程度小的特性,說明模型可以實現對故障的提前預測且精準度最高.從時間消耗來說,LSTM模型與BiLSTM模型涉及大量的參數更新和矩陣操作,模型的計算復雜度更高,而SLinformer模型在訓練和推理過程中可以利用并行計算的優勢提高計算效率.綜合而言,CNN-SLinformer模型相較于對比模型可以消耗更少的時間預測出更準確的故障發生時間,證明了本文所提的
CNN-SLinformer預測模型的有效性和優越性.
3.5模型泛化性驗證
為了驗證本文所提出的模型在風機故障時間預測的泛化性,選取風電場中同時段發生相同偏航故障的風機進行預測,共選擇05號、07號、13號和17號4臺風機第一次發生故障前的數據進行預測,CNN-SLinformer的參數設置與3.3節相同,4臺風機的預測結果如圖10所示.
圖10其他風機預測結果圖Fig.10 Predictionresultsplot of other wind turbines

在發生故障的05號、13號風機上預測故障的發生時間時,CNN-LSTM模型和CNN-BiLSTM模型預測數據均在距離故障發生時間之上,無法實現對于故障的提前預測.在對07號、17號風機預測時,CNN-Linformer模型與CNN-BiLSTM模型可實現部分時間段的提前預測.在四臺風機的預測過程中,CNN-Linformer預測值均在距離故障發生時間的下方,可實現對于風機偏航故障的提前預測.CNN-LSTM模型、CNN-Linformer模型、CNN-BiLSTM模型預測過程中預測精度下降明顯,CNN-SLinformer模型在離故障發生時間越近時,預測準確率越高.05號、07號、13號、17號風機的最大預測誤差分別是0.725d,0.292d,0.538d,1.214d.05 號與13號風機在預測過程中波動較大,預測誤差極大值出現在預測的中間階段;07號與17號風機預測曲線較為平穩,預測誤差極大值出現在預測的初始階段.結合不同風機、不同模型對于偏航故障發生時間的預測,進一步證明本文所提CNN-SLinformer模型在偏航故障發生時間預測中的精確性與適用性.
4結論
本文針對風電機組偏航系統故障預測問題,提出了一種基于CNN-SLinformer神經網絡的故障時間預測方法.該方法結合了CNN在局部特征提取方面的優勢,以及SLinformer在全局建模和捕捉長期依賴性方面的優勢.首先使用CNN對SCADA數據在時間維度上進行掃描和卷積操作,提取多個相鄰時間步的局部特征,然后將這些局部特征輸人SLinformer中,通過自注意力機制學習特征之間的相關性和重要性,捕捉長期依賴關系.最后,整合多時間步和多變量的特征信息,通過多層感知器輸出下次偏航故障的發生時間預測.在中國西北某風電場的實驗中,該CNN-SLinformer模型在預測偏航系統故障發生時間方面取得了非常好的效果,平均預測誤差僅為1.59d,部分風機的預測時間甚至與實際發生時間相差不到 5h. 與其他主流方法相比,CNN-SLinformer在預測精度、穩定性和計算效率方面都展現出優勢,能夠充分挖掘SCADA數據中蘊含的時空相關信息,提高風電機組故障預測的準確性和可靠性.
在未來研究中,可以考慮結合先驗知識或其他數據源,進一步提高模型在小樣本場景下的泛化能力;還可以探索將該方法應用于其他類型新能源設備的故障預測,期望在更廣泛的應用場景中發揮作用,
參考文獻
[1]WANG Y J,WANG R,TANAKA K,et al. Accelerating the energy transition towards photovoltaic and wind in China[J].Nature, 2023,619(7971):761-767.
[2]HANJL,WANG X,YANGXB,et al. Yaw system restart strategy optimization of wind turbinesin mountain wind farms based on operational data mining and multi-objective optimization [J]. Engineering Applications of Artificial Intelligence,2O23,126: 107036.
[3]MAHESHWARI Z,KENGNEK,BHAT O.A comprehensive review on wind turbine emulators[J].Renewable and Sustainable EnergyReviews,2023,180:113297.
[4]LINM,PORTE-AGEL F.Wake meandering of wind turbines under dynamic yaw control and impacts on power and fatigue[J]. Renewable Energy,2024,223:120003.
[5] 趙順治,林濤,郭衛民,等.風機主軸故障預測診斷與處理方法 研究綜述[J].中國鑄造裝備與技術,2021,56(5):86-94. ZHAOSZ,LIN T,GUOWM,etal. Overview of research on fault prediction,diagnosis and processing methodsof wind turbine mandrel[J].China Foundry Machineryamp; Technology,2021, 56(5):86-94.(in Chinese)
[6]JIN XH,XU ZW,QIAO W.Condition monitoring ofwind turbine generators using SCADA data analysis [J].IEEE Transactions on Sustainable Energy,2021,12(1):202-210.
[7]WU ZY,LIYT,WANG P.A hierarchical modeling strategy for condition monitoring and fault diagnosis of wind turbine using SCADAdata[J]. Measurement,2024,227:114325.
[8]NASCIMENTO EGS,DE MELO TAC,MOREIRADM.A transformer-based deep neural network with wavelettransform for forecasting wind speed and wind energy[J].Energy,2O23,278: 127678.
[9]DAFONSECA SANTIAGO RA,BARBOSANB,MERGULHAO H G,et al.Data-driven models applied to predictive and prescriptive maintenance of wind turbine:a systematic review of approaches based on failure detection,diagnosis,and prognosis [J].Energies,2024,17(5):1010.
[10]KUSIAK A,ZHANGZJ.Analysis ofwind turbinevibrations based on SCADA data[J].Journal of Solar Energy Engineering, 2010,132(3):031008.
[11]ZHANG GY,LIYT,ZHAOY.A novel fault diagnosis method forwind turbine based on adaptive multivariate time-series convolutional network using SCADA data [J]. Advanced Engineering Informatics,2023,57:102031.
[12]BIR,ZHOU C K,HEPBURN D M. Detection and classification offaults in pitch-regulated wind turbine generators using normal behaviour models based onperformance curves[J].Renewable Energy,2017,105:674-688.
[13]段圣猛,張帆,劉杰,等.海上風力發電機組運行數據實時分析 系統[J].船舶工程,2023,45(增刊2):13-17. DUAN S M,ZHANG F,LIU J,et al. Real-time analysis system foroperationdataof ofshore wind turbines[J].ShipEngineering, 2023,45(Sup.2):13-17.(in Chinese)
[14]LIANG PF,DENG C,YUAN X M,et al. A deep capsule neural network with data augmentation generative adversarial networks for singleand simultaneous fault diagnosis of wind turbine gearbox [J].ISA Transactions,2023,135:462-475.
[15]李川,李維華,王迎暉,等.基于transformer的門控雙塔模型預 測H1N1流感抗原性[J].計算機科學,2022,49(增刊2): 71-76. LI C,LI W H,WANG Y H,etal.Predicting the antigenicity of H1N1 influenza by the gated twin-tower model based on transformer[J].Computer Science,2022,49(Sup.2):71-76.(in Chinese)
[16]楊國亮,習浩,龔家仁,等.基于Transformer的短時交通流時空 預測[J].計算機應用與軟件,2024,41(3):169-173. YANGG L,XI H,GONGJR,et al.Short term traffic flow forecasting based on transformer[J].Computer Applications and Software,2024,41(3):169-173.(in Chinese)
[17]LISY,JINXY,XUANY,etal.Enhancing the locality and breaking the memory bottleneck of transformer on time series forecasting[EB/OL].2019:1907.00235.https://arxiv.org/abs/ 1907.00235v3.
[18]HOU Y D,WANG JJ,CHEN ZQ,et al. Diagnosisformer: an efficientrollingbearing fault diagnosismethodbased onimproved TransformerJ].EngineringApplicationsofArtificialIntelligence, 2023,124:106507.
[19]TURNBULL A,CARROLL J,MCDONALD A. Combining SCADA and vibration data intoa singleanomalydetectionmodel to predict wind turbine component failure[J].Wind Energy,2O21,24(3): 197-211.
[20]鄭小東.設備全壽命周期管理與故障預測研究[D].綿陽:西 南科技大學,2021:28-30. ZHENG X D. Research on equipment life cycle management and fault prediction[D].Mianyang: Southwest University of Science and Technology,2021:28-30.(in Chinese)
[21]WANG SN,LI B Z,KHABSA M,et al. Linformer:self-attention with linear complexity[J].ArXiv e-Prints,2O2O:arXiv:2006. 04768.
[22]LU J,YAO J, ZHANG J,et al. Soft: Softmax-free transformer with linear complexity[J].Advancesin Neural Information Processing Systems,2021,34: 21297-21309.
[23]QIU Y N,FENG Y H,INFIELD D.Fault diagnosis of wind turbine with SCADA alarms based multidimensional information processing method[J].Renewable Energy,2020,145:1923- 1931.
[24]MALDONADO-CORREA J, TORRES-CABRERA J,MARTINMARTfNEZ S,etal.Wind turbine fault detectionbased on the transformer model using SCADA data[J].Engineering Failure Analysis,2024,162:108354.
[25]KHAN P W,BYUN Y C.A Review of machine learning techniques for wind turbine’s fault detection,diagnosis,and prognosis[J]. International Journal of Green Energy,2024, 21(4): 771-786.
[26]GAO Z W,ODGAARD P. Real-time monitoring,fault prediction and health management for offshore wind turbine systems [J]. Renewable Energy,2023,218:119258.