趙茗羽, 陳洪磊, 孫澤賢, 張 怡, 劉曉悅
(1.華北理工大學 國際合作處, 河北 唐山 063000; 2.華北理工大學 電氣工程學院, 河北 唐山 063000)
隨著風能、 傳感器技術和無線通訊技術的快速發展, 風機的健康度評估已經從低級的人為判斷階段向以人工智能技術為基礎的大數據智能化的方向發展。
目前在設備的預診斷和健康管理領域已有多項研究。 文獻[1]引入迭代算法—匹配解調轉換分析收集數據的時域信息,實現軸承的診斷和預警。文獻[2]搭建了馬爾可夫非線性系統,根據發電機所處運行狀態的不同,實時動態地調整系統參數,進而追蹤發電機性能退化蹤跡。 文獻[3]提出了一種基于深度置信網絡的暫態穩定評估方法, 利用深度置信網絡將原始輸入空間映射到低維可分空間, 采用支持向量機和線性分類器對電力系統的暫態穩定進行分類評估。 文獻[4]采用非線性狀態評估技術實現風機齒輪箱故障變化趨勢模型化。文獻[5]結合了時域流信息分析和稀疏信號重構技術,改進了軸承故障信號的提取性能。 文獻[6]基于BP 反向傳播神經網絡和最小支持向量機,建立了最優的組和預測模型, 比較預測值和實際值間的殘差, 通過信息熵理論實現風電機組狀態參數的異常識別。 文獻[7]通過風機出力相關性分析與模糊故障Petri 網相結合,對機組運行狀態進行分類。 文獻[8]提出一種雙向循環神經網絡,并結合局部特征提取技術,實現設備的健康預測。文獻[9]基于深度置信網絡的集成模型,實現了對所用系統剩余有效壽命的預測。
本文首先剖析層次化、機構化的風機結構,為風機的健康度量化分析提供結構知識信息元。 基于“離線分類,在線匹配”的思想,從不同電氣信號的波動性分析出發, 采用變點理論將相近波動水平的電氣信號進行空間劃分; 運用長短期記憶神經網絡學習電氣信號的內部依賴關系, 在預測階段首先匹配測試樣本的波動范圍, 再結合相應的回歸器實現電氣信號的有效預測; 最后提出了一種加權評估方法, 整合多個重要部件電氣信號預測值與實際值間的殘差值, 展開對風機運行健康度的量化分析。
本文主要分析雙饋式風電機組, 其基本參數如表1 所示。

表1 雙饋式風電機組基本參數Table 1 Basic parameters of doubly fed wind turbine
由于風機自身復雜的非線性結構, 風機的失效過程會呈現多態漸變特征。 在評估風機健康度的過程中,需要綜合考量多個子系統。
在時間序列中具有突變性質的數據項稱為變點,本文采用數據項的方差搜索變點,進而實現時間序列數據的分類。
單個SCADA 參數的時間序列可以表示為(x1,x2,…,xn),時間序列的方差由式(1)計算得到。

式中:vi為時間序列第i 個數據點的方差;pj為第j 個數據項;pˉi為該時間序列從第1 個數據項~第i個數據項的均值, 可以有效評估第i 個數據與前i-1 個數據的偏離程度。
計算時間序列每一個數據項的方差后, 依據方差對時間序列進行升序排序,通過式(2)分析數據項的方差變化情況。

式中:k(i)為第i 個時間序列與第i-1 個時間序列的變化值;si為第i 個時間序列;si-1為第i-1 個時間序列。
為了分析在時間序列中突變點的具體位置,本文采用多線性回歸模型在數據空間中搜索變點。

權重wi與樣本k(i)的誤差方差呈反比關系,權重間的比例關系為

式中第j 個數據項即為時間序列中的首個變點。確定首個變點后,在其左右兩側的場景數據中按照上述方式搜索,確定所有變點位置。根據變點理論實現時間序列的離線分類流程(圖1)。

圖1 基于變點理論實現的時間序列的離線分類流程圖Fig.1 The steps of classifying the time series by the changepoint algorithm
對于給定的時間序列X=(x1,x2,…,xn),采用標準的循環神經網絡,通過式(9),(10)計算隱含層輸出ht和輸出層輸出yt。

式中:f 為激活函數;Wxh為連接輸入層神經元與隱含層神經元的權重;Whh為連接上一時刻隱含層神經元狀態與目前神經元狀態的權重;bh為隱含層神經元偏置;by為輸出層神經元偏置。
循環神經網絡能夠有效實現時間序列模型化,但受困于梯度爆炸的問題,可能忽視時間序列內部的長期依賴關系。為了解決這一缺陷,長短期記憶神經網絡(LSTM)模型在非線性映射的設計中引入了門函數的概念, 模型細胞結構如圖2 所示。

圖2 LSTM 隱藏層細胞結構圖Fig.2 LSTM cell structure in hidden layer
在LSTM 模型中,遺忘門、輸入門和輸出門作為保存歷史信息的控制器,其前向計算式分別為

式中:W,U 和b 為LSTM 的參數;It,Ft,Ot,Ct分別為輸入門、遺忘門、細胞狀態和輸出門輸出狀態;σ 為sigmoid 激活函數。
輸入門接收當前樣本的信息, 并傳送到記憶單元。遺忘門決定記憶信息存儲的程度,即從歷史數據中需要提取多少有效的信息。 輸出門結合輸入數據xt和上一時刻的隱含層狀態ht-1,計算4 個控制門后確定輸出值。
LSTM 模型的訓練過程與反向傳播算法基本類似,可以分為3 個步驟:
①前向計算,按照式(11)~(15)計算LSTM 細胞的輸出值;
②反向傳播,計算LSTM 細胞的誤差值,按照時間、網絡層級兩個方向傳播;
③更新權重, 基于梯度優化算法更新連接權重,本文選用適應性動量估計算法進行梯度優化。
風機是一種具有復雜結構的非線性系統,發電機、齒輪箱、葉輪等重要組成部件對其正常運行均有一定的影響。對風機整體進行健康度評估,需要充分考慮各個子系統的運行情況, 由于運行特征的差異,各子系統的健康狀態也會有所不同。因此,為了充分考慮對各子系統的劣化過程,進而實現風機健康狀態的有效分析, 本文采用模糊度函數設計加權評估方法的權重。

式中:Δd 為SCADA 屬性的監測值與LSTM 預測值之間的歐氏距離,二者間的距離越大,則對應子系統包含故障信息量越大, 對風機健康維持作用越小,則相應的權重越小。
因此,風機的運行健康度評估方式為

式中:hj為風機在j 時刻的健康度;n 為風機包含子系統的數量。
本文提出的風機健康度評估模型整合了變點理論、LSTM 和加權評估模型,模型構建主要分為離線和在線兩部分, 離線訓練和在線評估的具體步驟如下。
離線訓練包括:
①選取風機SCADA 監測數據作為訓練樣本;
②對每一個SCADA 選取屬性并進行標準化處理;
③根據變點理論對SCADA 屬性的時間序列進行離線分類;
④基于每一類別的樣本數據, 訓練相應的LSTM 預測模型;
⑤輸出每組LSTM 的參數集合。
在線評估包括:
①對測試數據進行標準化處理, 并進行在線匹配,將測試樣本映射到對應的類別中;
②獲取相應的LSTM 模型對測試樣本的預測值;
③計算SCADA 系統的監測值與LSTM 預測模型輸出值之間的差異;
④按照式(15),(16)對風機運行健康度進行評估。
以正常運行數據作為輸入, 整合各子系統屬性的預測值, 計算與實際監測值的偏差以加權的形式評估風機運行健康度。 選取某風電場一臺風機作為實驗對象,訓練樣本包括14 690 個正常運行數據,測試樣本包括295 個數據,其中包含部分故障數據。
對預測結果的誤差分析能夠有效地評定預測方法的優劣, 不同的誤差計算公式可以反映預測模型的不同特性。 因此, 本文采用均方根誤差(RMSE)、絕對平均誤差(MAE)、偏差(BIAS)以及標準偏差(SDE)4 種評判指標評價預測模型的性能。

為了驗證本文方法的適應性和準確率, 采用本文所提方法、 原始LSTM、ELMAN 神經網絡和ELM 神經網絡對風機的4 個SCADA 屬性進行預測分析, 其中LSTM 的網絡結構設定為5 個輸入層神經元,學習速率為0.1,迭代次數為300。 圖3~6 分別為1 號風機發電機轉速、主軸轉速、液壓站壓力和頂控柜溫度預測結果曲線。

圖3 發電機轉速預測結果Fig.3 The generator speed prediction results

圖4 主軸轉速預測結果Fig.4 The spindle speed prediction results

圖5 液壓站壓力預測結果Fig.5 The hydraulic station pressure prediction results
由圖3~6 可知:在發電機轉速、主軸轉速、液壓站壓力曲線的前半部分中, 本文所提方法與實際值產生了較為明顯的誤差, 發電機轉速和主軸轉速突降為0 而液壓站壓力降低了大約1.5 MPa;頂控柜溫度也呈現類似的波動,此時風機健康度可能出現下降趨勢;ELMAN 神經網絡和ELM 模型在4 種對比模型中性能較差, 且ELM模型極易出現過擬合問題。
為了進一步驗證本文所提模型的預測性能,分別計算RMSE,MAE,BIAS 和SDE 4 種指標(表2)。

表2 采用本文所提方法預測風機參數的性能指標Table 2 The index for forecasting the SCADA parameters of wind turbine by the proposed model
由表2 可知,發電機轉速、主軸轉速、液壓站壓力具有最大的誤差。結合圖6,頂控柜溫度的預測曲線和實際曲線幾乎擬合。 此時風機運行健康度的波動極有可能受到發電子系統或者偏航子系統運行的影響。通過調取風機維修記錄證實,此時風機液壓站出現電壓不正常, 風機故障停機的情況, 即偏航子系統出現劣化導致風機健康度出現了波動。此外,為了從數字化的角度驗證本文所提方法的優越性,表3~5 分別記錄了傳統LSTM、ELMAN 神經網絡、ELM 神經網絡的預測性能。

圖6 頂控柜溫度預測結果Fig.6 The predicted results from proposed model and benchmark models for the top box temperature

表3 采用傳統LSTM 預測1 號風機參數的性能指標Table 3 The index for forecasting the SCADA parameters of wind turbine1 by the traditional LSTM

表4 采用ELMAN 神經網絡預測1 號風機參數的性能指標Table 4 The index for forecasting the SCADA parameters of wind turbine1 by ELMAN

表5 采用ELM 神經網絡預測1 號風機參數的性能指標Table 5 The index for forecasting the SCADA parameters of wind turbine1 by ELM
由表2~5 可知:本文所提方法在4 項SCADA屬性預測領域性能要優于其他3 種模型; 相比于未進行波動性分類的原始LSTM 模型, 在發電機轉速預測中,本文所提方法在RMSE,MAE,BIAS,SDE 4 個指標上分別提高了0.013,0.021,0.014和0.014; 在 主 軸 轉 速 預 測 結 果 中, 在RMSE,MAE,BIAS,SDE 4 個指標上分別提高了0.151,0.058,0.027 和0.127;在液壓站壓力預測結果中,在RMSE,MAE,BIAS,SDE 4 個指標上分別提高了0.010,0.021,0.021 和0.008。
綜合風機SCADA 屬性預測結果, 按照式(15)計算權重,采用SCADA 屬性所對應的發電機轉速權重、主軸轉速權重、液壓站壓力權重和頂控柜溫度權重分別為0.083,0.114,0.153 和0.650。圖7,8 描述了同一時段的風機健康度曲線與有功功率曲線的變化情況。

圖7 風機健康度曲線Fig.7 The trend of the health degree for wind turbine

圖8 風機風電功率曲線Fig.8 The wind power series in the testing period for wind turbine
由圖7,8 可知,風機在前半部分出現故障時,有功功率從1 600 kW 突降為0,其余大部分時刻風機健康度均大于0.6。 結合圖3~6 和表2~5 可知,在此時段內風機可能處于故障狀態,故障的部件可能為發電子系統或者液壓站。
本文基于“離線分類,在線匹配”的思想,將變點理論嵌入到LSTM 中,建立了風機SCADA 正常運行數據的點預測模型, 提高了預測模型的泛化能力與精確度。然后提出了一種加權評估方法,計算子系統參量預測值與實際值的偏差, 偏差較大的子系統權重較小,偏差較小的子系統權重較大,從多維空間考慮風機運行的健康水平。 整合風電機組的多個子系統,共同評估風機運行健康度。最后,將兩臺風機作為訓練對象,從圖形化、數字化的角度共同驗證了本文所提方法在訓練精度方面的優越性。