馬軍巖 袁逸萍 柴 同 趙 琴
新疆大學機械工程學院,烏魯木齊,830047
風力發電具有清潔性和可持續性特點,已成為解決能源與環境問題的重要戰略之一[1]。風電機組的故障率隨風速變化具有時變性,短期風速預測值會直接影響風電機組的運行可靠性評估結果[2],因此風速預測結果也被認為是風電場運行與維護的重要依據[3]。現有研究主要針對整個風電場區域進行風速預測,主要研究方法包括基于數值氣象預報(numerical weather forecast,NWP)模型的后處理法和基于統計模型的外推法。文獻[4-6]探討了卡爾曼濾波(Kalman filtering,KF)作為后處理方法來修正NWP模型的預測結果,提高了數值預測的精度。ZHAO等[7]結合非線性自相關網絡和混合核密度估計法對NWP風速數據誤差進行了校正優化。DING等[8]采用門控循環單元(gated recurrent unit,GRU)修正了NWP風速數據。WANG等[9]提出了一種針對NWP風速的序列傳遞校正算法(sequence transfer correction algorithm,STCA)。上述研究中的NWP模型均基于中尺度模式,空間范圍遠大于單個風電機組所占面積,且時間上為提前一天預測風速。綜合考慮空間和時間尺度,基于NWP模型的外推法預測粒度過大,無法適用于風電機組輪轂處的短期(6 h以內)風速預測。
基于統計模型的外推法通常使用統計模型對測風塔風速序列的時間演化進行建模來預測整個風場范圍內的平均風速。相關研究模型包括自回歸(AR)模型、自回歸移動平均(ARMA)模型、人工神經網絡(ANN)及深度學習(DL)模型等[10-14]。為了克服單個模型的不穩定性和各自的缺點,部分學者將各種預測方法與不同的預測框架和策略合理地結合起來,從而產生更強的預測器,以獲得更準確和穩健的預測結果。MONFARED等[15]利用模糊邏輯和神經網絡對風速時間序列統計特性進行了建模。POURMOUSAVI KANI等[16]使用ANN和Markov鏈來捕獲風速時間序列中的特征。CHEN等[17]將支持向量回歸(support vector regression,SVR)與KF相結合,實現了風速的動態預測。ZHANG等[18]采用變分模態分解-小波變換(variational mode decomposition-wavelet transform,VMD-WT)方法將原始風速進行二次分解,采用徑向基(RBF)網絡分別預測各子序列,再合成為最終的風速預測值。MA等[19]分別對原始風速序列和誤差序列進行模態分解,利用長短期記憶(long short-term memory,LSTM)網絡對各子序列進行預測,得到了修正后的預測值。上述統計外推法基于歷史數據進行預測,缺乏對實時氣象風速變化的考慮,預測模型中包含的規則種類有限,且由于存在時間序列慣性,在風速驟變情況下其變化規律與模型訓練所得規則無法匹配,會產生較大的時間序列慣性誤差,導致短期風速預測效果較差。
本文將監控與數據采集(supervisory control and data acquisition,SCADA)系統記錄的近期風速序列外推法和NWP風速后處理法相結合,以期避免統計外推法導致的相位誤差、估計規則無法匹配等問題以及基于NWP模型的預測粒度過大的缺點。建立卷積神經網絡與門控循環單元(convolutional neural networks and gated recurrent units,CNNGRU)模型和Elman模型分別對SCADA近期風速序列的趨勢項和細節項進行預測,并對誤差部分進行概率擬合。結合NWP風速降尺度模型和廣義自回歸條件異方差(generalized autoregressive conditional heteroscedasticity,GARCH)模型進行誤差修正,從而提高風速驟變情況下的短期風速預測精度。
由于風速數據本身具有非線性和非平穩的特點,如果直接將原始風速序列應用于模型預測,則無法獲得準確穩定的預測值[20],因此,在風速預測中,時間序列分解(time series decomposition,TSD)方法等數據預處理方法越來越受到研究者的重視[21]。例如,經驗模態分解(empirical mode decomposition,EMD)[22]和集成經驗模態分解(ensemble empirical mode decomposition,EEMD)[23]被研究人員廣泛用于處理原始時間序列。雖然這兩種數據處理方法可以在一定程度上捕捉到風速數據的有效信息,但仍存在EMD模式混合問題、EEMD風速數據存在殘差噪聲等缺點。EMD和EEMD缺乏嚴格的數學理論[24],針對這些方法的不足,本文采用變分模態分解(variational mode decomposition-wavelet transform,VMD)[25]方法對風速序列進行處理,獲取有效信息,減少不確定性。
VMD利用固有模態函數(intrinsic mode function,IMF)將信號分解為K個固有模態,提取相應IMF的中心頻率,使得模態uk在中心頻率ωk附近波動。VMD算法可分為構造變分問題和求解變分問題兩個過程。VMD分解原始信號時,變分問題可表示為
(1)
式中,K為需要分解的模態總數量;uk(t)為第k個模態分量函數;ωk為第k個模態分量的中心頻率;f(t)為原始輸入信號;δ(t)為單位脈沖函數;t為時間;*為卷積運算符。
通過引入懲罰因子α和拉格朗日乘子λ(t),將約束變分問題轉化為無約束變分問題:
L({uk},{ωk},λ)=
(2)
其中,{uk}={u1,u2,…,uK},表示分解得到的K個模態分量,{ωk}={ω1,ω2,…,ωK},表示各模態分量的中心頻率。采用交替乘法求解無約束變分問題,即通過交替更新uk、ωk和λ,得到擴展拉格朗日表達式的最小值。uk、ωk和λ的表達式如下:
(3)
(4)

(5)

VMD首先根據原始信號的特征劃分頻帶,然后對每個IMF及其對應的中心頻率進行連續更新,最后根據約束條件實現原始信號的自適應分解。
由VMD得到的風速時間序列的主趨勢分量不僅具有長短期時間的相關性,而且具有風速變化規律的深層隱含特征。為預測主趨勢分量,設計了CNNGRU網絡。在CNNGRU網絡中,卷積層用于捕獲深度特征,而GRU層用于獲取長-短時間依賴關系。
卷積層利用過濾器自動提取特征,本文設計的卷積層一共包括兩層卷積,第一層為4個大小為3×1的卷積核,第二層為36個大小為3×1的卷積核。對于相同的卷積層,神經元之間不存在連接,權值可以共享。在正向傳播階段,每個卷積層對前一層的輸出進行函數激活和卷積運算。
卷積的最后輸出層(X1,X2,…,XC)作為GRU的輸入,每一個Xc都包含一個向量,其數量與卷積層的最后一層輸出相同。此外,以序列(Y1,Y2,…,YC)為訓練標簽,表示風速序列的主要趨勢分量。GRU采用遞歸網絡單元從c=1到c=C逐步映射輸入與輸出關系。在第C步GRU單元的激活計算過程參考文獻[25]。在本研究中,采用Adam算法[26]作為優化函數。
具有前饋連接結構的Elman神經網絡是一種簡單的循環遞歸神經網絡(recurrent neural network,RNN)模型。它可以存儲來自隱含層的輸出信息,并在下一次迭代中轉發之前的狀態,因此具有快速存儲短期時間序列中所包含信息的特點[27]。由于風速時間序列往往具有短期依賴性,因此Elman神經網絡是風速預測的良好選擇。

(6)
(7)
(8)
式中,εt為白噪聲序列;δt為條件方差;ηl、ζm為負時變系數。
由于風速誤差ξt(式(7))具有時變性,且其條件方差滿足式(8),因此誤差ξt符合GARCH(p,q)模型要求。
拉格朗日乘子(Lagrange multiplier,LM)統計量如下:
λ=br2~χ2(q)
(9)
其中,b表示樣本數量,r2表示擬合度,χ2表示卡方分布函數。采用拉格朗日乘子λ確定是否有必要建立GARCH模型。如果λ值大于χ2(q),則采用GARCH模型修正預測結果。在本研究中,利用標準GARCH(1,1)模型修正預測結果。
選取中國新疆某風場的歷史風速數據作為案例分析的對象,其中包括3組2.0 MW風電機組SCADA系統的歷史風速數據和同一時期的風場NWP風速數據。數據集1為2018年11月份70 m高空NWP風速序列和13號機組SCADA系統記錄的10 min平均風速序列;數據集2為2018年10月份70 m高空NWP風速序列和22號機組SCADA系統記錄的10 min平均風速序列;數據集3為2018年1月份70 m高空NWP風速序列和4號機組SCADA系統記錄的10 min平均風速序列,每組風速序列包括3000個樣本。
提出一種將統計預測法和NWP模型輸出集成到一個統一框架中的風速預測與誤差修正策略。風速預測模型的建立主要分為數據處理、組合模型的建立和風速預測的有效性驗證三個部分。本文以數據集1為例詳細介紹這三部分的實現過程。組合預測模型的整個架構如圖1所示。

圖1 組合預測模型架構Fig.1 Framework of combined forecasting model
風速數據處理過程如下。
(1)采用VMD將 SCADA系統記錄的歷史風速序列分解為多個不同頻帶的子序列,如圖2所示。趨勢項包含長短期依賴關系,細節項子序列包含風速短期相關性。由于所有固有模態函數相加所得結果與原始信號之間存在誤差,本文提取了VMD算法的誤差序列,記作ER。

(a)IMF5風速
(2)對每個子序列樣本進行熵值計算,計算結果如表1所示。熵值越大,序列混亂程度越高。采用VMD算法分解原始信號時,需要設定帶寬參數,本文通過對比各模態分量的熵值,得知當帶寬參數設定為3830時,分解所得各子序列熵值之和小于原始風速序列熵值,且子序列樣本熵值呈均勻遞減趨勢,能夠更好地區分各子序列。

表1 VMD分解后的各子序列樣本熵值Tab.1 Sample entropy of each subsequence in VMD decomposition
風速預測組合模型建模過程如下。
(1)分別建立各IMF子序列的預測模型。趨勢項為低頻非線性序列,其變化趨勢不僅依賴于風速的短期變化,而且與風速的長期變化規律緊密相關。為了提取風速序列變化的深層特征,準確預測風速序列變化趨勢,基于趨勢項的主成分建立CNNGRU網絡,數據集中SCADA風速序列的前2000個數據作為訓練集,后1000個數據作為測試集。2018年11月1日至2018年11月30日期間13號機組輪轂處風速時間序列趨勢項的特征提取結果如圖3所示。其余各子序列表征SCADA風速變化的詳細過程,其變化依賴于短時間內風速序列所包含的信息,因此針對其余各子序列分別建立Elman神經網絡,預測各子序列的變化。由于各模態分量相加所得結果與原始風速信號之間存在誤差,因此擬合ER序列的概率分布,得知誤差序列符合正態分布,并計算其分位數,得到90%置信度時ER序列的分位數為1.2711,70%置信度時ER序列的分位數為0.5204。

圖3 低頻序列的特征提取Fig.3 Feature extraction of low frequency sequence
(2)考慮導致風速預測效果變差的原因是風速在某一時刻變化趨勢發生突變,即風速由上升變為下降或反之,降尺度后的NWP風速數據在一定程度上可以對實際風速的突變拐點進行有效預測[29]。基于NWP風速序列和目標風電機組SCADA實測風速序列,建立數據集1的NWP風速的SVR回歸模型,如圖4所示。利用降尺度模型對NWP風速進行降尺度計算,將風電場范圍內的大尺度NWP風速映射為目標風力發電機輪轂處的風速。

圖4 NWP風速降尺度模型Fig.4 Downscaling model of NWP wind speed

(1)確定性預測結果的評價。選取平均絕對誤差(mean absolute error,MAE)、均方誤差(mean square error,MSE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)作為誤差評價指標,預測誤差的范圍、平均值和標準差作為穩定性指標。MAE、MSE、MAPE的值越小,預測的精度越高。通過上述各個指標對各預測模型性能進行對比。計算公式如下:
(10)

(2)不確定性預測評價。根據預測區間的直徑和實際值的覆蓋率,可以評估區間預測的效果。覆蓋范圍越大,區間預測的可靠性越高。間隔寬度越小,靈敏度越高。計算區間直徑和覆蓋率的計算公式如下:
(11)
(12)

為驗證該模型的預測性能,將該模型應用于3個數據集進行測試并將所提出的混合模型(VMD-CNNGRU-Elman-NWPE)與其他6個模型的預測結果作對比。涉及的模型包括持續法(autoregressive integrated moving average,ARIMA)模型、Elman模型、CNNGRU模型、VMD-Elman模型、VMD-CNNGRU-Elman模型、VMD-CNNGRU-Elman-E模型和VMD-CNNGRU-Elman-NWPE模型。各模型在3個數據集上的評價指標結果如表2所示。
在數據集1和數據集3中,由于未來6 h內SCADA風速與降尺度后的NWP風速有共同風速拐點,故在共同拐點處以NWP風速拐點為依據進行風速修正,由表2評價指標結果可知,VMD-CNNGRU-Elman-NWPE組合預測模型在短期風速預測中表現良好,具有更高的預測精度;數據集2在未來6 h內SCADA風速與降尺度后的NWP風速沒有共同風速拐點,修正結果與初步預測結果相同,即VMD-CNNGRU-Elman-NWPE與VMD-CNNGRU-Elman-E組合預測模型的精度相同。

表2 各模型在3個數據集上的評價指標結果Tab.2 Evaluation index results of each model in three datasets
由于風電場中風資源的不確定性、數據采集系統的固有測量誤差及現有的流場模型參數設置誤差等不可避免的影響因素,使得預測風速與實際風速之間必然存在偏差,本文所提VMD-CNNGRU-Elman-NWPE組合模型綜合考慮風速變化趨勢的深層特征提取與拐點處誤差修正策略,預測偏差在3.85%以內。通過對比圖5~圖7中各模型的預測結果可知,所提模型提高了預測精度,適用于風速驟變情況下的短期風速預測。

圖5 數據集1的確定性預測結果Fig.5 Deterministic prediction results of dataset 1

圖6 數據集2的確定性預測結果Fig.6 Deterministic prediction results of dataset 2

圖7 數據集3的確定性預測結果Fig.7 Deterministic prediction results of dataset 3
本文給出以數據集1為研究對象的不同置信水平(70%,90%)下風速區間預測結果,如圖8所示。從圖8中可以看出風速預測的90%置信度區間寬度大于70%置信度區間寬度,風速實際值大部分落在90%置信度區間內,少部分落在70%置信度區間外,不確定性預測結果符合概率統計規律,滿足實際情況。

圖8 數據集1的區間預測結果Fig.8 Interval prediction results of dataset 1
表3反映了三個風速數據集上區間預測的覆蓋率和寬度。隨著置信度的降低,置信區間寬度和覆蓋率也隨之降低,表明預測結果符合統計規律且具有準確性,進一步說明本文所提VMD-CNNGRU-Elman-NWPE模型可實現短期內風速區間的預測。

表3 三個數據集上預測區間的寬度和覆蓋率Tab.3 The width and coverage of prediction intervals on three datasets
(1)基于實驗數據,采用變分模態分解(VMD)算法將監控與數據采集(SCADA)系統采集的風速分解為趨勢項和細節項。建立CNNGRU模型和Elman模型分別對趨勢項和細節項進行預測,概率擬合誤差部分符合正態分布。對上述三個部分進行重構,得到初步風速預測結果。基于數值氣象預報(NWP)風速降尺度模型和廣義自回歸條件異方差(GARCH)模型的誤差修正模型對預測誤差進行了修正。
(2)將本文所提組合模型VMD-CNNGRU-Elman-NWPE與ARIMA模型、Elman模型、CNNGRU模型、VMD-Elman模型、VMD-CNNGRU-Elman模型、VMD-CNNGRU-Elman-E模型進行對比,結果驗證了本文模型的有效性和優越性。
(3)該方法可用于風速的確定性預測和不確定性預測。確定性預測結果具有較高的預測精度和較強的穩定性,尤其在風速驟變時具有較好的預測效果;不確定性預測結果具有較高的可信度,為風電機組運行可靠性評估提供了可靠依據,有助于保證風電系統的穩定性。