陳中慧,王海云,王維慶,武家輝
(新疆大學電氣工程學院,新疆 烏魯木齊 830047)
為了應對化石能源枯竭以及化石能源帶來的環境污染問題,世界各國正在大力開發可再生能源。風能是可再生能源的重要組成部分,得到了大力發展。由于風的波動性與間歇性使得大規模風電并入電網時給電力系統安全穩定運行以及電力調度部門帶來了巨大挑戰。當前,風電功率預測是解決該問題的重要手段[1]。
風電功率預測按時間尺度的不同可分為長期(以年為單位)風電功率預測、中期(3-7天)風電功率預測、短期(1-72小時)風電功率預測[2]。短期風電功率預測便于電力調度部門制定合理的電網調度策略,保證供電質量[3]。目前,風電功率的預測方法主要有人工神經網絡法(artificial neural netwoks,ANN),時間序列分析模型法、支持向量機(support vector machine,SVM)等。其中ARMA是時間序列分析法中高級的預測方法,具有較好的預測精度[4]。文獻[5]運用改進的牛頓算法LM優化BP神經網絡參數形成LM-BP模型進行風電功率預測,將預測結果與BP神經網絡進行比較,證明LM-BP的優越性,最后用時間序列法ARMA對預測風電功率序列進行誤差修正,取得了較好的預測效果,但是對于建模所需的風電數據并未做深入挖掘處理使得風電數據質量不高,影響預測精度需要加入ARMA誤差校正,使得預測模型復雜。文獻[6]采用改進K近鄰算法(improved K nearest neighbor,IKNN),進行風功率預測,根據預測結果進行風水協同運行次日計劃,并加入風功率實時預測對計劃數據進行修正以減少預測誤差,實現實時協同控制運行。但在風電預測環節并未對歷史風速與風電功率數據進行處理,導致在次日風水協同計劃中加入實時預測來進一步提高風電功率預測精度。文獻[7]利用信息熵對預測模型的輸入輸出量進行高關聯度樣本篩選,充分挖掘風電數據之間的關系,提高建模數據質量,然后采用粒子群PSO優化Elman神經網絡進行風電功率預測,結果證明經過信息熵處理的風電功率預測取得了較好的預測效果,但是熵相關系數求解較復雜,高關聯度沒有統一的標準值。文獻[8]利用經驗模態分解(EEMD)對風速進行分解,然后對每個風速子序列預測建立最小二乘支持向量機(LS-SVM)模型進行預測,之后將風速預測結果疊加。同樣文獻[9]利用小波分析分解風電功率,之后對不同風電功率分量分別建立相應的徑向基神經網絡模型進行風電高功率預測,最后重構各分量預測結果。文獻[8]與文獻[9]需分別對每個分解的風電子序列建模,使得風電功率預測模型復雜且消耗大量計算。影響風電功率預測效率。
綜上,本文提出了基于數據挖掘與小波去噪的短期風電功率預測模型。通過應用曲線擬合方法修改異常數據、填補丟失數據,解決了一些未采用數據挖掘技術的風電功率預測所導致的預測精度不高需要添加ARMA進行誤差較正的問題。且曲線擬合方法建模簡單,計算量小改善了信息熵數據挖掘方法建模復雜難求解的問題。應用小波變換法消除風電數據中的噪聲降低了風電數據的波動性,以期進一步提高風電功率預測精度。本文重構經過處理的風電功率序列建立單個ARMA預測模型與應用EEMD、小波分析法分解風電序列建立多個預測模型相比,簡化了風電預測模型,大大減少了計算量。最后,經過算例仿真分析驗證了所述方法有效的提高了風電功率預測精度。
隨著數據收集和存儲技術的進步在風電領域產生了海量數據,為了提取海量風電數據中的有用信息,在風力發電背景下的數據挖掘技術得到了廣泛應用[10]。數據挖掘是對大量且粗糙的數據進行處理,挖掘數據中隱含的有用信息的過程[11]。本文采用多項式曲線擬合法擬合出風速-風電功率曲線圖,挖掘出隱藏在歷史數據中風速與風電功率的內在聯系。曲線擬合的原理就是尋找與給定點的距離平方和為最小的曲線。多項式曲線擬合[12]的原理如式(1),(2)所示

(1)

(2)
式中f(x)為擬合多項式函數;Pn(x)為多項式函數;(xi,yi)為給定數據點;ak為系數。n為多項式階數。當滿足式(1)時,便可求出擬合曲線f(x)。
小波變換(wavelet transform,WT)具有局部變換的思想又克服了傅里葉變換窗口大小不隨頻率變化等缺點,能夠提供一個隨頻率改變的“時間-頻率”窗口,是進行信號時頻分析和處理的理想工具[13]。風電數據在采集時會受到噪聲的污染,小波變換將風電功率信號分解為低頻部分和高頻部分,噪聲多包含在高頻部分中,需對高頻部分設置閾值,濾除高頻部分中包含的噪聲,然后對分解的低頻部分與經過去噪處理的高頻部分進行重構即進行小波逆變換,達到小波信號去噪的目的。本文采用離散小波變換分解風電功率時間序列f(t),其公式如式(3)所示

(3)
式中j為位置范圍,k為采樣時間,Ψj,k(t)為小波函數,Wj,k為離散小波變換的系數。
離散小波變換的重構公式(逆變換)如式(4)所示

(4)
式中C為與信號無關的常數。y(t)為經過小波去噪后的風電功率序列。
時間序列法常用于短期的風電功率預測,利用適當的時間序列模型輸入風電場的輸出風電功率便可以進行風電功率的輸出預測。自回歸移動平均(ARMA)模型、移動平均(MA)模型以及自回歸(AR)模型是常見的時間序列模型[14],其模型結構如式(5)所示

(5)
式中xi為原始序列;φi和θi為模型參數;p為AR(自回歸模型)階數;q為MA(移動回歸模型)的階數。由上式可以看出當ARMA模型的p,q為特定值時,即p=0時,ARMA模型變成了AR(p)模型;q=0時,ARMA模型變成了MA(q)模型。
時間序列預測法的輸入量要求為平穩序列,因此在應用ARMA模型預測風電功率是應首先判斷輸入的風電功率是否為平穩序列。本文利用增廣迪基-福勒ADF(Augmented Dickey-Fuller)單位根檢驗[15]判斷風電功率時間序列的平穩性。ADF的3種檢驗模型公式如式(6)(7)(8)所示

(6)

(7)

(8)
式中t為時間變量,ΔXt為t時刻的殘差;X(t-1)為t-1時刻的殘差;βt為趨勢項;α常數項;εt為殘差項。從式(6)開始檢驗,假如檢驗不滿足H0:δ=0,表明原序列不存在單位根則原序列為平穩序列,檢驗終止,反之繼續式(7)的檢驗,直到式(8)為止。若經過式(8)的檢驗,原始序列依然存在單位根則序列為非平穩時間序列需對其進行平穩化處理。
在對輸入ARMA模型的輸入時間序列進行平穩性判斷之后,需要確定ARMA模型的p,q值,本文采用Akaike Information Criterion(AIC)準則對模型ARMA(p,q)定階。當AIC函數取得最小值時,ARMA模型便認為取得最佳模型。AIC準則函數[16]公式如式(9)所示

(9)


(10)

本文采用Yule-Walker方程[17]確定模型的自回歸參數φp計算公式如式(11)所示:

(11)
式中φp為自回歸參數,ρ為模型的自相關系數。
應用矩估計法估計移動平均參數θq,模型的自協方差函數和移動平均參數θq的關系如式(12)(13)所示

(12)

(13)
且1≤k≤q,式中σ2為方差,γ為協方差。
圖1為本文模型的流程圖,首先對數據進行預處理,其次采用ARMA進行風電功率輸出預測。

圖1 建模流程圖
本文采用國內西北某風電場2018年1月1日至1月31日的風速、風電場輸出風電功率為原始數據,數據采樣間隔為15min,共計1514個數據點。對未來2018年2月1日00:00到2018年2月1日2:45的12個數據點進行風電場輸出短期風電功率預測。
首先根據歷史風速與風電場輸出風電功率數據進行多項式曲線擬合,擬合曲線如圖2。

圖2 多項式擬合曲線
大量歷史風電數據含有一些錯誤的數據,如風速為零時輸出風電功率不為零或者風電功率、風速為負等,以及丟失部分數據,直接應用原始風電功率往往達不到較好的預測效果,由圖2多項式擬合的曲線知,若風速值小于3m/s,則風電出力為零;若風速值大于3m/s,便可以通過多項式擬合曲線更正錯誤的風電功率值。當風電功率有誤時,可根據風速利用擬合曲線計算風電功率;當風速錯誤時根據風電功率計算風速值。對于歷史風電數據中丟失的數據可用前一天以及后一天此刻的平均值代替。然后將經過多項式擬合曲線處理的風電功率序列進行小波分解。結果如圖3。

圖3 小波分解結果
噪聲包含在高頻部分中,對高頻部分設置閾值濾除噪聲后與低頻部分重構,只經過多項式擬合曲線修正的風電功率與加上小波去噪的風電功率結果對比如圖4。經過小波閾值消噪后的風電功率波形較為平滑,可以更好的展現風電功率的變化趨勢。
將經過小波去噪的風電功率時間序列作為ARMA模型的輸入時間序列。本文采用ADF判斷輸入風電功率時間序列的平穩性,其結果見表1。

表1 單根檢驗
由表1的結果可以看出,ADF的統計值為-8.04524,小于10%水平下的臨界值-2.14861,這表明在10%顯著水平下拒絕風電功率時間序列存在單位根的假設,可認為風電功率時間序列為平穩時間序列。

圖4 消噪結果對比圖
ARMA模型的輸入風電功率時間序列自相關圖和偏相圖如圖5。

圖5 風電功率的相關性檢驗
圖5展示出了風電功率時間序列的自相關(Autocorrelation)與偏相關(Partial Correlation)柱狀圖以及與其對應的自相關系數值(AC)、偏相關系數值(PAC),由圖5可以看出自相關與偏相關柱狀圖均存在拖尾現象,自相關柱狀圖在3階之后均在虛線之內,即q=3。偏相關柱狀圖在2階之后均在虛線之內,即p=2。可初步確定模型階數ARMA(2,3)。為進一步確定ARMA模型階數,AIC的計算值見表2。

表2 各模型的AIC值
由表2可知當模型復雜度升高時,AIC函數值基本呈下降趨勢,但是當復雜度過高時,AIC函數值反而增大,當p=2,q=3時,根據AIC函數值最小原則,確定ARMA最佳模型即ARMA(2,3)。
利用上文中第3節的Yule-Walker方程確定模型參數,結果如表3所示。

表3 ARMA模型參數值
將經過數據挖掘處理以及小波去噪的1514個風電功率數據作為ARMA(2,3)模型的訓練樣本。
為了驗證本文模型在預測精度方面的優勢將本文預測模型的預測結果與未經數據處理的傳統ARMA模型的預測結果與應用較廣泛粒子群優化BP神經網絡(PSO-BP)模型預測結果對比,如圖6。

圖6 不同預測模型結果對比圖
由圖6可以看出各預測模型均有較好的預測趨勢,傳統ARMA預測模型隨著預測步數的增加預測精度降低。但本文預測模型比較貼近實際值。
為了定量的分析不同預測模型的精確度,本文引用了MAPE(平均絕對百分比誤差)、RMSE(均方根誤差)、MAE(平均絕對誤差)進行誤差分析,其計算公式如式(14)-(16)所示。結果見表4。

(14)

(15)

(16)
式中N表示樣本容量,y表示實際風電功率,表示預測風電功率。

表4 各預測模型的誤差評價指標
由表4可知,本文模型的平均絕對百分比誤差比傳統的ARMA模型降低了9.44%,比PSO-BP模型降低了10.35%;本文模型的其它兩種誤差指標均小于傳統ARMA模型與PSO-BP模型。證明了用于建模的風電數據質量對預測精度的影響。在進行風電功率建模前對風電數據進行數據挖掘與去噪能顯著提高風電功率預測精度。
本文提出基于數據挖掘與小波去噪的短期風電功率預測模型,結合算例仿真分析得到如下結論。
1)應用多項式曲線擬合的方法挖掘風電數據中風速與風電功率的內在聯系,從而修改異常數據、填補丟失數據,提高了風電數據質量。
2)利用小波變換法消除風電功率數據中噪聲,降低了風電功率數據的波動性,有效的提高了風電功率預測精度。
3)建立單個ARMA預測模型相比于其它組合預測建立多個預測模型,建模簡單、計算量小。
4)通過算例仿真該模型與PSO-BP和ARMA預測模型相比,平均絕對百分比誤差降低了10.35%和9.44%,均方根誤差降低了0.62MW和088MW,平均絕對誤差降低了0.58MW和0.65MW,表明該預測模型有效提高了風電功率預測精度。