曹天行,劉三明,王致杰,劉劍,孫元存
(上海電機學院 電氣學院, 上海 200240)
風能作為一種新能源具有清潔環保的特點,因此世界各國的裝機容量逐年增加,使得風電滲透率增加,但是隨著風速的變化風電出力并不穩定,這使得電力系統的運行面臨不小的挑戰[1-2]。因此風功率的準確預測是保證電力系統的可靠運行以及增加風電上網的競爭性的必要前提。
風電功率短期預測方法主要包括基于數值天氣預報(NWP)的預測方法和時間序列分析法(ARMA)[3-4]。基于NWP的預測方法包括支持向量機(SVM)[5-6]、人工神經網絡(ANN)[7]等;時間序列法包括卡爾曼濾波法(KF)[8]、持續預測法[9]等。然而這些常見方法都有各自的缺點,例如持續法的預測結果不穩定,且預測誤差大; 人工神經網絡容易陷入局部極值,對高頻的序列學習效果不好; 支持向量機難以訓練大規模的樣本。深度學習網絡是指多類機器學習結合各層次結構的網絡,使用多層非線性信息處理方法,進行識別特征、分類數據和生成數據。文中采用集合經驗模態分解[10-11](EEMD)將風電功率變成一組平穩性序列,再結合稀疏自編碼器(SAE)及BP神經網絡進行預測可提高預測精度。
集合經驗模態分解是傳統的經驗模態分解方法的改進,文獻[12]介紹了經驗模態分解,經驗模態分解是一種依據數據固有的時間尺度特征來分解信號的方法,可逐級篩選出原信號中不同時間尺度的局部特征信號,得到具有相同特征的固有模態分量(Intrinsic Mode Function, IMF)。IMF應滿足以下兩個條件:(1)信號的局部極大值與極小值構成的包絡線均值為零;(2)極點數和零點數相差不大于1。對于某序列{x(t)}經驗模態分解步驟如下:
(1)求出序列{x(t)}中所有極值點(極大值和極小值),然后用三次樣條函數插值擬合上包絡線xmax(t)以及下包絡線xmin(t);
(2)求出兩包絡線的均值m(t),進而求出x(t)和m(t)的差值h(t),其中:
h(t)=x(t)-m(t)
(2)
(3)判斷h(t)是否滿足IMF的條件,若滿足,則h(t)為第一個IMF,記c1(t)=h(t),并求出原信號與該IMF的差值r1(t);若不滿足,則令h(t)為原始序列,重復前兩步直到滿足條件;
(4)將r(t)作為待分解信號,重復步驟(1)~步驟(3),直到剩余信號rn(t)為單調函數時,停止分解。則原序列可表示為:
雖然傳統EMD減少了人為因素的影響,但是會出現模態混疊的現象。EEMD通過在原始序列中加入白噪聲序列這一方法有效地解決了此問題。集合經驗模態分解步驟如下:

(2)對{X(t)}進行EMD分解,得到若干IMF;
(3)重復前兩步N次,每次加入不同的白噪聲序列;
(4)將N次分解所得的各分量的均值作為{x(t)}的最終IMF。
稀疏自編碼器是深度學習網絡的一種常用方法,深度學習網絡是指一大類的機器學習和各種層次結構結合的網絡,其特性是使用多層非線性信息處理方法。

此時代價函數為:
式中β表示稀疏懲罰項的權重。
圖1是自動編碼器的結構,AE的訓練過程是:首先自動編碼器將x∈[0,1]d作為輸入向量,利用定性映射函數y=fθ(x)=s(Wx+b)將其映射到隱層y∈[0,1]d′,其中網絡參數θ={W,b},W是大小為d′×d的權值矩陣,b是維數為d′的偏置向量,s(x)=1/(1+e-x);其次將之前得到的y再次利用映射函數z=gθ′(y)=s(W′y+b′)將其映射重構得到向量z∈[0,1]d,其中網絡參數為θ′={W′,b′},通過限定W′=WT,可以取得最優的反向映射的權值矩陣W′;這樣,每個輸入x(i)映射得到對應的y(i),再重構得到對應的z(i),通過最小化平均重構誤差我們可以得到模型的最優參數,即:
式中L為損失函數。
傳統的平方差函數就是損失函數的一種形式,即:
或者若把向量x和z的每個分量看作滿足伯努利分布,使用交叉熵來度量x和z之間的距離,即:
(8)
同時,利用前向反饋神經網絡(FFNN)算法實現網絡的微調,從網絡最后一層的代價函數Jsparse(W,b),利用梯度下降法對整個網絡進行微調。

圖1 自動編碼機結構Fig.1 Structure of the auto-encoders
BP神經網絡是基于誤差反向傳播算法的多層前向神經網絡,是淺層學習網絡的一種,用的是有監督的訓練方式。BP可以學習并自適應未知信息,具有分布式信息存儲與處理結構,具有一定的容錯性,因此構造出來的系統具有較好的魯棒性,適合處理復雜問題。使用BP神經網絡的步驟如下:
(1)初始化網絡的結構和權值;
(2)前向計算:按照置好的樣本,計算BP網絡每層神經元的輸入和輸出信號;
(3)根據實際輸出計算反向誤差,以修正權值;
(4)判斷誤差,如果誤差值小于給定值或者迭代次數超過設定值則結束學習。否則返回步驟(3)。
雖然BP神經網絡在解決一些不太復雜的或者有限制的問題中表現出了良好的效果,但是其表征和建模能力有限,容易陷入局部極值,在應對較為復雜的實際的問題的時候,如不具有明顯周期性變化的高頻分量時,BP神經網絡就達不到良好的效果。深度的學習網絡比BP神經網絡有更優秀的表達能力。跟BP網絡最大的不同是,深度學習網絡能用更為簡單的方法來表示更大的函數集合,而多層的優點是只要很少的參數就可以表示更加復雜的函數關系。因此對于高頻信號的學習能力,SAE明顯優于BP神經網絡。
所提出的EEMD-SAE-BP模型,就是將EEMD分解結果中的高頻分量用SAE進行預測,而具有明顯周期性的其他分量以及余量用BP進行預測,這樣既保證了預測精度,又能縮短預測時間。
首先使用EEMD分解風電功率序列,以降低其非平穩性,得到若干子序列;再用SAE對IMF中前j個高頻分量分別進行建模預測,其余分量以及rn(t)則用BP分別進行建模預測,最后將各個預測結果疊加并進行誤差分析。EEMD-SAE-BP預測模型建模流程如圖2所示。

圖2 基于EEMD-SAE-BP的風功率預測模型流程圖Fig.2 Power forecasting flow chart based on EEMD-SAE-BP
(1)用EEMD分解風電功率序列,得到各IMF以及rn(t)。其中白噪聲參數p取0.2,ε取100;
(2)分別對IMF中j個高頻分量建立SAE網絡預測模型;
(3)分別對其余IMF分量以及rn(t)建立BP網絡預測模型;
(4)將各分量預測值疊加求和,得到最終的預測結果;
(5)對模型進行評價。
以上海某風電場2013年2月份的一號風機實測數據為例進行建模分析,數據采樣時間間隔為15 min。
由圖3可知2月份最高發電功率為2 058 MW,最低為0 MW,平均值為511.23 MW,功率波動較大。一共2 688個數據,取每96個數據為一組作為訓練輸入,后16個點作為訓練輸出,來訓練網絡,最后一組96個數據為測試數據,預測未來4小時的風功率變化情況。

圖3 某風電場2月的實測功率Fig.3 The actual power of a wind farm in February
EEMD的分解過程如圖4所示。分解結果顯示分解后的子序列頻率是逐步平緩的,并得到各個頻率下振幅的變化情況。其中IMF1~IMF3分量是不具有明顯周期性變化的高頻分量,因此用深度學習網絡(文中使用SAE)有更好的預測效果,即建立SAE預測模型;IMF4~IMF8分量周期特性較明顯,則使用BP建立預測模型;IMF9~IMF10和rest序列的趨勢變化十分明顯,使用BP網絡建立預測模型。


圖4 EEMD分解結果Fig.4 Component diagram after EEMD decomposition
分別采用EEMD-BP、EEMD-SAE、EEMD-SAE-BP、SAE、BP五種模型進行風功率預測,并對預測結果進行誤差評價。
圖5為5種模型對原始數據進行學習后,對未來四小時風功率進行預測的結果,表1為不同預測模型對風功率預測的評價結果。

圖5 未來四小時的各模型預測結果Fig.5 Time span of 4 hours of the model forecast results
從幾種預測模型的評價結果中可以看出:
(1)使用EEMD先對原始功率序列分解后再進行機器學習,有效的提高了預測精度,如EEMD-SAE預測模型與SAE預測模型的對比;
(2)由SAE以及BP的評價結果中可以看出,由于BP存在容易陷入局部極值的問題,使用深度網絡進行學習原始序列效果更佳;
(3)使用提出的EEMD-SAE-BP預測模型,在預測精度上明顯優于其他預測模型,與前文的論證相符。

表1 不同風電功率預測方法的誤差對比Tab.1 Compared errors of wind power prediction under RMSE and MAPE
提出一種基于集合經驗模態和深淺層學習結合的風電場功率短期預測方法。經反復實驗和深入對比,所提EEMD-SAE-BP模型在短期風功率預測中相較EEMD-BP、EEMD-SAE、SAE、BP四種模型預測,擁有較小的誤差,能夠更好滿足系統對并網風電預測精度的要求,進一步增強風電上網競爭力。然而,純粹基于歷史數據的風功率預測模型在預測步長增加時,預測效果將可能變差。下一步的研究工作是考慮更多影響風功率的因素,并運用所提方法進行預測,使得EEMD-SAE-BP的風功率預測具有更好的實用價值。