近年來(lái),不可再生能源日益匱乏.除了積極提高能源效率外,從自然界中直接獲得的可再生能源引起了許多學(xué)者的關(guān)注.風(fēng)能、太陽(yáng)能和潮汐能等均已被用于電力轉(zhuǎn)換[1],因此可再生發(fā)電的部署是低碳經(jīng)濟(jì)的關(guān)鍵推動(dòng)力[2].由于對(duì)風(fēng)力發(fā)電的需求不斷增長(zhǎng),加上社會(huì)、環(huán)境以及經(jīng)濟(jì)因素的制約,使得目前風(fēng)力渦輪和風(fēng)電場(chǎng)規(guī)模增加[3].風(fēng)向變化是影響風(fēng)力渦輪機(jī)運(yùn)行最重要的環(huán)境因素之一,風(fēng)向預(yù)測(cè)可用于設(shè)計(jì)最佳偏航控制的風(fēng)力渦輪機(jī).受臺(tái)風(fēng)、復(fù)雜地形以及上游風(fēng)力發(fā)電機(jī)產(chǎn)生尾流等因素的影響,風(fēng)力發(fā)電的來(lái)風(fēng)方向總是在變化,導(dǎo)致每個(gè)風(fēng)力渦輪機(jī)的進(jìn)入風(fēng)向也不同.針對(duì)風(fēng)向變化,大型風(fēng)力渦輪機(jī)對(duì)偏航控制系統(tǒng)采用不同的控制策略[4].動(dòng)態(tài)偏航過(guò)程是由連續(xù)的靜態(tài)偏航過(guò)程形成的,因此對(duì)靜態(tài)偏航的研究是動(dòng)態(tài)偏航的基礎(chǔ).國(guó)內(nèi)外學(xué)者對(duì)靜態(tài)偏航風(fēng)力發(fā)電機(jī)的空氣動(dòng)力學(xué)性質(zhì)進(jìn)行了許多研究,通過(guò)對(duì)風(fēng)向角度的研究可知:當(dāng)風(fēng)速不變時(shí),短時(shí)間內(nèi)的風(fēng)向變化導(dǎo)致迎面風(fēng)速降低,風(fēng)力渦輪機(jī)轉(zhuǎn)子速度也隨之降低.
目前,國(guó)內(nèi)外學(xué)者針對(duì)短期風(fēng)向的預(yù)測(cè)做了大量的研究并提出了很多方法.在風(fēng)向預(yù)測(cè)方面,建立混合模型來(lái)尋找最優(yōu)預(yù)測(cè)方法是比較常見(jiàn)的研究策略,例如:唐振浩等[5]提出一種基于數(shù)據(jù)解析的混合風(fēng)向預(yù)測(cè)算法;Sari等[6]基于3DCNN和深度卷積LSTM提出短期風(fēng)速和風(fēng)向預(yù)測(cè)方法;Chitsazan等[7]基于非線性函數(shù)的回波狀態(tài)網(wǎng)絡(luò)來(lái)預(yù)測(cè)風(fēng)向.
風(fēng)向數(shù)據(jù)具有隨機(jī)性、不確定性等特點(diǎn)[8].為提高風(fēng)向測(cè)量的準(zhǔn)確性,本文提出了一種基于EEMD-CNN-GRU的混合預(yù)測(cè)模型.此模型先運(yùn)用集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)算法對(duì)原始風(fēng)向序列進(jìn)行分解,得到更能反映風(fēng)向序列變化特性的多個(gè)分量,以降低不平穩(wěn)性和間歇性;其次使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)提取潛在特征,使得各分量簡(jiǎn)單化;最后利用門(mén)控循環(huán)單元網(wǎng)絡(luò)(Gated Recurrent Unit,GRU)擬合輸入數(shù)據(jù),輸出各分量的預(yù)測(cè)值,通過(guò)疊加得到最終的風(fēng)向預(yù)測(cè)值.
EEMD本質(zhì)上是疊加高斯白噪聲的多重經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)[9].
它先利用頻率分布均勻的高斯白噪聲的統(tǒng)計(jì)特性,通過(guò)每次添加的白噪聲來(lái)改變信號(hào)的極值點(diǎn)特征,然后對(duì)多個(gè)EMD得到的對(duì)應(yīng)的基本模態(tài)分量(IMF)進(jìn)行整體平均,以抵消加入的白噪聲,從而有效抑制模態(tài)混疊的產(chǎn)生.記加入噪聲的總次數(shù)為N,EEMD的步驟如下:
1) 對(duì)原始信號(hào)x(t)加一個(gè)標(biāo)準(zhǔn)正態(tài)分布的白噪聲ni(t):
xi(t)=x(t)+ni(t),
(1)
其中,ni(t)表示第i次加入的白噪聲序列,xi(t)表示第i次實(shí)驗(yàn)的附加噪聲信號(hào).
2) 對(duì)新的信號(hào)序列xi(t)執(zhí)行EMD,得到J個(gè)模態(tài)分量和1個(gè)殘差分量:

(2)
其中,IMF′j和ei(t)分別為xi(t)由EMD產(chǎn)生的第j個(gè)模態(tài)分量以及殘差分量,ei(t)代表信號(hào)的平均趨勢(shì).
3) 將步驟1)和2)重復(fù)N次,得到IMF的集合為
{c1,j(t),c2,j(t),…,cN,j(t)},j=1,2,…,J.
(3)
4) 根據(jù)不相關(guān)序列的統(tǒng)計(jì)平均值為零這一原則,將上述對(duì)應(yīng)的IMF進(jìn)行集合平均運(yùn)算,得到EEMD的最終分量,即:

(4)
其中,cj(t)是EEMD的第j個(gè)IMF.
作為一類(lèi)包含卷積計(jì)算的前饋神經(jīng)網(wǎng)絡(luò),CNN是深度學(xué)習(xí)的代表性算法之一[10].人工神經(jīng)元可以響應(yīng)周?chē)鷨卧?進(jìn)行大型數(shù)據(jù)處理,它通過(guò)數(shù)據(jù)的轉(zhuǎn)換以及降維將原始輸入映射為新的特征.與標(biāo)準(zhǔn)的全連接網(wǎng)絡(luò)不同的是,CNN具有特殊的網(wǎng)絡(luò)結(jié)構(gòu),它包括卷積層和池化層組成的特征提取器,利用局部連接和權(quán)值共享來(lái)提取原始數(shù)據(jù)的特征,使得網(wǎng)絡(luò)模型變得簡(jiǎn)單,從而加快訓(xùn)練速度、提高泛化性能.在CNN網(wǎng)絡(luò)中卷積層之后會(huì)跟上一個(gè)池化層,其作用是提取局部均值或最大值,一般常見(jiàn)的多為最大值池化層[11].
本文選用一維卷積神經(jīng)網(wǎng)絡(luò),將風(fēng)向建模為一系列時(shí)間序列數(shù)據(jù).CNN通過(guò)減少權(quán)值輸入提取時(shí)序序列特征,挖掘數(shù)據(jù)之間的聯(lián)系,再將處理后的特征傳入GRU網(wǎng)絡(luò)中.
一維卷積經(jīng)常用在信號(hào)處理中,以計(jì)算信號(hào)的延遲累計(jì).假設(shè)在每個(gè)時(shí)刻t都會(huì)產(chǎn)生一個(gè)信號(hào)pt,其衰減系數(shù)為wk,即在k-1個(gè)時(shí)間延遲后為原來(lái)的wk倍.在時(shí)刻t收到的信號(hào)qt為當(dāng)前信息和以往信息產(chǎn)生的累加和,計(jì)算公式如下:
qt=w1pt+w2pt-1+…+wkpt-k+1.
(5)
一般把w1,w2,w3,…稱(chēng)為濾波器或者卷積核.假設(shè)濾波器的長(zhǎng)度為K,它與一個(gè)信號(hào)序列p1,p2,p3,… 的卷積和為

(6)
GRU是LSTM網(wǎng)絡(luò)的一種變體[12],其結(jié)構(gòu)更加簡(jiǎn)單,而且效果也很好.因此,GRU是目前非常流行的一種網(wǎng)絡(luò),可以解決循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)中的長(zhǎng)依賴(lài)問(wèn)題,廣泛應(yīng)用于時(shí)間序列的預(yù)測(cè).
GRU與LSTM具有相似的數(shù)據(jù)流[13],但GRU缺少單獨(dú)的存儲(chǔ)單元,使其在訓(xùn)練過(guò)程中效率更高.LSTM引入了輸入門(mén)、遺忘門(mén)和輸出門(mén)三個(gè)門(mén)函數(shù),分別控制輸入值、記憶值和輸出值.而在GRU模型中只有兩個(gè)門(mén):更新門(mén)和重置門(mén),其具體結(jié)構(gòu)如圖1所示.在圖1中,zt和rt分別表示更新門(mén)和重置門(mén).GRU的輸入為前一時(shí)刻隱藏層的輸出和當(dāng)前的輸入,輸出為下一時(shí)刻隱藏層的信息.重置門(mén)計(jì)算候選隱藏層的輸出,其作用是控制保留前一時(shí)刻的隱藏層的數(shù)量.更新門(mén)是控制加入特定數(shù)量候選隱藏層的輸出信息,從而得到當(dāng)前隱藏層的輸出.

圖1 GRU網(wǎng)絡(luò)基本單元Fig.1 Basic unit of GRU network
Sigmoid函數(shù)將數(shù)據(jù)映射到0~1,用來(lái)描述應(yīng)該傳遞信息的數(shù)量,tanh函數(shù)將值置于-1和1之間.GRU單元的計(jì)算公式如下:
rt=σ(Wr·[ht-1,xt]),
(7)
zt=σ(Wz·[ht-1,xt]),
(8)

(9)

(10)
yt=σ(Wσ·ht),
(11)
其中,[]表示兩個(gè)向量相連,*表示矩陣的Hadamard積,σ為Sigmoid函數(shù).
考慮到預(yù)測(cè)效率和準(zhǔn)確率等要求,提出一種基于EEMD-CNN-GRU的混合短期風(fēng)向預(yù)測(cè)模型.采用集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)將數(shù)據(jù)分解為有限個(gè)基本模態(tài)分量和1個(gè)殘差分量.卷積神經(jīng)網(wǎng)絡(luò)(CNN)具有特征提取能力,挖掘特征向量,從而提升預(yù)測(cè)性能.門(mén)控循環(huán)單元網(wǎng)絡(luò)(GRU)可以學(xué)習(xí)序列相關(guān)性,通過(guò)CNN和GRU的結(jié)合得到風(fēng)向的預(yù)測(cè)值.
所建立的混合預(yù)測(cè)模型的流程如下:首先將具有時(shí)序特征的數(shù)據(jù)集作為混合模型的輸入;然后對(duì)原始風(fēng)向數(shù)據(jù)進(jìn)行歸一化處理,并劃分出訓(xùn)練集和測(cè)試集;最后采用所提出的混合模型進(jìn)行預(yù)測(cè),如圖2所示.混合模型的網(wǎng)絡(luò)結(jié)構(gòu)主要分為3層:第1層為EEMD,它對(duì)原始數(shù)據(jù)進(jìn)行分解,提高輸入序列的平滑性和可信度;第2層為CNN,通過(guò)構(gòu)造一維卷積層和池化層來(lái)提取特征;第3層是GRU,發(fā)揮其結(jié)構(gòu)簡(jiǎn)單、參數(shù)較少的優(yōu)勢(shì)[14],提高訓(xùn)練速度、縮短訓(xùn)練時(shí)間以及預(yù)測(cè)時(shí)間,從而保證混合模型預(yù)測(cè)的快速性以及準(zhǔn)確性.因此,本文提出的EEMD-CNN-GRU混合模型采用EEMD對(duì)數(shù)據(jù)集進(jìn)行分解優(yōu)化,并結(jié)合CNN預(yù)測(cè)時(shí)間短與GRU預(yù)測(cè)準(zhǔn)確性高的特點(diǎn),優(yōu)化改進(jìn)風(fēng)向的預(yù)測(cè).

圖2 基于EEMD-CNN-GRU的短期風(fēng)向預(yù)測(cè)流程Fig.2 Flow chart of short-term wind direction prediction via EEMD-CNN-GRU
選用土耳其2018年4月的風(fēng)電場(chǎng)數(shù)據(jù)進(jìn)行短期風(fēng)向預(yù)測(cè),采樣間隔為10 min,共4 305條數(shù)據(jù),得到的風(fēng)向時(shí)間序列如圖3所示.其中,前2/3的數(shù)據(jù)作為訓(xùn)練集,后1/3的數(shù)據(jù)作為測(cè)試集,用前1 h風(fēng)向數(shù)據(jù)來(lái)預(yù)測(cè)下一時(shí)刻的風(fēng)向,實(shí)現(xiàn)風(fēng)向的滾動(dòng)預(yù)測(cè).為了便于模型訓(xùn)練,在CNN-GRU前對(duì)數(shù)據(jù)進(jìn)行歸一化處理,計(jì)算方式如下所示:

圖3 風(fēng)向時(shí)間序列Fig.3 Time series of wind direction

(12)
其中,u為原始的數(shù)據(jù),umin為最小值,umax為最大值.
由圖3可以看出,風(fēng)向數(shù)據(jù)具有隨機(jī)性、不連續(xù)性和非平穩(wěn)性,并發(fā)現(xiàn)該風(fēng)向數(shù)據(jù)不僅周期性差,而且含有大量的高頻分量等,因此需要對(duì)所選風(fēng)向序列進(jìn)行數(shù)據(jù)預(yù)處理.
預(yù)測(cè)結(jié)果的誤差評(píng)價(jià)采用均方根誤差(Root Mean Squared Error,RMSE)、絕對(duì)平均誤差(Mean Absolute Error,MAE)和決定系數(shù)(R-square,R2),公式如下:

(13)

(14)

(15)

對(duì)風(fēng)向數(shù)據(jù)集進(jìn)行EEMD,分解成12個(gè)IMF和1個(gè)殘差(Res),結(jié)果如圖4所示.IMF反映風(fēng)向數(shù)據(jù)在不同影響因素下的分布,數(shù)據(jù)逐漸趨于平穩(wěn),Res能夠反映風(fēng)向序列的變化規(guī)律,并且整體的變化趨勢(shì)比較一致[15].

圖4 EEMD的結(jié)果Fig.4 Results of EEMD
EEMD將風(fēng)向數(shù)據(jù)進(jìn)行平穩(wěn)化處理,各個(gè)IMF分量包含了原始序列的不同時(shí)間尺度的局部特征信號(hào),使用GRU模型對(duì)各分量特征進(jìn)行單獨(dú)預(yù)測(cè),從而降低預(yù)測(cè)難度.
將EEMD分解后的數(shù)據(jù)分別輸入CNN-GRU模型進(jìn)行訓(xùn)練,設(shè)置循環(huán)步長(zhǎng)為6,即用前6個(gè)時(shí)刻的數(shù)據(jù)預(yù)測(cè)當(dāng)前數(shù)據(jù).CNN的卷積層個(gè)數(shù)為32,各層都有卷積核,使用BN層對(duì)每個(gè)神經(jīng)元做歸一化處理,池化窗口的大小為1,激活函數(shù)為ReLU.GRU的神經(jīng)元個(gè)數(shù)分別為128和32,選用ReLU作為激活函數(shù),Adam作為優(yōu)化器,迭代輪數(shù)為100.
分別使用BP神經(jīng)網(wǎng)絡(luò)、LSTM、GRU、CNN-GRU、EMD-GRU、EEMD-GRU、VMD-CNN-GRU、EMD-CNN-GRU、EEMD-CNN-LSTM、EEMD-CNN-GRU進(jìn)行仿真實(shí)驗(yàn),其中VMD是變分模態(tài)分解[16].對(duì)各網(wǎng)絡(luò)模型進(jìn)行參數(shù)調(diào)優(yōu),使用相同的訓(xùn)練集進(jìn)行訓(xùn)練,并選取同樣的測(cè)試集來(lái)預(yù)測(cè)風(fēng)向,計(jì)算其RMSE、MAE以及R2,結(jié)果如表1所示.通過(guò)觀察表1,可以得到如下結(jié)論:選用模型的R2都大于0.77,表明這10種模型都是有效的,且EEMD-CNN-GRU的RMSE、MAE和R2表現(xiàn)優(yōu)異.

表1 不同模型預(yù)測(cè)結(jié)果對(duì)比
為了更好地對(duì)比預(yù)測(cè)結(jié)果與原始數(shù)據(jù)的擬合程度,對(duì)EEMD-GRU、VMD-CNN-GRU、EMD-CNN-GRU、EEMD-CNN-LSTM、EEMD-CNN-GRU在同一數(shù)據(jù)集繪制風(fēng)向預(yù)測(cè)曲線,結(jié)果如圖5所示.為了更直觀地對(duì)比預(yù)測(cè)結(jié)果,將局部曲線進(jìn)行了放大處理.從圖5可以明顯地看出:EEMD-GRU在峰值區(qū)域出現(xiàn)大幅偏差,而其他4種模型則能夠較好地接近真實(shí)曲線.此外,EEMD-CNN-GRU模型的預(yù)測(cè)結(jié)果不僅在峰值區(qū)域與真實(shí)值更吻合,在其他區(qū)域與實(shí)際變化曲線也比較貼近.其主要原因是風(fēng)向序列的非平穩(wěn)性導(dǎo)致GRU對(duì)原始序列的變化趨勢(shì)不能很好地預(yù)測(cè),而加入EEMD進(jìn)行分解重構(gòu),并用CNN進(jìn)行轉(zhuǎn)換及降維,就可以大大緩解此問(wèn)題,使得模型的預(yù)測(cè)精度更高.

圖5 不同模型的風(fēng)向預(yù)測(cè)曲線Fig.5 Wind direction curves predicted by different models
在表1中,EEMD-CNN-LSTM與EEMD-CNN-GRU的預(yù)測(cè)性能接近,且顯著優(yōu)于其他模型.下面比較這兩種模型在預(yù)測(cè)階段的運(yùn)行時(shí)間,結(jié)果如表2所示.從表2可以看出,所提出混合模型的預(yù)測(cè)時(shí)間大約是EEMD-CNN-LSTM的68%,即EEMD-CNN-GRU具有較短的計(jì)算時(shí)間.
為了更好地預(yù)測(cè)短期風(fēng)向,本文提出了一種基于EEMD-CNN-GRU的混合風(fēng)向預(yù)測(cè)模型.經(jīng)實(shí)驗(yàn)驗(yàn)證,得到以下結(jié)論.
1) 對(duì)風(fēng)向序列使用EEMD,得到更能反映風(fēng)向序列變化特性的多個(gè)模態(tài)分量和殘差分量,從而降低風(fēng)向的不平穩(wěn)性、間歇性和非線性對(duì)預(yù)測(cè)結(jié)果的不利影響.
2) 引進(jìn)CNN-GRU混合預(yù)測(cè)模型,先使用CNN提取潛在特征,使數(shù)據(jù)簡(jiǎn)單化,再利用GRU時(shí)序依賴(lài)的特性,對(duì)輸入數(shù)據(jù)進(jìn)行擬合,直接輸出各分量的預(yù)測(cè)值,最終通過(guò)疊加得到風(fēng)向預(yù)測(cè)值.相比于其他的分解預(yù)測(cè)方法,所提模型降低了預(yù)測(cè)難度;與EEMD-CNN-LSTM相比,EEMD-CNN-GRU縮短了預(yù)測(cè)時(shí)間.
3) 所提混合模型結(jié)合了EEMD、CNN和GRU各自的特點(diǎn).實(shí)驗(yàn)結(jié)果表明,相比于其他預(yù)測(cè)模型,EEMD-CNN-GRU的風(fēng)向短期預(yù)測(cè)精度較高,驗(yàn)證了模型的可行性以及一定的優(yōu)越性,為后續(xù)風(fēng)力發(fā)電中風(fēng)向的預(yù)測(cè)問(wèn)題提供了一種新的方法.