基于完全集成經驗模態(tài)分解和模糊熵分頻的短期風電功率預測

2023-09-27 09:52:54文博陳芳芳胡道波羅銀榕張倩倩

科學技術與工程 2023年25期

文博, 陳芳芳, 胡道波, 羅銀榕, 張倩倩

(云南民族大學電氣信息工程學院, 昆明 650031)

中國制定了相應的“碳達峰”合“碳中和”計劃,將力爭于2030年前二氧化碳排放達到峰值,努力爭取在2060年前實現(xiàn)碳中和。因此,風能、太陽能、地熱能、核能等新能源的發(fā)展成了主要趨勢。其中,風電在中國新能源電力中占有較大比例,且其因清潔環(huán)保、成本較低等優(yōu)點成為新能源發(fā)展的主力。截至2021年7月底,中國非化石能源發(fā)電裝機容量10.3億kW,其中風電裝機容量2.9億kW[1-2]。但是,風力的波動性和隨機性較大,易受天氣因素的影響,給風電的利用率帶來了較大限制。因此,短期風電功率的準確預測對電力系統(tǒng)穩(wěn)定運行具有重要意義。

短期風電功率的預測方法主要可以分為物理方法、統(tǒng)計方法和組合預測方法三大類。物理方法對歷史氣象數(shù)據(jù)的精確性要求極高且模型與求解過程復雜,適應于某一特定地區(qū)的風電功率預測;統(tǒng)計預測法模型結構簡單、計算速度較快,可以通過大量的歷史數(shù)據(jù)可得到較好的預測結果,但是其預測精度隨著時間序列的增加而迅速降低;組合預測方法采用其他方法對模型的輸入、輸出以及模型自身中的一種或者多種進行了優(yōu)化并融合改進[3],具有強大的非線性映射功能,因此組合預測法是一種現(xiàn)在較為廣泛的研究趨勢。

文獻[4]中采用變分模態(tài)分解(variational mode decomposition,VMD)分解將原始序列分解為N個中心頻率不同的子序列,再用頻率游程判別法將各子序列分為高頻和低頻分量,然后分別采用t-SSA-LSTM和t-SSA-ARIMA組合預測法對高頻與低頻分量進行預測,以此提高功率預測精度。文獻[5]用完全集成經驗模態(tài)分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)對原始風電功率序列進行分解,然后用精細復合多尺度熵(refined composite multi-scale entropy,RCMSE)對子序列進行重構,得到頻率類別較為規(guī)律的序列分量。隨后用基于哈里斯鷹改進的算法對極限學習機模型(extreme learning machine,ELM)進行優(yōu)化,來提升預測精度,并引入AdaBoost來進一步提高預測精度。文獻[6]用CEEMDAN對風電功率歷史序列進行分解,再利用樣本熵(sample entropy,SE)對所得序列分量進行重組,然后用模型堆疊(stacking模型)方法來構建預測模型,并用信息融合將歷史功率序列與歷史測風塔數(shù)據(jù)進行融合,以此構建高精度預測模型。

文獻[7]提出了一種CEEMDAN和時間模式注意力機制改進的時間卷積網(wǎng)絡模型,這也是一種分解-預測-重構的組合預測模型,首先用 CEEMDAN 對風電功率原始序列進行分解,然后使用該組合模型對各分量進行預測。文獻[8]提出了一種RR-VMD-LSTM模型,首先使用魯棒回歸(robust regression, RR)和VMD對原始數(shù)據(jù)進行預處理,達到通過數(shù)據(jù)處理首先提高預測精度的效果,然后將處理過后的分解序列逐一輸入到長短時記憶模型中分別進行預測。文獻[9]將預處理后的信號用CEEMDAN分解,用辛幾何模態(tài)分解(symplectic geometry mode decomposition,SGMD)對CEEMDAN分解后的最高頻分量IMF1進行再分解。隨后用粒子群算法對BiGRU網(wǎng)絡進行優(yōu)化,以此提高預測模型精度。但是,對原始序列分解之后,分解所得的子序列之和與原始序列之間存在較大的殘差,重構后的序列可能存在模態(tài)混疊和頻率混疊的情況。除此之外,傳統(tǒng)的神經預測網(wǎng)絡并沒有對分解后的序列中的高頻項和趨勢項給予相應的關注。

針對上述問題,現(xiàn)建立一種基于模糊熵分頻和CEEMDAN分解的短期風電功率預測模型。首先,利用CEEMDAN將原始風電功率分解為若干IMFs分量。隨后采用模糊熵算法識別子序列的頻率特征,并根據(jù)此特征將其分為高、中頻分量和殘差分量。分別建立SSA-LSTM-Attention和SSA-SVR模型來預測高、中頻分量和趨勢項。趨勢項的頻率低,振幅低,能反映一般外界對風力發(fā)電的影響,該項也會引起風電功率長期穩(wěn)定的趨勢變化。最后,疊加所有模型的預測結果得到風電功率預測值。并與其他模型對比以驗證所提預測方法的優(yōu)越性。

1 風電功率數(shù)據(jù)的分解與重構

1.1 CEEMDAN分解算法

經驗模態(tài)分解(empirical mode decomposition,EMD) 是Huang等[10]針對信號的非線性、非平穩(wěn)特點提出的一種自適應信號處理方法。根據(jù)數(shù)據(jù)本身特征對信號進行直接分解無須設置其他的基函數(shù)。EMD分解存在模態(tài)混疊現(xiàn)象,集合經驗模態(tài)分解(ensemble empirical mode decomposition,EEMD)可以克服EMD的模態(tài)混疊問題,EEMD是一種噪聲輔助數(shù)據(jù)分析方法。EEMD 在進行信號分解后可得到包括反映原始序列波動性的高頻信號和反映其穩(wěn)定性的低頻殘差信號。由于殘余噪聲信號和加噪聲信號不同,以此來實現(xiàn)的重構信號可能會導致產生的 IMF數(shù)量不同。雖然其整個過程能夠有效地克服 EMD 方法的模態(tài)混疊缺陷,但并不能有效消除白噪聲信號,所以使得重構誤差過大。

CEEMDAN較 EEMD 而言分解速度更快且運算量也大幅減小。與CEEMD最后總體平均不同的是,它在得到第一次的IMF后就進行平均計算,這種處理方法有效地避免了白噪聲信號從高頻到低頻的傳遞,從而影響最后的分析和處理。在接下來的每一個階段都加入有限次的白噪聲信號,能有效降低EEMD的重構誤差[11],但也在一定程度上增加了運算量。其具體分解流程如下。

步驟1對風電功率原始序列C(t)添加白噪聲,公式為

Cj(t)=C(t)+βknj(t)

(1)

式(1)中:t為原始功率分解的次數(shù);Cj(t)為最新得到的功率序列;βk為第k個信噪比;nj(t)為第j次添加的高斯白噪聲。

步驟2用原始功率序列計算殘差信號。公式為

R1(t)=C(t)-imf1(t)

(2)

步驟3在R1(t)中加入正負成對的高斯白噪聲,并對所得新信號R1(t)+β1E1[nj(t)]進行N次重復分解并求均值。由式(3)和式(4)得到分解后的第二個模態(tài)分量imf2及第二個殘差信號R2(t)分別為

(3)

R2(t)=R1(t)-imf2

(4)

步驟4接下來不斷地重復步驟3的計算過程,通過CEEMDAN不斷地分解得到第k+1個模態(tài)分量imfk+1和第k個余量信號Rk。

步驟5重復上述步驟,最后得到若干個IMFs分量并計算出相應的滿足條件殘差分量。最終信號被分解為

(5)

1.2 模糊熵

熵可以衡量時間序列的無序性。Shannon首次將熵引入信息論,提出了信息熵的概念來度量事件的不確定性。隨后不同的熵方法被提出用于分析復雜性特征,包括量化金融市場效率[12]。由于模態(tài)之間的邊界是模糊的,模態(tài)之間的關系也難以確定,為此提出了基于模糊理論的模糊熵方法,利用隸屬函數(shù)計算不同隱藏模式之間的模糊相似度。具體而言,對于給定的時間序列x(t),t=1, 2,…,T,其中T為x(t)的長度,其模糊熵值計算如下。

步驟1基于時間序列x(t)構造嵌入向量X(i),嵌入維度為m,表達式為

(6)

[x(j+k)-x0(j)]|}

(7)

(8)

(9)

(10)

步驟5基于式(11)計算時間序列x(t)的模糊熵值。

(11)

從式(11)可以看出,模糊熵值FE受參數(shù)m、n、r、T影響。其中m為嵌入維度,參數(shù)n、r決定模糊相似邊界,T為樣本長度。參考文獻[13],嵌入維度m通常取2或3;而參數(shù)r設置不宜過大,否則容易丟失過多統(tǒng)計信息,因此,r一般取0.1σsd～0.25σsd,其中σsd為原序列的標準差;n取2或3。

2 風電功率預測模型構建

經過CEEMDAN分解后的原始數(shù)據(jù)大大降低了數(shù)據(jù)本身的復雜程度,將分解所得序列分為高頻分量、中頻分量以及趨勢項。為了更準確地對各分量進行預測,搭建了長短期記憶網(wǎng)絡(long short-term memory, LSTM)預測模型和支持向量回歸(support vector regression,SVR)預測模型,分別對不同類型分量進行預測。在此過程中,為了更好地發(fā)揮預測模型的性能,選用麻雀算法(sparrow search algorithm,SSA)對模型進行優(yōu)化,且為了區(qū)分不同分量信息的重要性,采用了注意力機制,以此達到優(yōu)化模型性能、提高預測精度的目的。

2.1 LSTM原理

針對 RNN 網(wǎng)絡出現(xiàn)的梯度消失和爆炸問題, Hochreiter等[14]提出一種長短期記憶網(wǎng)絡(LSTM)。LSTM與 RNN 不同之處在于LSTM隱藏層內的循環(huán)遞歸單元中存在特殊的門控機制,有效地克服了梯度爆炸等問題[15-16]。一個LSTM模型有輸入門、遺忘門和輸出門[17]。LSTM非常適合處理和預測短期或者超短期內具有未知持續(xù)時間的時間序列,從而使其能夠得到充分訓練并且能展現(xiàn)出比RNN更加優(yōu)異的性能。

LSTM網(wǎng)絡采用反向誤差傳播算法對時間網(wǎng)絡進行訓練[18]。LSTM可以較好地對風速、風向、大氣密度等相關時間序列進行預測,起到提高預測精度的效果,預測結果精度提高后更有利于進行相關的風電并網(wǎng)調度等一系列工作, LSTM的網(wǎng)絡結構圖[19]如圖1所示。

LSTM中如遺忘門ft、輸入門it、輸出門ot等各變量可根據(jù)如式(6)～式(11)計算得出。

ft=σ(Wf[ht-1]+bf)

(12)

it=σ(Wi[ht-1,xt]+bi)

(13)

(14)

(15)

ot=σ(Wo[ht-1,xt]+bo)

(16)

ht=ottanhCt

(17)

式中:ht-1和ht分別為上一時刻和當前時刻的輸出;xt為當前時刻的輸入;Wf、Wi、Wc、Wo為各狀態(tài)下的權重矩陣;bf、bi、bc、bo分別為各門偏置項向量;Ct-1和Ct分別為上一時刻和更新后的細胞狀態(tài)向量。

2.2 SVR原理

支持向量回歸(SVR)是由Vapnik[20]提出的一項數(shù)據(jù)挖掘技術,其以統(tǒng)計學理論為基礎,基于VC維(Vapnik-Chervonenkis dimension)理論和結構風險最小化原理。SVR的基本思想是將影響因素映射到一個高維的特征空間。SVR具有出色的泛化能力,且對異常值具有魯棒性,因此具有很高的預測精度。但是當數(shù)據(jù)集中有更多噪聲時,SVR往往表現(xiàn)不佳,且其不適用于大型的數(shù)據(jù)集。鑒于SVR這些特點,將其用于對CEEMDAN分解后的趨勢項進行預測,使得整體精度進一步提高。

SVR中非線性模型轉化為一個高維的線性回歸模型,表達式為

f(x)=ωTφ(x)+b

(18)

式(18)中:ω和b為模型參數(shù)。

由結構風險最小化原則,得到風險函數(shù)為

(19)

風險函數(shù)的最小值計算公式為

(20)

(21)

高維特征空間中內積運算可用核函數(shù)進行,為方便計算引入拉格朗日函數(shù),將上述問題轉化為對偶問題,可得非線性函數(shù)為

(22)

(23)

式(23)中:g為徑向基核函數(shù)寬度。

2.3 SSA優(yōu)化算法

麻雀搜索算法(SSA)[21]是于2020年提出的一種關于麻雀在覓食過程中各種行為的智能優(yōu)化算法。麻雀是一種動作迅速的、記憶力好的群居動物,因此麻雀種群在覓食過程中具有一些更為顯著的生物學特征,通過模仿麻雀的具體行為來獲得最優(yōu)值。

由麻雀的相關生物特征可概括為如下SSA的數(shù)學模型,在進行優(yōu)化計算之前,必須將參數(shù)進行初始化,其中的參數(shù)包括種群大小、生產者數(shù)量、偵查員數(shù)量、最大迭代次數(shù)、搜索空間的維度以及搜索范圍的上界和下界。隨機生成的麻雀定義為xn,適應度函數(shù)用f(xi)表示。首先一個種群中n只尋找食物的麻雀可表示為

(24)

(25)

式(25)中:f為適應度值。

在SSA中,發(fā)現(xiàn)者的位置更新式為

(26)

式(26)中:Q為服從正態(tài)分布的隨機數(shù);L為所有元素為 1的單位向量;R2為警告值,其范圍是[0,1];ST為安全閾值,其取值范圍是[0.5,1]。R2

由于加入者和發(fā)現(xiàn)者的身份不斷地互換并一直尋找更好的食物來源。加入者的位置更新為

(27)

最后,根據(jù)麻雀尋優(yōu)的規(guī)則和式(28)更新偵察員的位置為

(28)

步驟1初始化種群數(shù)量,并進行參數(shù)確定。

步驟2計算適應度值,并進行排序。

步驟3分別利用式(14)～式(16)來更新捕食者位置、加入者位置以及警戒者的位置。

步驟4根據(jù)計算出的適應度值來更新麻雀占有的新位置。

步驟5若滿足條件,則停止迭代并輸出結果,否則重復執(zhí)行步驟2～步驟4。

SSA優(yōu)化流程圖如圖2所示。

圖2 SSA優(yōu)化流程圖Fig.2 SSA optimization flow chart

2.4 注意力機制

Attention機制(Attention mechanism)的原理是在模型輸出時會選擇性地考慮輸入中的對應相關的信息,計算每個特征的權重,對重要特征賦予較高的權重,對不重要的特征給予較低的權重。在解決循環(huán)網(wǎng)絡的短期記憶問題時,能將有用的信息留下,并將不重要的信息進行忽略。

注意力模型的結構如圖3所示。

圖3 注意力機制模型結構圖Fig.3 Structure of the attention mechanism model

設h=(h1,h2,…,hi,…,hn) 表示通過LSTM網(wǎng)絡后得到的風電狀態(tài)向量,hi是其中的一個狀態(tài)向量,對應于hi的注意力αi,其計算公式為

ei=a(ct,hi)

(29)

(30)

式中:ei為得到的注意力值;ct為LSTM在t時刻的狀態(tài)向量;α用來計算ct與hi之間的相關性的大小;αi由ei進行指數(shù)非線性變換得到。計算注意力加權特征向量ε的公式為

(31)

由于注意力機制使序列建模突破了距離的限制,因此注意力機制通常和循環(huán)神經網(wǎng)絡聯(lián)合使用。將注意力加權后的特征向量輸入LSTM模型中進行訓練,LSTM與AM的結構圖如圖4所示。

y為輸出值;v為整合各部分權重后的新函數(shù)圖4 LSTM-AM機制結構圖Fig.4 Structure diagram of LSTM-AM mechanism

3 預測流程

短期風電功率預測具體步驟如下。

步驟1使用CEEMDAN將原始風電功率序列分解為IMFs分量和一個殘差量。

步驟2采用模糊熵算法對CEEMDAN分解出的子序列分量進行頻率識別,重構成新的分量類型,并將其分為高頻和中頻分量。

步驟3針對高中頻分量具有波動較大、振幅較大的特征,選擇用注意力機制結合SSA-LSTM組合算法進行預測。

步驟4對于殘差趨勢項(RES)波動較小、信號較為平穩(wěn)的特征,則采用SSA-SVR組合算法進行預測。

步驟5重構步驟3、步驟4中所得的序列預測分量,得到預測結果。

步驟6將不同模型預測所得的預測值通過誤差評價指標來分析各個模型的相關性能。

短期風電功率預測流程圖如圖5所示。

圖5 短期風電功率預測結構圖Fig.5 Structure of short-term wind power forecast

4 短期風電功率預測與結果分析

以風電場2017年6—7月實際風電功率數(shù)據(jù)為例進行建模,其中包括風速、風向、大氣密度等,且每兩組數(shù)據(jù)之間的采樣間隔為 15 min,算例中采集5 856個數(shù)據(jù)樣本, 其中最高發(fā)電功率為49.017 MW,最低發(fā)電功率為3.234 MW,所得平均發(fā)電功率為14.62 MW。選用樣本數(shù)據(jù)前90%作為訓練集,后10%為測試集來進行訓練、預測。

在采集風電功率相關的特征數(shù)據(jù)時,例如風速、風向、風電功率等特征,其數(shù)量級和數(shù)量單位都各不相同,有的數(shù)量級甚至相差極大,造成無法對各影響特征進行有效分析的問題。為了解決這一問題,將所有的歷史數(shù)據(jù)先做歸一化處理[22],即將所有數(shù)據(jù)映射到[-1,1],表達式為

(32)

式(32)中:xmin和xmax分別為輸入數(shù)據(jù)的最小、最大值。

選用的誤差評價指標為平均絕對誤差(mean absolute error,MAE)、平均絕對百分比誤差(mean absolute percentage error,MAPE) 和均方根誤差(root mean square error,RMSE),各誤差計算公式如下。

(33)

(34)

(35)

4.1 基于CEEMDAN的風電功率序列分解

為了提高風電功率最終的預測精度,同時降低風能本身隨機性和波動性對預測的影響。所以采用CEEMDAN分解算法對歸一化后的原始數(shù)據(jù)進行預處理,其分解所得的各IMFs分量如圖6所示。

圖6 CEEMDAN分解分量Fig.6 CEEMDAN decomposition components

在圖6中,將預處理后的數(shù)據(jù)分解為13個頻率各異的IMF分量。IMFs分量按頻率由高到低排列且各個分量之間保持較高的獨立性。其中,高頻信號分量波動性較大,其反映了原始功率序列較大的波動性,在預測時會產生較大的誤差。低頻信號分量較為平穩(wěn),接近一條平滑的曲線,其反映了原始序列平穩(wěn)的變化趨勢,在預測時能夠較好地擬合效果。

4.2 模糊熵模態(tài)分量特征識別

在經過CEEMDAN分解后,不同的分量具有不同的頻率特征。為了能更好地對模態(tài)分量的頻率特征進行識別,CEEMDAN分解后使用模糊熵(fuzzy entropy,FE)復雜度算法將各模態(tài)分量進行類別劃分。模糊熵算法是用來衡量時間序列動態(tài)狀態(tài)的無序性,計算所得的FE越高,意味著時間序列的復雜度越高。因此,基于FE對模態(tài)分量進行分類,頻率特征識別過程如下。

步驟1基于模糊熵算法計算模式k的復雜度FEk,k=1,2,…,M。

步驟2設置臨界值λ0(2.3)和λ1(1.6)。

步驟3根據(jù)FE,對各模態(tài)分量imf進行類別劃分。imf1,imf2,…,imfK被識別為短期擾動項(FE>λ0);imfK+1,imfK+2,…,imfL被識別為中期變化項(λ1

模糊熵算法參數(shù)設定采用嵌入維度m=2,r=0.141 4σsd,n=2。基于模糊熵值(FE)對模態(tài)分量進行類別劃分,表1呈現(xiàn)了各模態(tài)分量的模糊熵值及分類結果。

表1 各分量模糊熵值及分類結果Table 1 Fuzzy entropy values and classification results of each component

4.3 預測結果分析

根據(jù)不同序列分量的特點,并對不同分量的預測模型進行更合理的分析,分別選用合適的模型進行預測。對于較為平穩(wěn)、波動性較小的序列,整體呈現(xiàn)出線性趨勢,基本代表整個風電功率的長期走向趨勢,采用對較平穩(wěn)信號預測效果較好的SVR預測模型進行滾動預測并采用SSA對SVR相關參數(shù)進行參數(shù)尋優(yōu)。由于高頻類的信號波動性大,具有復雜的非線性關系。因此,選用經注意力機制進行權值分配后的LSTM 神經網(wǎng)絡對中、高頻分量類進行時序滾動預測,并用SSA對LSTM-Attention進行參數(shù)尋優(yōu)。

根據(jù)高頻序列中的相關特征進行建模預測分析。在SSA優(yōu)化模型中,得到優(yōu)化后的學習率最終穩(wěn)定在0.006 8,最優(yōu)迭代次數(shù)為58用K表示,且由優(yōu)化后相關參數(shù)可知,第1隱含層和第2隱含層節(jié)點數(shù)最終穩(wěn)定為100和43,分別用L1和L2表示。SSA優(yōu)化效果隨迭代次數(shù)的變化用lr表示。對高頻序列模型進行SSA優(yōu)化相關參數(shù)如圖7和圖8所示。

圖7 SSA超參數(shù)隨迭代次數(shù)的變化(高頻序列模型)Fig.7 Variation of SSA hyperparameters with the number of iterations (high-frequency sequence model)

圖8 SSA適應度變化曲線(高頻序列模型)Fig.8 SSA adaptability change curve (high-frequency sequence model)

根據(jù)中頻序列中的相關特征進行建模預測分析。在SSA優(yōu)化模型中,得到優(yōu)化后的學習率最終穩(wěn)定在0.006 7,最優(yōu)迭代次數(shù)為49,且有優(yōu)化后相關參數(shù)可知第1隱含層和第2隱含層節(jié)點數(shù)最終穩(wěn)定為49和90。對中頻序列模型進行SSA優(yōu)化相關參數(shù)如圖9和圖10所示。

圖9 SSA超參數(shù)隨迭代次數(shù)的變化(中頻序列模型)Fig.9 Variation of SSA hyperparameters with the number of iterations(medium frequency sequence model)

圖10 SSA適應度變化曲線(中頻序列模型)Fig.10 SSA adaptability change curve (medium frequency sequence model)

對于高頻分量和中頻分量在分別進行SSA優(yōu)化時,參數(shù)上的差異表現(xiàn)如圖7～圖10所示。對于一組數(shù)據(jù)在進行優(yōu)化時,都選用了LSTM進行預測,但是由于數(shù)據(jù)頻率波動上的差異,可將其按照一定的頻率標準劃分之后再進行優(yōu)化,其優(yōu)化參數(shù)也會大不相同,這證明了兩組數(shù)據(jù)分別建立預測模型后再分開優(yōu)化,預測精度也會隨著優(yōu)化參數(shù)的精確而進一步提高。而在對低頻趨勢項進行預測時,則選用泛化能力較為出色、且對異常值的魯棒性較好的SVR進行功率預測。這種針對不同頻率選用不同預測模型的方法,能更大限度地利用不同模型的優(yōu)點,使得預測精度更佳。對SVR進行參數(shù)尋優(yōu),主要是對懲罰參數(shù)c、核參數(shù)g進行尋優(yōu)[23],選用均方誤差(mean square error,MSE)作為適應度函數(shù)的評價標準,其計算公式為

(36)

在迭代次數(shù)100、種群數(shù)量為20的情況下,經過不斷優(yōu)化可得最后的最優(yōu)懲罰參數(shù)c為12.245 8,最優(yōu)的核參數(shù)g為0.768 11,MSE為此時模型的誤差評價指標,為6.076 9,結果如圖11所示。

圖11 SSA優(yōu)化SVR相關參數(shù)Fig.11 SSA optimization of SVR-related parameters

由于原始功率波動性較大,且數(shù)據(jù)特征較為復雜。使用單一的預測模型進行功率預測時,會出現(xiàn)明顯的不足,而在進行預測前,采用CEEMDAN分解能有效降低原始數(shù)據(jù)的復雜程度,為進一步分頻預測打下基礎。且使用不同的單一模型對同一數(shù)據(jù)進行預測時也會出現(xiàn)明顯的差異,比如使用單一的LSTM和SVR對功率進行預測,則會發(fā)現(xiàn)LSTM在數(shù)據(jù)波動較大、數(shù)據(jù)量增多的情況下預測效果更佳,相反SVR在數(shù)據(jù)較為平滑、波動較小時預測效果更好,且其對于數(shù)據(jù)較多的情況往往難以展現(xiàn)其優(yōu)點。所以采用不同模型進行分頻處理,得到的整體預測效果更好。

為了更好地評估所提出模型的性能,選用SVR、LSTM、SSA-SVR、SSA-LSTM、CEEMDAN-SSA-LSTM、CEEMDAN-SSA-LSTM-Attention共6種預測模型與所提的“分解-分類-預測-集成”模型進行對比,結果如圖12所示。

圖12 不同模型預測值對比Fig.12 Comparison of predicted values of different models

分別計算SVR、LSTM、SSA-SVR、SSA-LSTM、CEEMDAN-SSA-LSTM、CEEMDAN-SSA-LSTM-Attention和“分解-分類-預測-集成”模型的評價指標MAE、MAPE、RSME的值,如表2所示。

表2 不同模型的誤差評價指標Table 2 Error evaluation index of different models

由圖12可得出,在功率波動較平穩(wěn)的點SVR的預測效果明顯優(yōu)于LSTM,但是在波動較大的點,SVR顯然達不到較好地預測效果,而LSTM則能較好地進行波動較大處的預測。充分驗證了SVR對于較為平滑且穩(wěn)定的點有較好的預測效果,而LSTM則可以對波動較大的數(shù)據(jù)點進行更好的預測處理。首先,經過對比可以發(fā)現(xiàn),原始數(shù)據(jù)經過CEEMDAN分解后再進行預測,所得到的誤差評價指標均要比直接進行預測時效果更好,從表2中不難發(fā)現(xiàn)CEEMDAN-SSA-LSTM預測模型相較于SSA-LSTM模型,MAE、RMSE和MAPE分別下降了0.409、0.664、0.048。此外,相較于傳統(tǒng)的用經驗來進行LSTM的超參數(shù)選擇方法,在經過SSA優(yōu)化后的LSTM能更好地體現(xiàn)預測性能,MAE、RMSE和MAPE分別下降了2.062、1.521、0.405。

所提出的“分解-分類-預測-集成”預測模型起到了較為明顯的預測效果,針對低頻的趨勢項采用魯棒性更強的SVR進行預測;對于波動和振幅較大的高、中頻項則采用LSTM行預測,并采用SSA對這兩個模型參數(shù)進行尋優(yōu)。該模型相較于CEEMDAN-SSA-LSTM-Attention的MAE、RMSE和MAPE分別下降了0.433、0.403和0.03。并且使得預測效果更好,對整個預測都采用SSA-LSTM比采用SSA-SVR的MAE、RMSE和MAPE分別下降了0.556、1.281和0.201。同時,對于模糊熵重構的序列中的中、高頻分量都采用了LSTM預測,但是在用SSA進行優(yōu)化時,由于波動程度及幅值大小的整體差異,在進行參數(shù)優(yōu)化時,所得到的優(yōu)化參數(shù)也會各不相同,如前者第1隱含層和第2隱含層節(jié)點數(shù)最終穩(wěn)定為49和90,而后者第1、2隱含層節(jié)點數(shù)最終為100和43。經過這種分頻的優(yōu)化使得模型的整體預測精度進一步提高。

5 結論

對于所提出的分解-分類-預測的預測框架,經過實驗分析得到如下結論。

(1)研究CEEMDAN分解方法、模糊熵分類法、SSA優(yōu)化算法以及LSTM和SVR預測算法,提出了基于頻率的不同對序列進行重構的模糊熵分類法和對不同頻率序列采用不同模型進行預測的組合模型,目的是為了提高短期風電功率的預測精度。

(2)經過 CEEMDAN 分解對原始數(shù)據(jù)的預處理,把原本復雜的功率數(shù)據(jù)分解為多個簡單序列,減小了原始數(shù)據(jù)的不平穩(wěn)性。同時,考慮到子序列波動程度的不相同,采用了模糊熵將序列分量按FE值進行重構,分為高頻和中頻分量。

(3)使用SSA分別對SVR和LSTM預測模型進行超參數(shù)優(yōu)化,使用SSA-LSTM對高中頻分量進行預測;使用SSA-SVR對低頻趨勢項進行預測。由于高、中頻序列分量的整體波動程度及幅值大小各不相同,因此在采用SSA對LSTM進行超參數(shù)優(yōu)化時,會發(fā)現(xiàn)其優(yōu)化參數(shù)也各不相同。在對不同頻分量分類后,進一步提高了模型的整體預測精度。

(4)其他6種模型與所提出的模型進行對比,可以明顯地發(fā)現(xiàn)所提模型在很大程度上克服了單一預測模型易陷入局部最優(yōu)的缺點,且其有著更好的動態(tài)預測性能,因此,有著更為精確的預測效果。進一步證明了所提出模型的合理性及精確性,對風電功率的短期預測有著更好的實際應用意義。