郭韶昕, 陳 祥, 周 楓
(1.北京京能清潔能源電力股份有限公司內(nèi)蒙古分公司,呼和浩特 010070;2.福氏新能源技術(shù)(上海)有限公司 技術(shù)部,上海 201315)
風(fēng)能的大規(guī)模開發(fā)是我國實現(xiàn)“雙碳”目標(biāo)的重要手段。風(fēng)能在時間、空間尺度上差異較大,存在風(fēng)電功率不確定性強的固有缺點。準(zhǔn)確的風(fēng)電場出力預(yù)測,可以較好地解決風(fēng)電功率不確定帶來的風(fēng)電消納及電力系統(tǒng)的控制、調(diào)度問題。
風(fēng)電功率短期預(yù)測主要用于風(fēng)電機組的控制、電網(wǎng)的調(diào)度安排[1]。根據(jù)其原理可以分為物理學(xué)法、統(tǒng)計學(xué)習(xí)法[2]。文獻[3]從氣象學(xué)角度分析了風(fēng)電功率預(yù)測的誤差來源,提出一種針對物理學(xué)方法誤差來源的探明方法,獲取了各環(huán)節(jié)引入預(yù)測誤差的量化結(jié)果。結(jié)合氣象學(xué)方法的模型解算量較大,為了減少計算量,采用較大的空間網(wǎng)格尺寸又會導(dǎo)致預(yù)測的空間分辨率不高等問題。文獻[4]重點研究了風(fēng)速序列的自相關(guān)性和時序性,建立了短期風(fēng)速預(yù)測的滑動平均自回歸模型。雖然實驗表明該模型的預(yù)測精度有一定的改善,但是此類模型在風(fēng)速變化較大時擬合效果一般,需要修正預(yù)測誤差以改善預(yù)測結(jié)果。
為了提高預(yù)測的精度,很多學(xué)者將信號分解技術(shù)運用到風(fēng)電功率時序序列的處理,分別對分解后的子序列建立預(yù)測模型。文獻[5]利用完全集合經(jīng)驗?zāi)B(tài)分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)方法對風(fēng)電功率序列進行預(yù)處理并結(jié)合關(guān)鍵氣象變量數(shù)據(jù),使用基于時間模式注意力機制的時間卷積網(wǎng)絡(luò),對子序列分量分別進行預(yù)測,仿真結(jié)果表明該方法可行。文獻[6]使用CEEMD 方法將原始風(fēng)電功率序列分解為多個分量后,利用多尺度熵重組序列,既保留了原始數(shù)據(jù)特征又減少了計算量,基于集成學(xué)習(xí)的各分量預(yù)測模型有較好的風(fēng)電功率預(yù)測精度。對原始功率時序序列進行信號分解為風(fēng)電功率預(yù)測提供了新的思路,但是高階預(yù)測模型不可避免會帶來超參數(shù)選取的問題,需要設(shè)計算法對參數(shù)進行尋優(yōu)。
基于以上分析,本文提出一種基于CEEMD、改進蜻蜓算法(Improved Dragonfly Algorithm,IDA)和支持向量機(Support Vector Machine,SVM)的風(fēng)電功率短期預(yù)測模型,定義為CEEMDIDA-SVM 模型。該模型先采用CEEMD 方法將風(fēng)功率時序序列分解成為若干個模態(tài)分量,再利用IDA優(yōu)化的SVM 模型分別對每個分量建模預(yù)測。
經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)由Huang等[7]提出。將原始信號分解成幾個本征模函數(shù),設(shè)時序信號為x(t),對其采用EMD方法分解的步驟如下:
步驟1 確定原始序列的極值,以及局部極大值xmax(t)與局部極小值xmin(t)的擬合包絡(luò)線。
步驟2 記原始序列x(t)與包絡(luò)線的均值m(t)的差值為h(x),判斷h(x)是否滿足成為分量的兩個條件。滿足條件時,h(x)成為提取的第一個分量c1(t);不滿足條件時,計算h(x)的極值點,并重復(fù)步驟1。
步驟3 原始序列減去提取到的分量c1(t)后,再次重復(fù)以上過程,產(chǎn)生下一個分量。當(dāng)分量小于設(shè)定值或分量單調(diào)時,分解完成,原始序列表示為

式中:ci(t)為提取的第i個分量;rn(t)為殘余分量。
EMD方法中出現(xiàn)的端點效應(yīng)和模態(tài)混疊,會使得信號分解出現(xiàn)較大誤差。有學(xué)者在EMD方法的基礎(chǔ)上,提出了集合經(jīng)驗?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)方法,在原始信號中加入高斯白噪聲,使得信號能被解出具有各個頻率的模態(tài)信號,在一定程度上改善了EMD方法的不足[8]。然而,當(dāng)高斯白噪聲幅值和次數(shù)不合適時,原信號會產(chǎn)生偽分量,使得重構(gòu)誤差增大。在原始信號中加入幅值相等的正負白噪聲,既可抑制EMD 方法模態(tài)混疊的問題,也可改善EEMD 方法重構(gòu)誤差大的問題,這就是CEEMD方法[9]。
SVM[10-11]是一種小樣本學(xué)習(xí)方法。區(qū)別于傳統(tǒng)的歸納演繹,SVM 可以高效地實現(xiàn)訓(xùn)練數(shù)據(jù)到預(yù)報數(shù)據(jù)的回歸預(yù)測。其計算的復(fù)雜度不取決于數(shù)據(jù)的維度,在一定程度上避免了“維數(shù)災(zāi)難”,算法簡潔,魯棒性強。通過非線性變換將輸入空間映射到一個特征空間,常用于解決線性和非線性回歸問題。超平面可記為

式中:σ為高斯核函數(shù)參數(shù),σ>0;g為常數(shù),g>0。
式(3)中的c、式(5)中的g的選取對SVM 的性能有很大影響,需要對其進行優(yōu)化以確定最優(yōu)參數(shù)。
蜻蜓算法(Dragonfly Algorithm,DA)[12]是一種種群智能算法,常用于求解有約束及搜索空間未知的問題,全局尋優(yōu)能力和尋優(yōu)精度較高。DA 模擬了蜻蜓種群分離、排隊、結(jié)盟、捕食和避敵等行為,以進行局部和全局搜索,分別由以下數(shù)學(xué)表達式表示。
第i種群個體分離行為的位置向量為

式中:N為個體數(shù)量;X是當(dāng)前個體的位置向量;Xj為第j個個體的位置向量。
第i種群個體排隊行為的位置向量為
式中:s、h、c、f、e分別為各行為的系數(shù);w為慣性系數(shù)。
引入萊維(Levy)飛行策略,在同類個體附近無臨近解時,采用此方法更新蜻蜓位置向量為

式中:d為蜻蜓個體的位置向量的維度;r1,r2是[0,1]之間的隨機數(shù);β=1.5。
在種群智能算法中,如果在開始迭代初期能夠獲得比較接近全局最優(yōu)解的機會,那么最終得到全局最優(yōu)解的概率就會增加,并能實現(xiàn)快速收斂。反向?qū)W習(xí)[13]是一種算法優(yōu)化方法,在實現(xiàn)過程中,把候選解及其反向解同時進行計算,再計算其反向解的適應(yīng)度值,選擇其中更優(yōu)值的個體開始下一次迭代,其公式為

在DA中引入Levy飛行策略和反向?qū)W習(xí)策略,形成的IDA流程如下:
步驟1 初始化算法。
步驟2 適應(yīng)度函數(shù)為樣本的均方差,更新種群適應(yīng)值,更新X+、X-。
步驟3 更新5個行為系數(shù),用式(11)更新步長向量、位置向量。當(dāng)個體周圍無臨近解時,使用Levy飛行策略進行更新。
步驟4 計算新的適應(yīng)度值。
步驟5 達到設(shè)定的反向?qū)W習(xí)概率時,計算反向解,并選擇較優(yōu)解。
步驟6 比較個體與食物位置和敵人位置的適應(yīng)度值,比食物的適應(yīng)度值好,則更新為食物的位置;比敵人的適應(yīng)度值差,則更新為敵人的位置。
步驟7 達到設(shè)定的結(jié)束條件就輸出最終結(jié)果,否則返回步驟2。
圖1所示為CEEMD-IDA-SVM 模型的預(yù)測流程,相關(guān)步驟如下:

圖1 CEEMD-IDA-SVM 模型的預(yù)測流程
步驟1 利用CEEMD 分解原始風(fēng)電功率數(shù)據(jù),得到各模態(tài)分量。
步驟2 利用SVM 對各分量分別建立預(yù)測模型。其中,SVM 中的參數(shù)c以及g由反向?qū)W習(xí)策略改進的DA,即IDA優(yōu)化得到。具體為:首先,設(shè)置IDA參數(shù)和SVM 參數(shù);其次,初始化蜻蜓初始位置和更新步長,保存懲罰參數(shù)和核函數(shù)組合集合(c,g);接著,隨機初始化蜻蜓迭代半徑,并計算蜻蜓算法的各權(quán)重;最后,滿足條件時停止迭代,尋優(yōu)結(jié)束。
步驟3 各分量預(yù)測值線性相加得到最終結(jié)果。
(1) 采用整體正交性指標(biāo)IOO和完備性指標(biāo)IC比較各分解方法的性能[14],計算公式為

式中:IOi,k為CEEMD 方法分解的cj(t)分量與ck(t)分量的正交性指標(biāo);N為分量的個數(shù);M為采樣點的個數(shù)。
(2) 采用均方根誤差ERMS、平均絕對誤差EMA、平均絕對百分比誤差EMAP這3個指標(biāo)評價風(fēng)電功率預(yù)測模型的性能[15],計算公式為

為了驗證本文所提模型的有效性,選取某額定功率為10 MW 的風(fēng)電場某年1月的數(shù)據(jù)進行仿真,采樣間隔為15 min,使用前30天2 880組數(shù)據(jù)訓(xùn)練預(yù)測模型,預(yù)測后1天96組數(shù)據(jù),仿真環(huán)境為Matlab R2020b。使用IDA優(yōu)化的SVM 對CEEMD分解后的分量分別進行預(yù)測。在IDA 中,蜻蜓初始種群個數(shù)為50,最大迭代次數(shù)為200,尋優(yōu)數(shù)量為2,尋優(yōu)區(qū)間為[0.01,100],采用均方差最小作為適應(yīng)度值標(biāo)準(zhǔn)。CEEMD 中加入的白噪聲標(biāo)準(zhǔn)差設(shè)置為0.25,總集合次數(shù)設(shè)置為100。
針對風(fēng)電功率時序序列的強隨機特點,使用CEEMD分解技術(shù),分解為保留了原始數(shù)據(jù)信息特征的分量,分解結(jié)果如圖2所示。

圖2 CEEMD分解結(jié)果
為驗證CEEMD 方法的優(yōu)越性,同時采用EMD方法及EEMD方法對該時序序列進行分解。采用上文提出的評價指標(biāo)對比分析其分量正交性和重構(gòu)誤差,表1為3種分解方法的評價指標(biāo)。

表1 分解方法的評價指標(biāo)
由表1和圖2可以看出,對于具有強隨機和波動性的風(fēng)電功率時序序列,CEEMD方法不論是整體正交性指標(biāo)還是重構(gòu)誤差指標(biāo)都是3種方法中最小的。這表明CEEMD方法較大程度上改善了經(jīng)驗?zāi)B(tài)分解產(chǎn)生的模態(tài)混疊現(xiàn)象,同時重構(gòu)誤差并沒有增加,各分量完備性較強,較好地保留了原始數(shù)據(jù)的信息特征。該方法對于電功率時序序列的處理,為風(fēng)電功率預(yù)測模型提供了優(yōu)質(zhì)的數(shù)據(jù)支撐。
CEEMD-IDA-SVM模型的預(yù)測結(jié)果如圖3所示。

圖3 CEEMD-IDA-SVM 模型的預(yù)測結(jié)果
為了驗證CEEMD-IDA-SVM 模型的優(yōu)越性,建 立 了EMD-IDA-SVM 模 型、EEMD-IDASVM 模型和CEEMD-粒子群優(yōu)化(Particle Swarm Optimization,PSO)-SVM 模型,與之進行對比。各模型的預(yù)測結(jié)果如圖4所示,預(yù)測結(jié)果評價指標(biāo)如表2所示。

圖4 各模型的預(yù)測結(jié)果

表2 各模型預(yù)測結(jié)果評價指標(biāo)
由圖3可以看出,本文提出的CEEMD-IDASVM 模型的預(yù)測結(jié)果與實測值的誤差較小。前期1~60采樣點,風(fēng)電功率變化平緩,預(yù)測的結(jié)果和真實值相差不大。后期采樣點的波動變大,預(yù)測的結(jié)果沒有很好地擬合實測值的變化細節(jié)。在模型的對比實驗中,由圖4和表2可以看出,本文構(gòu)建的IDA改進的SVM 模型比經(jīng)典的PSO算法改進的SVM 模型的預(yù)測精度更高,ERMS和EMAP指標(biāo)提高了30%以上。這是因為IDA在參數(shù)尋優(yōu)的過程中收斂快,收斂的精度也更高。由于EMD 和EEMD分解在正交性和重構(gòu)誤差指標(biāo)上都不如CEEMD,所以依據(jù)EMD和EEMD分解后的分量建立的預(yù)測模型準(zhǔn)確度都不如基于CEEMD的模型。相較EMD-IDA-SVM 模型和EEMD-IDASVM 模型,CEEMD-IDA-SVM 模型在ERMS、EMA、EMAP指標(biāo)上分別低了約50%、40%、60%。CEEMD方法保留了原始數(shù)據(jù)的特征,提高了數(shù)據(jù)的穩(wěn)定性,更有利于模型預(yù)測。綜上,本文所構(gòu)建的CEEMD-IDA-SVM 模型的預(yù)測性能有一定的優(yōu)越性,更適用于風(fēng)電功率短期預(yù)測。
(1) 采用CEEMD 方法處理風(fēng)電功率原始數(shù)據(jù),將非平穩(wěn)、強波動的復(fù)雜數(shù)據(jù)分解為多個簡單分量,為后期建模提供了數(shù)據(jù)支撐。
(2) 在標(biāo)準(zhǔn)DA 的基礎(chǔ)上引入了反向?qū)W習(xí)策略,優(yōu)化了個體的位置更新模式,算法收斂更快,尋優(yōu)成功的概率也有所增加。
(3) 對比分析了各模型的預(yù)測結(jié)果,CEEMDIDA-SVM 模型的誤差指標(biāo)均最小,預(yù)測精度高且算法運行速度快,用時短,具有較好的實用價值。