文博,陳芳芳,王華玉
1. 云南民族大學(xué) 電氣信息工程學(xué)院,云南 昆明 650031
2. 云南民族大學(xué) 法學(xué)院,云南 昆明 650031
隨著“碳達(dá)峰”和“碳中和”的目標(biāo)在聯(lián)合國大會上提出后,我國也制定了相應(yīng)的響應(yīng)計劃,力爭二氧化碳排放于2030 年前達(dá)到峰值,努力爭取2060 年前實現(xiàn)碳中和[1?2]。風(fēng)電在我國新能源電力中占有較大比例,且其因清潔環(huán)保、成本較低等優(yōu)點成為新能源發(fā)展的主力。但是,風(fēng)力的波動性和隨機性較大,易受天氣因素的影響,給風(fēng)電的利用率帶來了較大限制。因此,短期風(fēng)電功率的準(zhǔn)確預(yù)測對電力系統(tǒng)穩(wěn)定運行具有重要意義。
短期風(fēng)電功率的預(yù)測方法主要可以分為物理方法、統(tǒng)計方法和組合預(yù)測方法3 大類。物理方法對歷史氣象數(shù)據(jù)的精確性要求極高且模型與求解過程復(fù)雜[3],適應(yīng)于某一特定地區(qū)的風(fēng)電功率預(yù)測;統(tǒng)計預(yù)測法模型結(jié)構(gòu)簡單、計算速度較快,可以通過大量的歷史數(shù)據(jù)得到較好的預(yù)測結(jié)果,但是其預(yù)測精度隨著時間序列的增加而迅速降低;組合預(yù)測方法采用其他方法對模型的輸入、輸出以及模型自身的一種或者多種結(jié)構(gòu)進(jìn)行了優(yōu)化并融合改進(jìn)[4],具有強大的非線性映射功能,因此組合預(yù)測法是現(xiàn)在一種較為廣泛的研究趨勢。
文獻(xiàn)[5]采用皮爾遜相關(guān)系數(shù)( Pearson correlation coefficient,PCC)來來尋找與預(yù)測日相似的歷史時刻的數(shù)值天氣預(yù)報(numerical weather prediction, NWP)信息,從而通過相似日歷史功率估計出與預(yù)測日的功率。這種方法避免了采用神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測時波動過大而無法準(zhǔn)確預(yù)測的缺點。文獻(xiàn)[6]提出了一種自適應(yīng)噪聲完全集成經(jīng)驗?zāi)B(tài)分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)和時間模式注意力機制改進(jìn)的時間卷積網(wǎng)絡(luò)模型,這也是一種分解–預(yù)測–重構(gòu)的組合預(yù)測模型,首先用CEEMDAN 對風(fēng)電功率原始序列進(jìn)行分解,然后使用該組合模型對各分量進(jìn)行預(yù)測。文獻(xiàn)[7]采用了多算法的組合預(yù)測模型,然后用主成分分析(principal component analysis,PCA)進(jìn)行特征提取以起到降維的效果,再用模態(tài)特征和PCA 進(jìn)行拼接構(gòu)成新的序列,最后用果蠅算法優(yōu)化極限學(xué)習(xí)機(extreme learning machine,ELM)作為預(yù)測模型。文獻(xiàn)[8]采用集成經(jīng)驗?zāi)B(tài)分解對原始信號進(jìn)行分解,然后采用時間模式注意力從優(yōu)化的雙向長短期記憶( bi-directional long short-term memory,BiLSTM)中提取相關(guān)特征并建立相關(guān)關(guān)系,再將子序列分量輸入其中進(jìn)行預(yù)測。文獻(xiàn)[9]采用卷積神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)特征進(jìn)行提取,并引入了特征交叉機制對特征相關(guān)性進(jìn)行分析并交叉組合,然后將所得特征進(jìn)行長短期記憶(long shortterm memory, LSTM)網(wǎng)絡(luò)預(yù)測,在此基礎(chǔ)上對比得到誤差序列,由其訓(xùn)練得誤差模型,最后疊加預(yù)測值與誤差值得到最終預(yù)測值。文獻(xiàn)[10]采用向量自回歸模型預(yù)測風(fēng)電序列的線性特征,并用Elman 神經(jīng)網(wǎng)絡(luò)模型預(yù)測非線性特征,在此基礎(chǔ)上建立誤差補償模型,并將這兩者疊加得到最終預(yù)測值。文獻(xiàn)[11]采用改進(jìn)的粒子群算法優(yōu)化BiLSTM 模型,并用注意力機制進(jìn)行權(quán)重分配,以此來對功率序列進(jìn)行預(yù)測。
綜上所述,為解決風(fēng)電功率各因素和誤差值對功率預(yù)測的影響,本文提出了一種基于數(shù)據(jù)特征提取和SSA-BiLSTM 的短期風(fēng)電功率預(yù)測方法。先用PCC 分析歷史風(fēng)電數(shù)據(jù)與各影響因素的相關(guān)程度,并將與功率呈弱相關(guān)的因素去除;然后將所提取的特征序列經(jīng)過CEEMDAN 分解,并將分解所得子序列分量輸入SSA-BiLSTM 模型中進(jìn)行預(yù)測,同時所得的預(yù)測值對風(fēng)速序列進(jìn)行修正;最后將修正所得的風(fēng)速序列與風(fēng)電功率序列輸入SSA-BiLSTM 模型中進(jìn)行預(yù)測,以此達(dá)到提高預(yù)測精度的目的。
PCC 是由著名統(tǒng)計學(xué)家卡爾·皮爾遜[12]提出的一種衡量向量相似度的常用方式[13]。PCC 對向量的值做了中心化處理,并對中心化結(jié)果求余弦距離。PCC 會去掉不同變量量綱在計算過程中的差別,也會在進(jìn)行余弦相似度計算時把缺失的維度值賦值為0,其計算公式為
式中ρX,Y絕對值的大小表示2 個變量的相關(guān)性強弱,其值越接近1 表示相關(guān)性越強,若越接近0 則相關(guān)性越弱。相關(guān)程度如表1 所示。

表1 相關(guān)程度劃分
鑒于PCC 的以上特征,其常被用于大量數(shù)據(jù)的預(yù)處理中,進(jìn)行數(shù)據(jù)的特征降維[14]、相似日特征提取和組合預(yù)測[15]等場景中。
經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)是Huang 等[16]針對信號的非線性、非平穩(wěn)特點提出的一種自適應(yīng)信號處理方法。根據(jù)數(shù)據(jù)本身特征對信號進(jìn)行直接分解無需設(shè)置其他基函數(shù)。EMD 分解存在模態(tài)混疊現(xiàn)象。因此,Wu 和Huang 提出了集合經(jīng)驗?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)來克服EMD 的模態(tài)混疊問題[17],EEMD 是一種噪聲輔助數(shù)據(jù)分析方法。EEMD 在進(jìn)行信號分解后可得到包括反應(yīng)原始序列波動性的高頻信號和反應(yīng)其穩(wěn)定性的低頻殘差信號R。由于殘余噪聲信號和加噪聲信號的不同,以此來實現(xiàn)的重構(gòu)信號可能會導(dǎo)致產(chǎn)生的本征模態(tài)函數(shù)(intrinsic mode function,IMF)數(shù)量不同。雖然其整個過程能夠有效地克服EMD 方法的模態(tài)混疊缺陷,但并不能有效消除白噪聲信號,所以使得重構(gòu)誤差過大。
Flandrin 等為了克服EEMD 中重構(gòu)誤差大的問題而提出了CEEMDAN 這種新的信號分解算法。CEEMDAN 較EEMD 而言分解速度更快且運算量也大幅減小。與互補集合經(jīng)驗?zāi)B(tài)分解(complementary ensemble empirical mode decomposition,CEEMD)最后總體平均不同的是,它在得到第一次的IMF 后就進(jìn)行平均計算,這種處理方法有效地避免了白噪聲信號從高頻到低頻的傳遞,從而影響最后的分析和處理。在接下來的每一個階段都加入有限次的白噪聲信號,能有效降低EEMD 的重構(gòu)誤差[18],但也在一定程度上增加了運算量。其具體分解流程如下:
1)對風(fēng)電功率原始序列C(t)添加白噪聲,計算如下:
式中:t為原始功率分解的次數(shù),Cj(t)為最新得到的功率序列,βk為第k個信噪比,nj(t)則為第j次添加的高斯白噪聲。
2)用原始功率序列計算殘差信號:
3)在R1(t)中加入正負(fù)成對的高斯白噪聲,并對所得新信號R1(t)+β1E1(nj(t))進(jìn)行N次重復(fù)分解并求均值,得到分解后的第2 個模態(tài)分量fim,2(t)及第2 個殘差信號R2(t):
4)接下來不斷重復(fù)步驟3)的計算過程,通過CEEMDAN 不斷地分解得到第k+1 個模態(tài)分量fim,k+1和第k個余量信號Rk。
5)重復(fù)上述步驟,最后得到若干個IMF 分量并計算出相應(yīng)的滿足條件殘差分量。最終信號被分解為
麻雀搜索算法(sparrow search algorithm, SSA)[19]是2020 年提出的一種有關(guān)麻雀在覓食過程中的相關(guān)行為的智能優(yōu)化算法。麻雀是一種動作迅速、記憶力好的群居動物,因此麻雀種群在覓食過程中具有一些更為顯著的生物學(xué)特征,因此可通過模仿麻雀的具體行為來獲得最優(yōu)值。
由麻雀的相關(guān)生物特征可概括為如下SSA 的數(shù)學(xué)模型,在進(jìn)行優(yōu)化計算之前,必須將參數(shù)進(jìn)行初始化,其中的參數(shù)包括種群大小、生產(chǎn)者數(shù)量、偵查員數(shù)量、最大迭代次數(shù)、搜索空間的維度以及搜索范圍的上界和下界。隨機生成的麻雀定義為xn,適應(yīng)度函數(shù)用f(xi)表示。首先一個種群中n只尋找食物的麻雀可做表示如下:
式中:d為待優(yōu)化問題變量的維數(shù),n為麻雀數(shù)量。其適應(yīng)度函數(shù)為
在SSA 中,發(fā)現(xiàn)者的位置更新表示為
式中:imax為最大迭代次數(shù);Q為服從正態(tài)分布的隨機數(shù);L為所有元素為1 的單位向量;R2為警告值,其范圍是[0,1];Tsafe為安全閾值,其取值范圍為[0.5,1]。R2 由于加入者和發(fā)現(xiàn)者的身份不斷地互換并一直尋找更好的食物來源,加入者的位置更新表示為 式中:Xworst和分別為全局最差位置和發(fā)現(xiàn)者所占最優(yōu)位置;A為在[?1,1]隨機取值的1×d矩陣,A+=AT(AAT)?1。 最后,根據(jù)麻雀尋優(yōu)的規(guī)則和如下方程更新偵察員的位置: SSA 優(yōu)化流程如圖1 所示。 圖1 SSA 優(yōu)化流程 針對循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)出現(xiàn)的梯度消失和爆炸問題,Hochreiter等[20]提出一種LSTM 網(wǎng)絡(luò)。LSTM 與RNN 不同之處在于LSTM 隱藏層內(nèi)的循環(huán)遞歸單元中存在特殊的門控機制,有效地克服了梯度爆炸等問題[21?22]。1 個LSTM 模型有輸入門、遺忘門和輸出門[23?24]。LSTM 模型非常適合處理和預(yù)測短期或者超短期內(nèi)具有未知持續(xù)時間的時間序列,從而使其能夠得到充分訓(xùn)練并且能展現(xiàn)出比RNN 更加優(yōu)異的性能。 LSTM 網(wǎng)絡(luò)采用反向誤差傳播算法對時間網(wǎng)絡(luò)進(jìn)行訓(xùn)練[25]。LSTM 模型可以較好地對風(fēng)速、風(fēng)向、大氣密度等相關(guān)時間序列進(jìn)行預(yù)測,起到提高預(yù)測精度的效果。預(yù)測結(jié)果精度提高后更有利于進(jìn)行相關(guān)的風(fēng)電并網(wǎng)調(diào)度等一系列工作,LSTM 的網(wǎng)絡(luò)結(jié)構(gòu)圖[26]如圖2 所示。 圖2 LSTM 的網(wǎng)絡(luò)結(jié)構(gòu) LSTM 中如遺忘門tf、輸入門ti、輸出門to各變量計算公式為 式中:ht–1和ht分別為上一時刻和當(dāng)前時刻的輸出,xt為當(dāng)前時刻的輸入,Wf、Wi、Wc、Wo分別為遺忘門、輸入門、候選門和輸出門下的權(quán)重矩陣,bf、bi、bc、bo為各門偏置項,Ct–1和Ct為上一時刻和更新后的細(xì)胞狀態(tài)。 而雙向長短期記憶網(wǎng)絡(luò)則是在LSTM 的基礎(chǔ)上進(jìn)一步優(yōu)化。BiLSTM 是由前向的LSTM 結(jié)構(gòu)和反向LSTM 結(jié)構(gòu)組成,彌補了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時只從前到后的傳播訓(xùn)練。BiLSTM 模型能更大程度地挖掘風(fēng)電功率數(shù)據(jù)中所包含的信息,克服了傳統(tǒng)LSTM 挖掘數(shù)據(jù)不充分的缺點,為風(fēng)電功率的進(jìn)一步準(zhǔn)確預(yù)測創(chuàng)造了更好的條件。BiLSTM 模型的結(jié)構(gòu)如圖3 所示。 圖3 BiLSTM 結(jié)構(gòu) 1)用PCC 法分析風(fēng)電數(shù)據(jù)中風(fēng)電功率與各影響因素之間的相關(guān)系數(shù),從而剔除與功率相關(guān)性低的因素。 2)對所選取出來的風(fēng)速序列數(shù)據(jù)進(jìn)行CEEMDAN 分解,得到一系列子序列分量。 3)將分解所得序列分量放入SSA 優(yōu)化后的BiLSTM 模型中進(jìn)行訓(xùn)練,并預(yù)測風(fēng)速值。 4)將風(fēng)速預(yù)測值與實際值作對比,并對風(fēng)速值進(jìn)行修正。 5)把修正所得的風(fēng)速值與風(fēng)電功率序列作為輸入,送入SSA-BiLSTM 模型中進(jìn)行預(yù)測。 6)將各模型的誤差評價指標(biāo)進(jìn)行分析,得到所用模型的可行性。 預(yù)測流程如圖4 所示。 圖4 風(fēng)電功率預(yù)測流程 在采集風(fēng)電功率相關(guān)的特征數(shù)據(jù)時,例如風(fēng)速、風(fēng)向、風(fēng)電功率等特征,其數(shù)量級和數(shù)量單位都各不相同,有的數(shù)量級甚至相差極大,造成無法對各影響特征進(jìn)行有效分析的問題。為了解決這一問題,將所有的歷史數(shù)據(jù)先做歸一化處理[27],即將所有數(shù)據(jù)映射到[?1,1]: 式中xmin和xmax分別為輸入數(shù)據(jù)的最小、最大值。 選用的誤差評價指標(biāo)[28]為平均絕對誤差(mean absolute error,MAE)EMA、平均絕對百分比誤差(mean absolute percentage error,MAPE)EMAP和均方根誤差(root mean square error,RMSE)ERMS,誤差計算公式為 式中:n為風(fēng)電功率總采樣數(shù),m為訓(xùn)練集樣本數(shù)量,yi和y?i分別為風(fēng)電功率真實值和預(yù)測值。 以某風(fēng)電場2017 年6 月及7 月實際風(fēng)電功率數(shù)據(jù)為例進(jìn)行建模,其中包括風(fēng)速、風(fēng)向、大氣密度等,且每2 組數(shù)據(jù)之間的采樣間隔為15 min,算例中采樣5 856 個數(shù)據(jù)樣本,其中最高發(fā)電功率為49.017 MW,最低發(fā)電功率為3.234 MW,所得平均發(fā)電功率為14.62 MW。選用樣本數(shù)據(jù)前90%作為訓(xùn)練集,后10%為測試集來進(jìn)行訓(xùn)練、預(yù)測。 將風(fēng)電場中所采集的數(shù)據(jù)點通過計算NWP影響因素和輸出功率的PCC 對樣本數(shù)據(jù)進(jìn)行降維處理。得到的的系數(shù)值如表2 所示。 表2 PCC 降維結(jié)果 通過對比表中的相關(guān)系數(shù)得出,與輸出功率最相關(guān)的特征為70 m 高處風(fēng)速。 為了提高風(fēng)電功率最終的預(yù)測精度,同時降低風(fēng)能本身隨機性和波動性對預(yù)測的影響,采用CEEMDAN 分解算法對數(shù)據(jù)特征提取所得的風(fēng)速序列進(jìn)行分解預(yù)處理,其分解所得的各IMF 分量如圖5 所示。 圖5 CEEMDAN 風(fēng)速分解 圖5中,將預(yù)處理后的數(shù)據(jù)分解為12 個頻率各異的IMF 分量。IMF 分量按頻率由高到低排列且各個分量之間保持較高的獨立性。其中,高頻信號分量波動性較大,其反映了風(fēng)速序列較大的波動性,在預(yù)測時會產(chǎn)生較大的誤差;低頻信號分量較為平穩(wěn),接近一條平滑的曲線,其反映了原始序列平穩(wěn)的變化趨勢,在預(yù)測時能夠較好地擬合效果。 采用LSTM 預(yù)測數(shù)據(jù)集后10%的風(fēng)速預(yù)測結(jié)果如圖6 所示,容易看出實際值與所得預(yù)測值有明顯的相位差異。由圖6 可知,采用單一LSTM模型對風(fēng)速序列進(jìn)行預(yù)測所得結(jié)果與真實值相比會存在較大的相位差異。因此本文采用SSA 優(yōu)化后的BiLSTM 對風(fēng)速預(yù)測結(jié)果進(jìn)行修正,所得修正結(jié)果如圖7 所示。由圖6、圖7 對比可得出,在使用SSA 對BiLSTM 的超參數(shù)進(jìn)行優(yōu)化后,再對風(fēng)速序列進(jìn)行預(yù)測,所得結(jié)果相較于單一LSTM 模型相位差異性更小,所得結(jié)果可用度更高。2 種不同模型誤差指標(biāo)如表3 所示。 圖6 LSTM 風(fēng)速預(yù)測結(jié)果 圖7 風(fēng)速預(yù)測值校正結(jié)果 表3 風(fēng)速修正前后誤差指標(biāo)對比 對數(shù)據(jù)進(jìn)行相關(guān)預(yù)處理后,選用SSA-BiLSTM模型作為預(yù)測模型。對于BiLSTM 模型,在用SSA 優(yōu)化過程中,得到優(yōu)化后的學(xué)習(xí)率為0.006 7,種群數(shù)為8,最優(yōu)迭代次數(shù)為49,生產(chǎn)者在全部種群中的占比為0.2。為了更好地評估本文所提模型的性能,選用SSA-LSTM、SSA-BiLSTM 以及未經(jīng)過風(fēng)速修正的SSA-BiLSTM 模型與本文所提出的CEEMDAN 風(fēng)速分解和SSA-BiLSTM 預(yù)測模型作對比。各種模型的預(yù)測曲線如圖8 所示。 圖8 風(fēng)電功率預(yù)測結(jié)果對比 從圖8 所示預(yù)測曲線可以看出,在經(jīng)過風(fēng)速修正后建立的預(yù)測模型,預(yù)測值與真實值更為相似。根據(jù)模型的誤差評價指標(biāo)計算可得表4。 表4 誤差評價指標(biāo)對比結(jié)果 經(jīng)過對比發(fā)現(xiàn),風(fēng)速數(shù)據(jù)經(jīng)過CEEMDAN 分解后再進(jìn)行預(yù)測修正,所得到的誤差評價指標(biāo)均要比直接進(jìn)行預(yù)測時效果更好。從表4 中不難發(fā)現(xiàn),相較于傳統(tǒng)的用經(jīng)驗來進(jìn)行BiLSTM 的超參數(shù)選擇方法,在經(jīng)過SSA 優(yōu)化后的BiLSTM 能更好地體現(xiàn)預(yù)測性能,EMA、ERMS和EMAP值分別下降了2.480 MW、4.127%和10.142 MW。 本文所提模型相較于未經(jīng)過風(fēng)速修正的SSA-BiLSTM 模型的EMA、ERMS和EMAP值分別下降了4.762 MW、5.041%和12.904 MW,可以得出經(jīng)過風(fēng)速修正后再進(jìn)行SSA-BiLSTM 預(yù)測的方法能使得整體精度進(jìn)一步提高。在實際風(fēng)電場功率序列上的實驗結(jié)果表明,本文提出的基于數(shù)據(jù)特征提取和SSA-BiLSTM 預(yù)測模型相較于文中所對比的其他幾種預(yù)測模型誤差評價指標(biāo)明顯降低,優(yōu)化過程耗時也更短,能更精確高效地進(jìn)行短期風(fēng)電功率預(yù)測。 本文提出的一種基于數(shù)據(jù)特征提取和SSABiLSTM 的短期風(fēng)電功率預(yù)測模型,經(jīng)過實例分析表明: 1)對原始風(fēng)電數(shù)據(jù)進(jìn)行特征提取得到與風(fēng)電功率相關(guān)性最強的風(fēng)速序列,以此將原始序列中與風(fēng)電功率無關(guān)和相關(guān)性較弱的序列除去,增加預(yù)測的準(zhǔn)確性。 2)將所提取的風(fēng)速序列經(jīng)過CEEMDAN 分解得到一系列子序列分量,降低了波動性對風(fēng)速預(yù)測結(jié)果的影響程度。 3)根據(jù)所得預(yù)測值對風(fēng)速序列進(jìn)行修正,使預(yù)測結(jié)果與真實值更為接近,進(jìn)一步提升了預(yù)測精度。 4)將修正所得的風(fēng)速序列與風(fēng)電功率序列作為輸入,送入SSA-BiLSTM 模型中進(jìn)行預(yù)測。并將得到的不同模型的預(yù)測結(jié)果進(jìn)行誤差評比,對比得出本文所提方法在預(yù)測精度和預(yù)測效率上具有更高的可行性。
2.2 BiLSTM 原理


3 風(fēng)電功率預(yù)測流程及評價指標(biāo)
3.1 預(yù)測流程

3.2 誤差評價指標(biāo)
4 算例分析
4.1 基于PCC 的特征提取

4.2 基于CEEMDAN 的風(fēng)速分解

4.3 基于SSA-BiLSTM 的風(fēng)速預(yù)測及修正



4.4 風(fēng)電功率預(yù)測結(jié)果及誤差分析


5 結(jié)論