張柯 劉海忠



摘? 要: 由于風速序列高度非線性、間歇性和非平穩的特點,給預測帶來了困難,從而影響了可再生能源制造。本文提出基于變分模態分解(VMD)和Stacking集成學習的短期風速混合預測方法。VMD將風速序列分解為平穩分量,以解決非平穩問題;考慮風速序列實質特征,Stacking的基學習器采用LightGBM、LSTM和全連接網絡(FCN)算法。實驗采用真實風速數據,VMD-Stacking混合模型的RMSE、MAE和MAPE分別為0.1772、0.1553和8.32%。與其他分解方法或不同的基學習器組合相比,VMD-Stacking充分利用時間序列特征和風速波動信息,提高了短期風速預測的準確性和穩定性。
關鍵詞: 短期風速; 變分模式分解; LightGBM; LSTM; Stacking
中圖分類號:TM614? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2023)05-40-05
Research on short-term wind speed prediction based on VMD-Stacking hybrid model
Zhang Ke, Liu Haizhong
(School of Mathematics and Physics, Lanzhou Jiaotong University, Lanzhou, Gansu 730070, China)
Abstract: Due to the highly nonlinear, intermittent and non-stationary characteristics of wind speed series, it is difficult to predict and affects renewable energy production. A hybrid short-term wind speed prediction method based on VMD and Stacking integrated learning is proposed to improve the performance of short-term wind speed prediction. VMD decomposes the wind speed series into stationary components to solve the non-stationary problem. Considering the essential characteristics of wind speed series, LightGBM, LSTM and full connected network (FCN) algorithms are used in the basic learner of Stacking. Using real wind speed data for experiments, the RMSE, MAE and MAPE of the VMD-Stacking hybrid model are 0.1772, 0.1553 and 8.32% respectively. Compared with other decomposition methods or different basic learner combinations, VMD-Stacking makes full use of time series characteristics and wind speed fluctuation information to improve the accuracy and stability of short-term wind speed prediction.
Key words: short-term wind speed; variational mode decomposition (VMD); LightGBM; LSTM; Stacking
0 引言
能源在人們生活中一直扮演著不可替代的角色。現在許多國家都在大力發展可再生能源技術,以解決傳統能源消耗的問題。許多學者已將研究重點轉向風能,常用風速預測構建模型主要分為三類:統計模型、人工智能模型和混合預測模型。其中,統計模型有時間序列分析法、多元線性回歸、卡爾曼濾波法等。但由于風速較強的非線性特征,其預測效果普遍較差。人工智能模型主要包括人工神經網絡[1]、灰色預測[2]等,具有較強的非線性特征提取能力。然而,神經網絡存在收斂速度慢[3]、對參數選擇敏感、過擬合等問題,限制了其進一步發展。為了彌補其不足,混合預測模型被廣泛應用。文獻[4]發現,組合預測的精度高于任何單個預測,但這種高精度預測受單個模型預測誤差之間的關系影響。文獻[5]研究了風速序列的不同分解方法,如小波分解、經驗模式分解(EMD)、變分模式分解(VMD),并比較了他們的有效性。文獻[6]利用EEMD將原始風速分解為具有不同頻率和一定規則的模態分量。然后將每個分量輸入到遺傳算法優化的BP神經網絡中,每個分量的結果進行加和得到最終的預測結果。此模型有EEMD計算量大,分量不可控的問題,這往往導致函數不收斂而使風速數據的分解效果不佳。文獻[7]結合了全連接網絡(FCN)、長短期記憶網絡(LSTM)和殘差網絡。通過多種模型的合理組合,取得了較好的預測結果。
為了填補上述空白,本文采用具有足夠理論基礎和性能優越的VMD分解方法。VMD是一種新的自適應時頻分解方法,它對采樣噪聲具有更強的魯棒性。此外,LSTM網絡可充分利用時間序列數據之間的內在相關性,但預測精度一般[8]。LightGBM模型訓練速度快、精度高,支持高效的并行訓練[9],但缺乏對時間序列的整體感知能力。而對于殘差變化較小的時間序列數據,FCN做為主流預測模型,精度更高。因此提出一種基于VMD-Stacking的短期風速混合預測模型。主要創新點包括:①VMD和Stacking的結合可提高風速序列預測的精度;②Stacking選擇LSTM、LightGBM和FCN作為基學習器,不僅可以有效利用時間序列變化趨勢,還可以充分挖掘不同波動水平下的序列信息。從這兩個角度實現風速信息的全面提取,以便訓練出更優越的預測模型。
1 理論介紹
1.1 變分模態分解
VMD[11]是一種新的自適應數據分解方法,根據各分解分量的中心頻率和帶寬,實現信號的頻域分解和各分量的有效分離。VMD將信號分解,轉換為變分模式,并尋找約束變分模型的最優解[12]。
對給定的信號序列y(t),VMD假設它由K個有限帶寬的分量y(t)組成,通過求解約束變分問題來實現信號的分解:
[minuk,wkk=1K?tδt+jπt?uk(t)e-jwkt22s.t.k=1Kuk(t)=f]? ⑴
其中,uk(t)是模態函數的輸入信號,uk代表模態集合{u1,u2,…,uk},wk為第k個模態相對應的中心頻率;δ(t)為狄利克雷函數,引入平衡約束參數α和拉格朗日乘法算子λ(t),以保證重構精度和約束條件的嚴格性,將其變為非約束優化問題:
[Luk,wk,λt=αk=1K?tδt+jπt?uk(t)e-jwkt22]
[+yt-k=1Kuk(t)22+λt,yt-k=1Kuk(t)] ⑵
利用交替方向乘子方法求解式⑵,即對uk、wk和λ(t)進行交替迭代,計算步驟見文獻[13],迭代公式為:
[un+1kw=yw-i≠kuniw+0.5λn(w)1+2α(w-wnk)2]
[wn+1k=0∞wunkw2dw0∞unkw2dw]
[λn+1w=λnw+ρyw-k=1Kun+1k(w)]
其中,ρ是噪聲容忍度,上式不斷更新迭代,直到滿足收斂精度,輸出最終的uk,wk。
1.2 Stacking集成學習
Stacking是一種分層融合模型,結構如圖1所示。首先,將原始數據劃分為幾個子數據集后輸入到第一層的每個基學習器中,其預測結果輸出作為第二層元學習器的輸入進行訓練,由元學習器輸出最終的預測結果。Stacking集成學習泛化了多個模型的結果,以提高總體預測精度[14]。
1.3 基學習算法
1.3.1 Lightgbm
LightGBM是一個基于決策樹算法的GBDT推廣框架[15],該算法的優點有訓練速度更快、精度更高、支持并行學習等。其基本思想是將M個弱回歸樹線性組合成強回歸樹:
[FX=m=1Mfm(x)]? ⑶
其中,[FX]為回歸樹最終的輸出值;[fm(x)]為第m棵弱回歸樹的輸出值。原理是將損失函數的負梯度作為當前決策樹的殘差近似值,去擬合新的決策樹,即每一次迭代都保留原來的模型,再加入一個新的函數到模型中,使預測值不斷逼近真實值。
1.3.2 長短期記憶神經網絡(LSTM)
LSTM是一種深度學習算法[16],具體結構架構見圖2。
每一個LSTM單元擁有一個具有記憶功能的細胞元組,其在時刻t的狀態記為ct,LSTM單元通過輸入門、遺忘門和輸出門接收當前狀態xt和上一時刻元組的狀態ht-1。同時,記憶單元的狀態ct-1作為內部信息將輸入到各個門中。當接收輸入信息后,輸入門、遺忘門和輸出門將進行內部運算。輸入門的信號經過函數變換后,與遺忘門處理過的記憶單元狀態疊加,形成新的記憶單元狀態ct。最終,ct經過函數運算和輸出門的控制形成LSTM單元的輸出ht。各變量之間的計算公式如下:
[it=sigmoidWhi×ht-1+Wxi×xt+Wci×ct-1+bi]
[ft=sigmoidWhf×ht-1+Wxf×xt+Wcf×ct-1+bf]
[ot=sigmoidWho×ht-1+Wxo×xt+Wco×ct-1+bo]
[i=tanhWhg×ht-1+Wxg×xt+bc]
[ct=ft⊙ct-1+it⊙i]
[ht=ot⊙tanhct]
2 模型方法
2.1 VMD-Stacking模型基本信息
VMD-Stacking模型的結構如圖3所示。將風速序列F分解為固有模態函數,然后將t-1時刻分解后的分量[(IMF1t-11,IMF2t-12,…,IMFnt-1)]分別輸入到LightGBM和FCN以獲得相應的預測結果。此外[(Ft-τ,…,Ft-2,Ft-1)]輸入到LSTM,并使用每[τ]個相鄰歷史風速去預測t時刻的風速。最后,將三個基學習器的結果通過Stacking進行融合。
具體訓練過程:
⑴ 利用MI理論選擇歷史風速序列的最佳預測步長([τ])。
⑵ 將數據每[τ]個分為一組,并與下一時刻的風速形成訓練樣本,即[(Ft-τ,…,Ft-2,Ft-1),Ft],t=τ+1,τ+2,…N,一共有N-τ組。N是訓練集中的數據數,下標從1開始。
⑶ 進行歸一化后,通過VMD分解以獲得相應的分量{IMFt-1s},i=t-τ,t-τ+1,…,t-1,s=1,2…,n,,n是VMD的分解層數。
⑷ 分解得到的分量分別輸入基學習器進行訓練,{IMFt-1s}用作FCN和LightGBM的輸入,(Ft-τ,…,Ft-2,Ft-1)作為LSTM的輸入,分別預測t時刻的結果作為輸出,然后根據結果Ft更新每個模型的參數。
⑸ 基學習器經過訓練后,每個訓練樣本的輸出形成一個三維向量[Ft`,Ft``,Ft```],作為第二層元學習器的輸入,根據其輸出,使用反向傳播更新參數。
2.2 VMD分解
在變分模式分解過程中,當K值較小或較大時,很容易產生模態混疊或過度分解。這里采用觀察中心頻率的方法確定K值,從小到大取預設K值,當最后一層分量的中心頻率保持相對穩定時,認為此時K值最佳。見表1,在K=8之后最后一層IMF分量的中心頻率保持相對穩定,所以預設定K=8。分解結果如圖4所示。
3 實驗設置以及結果分析
3.1 實驗數據和評價指標
實驗中數據來自NOAA(美國海洋與大氣管理局數據)網站獲取的紐約地區2019年9月22日至27日的風速及相關的大氣數據,共采集22日720個采樣點,間隔為2min,其中90%數據作為訓練數據,10%作為測試數據。相關模型在Python3.6環境下完成編程計算。預測評價指標采用平均相對誤差eMAPE,相對均方誤差eRMSE和平均絕對誤差eMAE,具體如下所示:
[eMAPE=1ni=1nxj-x(i)x(i)×100%]
[eRMSE=1ni=1nxi-y(i)2]
[eMAE=1ni=1nxi-y(i)]
x(i)和y(i)分別表示i時刻的真實值和預測值;n為樣本數量。
3.2 集成效果分析
由圖5實驗結果可知,采用Stacking集成模型的預測效果優于傳統單一基礎模型預測效果。表2中指標數據為重復10次預測所得到的平均值(表3、表4、表5同理),可知Stacking集成方法比單一模型的最好預測效果相對提升63.33%,有效結合了各單一算法優勢,減少單一模型泛化性能不佳的風險。
3.3 分解去噪對比分析
圖6預測結果顯示,使用不同的分解去噪技術對預測結果有較大影響。對比經EMD、EEMD、CEEMDAN分解處理的Stacking模型的實驗結果,在此場景下,VMD對于短期風速的分解效果更佳,更為有效降低數據的復雜程度。
3.4 基學習器構建對比分析
將22日至27日的4320條原始數據相鄰時刻風速差設為新的序列G,G服從正態分布,稱差值在區間(μ-2σ,μ+2σ)內的數據為數據A,其以外的數據稱為數據B,它們分別代表風速變化幅度較小和較大的數據集合。表4為三個基學習器分別對A、B數據集的實驗誤差,表明對于殘差變化較大的數據,LightGBM預測精度更高;對于殘差變化較小的數據,FCN的預測精度更高,而LSTM對整體數據的殘差的正負號預測高達89%,表明其能夠一定程度上捕獲時間序列變化趨勢信息。綜合以上分析可以得出,將三種模型進行組合后,可增強模型對長時間序列的感知力,同時充分挖掘不同波動程度下的序列信息。
由表5可知,使用不同的基學習器對預測結果有較大影響。用SVM算法來進行舉例,去替換基學習器中任意一個,發現實驗誤差都會變大。從而驗證對于Stacking基學習器選擇的測試結果,并且剔除掉任何一個,評估性能都會有所下降。
4 結論
本文研究了一種基于VMD-Stacking集成學習的短期風速預測模型,并將模型應用于某風電場真實數據集,驗證模型的預測精度,主要結論如下:
⑴ VMD分解可將具有強非線性、非平穩性的風速時間序列分解為相對穩定的數組IMF分量,可增強時間序列的可預報性。對比EMD、EEMD和CEEMDAN,VMD實驗結果的RMSE降低了22.59%至39.97%,對于短期風速數據具有更好的分解效果。
⑵ Stacking選用的基學習器中,LSTM對風速變化正負值的預測高達89%,lightgbm在變化浮動較大的數據集上RMSE數值最小(0.4332),而FCN在浮動較小的數據集上RMSE數值最小(0.4789),三者結合具備更佳的預測效果。對比于用SVM去替換任意一個基學習器,本文模型都具有更為明顯的優越效果。
⑶ VMD-Stacking的對短期風速預測誤差指標RMSE、MAE、MAPE分別為0.1772、0.1553和8.32%。此模型可準確地追蹤風速變化情況,在預測短期風速變化中表現出更好的預測度和穩定性。
參考文獻(References):
[1] SINGH P, DWIVEDI P. Integration of new evolutionaryapproach with artificial neural network for solving short term load forecast problem[J]. Applied Energy,2018,217:537-549
[2] 焦潤海,蘇辰雋,林碧英,等.基于氣象信息因素修正的灰色短期負荷預測模型[J].電網技術,2013,37(3):720-725
[3] 孔祥玉,鄭鋒,鄂志君,等.基于深度信念網絡的短期負荷預測方法[J].電力系統自動化,2018,42(5):133-139
[4] BATES J M, GRANGER C W J. The combinationofforecasts[J]. Journal of the Operational Research Society,1969,20(4):451-468
[5] Qian Z,? Pei Y,? Zareipour H, et al. A review and discussionof decomposition-based hybrid models for wind energy forecasting applications[J]. Applied Energy,2019,235(FEB.1):939-953
[6] Wang S, Zhang N, Wu L, et al. Wind speed forecastingbased on the hybrid ensemble empirical mode decomposition and GA-BP neural network method[J]. Renewable Energy,2016,94:629-636
[7] 許言路,張建森,吉星,等.基于多模型融合神經網絡的短期負荷預測[J].控制工程,2019,26(4):619-624
[8] 陸繼翔,張琪培,楊志宏,等.基于CNN-LSTM混合神經網絡模型的短期負荷預測方法[J]. 電力系統自動化,2019,43(8):131-137
[9] 周挺,楊軍,周強明,等.基于改進 LightGBM 的電力系統暫態穩定評估方法[J].電網技術,2019,43(6):1931-1940
[10] Lu X, Miao F, Xie X, et al. A new method fordisplacement prediction of 'step-like' landslides based on VMD-FOA-SVR model[J]. Environmental earth sciences,2021(80-17)
[11] 羅亦泳,姚宜斌,黃城,等.基于改進VMD的變形特征提取與分析[J].武漢大學學報·信息科學版,2020,45(4):613
[12] Hu H, Zhang J, Li T. A Comparative Study of VMD-Based Hybrid Forecasting Model for Nonstationary Daily Streamflow Time Series[J]. Complexity,2020(2):1-21
[13] Hamilton N, Ferry M. vmd: Variational Mode Decompo-sition,2017
[14] Zandi O, Zahraie B, Nasseri M, et al. Stacking machinelearning models versus a locally weighted linear model to generate high-resolution monthly precipitation over a topographically complex area[J]. Atmospheric Research,2022,272:106159
[15] Friedman J H. Stochastic gradient boosting[J].Computa-tional Statistics & Data Analysis,2002,38
[16] 張宇帆,艾芊,林琳,等.基于深度長短時記憶網絡的區域級超短期負荷預測方法[J].電網技術,2019,43(6):1884-1891