















摘 要:電價預測對于國家電力市場的銷售價格,電力調度和市場波動管理具有重要意義,但現有方法在電價預測的準確性上不理想.為了進一步提升電價預測的準確性,提出一種基于改進完全自適應噪聲集合經驗模態分解(ICEEMDAN),貝葉斯優化(BO)和長短時記憶網絡(LSTM)的短期電價預測模型.ICEEMDAN將原始數據分解為多個本征模態函數(IMF)和一個殘差序列,然后將IMF分量重構為高頻,中頻和低頻三個子序列,將子序列和殘差序列分別與相關因素結合,重構為四個多維特征矩陣,輸入BO-LSTM模型進行訓練,最后得到預測結果.用西班牙國家電網公司Red Electric Espaa運營數據進行算例分析,結果表明ICEEMDAN-BO-LSTM模型具有更高的準確度,在電價跳躍點和峰值點處預測結果表現出色,與其他方法相比預測效果更好,對能源企業和國家電力市場調控策略具有實用價值.
關鍵詞:電價預測; 完全自適應噪聲集合經驗模態分解; 貝葉斯優化; 長短期記憶網絡
中圖分類號:TM715
文獻標志碼: A
Short-term electricity price prediction based on improved CEEMDAN-BO-LSTM
QIN Kun, LIU Li-qun*, WU Qing-feng, HE Jun-qiang
(School of Electronic and Information Engineering, Taiyuan University of Science and Technology, Taiyuan 030024, China)
Abstract:Electricity price prediction is crucial for the sales pricing,power dispatch,and market volatility management in the national electricity market.However,existing methods are often inadequate in terms of accuracy.To enhance the accuracy of electricity price predictions,a short-term electricity price prediction model based on Improved Complete Ensemble Empirical Mode Decomposition with Adaptive Noise (ICEEMDAN),Bayesian Optimization (BO),and Long Short-Term Memory networks (LSTM) is proposed.ICEEMDAN decomposes the original data into multiple Intrinsic Mode Functions (IMFs) and a residual sequence.The IMF components are then reconstructed into three sub-series:high-frequency,mid-frequency,and low-frequency.These sub-series and the residual sequence are combined with related factors to form four multi-dimensional feature matrices,which are then input into the BO-LSTM model for training.The final prediction results are obtained from this process.Case studies using data from Red Eléctrica de Espaa,the Spanish national grid operator,demonstrate that the ICEEMDAN-BO-LSTM model has higher accuracy.It performs exceptionally well in predicting price jumps and peak points,and it outperforms other methods,making it valuable for energy companies and national electricity market regulation strategies.
Key words:electricity price prediction; CEEMDAN; bayesian optimization; long short-term memory
0 引言
可再生能源,如太陽能和風能,在國家電力系統中所占比例越來越高,這使得平衡電力供需關系,追求更高經濟性變得更加困難[1].這就需要能夠分析消費者需求模式的電力需求響應策略,準確預測電價的變化是該策略的核心要素[2].可靠的電價預測能夠把握電力市場的運行狀態,推動市場主體,合理配置資源,提高效率.
目前對短期電價的預測方法研究中,數據分析挖掘預測方法成為熱點研究方向[3].深度學習和機器學習在當前的研究中表現出了比較好的預測精度.其中,機器學習包含支持向量機回歸(SVR)[4],隨機森林回歸(RF)[5]等算法,深度學習中包含循環神經網絡中的門控循環單元網絡(GRU)[6],長短時記憶網絡[7]等算法.以上方法對短期電價的預測通過輸入多維特征,如負荷、不同燃料類型的發電量、天氣特征等信息對模型進行訓練.模型對數據集中各項特征的關系進行提取和分析,實現了對未來電價更準確的預測[8].
研究人員為提高神經網絡模型的預測性能,文獻[9]提出一種基于最大信息數法(MIC)、集成經驗模態分解(EEMD)和改進informer的短期電價預測模型,能更好地捕捉數據的時序特性.文獻[10]將改進的自適應噪聲完備集合經驗模態分解與卷積神經網絡疊加稀疏去噪自動編碼器模型結合,但忽略了一些可能會有明顯影響的輸入特征.文獻[11]提出一種基于改進變分模態分解(VMD),粒子群算法(PSO),卷積神經網絡(CNN)和長短期神經網絡的短期電價預測模型,提高了電價預測的精度.
以上方法都針對初始電價數據的非線性和非平穩性做了處理,但在實際操作中,當輸入新一天的數據時,經過分解得到的IMF分量數量可能會發生變化,導致模型需要重新訓練.本文根據過零率(ZCR)將IMF分量組合為高頻,中頻和低頻序列進行訓練,結合相關數據重構為多維矩陣,從而提高了模型的可用性并減少了訓練時間.LSTM網絡在時間序列預測方面具有精度優勢[12],但LSTM存在輸入特征量較大時易出現過擬合問題,過擬合會導致模型的預測效果不好[13],因此采用皮爾森相關系數法(PCC)先對數據集的輸入維度進行特征提取,篩選出具有較強相關性的輸入特征以提高預測的精準度并避免過擬合問題[14].同時針對傳統方法依靠經驗選取超參數,導致預測精度不高且比較繁瑣的弊端,用貝葉斯算法(BO)優化LSTM的兩個超參數.采用西班牙電力市場運營數據進行驗證,結果證明ICEEMDAN-BO-LSTM在短期電價預測上具有更高的有效性和精準度.
1 模型介紹
1.1 改進CEEMDAN原理
1.1.1 CEEMDAN
CEEMDAN算法是經驗模態分解算法(EMD)的改進版本[15],引入自適應噪聲算法,能有效解決EMD模態混疊的問題,提供更準確和穩定的分解結果[16].給定輸入信號表示為f(t),定義Ei(°)表示使用EMD分解得到的第i個模態分量,計算公式如式(1)~(6)所示:
(1)向待分解信號f(t)中添加高斯白噪聲序列,其中δ0為信噪比,ωi為第i次添加的白噪聲序列:
1.1.2 ICEEMDAN
由于CEEMDAN分解的數據是歷史數據,考慮到未來數據的輸入,分解結果的數量可能會發生變化[17],這意味著在分解歷史數據后訓練的模型可能難以處理未來的輸入數據.同時,考慮到分量越多,所需時間越長.因此,本文通過計算每個分量的過零率(ZCR)來調整模型,ZCR公式如式(7)、(8)所示:
式(7)、(8)中:x(n)是第n個數據值,N是一幀數據的總長度.
ZCR表示每個分量數據中符號變化的比率,可以大致反映數據的波動頻率.各IMF分量的ZCR值如表1所示,IMF1的ZCR高于40%,屬于高頻分量;IMF2到IMF4的ZCR在10%到40%之間,屬于中頻分量;IMF5到IMF8的ZCR低于10%,屬于低頻分量.
將IMF分量按不同過零率組合進行實驗,求得最適合BO-LSTM模型預測電價數據的組合方式.實驗一將IMF分量分為高頻和低頻,再加上殘差序列;實驗二將IMF分量和殘差序列分為高頻,中頻和低頻;實驗三將IMF分量分為高頻,中頻和低頻再加上殘差序列,使用BO-LSTM模型進行驗證.選用RMSE,MAE和MAPE作為算法的評價指標,RMSE描述了預測值與實際值的差異,MAE描述了預測值與實際值之間差異的平均絕對值,MAPE描述了模型預測的相對誤差,其計算公式如式(9)~(11)所示:
式(9)~(11)中:Ti為實際電價;ti為預測電價;m為電價數量.
實驗結果如表2所示,ICEEMDAN-BO-LSTM模型在利用高頻,中頻,低頻和殘差序列四個分量時表現最佳.因此將預測模型的輸入數據固定為四個,如圖2所示,只需訓練四個分量,使得預測時間僅需394秒,相較于九個分量時的837秒,縮短了52.9%.
1.2 貝葉斯優化算法
貝葉斯優化算法是一種基于貝葉斯理論的全局優化算法,采用高斯過程建立概率代理模型,在先前參數信息的基礎上不斷更新先驗,利用采集函數尋找下一個評估點,從而在盡可能少的評估次數下找到最佳參數.貝葉斯優化算法的核心分為高斯過程回歸和采集函數兩個部分[18].
1.2.1 概率代理模型
高斯過程是一種非參數模型,其核心思想是不假設目標函數g的特定形式,而是通過數據來定義函數的分布,這一過程的公式如式(12)所示:
μ(a*)=c*T(C+σ2nI)-1bcov(a*)=c-c*T(C+σ2nI)-1c*
(12)
式(12)中:μ(a*)表示函數在a*處的均值;a*表示目標預測函數預測值對應的輸入點;c*為測試點與訓練數據點的協方差向量;C為訓練數據點之間的協方差矩陣;σ2n為高斯噪聲的方差;I為單位矩陣;b訓練數據點的目標值向量;cov(a*)表示函數在a*處的協方差;c為測試點自身的協方差.
1.2.2 采集函數
期望改進采集函數(EI)是根據后驗概率分布構造的,通過最大化采集函數來選擇下一個最有“潛力”的評估點.同時,有效的采集函數能夠保證選擇的評估點序列使得總損失最小.EI采集函數公式如式(13)、(14)所示:
EI(x)=(μ(x)-f(x*))φ(z)+σ(x)φ(z),σ(x)gt;0
0,σ(x)=0
(13)
z=μ(x)-f(x*)σ(x)
(14)
式(13)、(14)中:f(x*)為函數的最優值;μ(x)為均值;σ(x)為標準差;φ為標準正態分布概率密度函數.
神經元個數和正則化系數這兩個超參數對于LSTM神經網絡的收斂性和性能至關重要,合理調整這兩個超參數可以幫助模型達到更好的性能,提高其對新數據的預測能力,并減輕過擬合問題的影響,因此采用BO對神經元個數以及正則化系數這兩個超參數進行尋優.超參數尋優范圍見表3所示.
1.3 LSTM網絡模型
LSTM作為一種特殊的循環神經網絡(RNN),保留了RNN網絡的自反饋結構,使其在處理時間序列上具有明顯優勢,而且LSTM獨特的“門”結構能有效解決傳統RNN在處理長時間序列時出現的梯度消失與梯度爆炸等問題[19],其結構見圖3所示.
長短期記憶神經網絡方法包括三個門[20]:遺忘、輸入和輸出.遺忘門使用sigmoid函數過濾記憶信息和前一刻新輸入的信息,當門的值為1時,保留所有信息,當門的值為0時,丟棄所有信息.這個特性對于LSTM在順序數據中保持長期依賴關系的能力至關重要;輸入門用來控制當前時刻的網絡輸入進入單元的多少;輸出門用來控制單元狀態進入當前單元輸出的多少,其具體公式如式(15)~(20)所示.
(1)遺忘門:從單元狀態中刪除信息
ft=σ(wf[ht-1,xt]+bf)
(15)
(2)輸入門:向單元狀態添加信息
it=σ(wi[ht-1,xt]+bi)
(16)
ct=tanh(wc[ht-1,xt]+bc)
(17)
更新單元狀態:
ct=ftct-1+itct
(18)
(3)輸出門:從單元狀態中選擇有用的信息,并將其作為輸出進行傳輸
ot=σ(wo[ht-1,xt]+bo)
(19)
ht=ottanh(ct)
(20)
式(15)~(20)中:w為權重矩陣;b為偏置項;f為遺忘門;i為輸入門;o為輸出門;σ為sigmoid函數;tanh為雙曲正切函數.
1.4 ICEEMDAN-BO-LSTM模型
為提升電價預測的準確性,提出一種基于ICEEMDAN-BO-LSTM的短期電價預測模型,提高了電價預測的效率和準確性,其流程見圖4所示.
第一步:采用PCC找出原始數據中與電價數據相關性較高的影響因素,以降低后續訓練模型的輸入維度;第二步:將原始電價數據輸入CEEMDAN算法進行分解,隨后將IMF分量按ZCR值分類為高頻,中頻和低頻序列,提高預測的效率和準確性;第三步:是將高頻,中頻,低頻和殘差序列分別與第一步中尋找出的相關因素進行重構,提高電價預測的準確性和泛化性;最后,將第三步中重構所得多維特征矩陣運用滑動窗口的方式輸入BO-LSTM模型,其原理如圖5所示,根據后續需要,設置滑動窗口寬度為8,步長為1.
以2018年數據作為示例,展示ICEEMDAN-BO-LSTM模型超參數尋優結果,詳見表4所示.預測完成后將各預測結果疊加得到最終期望電價預測值.
2 算例分析
2.1 數據處理
本實驗所用數據集如表5所示,前四個數據集為西班牙2016年12月至2018年11月的春夏秋冬四季的電價數據及相關因素,第五個數據集為2018年電價及相關因素.樣本中的消耗和發電數據來自ENTSOE,結算價格來自西班牙電網公司Red Electric Espaa.
預測短期電價需要準確識別相關影響因素,這些因素對預測的準確性有顯著的影響.PCC通常用于評價兩個正態連續變量之間的線性相關性,本研究利用PCC來確定與實際電價相關的影響因素.皮爾森相關系數法的相關性強弱標準見表6所示.
基于PCC,將燃氣發電量,燃煤發電量,水電抽水蓄能消耗發電量,實際總負荷作為模型的輸入參數,其相關系數見表7所示.可以看出,這些因素與實際電價的相關系數的絕對值均大于0.5,與實際電價具有較強相關性.
2.2 預測結果對比
為驗證本模型的有效性及準確性,以SVR、LSTM、BO-LSTM和遺傳算法優化的反向傳播神經網絡(GA-BP)[21]作為對比,評價指標采用RMSE、MAE、MAPE,其公式見式(9)~(11).
預測結果如圖6所示,其中圖6(a)~(d)依次為春季、夏季、秋季和冬季的預測結果對比,圖6(e)為2018年的預測結果對比.分析圖6可知,ICEEMDAN-BO-LSTM的曲線擬合結果更好,相較于其他模型與實際電價數據的誤差更小,在電價跳躍點和峰值點處擬合結果也具有優越性,說明采用ICEEMDAN-BO-LSTM模型在電價預測上具有更高的精準度.各模型預測結果的評價指標詳見表8所示.
根據表8中的數據,可以看出ICEEMDAN-BO-LSTM在春季、夏季、秋季、冬季和2018年五種不同數據集上預測結果的RMSE值分別為1.11、1.17、1.17、1.66、1.13,遠低于BO-LSTM、LSTM和SVR.而BO-LSTM的RMSE值分別為2.15、2.02、1.81、2.45和1.99,僅次于ICEEMDAN-BO-LSTM;在春季、夏季、秋季、冬季和2018年ICEEMDAN-BO-LSTM預測結果的MAE值分別為0.83、0.86、0.92、1.35和0.95,預測效果優于BO-LSTM、LSTM和SVR.而BO-LSTM的MAE值分別為1.72、1.53、1.44、1.9和1.57,優于LSTM和SVR模型;ICEEMDAN-BO-LSTM在春季、夏季、秋季、冬季和2018年預測結果的MAPE值分別為1.17%、1.15%、1.34%、2.04%和1.38%,顯著低于BO-LSTM、LSTM和SVR.而BO-LSTM的MAPE值分別為2.48%、2.05%、2.07%、2.87%和2.3%,在對比模型中表現較好.綜上所述,ICEEMDAN-BO-LSTM在短期電價預測上具有更高的準確性.
為了進一步驗證算法的普適性,將2018年數據集結構重新劃分,95%作為訓練集,5%作為測試集,再次進行預測,曲線擬合圖見圖7所示,評價指標見表9所示.
根據表9中的結果,可以看出BO-LSTM、GA-BP和LSTM模型在重新劃分數據結構的數據集上預測效果均有改善,SVR表現效果變差.ICEEMDAN-BO-LSTM仍是表現最好的模型,與原數據劃分方式相比,變化不大,RMSE為1.2,MAE為0.93,MAPE為1.37%.可見ICEEMDAN-BO-LSTM在結構重新劃分的數據集上預測效果良好,具有普適性.
2.3 尖峰點、跳躍點預測結果對比
電價數據具有短期內可能出現顯著波動的特點,為進一步驗證本文所提模型在電價跳躍點和峰值點處的有效性和準確性,在各數據集預測結果中選取50個具有代表性的點,與2.2中在對比模型中預測效果較好的BO-LSTM模型進行對比,對比結果如圖8所示,評價指標見表10所示.
分析表10可知,ICEEMDAN-BO-LSTM的RMSE、MAE和MAPE相較BO-LSTM模型分別下降了0.85、0.7和1.06%.可見基于ICEEMDAN-BO-LSTM的電價預測模型在跳躍幅度大,變化速度快的電價跳躍點和峰值點處的預測結果與真實值差別不大,具有良好的性能.
3 結論
(1)針對現有方法短期電價預測效果差的問題,提出了一種ICEEMDAN-BO-LSTM模型.通過西班牙電價數據進行模型準確性驗證.
(2)采用改進CEEMDAN算法將原始電價數據分解為IMF分量和殘差序列,再將IMF分量按ZCR重構為高頻,中頻和低頻序列.最后將高頻,中頻,低頻和殘差序列與相關因素重構為四個多維特征矩陣,輸入BO-LSTM模型中進行預測,使混合模型預測有效性和準確性得到提高.
(3)基于同樣的數據集使用SVR、LSTM、BO-LSTM進行對比實驗,選取RMSE、MAE、MAPE作為評價指標.對比結果證明ICEEMDAN-BO-LSTM模型預測準確率更高,在電力市場中具有一定的應用價值.
(4)后續研究中可綜合考慮能源價格等因素,進行必要的特征選擇,進一步提高電價預測準確率.
參考文獻
[1] Ghimire S,Deo R C,Casillas Pérez D,et al.Two-step deep learning framework with error compensation technique for short-term,half-hourly electricity price forecasting[J].Applied Energy,2024,353:122 059.
[2] 胡艷美,王 品,丁亦新,等.基于MKELM的智能電網短期電價預測與分類[J].高電壓技術,2023,49(S1):47-52.
[3] 萬 燦,崔文康,宋永華.新能源電力系統概率預測:基本概念與數學原理[J].中國電機工程學報,2021,41(19):6 493-6 509.
[4] Sarwar S,Aziz G,Tiwari A K.Implication of machine learning techniques to forecast the electricity price and carbon emission:Evidence from a hot region[J].Geoscience Frontiers,2024,15(3):101 647.
[5] 魏 勤,陳仕軍,黃煒斌,等.利用隨機森林回歸的現貨市場出清價格預測方法[J].中國電機工程學報,2021,41(4):1 360-1 367,1 542.
[6] Haolin Yang,Kristen R.Schell.HFNet:Forecasting real-time electricity price via novel GRU architectures[C]//2020 International Conference on Probabilistic Methods Applied to Power Systems(PMAPS).Liege:IEEE,2020:1-6.
[7] 殷 豪,丁偉鋒,陳 順,等.基于長短時記憶網絡-縱橫交叉算法的含高比例新能源電力市場日前電價預測[J].電網技術,2022,46(2):472-480.
[8] Brynjolefsson E,Mitchell T.What can machine learning do:Workforce implications[J].Science,2017,358(6 370):172-176.
[9] 許 越,李 強,崔 暉.基于MIC-EEMD-改進Informer的含高比例清潔能源與儲能的電力市場短期電價多步預測[J].電網技術,2024,48(3):949-958.
[10] Tan Y Q,Shen Y X,Yu X Y,et al.Day-ahead electricity price forecasting employing a novel hybrid frame of deep learning methods:A case study in NSW,Australia[J].Electric Power Systems Research,2023,220:109 300.
[11] 郭雪麗,華大鵬,包鵬宇,等.一種基于改進VMD-PSO-CNN-LSTM的短期電價預測方法[J].電力科學與技術學報,2024,39(2):35-43.
[12] 張 揚,李曉杰,馬茲林,等.鋰離子電池故障診斷算法研究綜述[J].重慶理工大學學報(自然科學),2023,37(9):49-61.
[13] 吉興全,曾若梅,張玉敏,等.基于注意力機制的CNN-LSTM短期電價預測[J].電力系統保護與控制,2022,50(17):125-132.
[14] Li W,Becker D M.Day-ahead electricity price prediction applying hybrid models of LSTM based deep learning methods and feature selection algorithms under consideration of market coupling[J].Energy,2021,237:121 543.
[15] 牛群峰,袁 強,王 莉,等.基于CEEMDAN-RVM-LSTM模型的鋰電池剩余壽命預測[J].電源技術,2023,47(10):1 313-1 318.
[16] 江 莉,向世召.基于CEEMDAN-VSSLMS的滾動軸承故障診斷[J].計算機集成制造系統,2024,30(3):1 138-1 148.
[17] Wang J,Zhang T,Lu T,et al.A Hybrid forecast model of EEMD-CNN-ILSTM for crude oil futures price[J].Electronics,2023,12(11):2 521.
[18] 劉新宇,蒲欣雨,李繼方,等.基于貝葉斯優化的VMD-GRU短期風電功率預測[J].電力系統保護與控制,2023,51(21):158-165.
[19] 李家豪,王青于,范玥霖,等.鯨魚優化算法-雙向長短期記憶神經網絡用于斷路器機械剩余壽命的預測研究[J].高電壓技術,2024,50(1):250-262.
[20] 史加榮,王雙馨.基于VMD-BiLSTM-WOA的短期風電功率預測[J].陜西科技大學學報,2024,42(1):177-185.
[21] 柏 睿,羅 剛,唐 林,等.基于遺傳算法的高比例風電短期電價預測[J].人民長江,2022,53(S1):119-124.
【責任編輯:蔣亞儒】