蒲 維,楊毅強*,宋 弘,吳 浩,費 劍
(1.四川輕化工大學 自動化與信息工程學院,四川 宜賓 644000;2.人工智能四川省重點實驗室, 四川,宜賓 644000;3.阿壩師范學院,四川 阿壩 623002)
作為一種二次能源的電能,是各行各業穩定發展的前提,是國家健康發展的基石,是推動整個社會的前進的重要保障。國務院于2015年發布的《關于積極推進“互聯網+”行動的指導意見》中明確指出了未來“互聯網+”智慧能源的發展方向[1]。但發展的過程中,伴隨著分布式電源、電動汽車以及儲能裝置大規模并入電網,導致電力負荷預測的難度加大[2]。只有明確不同地域和區間的電力負荷,才能根據已有負荷數據進行合理的供電規劃,做到電力供需的平衡,充分保障每一位終端用戶的實際用電需求,以此為電力能源需求的規劃打下理論基礎。
在以往的電力負荷預測研究中,國內外的研究人員利用了各式各樣的方法來進一步提高負荷預測的精度,已有的方法總的可以歸為傳統預測法和人工智能預測法兩大類。其中,傳統預測法包括回歸分析法、時間序列法以及灰色預測法等[3-5];人工智能算法包括神經網絡算法和組合預測法[6]。梁毅[7]使用了BP神經網絡模型對電力負荷進行預測,但BP神經網絡存在泛化能力弱,同時極易陷入局部最優的問題[8]。楊宇晴等[9]使用了VMD-LSTM預測模型進行風功率預測,但單一的LSTM模型預測不能充分地提取特征,導致預測精度不夠高。張睿等[10]人采用了EMD-ELM的預測模型,但學者在研究過程中發現EMD分解會出現端點效應與模態混疊的情況[11]。
基于已有的研究內容,本文提出了一種新型的預測模型——基于優化的VMD-LSTNet組合預測模型,并進行了可行性的驗證。
1.1.1 變分模態分解
Zosso等[12]在2014年提出了一種新型信號處理手段并將其命名為變分模態分解(Variational Mode Decomposition, VMD)。在針對非平穩信號的處理方面,VMD分解是一種很好的自適應分解手段[13]。VMD分解是通過特定的手段將原始信號分解成數個帶寬以及中心頻率各不相同的本征模態函數(Intrinsic Mode Function, IMF)。與經驗模態分解與集合經驗模態分解相比較,VMD分解的計算量較小并且可以有效地克服端點效應以及分解過程出現模態混疊的情況,同時原始信號分解成IMF分量的個數還可以通過人為設置,因此VMD分解的自適應性明顯更強[14]。
VMD分解在將原始信號f分解成k個不同帶寬和中心頻率的IMF分量uk的同時需要滿足所有IMF分量的帶寬之和取得的值為最小值。
(1)
式(1)中,f為原始信號;uk為原始信號分解后的第k個IMF分量;ωk為原始信號分解后的第k個IMF分量的中心頻率;?t為對式子進行求偏導運算;*為卷積運算;δ(t)為狄拉克分布。
式(1)中的約束變分問題在經過引入的拉格朗日乘數λ和二次懲罰因子α相結合的方法處理后約束變分問題就得以解決的。引入的增廣拉格朗日函數如下:
(2)
最后采用交替方向乘子算法迭代更新,同時求取拉格朗日方程的“鞍點”。
(3)

1.1.2 鯨魚優化算法
2016年,Mirjalili等[15]提出了鯨魚優化算法(Whale Optimization Algorithm, WOA),WOA優化算法的靈感源自于座頭鯨特殊的捕獵方式——泡泡網覓食法,由此可見,WOA優化算法是一種模擬座頭鯨捕獵的群體智能優化算法。研究人員將座頭鯨的捕獵行為抽象為以下3個階段。
(1)包圍獵物。
目標獵物在搜索空間范圍內的位置是不確定的,所以WOA算法是把當前的最優候選解看作為目標獵物或者靠近目標獵物的位置,并且把當前最優候選解的位置作為依據來更新目標獵物的搜索位置。式子如下:
(4)
式(4)中,A=2ar-a,C=2r皆表示向量,a為收斂因子,r為[0,1]范圍內的隨機數;X*為當前獲得的最優解的位置向量。
(2)氣泡網攻擊方法。
在氣泡網攻擊方法中包括兩種。第一:可以通過減小a值的方式來實現收縮包圍機制,由于A的值域為[-a,a],且a的值會從2遞減至0,則A的值域會逐漸縮小至空集。第二:先計算位于(X,Y)個體位置與位于(X*,Y*)獵物之間的距離,在個體位置和目標獵物之間建立一個螺旋方程式,再模仿座頭鯨螺旋上升運動狀態。螺旋方程式如下:
X(t+1)=D′eblcos(2πl)+X*(t)
(5)
式(5)中,D’為個體位置到目標獵物的距離;b為對數螺旋形狀常數;l為[-1,1]內的隨機數。
(3)搜尋獵物。
當∣A∣>1時,表明目標獵物在座頭鯨攻擊范圍之外,此時WOA算法執行隨機搜索策略;當∣A∣≤1時,表明目標獵物在座頭鯨攻擊范圍之內,種群轉而執行攻擊策略,集中收縮攻擊目標獵物。
(6)
式(6)中,Xrand為當前種群中選擇的隨機位置向量。
1.1.3 基于WOA算法優化的VMD分解
采用VMD分解對信號進行分解的過程中,需要人為地設置IMF分解個數、懲罰因子、保真系數以及收斂條件等參數[16]。學者在以往的研究過程中發現,k以及α兩個參數在VMD分解的精度中起著決定性作用[17]。k值設置偏小,會導致原始信號欠分解,造成信息獲取不完整;k值設置偏大,會導致分解過度。α會對IMF分量的帶寬大小產生直接的影響進而間接影響對原始信息的提取。人為設置k和α工作量大并且很難找到最優的數值,極有可能造成對原始信號的欠分解或過分解的局面。目前大多數研究學者一般采用中心頻率觀測法對VMD參數進行優化,但該方法工作量大、過程煩瑣并且只能對k進行尋優[16]。為此,本文提出采用WOA算法優化VMD分解的k和α。
原始信號的稀疏特性可由包絡熵來表示,因此本文的適應度函數選取為包絡熵局部極小值,使用WOA算法對VMD分解的k和α進行尋優。當IMF分量噪聲較少,特征信息較多,則包絡熵值較大,反之,則包絡熵值較小。式子如下:
(7)
式(7)中,N為采樣點數個數;Ep為包絡熵;a(i)為k個IMF分量經過Hilbert解調后的包絡信號。
優化的VMD分解最佳參數[k,α]組合的求解步驟如下:
(1)設置WOA算法的初始種群以及[k,α]組合的取值范圍等基本參數,同時選取包絡熵局部最小值作為WOA算法適應度函數;
(2)利用VMD對原始信號進行分解,并通過式(7)可得到不同參數組合[k,α]的適應度值;
(3)利用WOA算法的優化機制,不斷更新出個體的位置,同時對各個個體位置對應的Ep進行比較,不斷更新出最小適應度的值;
(4)循環迭代(2)—(4)的步驟,當確定了全局最小適應度或者達到了初始設置的最大迭代次數,就直接輸出得到最佳參數組合[k,α];
(5)將得到的最優參數組合[k,α]對VMD分解進行參數設置,并對原始信號進行VMD分解。
采用WOA算法對VMD分解最佳參數[k,α]尋優的環節中,設置種群大小20,迭代次數為20,k和α的尋優范圍分別為[2,30]和[0,2000]。在WOA算法對VMD分解尋優后,最終確定出最優參數組合[k,α]的值為[9,5],最小局部包絡熵為7.141。最佳適應度值曲線如圖1所示。

圖1 最佳適應度值曲線
IMF分量的個數波動范圍較大,最終穩定在k=9,K值優化曲線如圖2所示。α大體呈現下降趨勢,隨著迭代的進行最終在α=5上下微小波動,懲罰因子α的優化曲線如圖3所示。

圖2 IMF分量個數優化曲線

圖3 懲罰因子的優化曲線
LSTNet網絡主要是由線性和非線性兩個部分共同構成,其中非線性部分主要包括卷積層、循環層以及循環跳躍層3個階段[18]。LSTNet網絡的結構如圖4所示。

圖4 LSTNet網絡結構
1.2.1 卷積層
LSTNet的第一層是一個卷積神經網絡(Convolutional Neural Networks, CNN),但該CNN網絡不包含池化層,LSTNet網絡使用由CNN組成的卷積層來捕獲負載的短期特征和變量的短期依賴性,能夠很好地捕獲到電力負荷數據中的時序信息。
hk=RELU(Wk*X+bk)
(8)
式(8)中,*表示卷積運算,輸出hk為向量,RELU函數為RELU(X)=max(0,X)。筆者通過輸入矩陣X的左側填充零來生成長度為T的每個向量hk。卷積層的輸出矩陣的大小為dc×T,其中dc表示濾波器的個數。
1.2.2 循環層
循環層和循環跳躍層的輸入就是卷積層的輸出。循環部分是帶有門控循環神經網絡的循環層,并使用RELU函數作為隱藏的更新激活函數。式子如下:
rt=σ(Wxrxt+Whrht-1+br)
ut=σ(Wxuxt+Whuht-1+bu)
ct=RELU(Wxcxt+rt·(Whcht-1)+bc)
ht=ht-1·(1-ut)+ut·ct
(9)
式(9)中,σ為sigmoid函數,xt為該層在時間t的輸入,W為相應的權重矩陣,h為相應時刻的輸入。這個層的輸出是每個時間戳的隱藏狀態。盡管研究人員習慣于使用隱藏的更新激活函數,RELU具有更可靠的性能,通過這種方式,梯度更容易反向傳播。
1.2.3 循環跳躍層
帶有GRU和LSTM單元的循環層經過精心設計,用于記憶歷史信息,因此記憶到相對長期的依賴關系。然而,由于梯度消失,GRU和LSTM在實際應用中通常不能捕獲很長時間的相關性,循環跳躍層能夠很好地緩解這個問題。
rt=σ(Wxrxt+Whrht-p+br)
ut=σ(Wxuxt+Whuht-p+bu)
ct=RELU(Wxcxt+rt·(Whcht-p)+bc)
ht=ht-1·(1-up)+ut·ct
(10)
式(10)中,p為跳過的隱藏單元個數。
1.2.4 AR層
由于卷積層和循環層的非線性性質造成對輸入的規模不敏感,自適應回歸部分組成的自回歸模型解決了神經網絡模型的尺度不敏感問題,同時還提高了模型的魯棒性。
(11)
最終的預測結果由線性和非線性兩個部分加權共同構成。結果如下式所示:
(12)

經過WOA算法優化的VMD-LSTNet的電力負荷預測模型步驟分為以下4步,模型預測流程如圖5所示。

圖5 模型預測流程
(1)結合原始數據,采用WOA算法對VMD分解的k以及α尋優,尋找出最優的IMF分量k值以及α。
(2)將在WOA算法中確定的最優參數組合k值和α值代到VMD分解。
(3)對分解得到IMF分量分別構建LSTNet模型,初始化LSTNet模型參數,采用Adam優化策略,對該模型進行優化以提高對各IMF分量預測的精度。
(4)運用訓練好的模型對各IMF分量單獨進行負荷預測,得到各IMF分量的預測值,最后對各IMF預測值疊加重構得到最終對的預測值。
本文選用了均值絕對誤差(MAE)、平均絕對百分比誤差(MAPE)及均方根誤差(RMSE)作為評價實驗預測結果的指標[19]。這些性能評價指標的數值越低,表明該模型的預測精度越精準。性能評價指標的公式如下:
(13)
式(13)中,hp,hi分別表示在時間t=i的預測值和實際值。
本文選取某地公開數據集2006—2010年電力負荷預測數據,每隔30 min提取一次負荷數據信息,共計87 648組數據,如圖6所示。選取原始數據的前87 311組數據作為訓練集,選取原始數據的后337組數據作為測試集。

圖6 電力負荷原始數據時序
在對使用VMD分解對原始數據進行分解時,采用經過WOA算法尋優確定出的最優參數組合[k,α]設置VMD分解參數,IMF分量k=9,懲罰因子α=5,其余的參數均設置為默認值。具體分解效果如圖7所示,由圖可知,IMF1在這些分量中占比最大。

圖7 VMD分解結果
3.3.1 實驗結果分析
在LSTNet網絡中將Adam作為優化器、MSE作為損失函數進行仿真預測,并且設置lstm-batch-size=64,epochs=30。在確定優化后的VMD-LSTNet預測模型的各個參數之后,首先使用該預測模型對VMD分解得到的各個IMF分量進行單獨預測,就可以得到每個IMF分量的預測值,然后將各個IMF分量的預測值疊加作為該預測模型的最終預測結果。
本文將每個IMF分量單獨預測得到的預測值進行疊加重構獲得最終的預測值,然后將預測值與原始數據通過性能評價指標公式得出性能指標的大小。顯而易見,經過優化的VMD-LSTNet預測模型的預測精度有很大的提高,能夠更為準確地進行負荷預測,是進行電力負荷預測的一個不錯的模型選擇。重構后的預測值與原始數據對比曲線如圖8所示。

圖8 優化的VMD-LSTNet模型預測
3.3.2 對比實驗
為了驗證本文選用的方法可行性,將本文經過WOA算法優化的VMD-LSTNet方法與基于LSTNet以及VMD-LSTM,VMD-CNN-LSTM多種模型進行對比實驗。選用RMSE,MAE和MAPE對這些模型進行評價,各個預測模型預測結果對比如圖9所示。

圖9 各模型預測結果
相較于VMD-LSTM和VMD-CNN-LSTM兩種模型,經過WOA算法優化的VMD-LSTNet預測模型在MAE,MAPE和RMSE3個性能指標上都有很大程度上的降低;相較于LSTNet模型,經過WOA算法優化的VMD-LSTNet模型在MAE降低了30.788 3,MAPE降低了0.457 6%,RMSE降低了45.969 1。性能評價指標如表1所示。

表1 不同模型性能評價標準對比
為了解決電力負荷預測精度低的問題,本文提出了使用WOA來優化VMD的分解模態數及懲罰因子兩個參數,采用LSTNet神經網絡預測模型對電力負荷數據進行預測,同時將本文所提模型與其他模型進行了對比實驗。得出如下結論。
(1)通過WOA來優化VMD的參數,相對于人為設置參數,可以更好地得到高度相關的時序子序列,提高了負荷數據的質量,在一定程度上避免了由數據問題導致的預測精度低的問題。
(2)本文所提出的預測模型由線性、非線性兩部分共同構成,能夠有效地捕獲電力負荷數據短、中期的信息,以此保證了電力負荷預測的精準度,預測結果顯示該模型的MAE為18.013 4,MAPE為0.243 1%,RMSE為21.524 3。
(3)本文所提出的預測模型為電廠等的日常工作安排及中、長期規劃提供了科學理論依據,符合國家可持續發展戰略,具有深遠的意義。
但本文所提方法未考慮到多特征變量輸入,可將這些因素負荷的影響考慮到未來的電力負荷預測模型研究中,進一步提高電力負荷預測的準確率。