張樹國,張 斌
(華北電力大學 經濟管理系,河北 保定 071000)
電力系統安全穩定運行是地區發展的前提。地區電力負荷的預測結果,可以為電網制定電力能源供應計劃提供參考。短期電力負荷預測對保證電力系統高效平穩運行具有重要意義。
傳統的電力負荷預測方法有趨勢外推法[1]、回歸分析法[2]、時間序列法[3]等。這些傳統預測方法存在對數據的穩定性要求較高、難以準確預測短期電力負荷等問題。
隨著研究的深入,粒子群(particle swarm optimization,PSO)[4]、支持向量機(support vector machine,SVM)[5]等機器學習方法被用于短期電力負荷預測。
文獻[6]基于長短期記憶神經網絡(long short term memory,LSTM)對短期電力負荷進行預測。由于LSTM在并行處理上存在劣勢,所以當時間跨度較大時,LSTM的處理速度較慢。
文獻[7]基于 SVM 對電網負荷進行了預測;但在歷史數據量較大時,SVM難以實施。
文獻[8]采用人工神經網絡進行負荷預測。因所需參數較多,算法的預測準確性受到影響。
上述基于單一模型的電力負荷預測精度較低,不能夠滿足目前短期電力負荷預測對精度的要求;因此,需要對現有的方法進行深入研究。
為了提高預測模型的準確性,有相關研究采用組合預測模型來預測短期電力負荷。
文獻[9]采用麻雀搜索算法(sparrow search algorithm,SSA)對LSTM模型進行優化。
文獻[10]使用PSO對LSTM模型的參數進行尋優。
文獻[11]基于卷積神經網絡,對 LSTM 的參數進行優化,使模型能夠更準確地預測短期電力負荷。
文獻[12]用蚱蜢優化算法優化SVM的參數,并采用組合模型對電力負荷進行了預測。
文獻[13]將天鷹優化算法(aquila optimizer,AO)與SVM集成,對智能電網的短期電力負荷進行了預測。
上述組合模型的特點是均采用優化算法對參數進行尋優;仍存在的問題是,優化算法迭代次數過少容易陷入局部最優,迭代次數過多計算速度又會下降,難以滿足預測要求。
短期電力負荷數據具有波動性和隨機性。如果直接將電力負荷數據用于預測,得到的預測結果難以達到預期精度。因此,在進行預測前,需要先對電力負荷數據進行處理,將復雜的電力負荷數據分解再進行重構,以在一定程度上消除隨機數據的影響。
文獻[14]基于集合經驗模態分解(ensemble empirical mode decomposition,EEMD),用粒子群方法優化小波神經網絡,最終實現了電力短期負荷預測。
文獻[15]基于EEMD,采用粒子群算法優化了最小二乘支持向量機的參數。
文獻[16]基于CEEMDAN及變分模式分解處理原始數據,采用鯨魚優化算法優化支持向量機的參數,并將該混合模型用于電力負荷的預測。
文獻[17]基于 CEEMDAN,利用卷積神經網絡和門控循環單元建立組合模型,實現短期電力負荷預測。該數據分解策略雖然能夠在一定程度上消除噪聲對預測結果的影響,但分解后的一些數據分量仍較為復雜,難以直接用于預測。
基于以上分析,為提高短期預測模型的準確度,本文創新性地采用多重數據降噪的方法處理數據,并提出用改進SSA優化LSSVM參數的組合預測模型。首先,利用自適應小波閾值去噪方法對原始數據進行一次降噪處理;采用 CEEMDAN分解處理后的數據,再將分解后最復雜的分量采用 SVD進行二次降噪;利用三階段優化的 SSA對LSSVM的參數進行尋優,建立組合預測模型,并利用組合預測模型對降噪后的各分量分別進行預測;最后,將各分量預測結果進行整合重構,得到短期電力負荷預測的最終結果。
經驗模態分解(empirical mode decomposition,EMD)是一種處理非平穩信號的方法,其特點是可以根據被分析信號自適應地產生固有模態函數[18]。
EMD方法的原理:將復雜的信號分解為有限個模態函數(intrinsic mode function,IMF)。分解得到的IMF包含了原始信號不同時間尺度的局部特征信息。
在EMD通過分解信號進而得到IMF的過程中,會出現模態混疊的現象:在同一個IMF分量中存在分布范圍很寬卻又不相同的信號,或者在不同的IMF分量中存在著尺度相近的信號。
模態混疊會使模型特征的提取和訓練變得困難。為了解決這種問題,文獻[19]提出了CEEMDAN方法——在每得到一階IMF分量時,重新給殘值加入白噪聲并求IMF分量均值,然后逐次迭代。CEEMDAN方法能較好地解決模態混疊與虛假分量的問題。
CEEMDAN算法步驟如下。
(1)將高斯白噪聲加入到原始信號中,得到新信號;對新信號進行EMD分解,得到第1階段本征模態分量:

式中:y(t)為原始信號;?為白噪聲標準表;vj(t)為滿足正態分布的高斯標準白信號;C1j(t)為第1階段本征模態分量;ri為信號殘差;E(y(t)+(-1)q?vj(t))為新信號經EMD分解后的本征模態分量。
(2)對產生的N個模態分量做總體平均,得到經CEEMDAN分解的第1個IMF:

(3)去除第1個IMF,得到剩余信號r1(t):

(4)在r1(t)中加入正負成對的高斯白噪聲,得到新信號;對新信號進行EMD分解,得到第1階段模態分量。由此得到經CEEMDAN分解的第2個IMF為:

式中:D1j(t)為第1階段模態分量。
(5)去除第2個IMF,得到剩余信號r2(t):

(6)重復上述步驟,直到剩余的殘差信號為單調函數且不能繼續分解,即完成分解過程。
最終得到K個IMF。原信號被分解為:

小波閾值去噪的思想是:首先將信號進行小波變換分解。分解后,信號的小波系數較大,噪聲的小波系數較小。通過設定合適的閾值剔除噪聲,從而達到信號去噪的目的[20]。
通常將小波閾值去噪分為軟閾值法和硬閾值法2類。
硬閾值降噪法:

式中:wj,k為小波系數;η為閾值函數。
軟閾值降噪法:

本文結合軟閾值降噪法和硬閾值降噪法的優點,采用一種自適應的閾值函數:

式中:μ為動態調節因子。
當μ值趨于0時,閾值函數變為軟閾值函數;當μ值趨于無窮時,閾值函數變為硬閾值函數。
SVD是一種分解矩陣的方法,常用于數據壓縮、數據去噪[21]。
SVD的原理如下:
對實矩陣 A ∈ Rm×n,必定存在一個m階正交矩陣和一個 n階正交矩陣,使得 A = UΣ VT。Σ為矩陣A的全部非零奇異值。Σ的前幾個值較大,包含著矩陣A的大部分信息;Σ其余的值較小,代表著矩陣的噪音。去除代表噪音的奇異值即可以達到去除噪聲的作用。
將所測的時間序列信號按每n個點截取m段的連續截取方式構造矩陣,得到的新矩陣如下:

式中:m和n大于1。
SSA是一種新型的智能優化算法,其通過模擬麻雀的覓食和反捕食行為來進行局部和全局搜索,其尋優能力強、收斂速度快[22]。
SSA種群中,含有發現者、加入者和偵察者3種類型的麻雀。具有良好適應度的個體為發現者,負責尋找食物并為整個種群提供覓食方向。當偵察者發現捕食者后會發出信號,麻雀種群會做出反捕食行為。
SSA算法步驟如下。
由n只麻雀組成的麻雀種群X可描述為:

式中:d為優化問題的變量維數。
(1)初始化麻雀種群位置和適應度。

式中:f為適應度值。
(2)排序得出當前最優個體位置和最佳適應度。
(3)更新發現者位置。


(6)計算適應度,更新麻雀位置。
(7)判斷停止條件:如果滿足,則輸出最優參數;如果不滿足,則重復執行步驟(2)—(6)。
麻雀搜索算法的缺點是:初始種群位置單一、全局搜索能力差、容易陷入局部最優、算法的精確度不足。
針對以上缺陷,本文從3個方面對麻雀搜索算法進行改進。
(1)初始化種群階段
麻雀搜索算法的初始種群位置決定了算法的尋優能力。本文引入Piecewise映射對麻雀搜索的初始位置進行映射:

式中:P、X的取值范圍是0~1。

式中:Xlb為每個維度的下限;Xub為每個維度的上限。
采用公式(17)得到的X為Piecewise映射的初始種群。該操作提高了麻雀搜索初始種群分布的多樣性。
精英反向學習可以保證種群的精英性。

式中:Xi為個體當前的信息;L和U分別為可行解的最小值和最大值;k是0~1的隨機數。
種群初始化的優化流程為:分別計算由Piece-wise映射和精英反向學習獲得的種群適應度值;在對適應度值排序后,選取較優個體作為種群的初始個體。
(2)尋優階段
麻雀搜索算法的全局和局部尋優能力不強,容易陷入局部最優情況。
本文采用加入動態自適應權重ω的方式,優化算法的全局搜索和局部開發能力。

式中:ωini為初始權重;ωfin為最終權重;δ為0~1均勻分布的隨機數。
在算法搜索前期,權重ω較大,發現者能夠充分進行全局搜索;到算法搜索后期,權重ω減小,以有利于算法進行局部搜索。
均勻分布的δ使權重ω實現動態變化,加快算法的收斂。
(3)最優麻雀階段
若算法中的最優麻雀達到適應度值時搜索停止,則結果容易陷入局部最優。本文采用隨機游走算法對最優麻雀進行擾動,以提高搜索性能。
隨機游走方法的過程為

式中:X(t)為隨機游走的步數集;sum為計算累加和函數;t為隨機游走步數。

式中:r為0~1的隨機數。
為了確保麻雀游走范圍可行,需要對麻雀位置進行歸一化。

式中:ai為隨機游走的最小值;bi為隨機游走的最大值;為變量在第t次迭代的最小值;為變量在第t次迭代的最大值。
LSSVM 可以用來解決模式分類和函數估計等問題。LSSVM使用最小二乘線性系統作為損失函數,代替了傳統 SVM 方法采用的二次規劃方法,從而簡化了計算[23]。

影響LSSVM算法的2個重要參數是懲罰參數和核函數參數。懲罰參數過小,會使模型的預測精度減;懲罰參數過大時會使模型變復雜,計算速度變慢。核函數參數過大會導致支持向量減少,過小則會使模型過飽和。
本文采用 ISSA算法對懲罰參數和核函數參數進行優化,以提高 LSSVM 預測的準確性。優化過程如圖1所示。

圖1 ISSA優化LSSVM流程圖Fig. 1 Flow chart of LSSVM optimization by ISSA
本模型的預測流程如圖2所示。首先將原始數據用自適應小波閾值降噪,然后采用CEEMDAN分解得到IMF分量和Res分量;將較復雜的IMF分量提取出來,進行SVD降噪;將CEEMDAN分解得到的剩余分量和經過 SVD降噪得到的分量用ISSA-LSSVM模型進行預測;將所有分量的預測結果進行整合,得到預測結果。

圖2 多重降噪優化ISSA-LSSVM流程圖Fig. 2 Flow chart of multiple noise reduction for ISSA-LSSVM optimization
本文以某地區2018年1月1日到2019年12月31日的日電力負荷數據為算例。將前529條數據作為訓練集,將后200條數據作為測試集。
首先對原始數據進行小波閾值去噪處理。分別采用軟閾值、硬閾值和自適應閾值對原始數據進行去噪。去噪結果如圖3所示。相關指標對比結果如表1所示。

表1 小波閾值去噪指標Tab. 1 Wavelet threshold denoising index

圖3 小波閾值去噪結果Fig. 3 Wavelet threshold denoising results
由表1數據可以看出:采用自適應閾值去噪方法得到的SNR值為28.22,分別比硬閾值和軟閾值去噪方法提升30.17%和21.74%;MSE值較硬閾值和軟閾值去噪方法降低49.79%和40.68%。該結果表明,采用自適應去噪方法的效果較好。
對采用自適應去噪方法處理后的數據進行CEEMDAN分解,分解結果如圖4所示。從圖4可以看出,CEEMDAN分解后的IMF1較復雜。采用SVD方法對IMF1進行降噪處理,處理結果如圖 5所示。從圖5可以看出,去噪后的IMF1較為平緩,適合進行預測。

圖4 CEEMDAN分解結果Fig. 4 CEEMDAN decomposition results

圖5 SVD降噪結果Fig. 5 SVD noise reduction results
為了提高預測精度,首先對負荷數據進行歸一化處理

式中:u為初始負荷值;umax為最大負荷值;umin為最小負荷值。
為了量化預測模型的精度,本文采用平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、均方根誤差(RMSE)作為評估指標。
為了驗證本文所提出的ISSA-LSSVM的預測模型的優越性,將其與AO-LSSVM、PSO-LSSVM、ISSA-LSSVM預測模型進行對比。
設定:各算法種群的數目均為20,最大迭代次數為 100。LSSVM 的 gam參數取值范圍為[0.1,1000],sig2參數的取值范圍為[0.1,100]。
各優化算法的迭代過程如圖6所示。

圖6 各優化算法迭代過程Fig. 6 Iteration process of each optimization algorithm
從圖6可以看出:AO算法的迭代速度較慢,適應度值也較大,出現了陷入局部最優的情況。PSO算法的迭代速度較快,但是適應度值較大,即尋優效果較差。SSA算法的尋優效果較好,但是迭代速度過慢,容易陷入局部最優。本文提出的 ISSA算法能夠在保證適應度值足夠小的情況下擁有較快迭代速度,這說明ISSA可以很快跳出局部最優情況。與SSA算法對比的結果說明,ISSA有助于提升迭代速度、提高預測準確度。
各優化算法下LSSVM的參數如表2所示。預測結果如圖7所示。預測結果評價如表3所示。

表2 各優化算法得到的LSSVM參數Tab. 2 LSSVM parameters obtained by each optimization algorithm

圖7 各優化算法預測結果Fig. 7 Prediction results of each optimization algorithm

表3 各優化算法預測結果指標Tab. 3 Prediction result index of each optimization algorithm 106MW·h
考察圖7、表3可知:在未對SSA算法進行優化時,SSA-LSSVM算法的MAE、MAPE值均比PSO-LSSVM算法大,這說明SSA-LSSVM的預測效果比PSO預測效果差;在對SSA算法進行優化后,ISSA-LSSVM預測模型相比SSA-LSSVM,MAE值降低 50.06%,MAPE值降低 35.82%,RMSE值降低14.67%。這說明,優化方法有效提高了SSA算法的準確性,也再次說明多策略改進SSA算法的有效性。
為了驗證多重降噪優化的有效性,分別對經CEEMDAN分解和經多重降噪優化后的數據進行ISSA-LSSVM預測,預測結果如圖8所示。

圖8 多重降噪的預測效果對比Fig. 8 Comparison of prediction effects of multiple noise reduction
由圖8可以看出,在將數據進行多重降噪優化后,預測結果比經CEEMDAN分解后的預測結果更加準確。
2種算法優化結果的評價指標如表4所示。由表4可以看出,與單純采用CEEMDAN分解數據的方法相比,多重降噪優化后預測結果的 MAE值降低7.07%,MAPE值降低15.79%,RMSE的值降低15.95%。這說明,多重降噪后的預測效果比單純采用CEEMDAN分解的預測效果好。

表4 各預測模型指標Tab. 4 Indicators of each prediction model 106MW·h
多重降噪優化ISSA-LSSVM的預測結果與表3中ISSA-LSSVM預測結果相比,MAE值降低了18.58%,MAPE值降低了25.58%,RMSE值降低了31.04%——說明將數據進行多重降噪優化能夠提升預測的準確性。
本文基于多重降噪方法,將多策略優化的ISSA-LSSVM 組合模型應用到短期電力負荷預測中,得到以下結論:
(1)在將原始數據 CEEMDAN分解前采用自適應小波閾值降噪,再將分解得到的復雜 IMF進行SVD降噪,最后將處理后的數據用于電力負荷預測。這種方法可以提高預測模型的準確性。
(2)使用多策略改進的ISSA算法對LSSVM的懲罰參數和核參數進行優化,能夠有效提高LSSVM模型的預測效果。