蘇 娟,方 舒,劉 博,杜松懷※,單葆國,高 天
(1.中國農業大學信息與電氣工程學院,北京 100083;2.國網北京市電力公司朝陽供電公司,北京 100124;3.國網能源研究院有限公司,北京 102209)
短期負荷預測在電力系統的日運行調度工作中具有舉足輕重的作用,可以有效協調發電、輸電、配電、用電的關系[1],對高比例可再生能源滲透下的電源靈活調節、電網高效聯通、用戶廣泛響應的電力市場建設具有重要意義[2-3]。隨著市場交易規模持續擴大,電力交易方式不斷更新,清潔能源將廣泛參與電力市場交易,電力負荷分析預測面臨新挑戰。
隨著電力系統對負荷預測精度的要求越來越高,人工神經網絡、支持向量機等機器學習方法因具有較強的學習和模擬能力,預測效果好等優點,得到廣泛使用。最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)在支持向量機(Support Vector Machine,SVM)的基礎上進行了改進,用平方差損失函數代替不敏感損失函數,將SVM的不等式約束變為等式約束,采用最小二乘線性系統作為模型的損失函數,待選參數少,簡化了計算過程,提高了運算速度[4],更適用于短期負荷預測。
對于波動性較強的負荷序列,單一的預測方法難以達到較高預測精度,組合預測方法得到廣泛應用。對原始負荷序列進行分解,可以實現平穩序列和非平穩序列的分離[5],降低預測過程中的干擾。國內外學者在基于負荷序列分解的短期負荷預測領域已開展了大量研究。文獻[6]利用經驗模態分解將負荷序列分解為多個獨立的模態分量,利用多個指標分析各分量與影響因素的相關關系,總結構成各分量的不同負荷成分,使負荷特性分析更加深入細化;文獻[7]采用經驗模態分解的方法將負荷時間序列分解為頻率成分不同的本征模態函數分量,然后利用LSSVM對各分量進行建模預測,將分量預測值疊加后得到最終的負荷預測值。但經驗模態分解法難以避免模態混疊現象產生,分解得到虛假的本征模態函數,在預測時產生不利的影響。文獻[8]利用小波分解算法對負荷曲線進行分解,對所分解出負荷中幅值較大的部分建立時間序列預測模型,對幅值較小的部分建立基于氣象影響的神經網絡預測模型,實例證明該方法可有效提升預測精度。但小波基函數和分解尺度主要受人為主觀的影響,基本靠先前經驗去選擇,無法保證所選小波基函數和分解尺度對于當前負荷序列的合理性。文獻[9]利用變分模態分解方法進行負荷序列分解,采用互信息理論量化影響因素與各負荷分量的相關度,最后利用深度信念網絡對每個分量建立預測模型,可提升預測精度。變分模態分解將數據分解為特征互異的本征模態函數,減輕了模態混疊現象發生,有利于信號的進一步分析。
在負荷預測過程中,LSSVM中懲罰系數和核函數寬度基于經驗選取,易增大預測誤差。因此,需要考慮利用人工智能算法對預測模型進行參數優化。文獻[10]利用布谷鳥搜索算法優化支持向量機,但布谷鳥搜索算法搜索速度慢;文獻[11]利用粒子群的全局搜索能力克服了LSSVM 在選參時的不足;文獻[12]采用粒子群算法對LSSVM的模型參數進行尋優,實現LSSVM參數的自動優化選取,單一的 LSSVM 很難做到準確地預測短期負荷;文獻[13]采用LSSVM模型提高了SVM模型的學習能力和泛化能力,采用基于雙種群的粒子群算法尋求混合核函數LSSVM模型的最優參數,結果表明預測精度明顯提高。
本文提出了一種基于模態組合的短期負荷預測方法。首先,從真實性、獨立性、有效性 3個方面,分別針對時域和頻域的不同特點,提出了負荷序列和影響因素序列分解評價方法,并以評價指標最優為目標函數,利用粒子群優化算法優化變分模態分解參數;然后,以負荷的組合模態與待分析因素的相關性特征值最大為目標函數,通過遍歷所有模態組合,尋找最優方案,將與負荷頻域特性相似的影響因素模態序列進行組合,實現了影響因素的拓展;最后,將模態組合方法拓展出的影響因素變量作為粒子群優化最小二乘支持向量機(PSO-LSSVM)預測模型的輸入變量,采用 2種預測組合策略進行短期負荷預測,并利用算例驗證所提預測方法的有效性。
在信號分解領域,變分模態分解(Variational Mode Decomposition,VMD)是目前應用較為廣泛的方法之一[14]。相比于其他常規信號分解方法,VMD解決信號混疊問題的性能卓越。但目前對于VMD參數優化的研究存在優化維度不全面、優化方向不明確、優化方法過于主觀等不足,無法滿足高精度的負荷預測要求,需要進一步的深入研究。因此,本文提出一種基于評價指標優化的改進VMD方法。
VMD整體框架為變分問題,以Wiener濾波、Hilbert變換、頻率混合[15]為基礎,可有效解決遞歸式分解方式所造成的包絡線估計誤差不斷累積的問題[16]。VMD方法[17-18]通過尋求指定個數的本征模態函數(Intrinsic Mode Function,IMF),使各模態的估計帶寬之和最小來構造變分問題,同時,利用交替方向乘子法更新模態的中心頻率,對變分問題進行求解。
本征模態函數為一個調幅-調頻信號,IMF的表達式為
式中Ak(t)為uk(t)的瞬時幅值,V;φk(t)為相位非遞減函數,ωk(t)為uk(t)的瞬時頻率,Hz。Ak(t)及ωk(t)相對 于φk(t)是 緩 變 的 , 即 在[t-δ,t+δ]( 其 中δ=2π //(t))的時間間隔內,u(t)可以看做是一個幅k值為Ak(t)、頻率為ωk(t)的諧波信號。
目前在負荷預測領域對信號分解質量的評價指標主要集中在時域層面,然而頻域中體現出的信號分解效果同樣重要。因此,本文綜合考慮時域、頻域 2個維度在信號分解評價中的突出特點,量化描述 2個維度在信號分解真實性、獨立性、有效性 3個方面的影響程度,建立改進的信號分解評價指標。
1.2.1 真實性檢驗
對信號分解的真實性檢驗包括冗余分量檢驗與殘差分量檢驗2部分,若某信號分解方法同時通過上述2個檢驗,則認為此分解方法信號分解通過真實性檢驗,可以進行后續評價指標的計算;若只通過 1種檢驗或是 2種檢驗均未通過,則該方法不滿足真實性檢驗的要求,說明其信號分解效果差,不宜采取。
1)冗余分量的真實性檢驗。
冗余分量真實性檢驗針對時域分解信號進行評價,采用分量信號與原始信號的皮爾遜相關系數[19]與真實性閾值的對比,公式如下:
式中{x1,x2,...xn}、{y1,y2,...yn}為2組長度為n的數據序列,、分別為2組數據序列的平均值。
冗余分量真實性檢驗通過的條件為 ?fi,ρ(fi,fo)>rre。其中fo為原始信號,fi, (i= 1 ,2,...,K)為分解出的分量信號,K為分量信號總數,ρ(fi,fo)為分量信號fi與原始信號fo的皮爾遜相關系數,rre為相關性閾值。
2)殘差分量的真實性檢驗
殘差分量的真實性檢驗的定義是殘差分量與原始信號數據序列的二范數比例衡量信號的能量占比。本文從頻域來評價分解信號的真實性,利用殘差頻譜中幅值顯著的頻段在原始信號頻段中的比例衡量殘差分量的頻譜特性。殘差分量真實性檢驗通過的條件為。其中fe為殘差分量,n o rm (fe)為殘差分量數據序列的二范數, n orm(fo)為原始信號數據序列的二范數,ren為能量占比閾值;lo為原始信號的顯著頻譜長度,ler為殘差頻譜中的顯著頻段長度,rfr為殘差頻段占比閾值。
1.2.2 獨立性評價指標
每一個信號分量分別對應原始信號中某一獨特的特征信息,相互獨立的信號分量之間信息交叉少,可提供較為純粹的特征信息,因此信號分量的獨立性是評價信號分解質量的重要參考依據。本文利用信號分量兩兩之間的平均皮爾遜相關系數I1和顯著頻段平均重疊度I2這2個指標,在時域和頻域2個維度對信號分解的獨立性進行評價。平均皮爾遜相關系數I1計算公式如下:
顯著頻段平均重疊度I2的計算公式如下:
式中=lij/(li+lj), (i,j∈ 1 ,2,...,K;i≠j),代表分量信號fi與fj的顯著頻段重疊度,li、lj分別為fi與fj的顯著頻段長度,lij為fi與fj重疊的顯著頻段長度。I2的數值越小,信號分解方法的頻域獨立性表現越好。
1.2.3 有效性指標檢驗
有效性評價指標用于評價分解出的各分量信號所攜帶有效信息的質量。高質量的分量信息攜帶原始信號中較多且集中的特征信息,其在時域中體現出與原始信號的相關性更強,因此,采用各信號分量與原始信號的平均皮爾遜相關系數I3來衡量有效性的時域特性,公式如下:
同時,高質量的信號分量在頻域中體現出頻譜更為密集的特點,采用分量信號顯著頻段的平均集中度指標I4對其進行量化:
式中lf為信號的頻域長度,lsec為第一個顯著頻率與最后一個顯著頻率之間的頻段長度。I4的數值越小,信號分解方法的頻域有效性表現越好。
1.2.4 綜合評價指標
針對獨立性評價的時域、頻域指標以及有效性評價的頻域指標,指標數值越小,特性表現越好。但有效性評價的時域指標I3卻表現出相反的性能,為了統一指標的性能方向,在綜合評價指標中對I3進行反向處理,采用=1-I3作為新的有效性評價時域指標,使4個指標的性能方向一致,且4個指標的取值范圍均在0~1之間,不存在數據量級不統一帶來的數據遮蔽問題。綜合評價指標Ic由這4個指標相加得到,公式如下:
綜合評價指標的數值越小,信號分解效果越好。需要注意的是,綜合評價指標的使用前提為通過真實性檢驗。
VMD方法中涉及的參數有4個,分別為模態分解總數K,二次項懲罰因子α、拉格朗日乘子保真度τ和判別精度e[20]。其中判別精度參數對分解結果的影響較小。另外 3個參數對信號分解的效果影響較大,需要對其進行優化。本文以信號分解的綜合評價指標為目標函數,利用粒子群優化算法對 3個參數進行優化,建立基于評價指標優化的VMD方法。
粒子群優化算法[21-22](Particle Swarm Optimization ,PSO)的原理表述如下:首先,在可行域的范圍內初始化一群隨機粒子,在每一次迭代中,每個粒子通過2個極值來更新自己的速度和位置:個體極值pbest和全局極值。個體極值是單一粒子曾經經過的最優位置,全局極值是粒子群中所有粒子曾經經過的最優位置。通過多次迭代搜索優化問題的最優解。
粒子群的進化公式如下:
式中w為慣性權重;c1、c2為加速因子;r1,r2∈ R and[0,1],用以保證算法的不確定性;分別為第k次迭代中第i個粒子的速度、位置、個體極值最優位置和群體極值最優位置。
在以往的負荷預測建模中,通常將影響因素的原始序列作為影響因素變量直接加入到模型的輸入中。但上述做法并未挖掘影響因素序列中隱含的特征信息,存在數據利用效率低的問題。因此,本文利用模態組合的方法對負荷預測的影響因素序列進行預處理,充分挖掘隱含的特征信息。同時,采用最小二乘支持向量機(LSSVM)作為預測算法,利用粒子群優化算法(PSO)優化LSSVM的參數。
每一個模態序列都對應原始序列的某種特征信息,將模態序列進行組合,可以挖掘出更多的隱含特征。依據特征條件將攜帶相似特征信息的模態進行組合,實際上是對原始序列的有效分割。模態組合方法主要包含特征提取、模態組合2部分。
2.1.1 特征提取
1)時域特征提取
在概率論和信息論的領域中,互信息(Mutual Information)是一種有效的信息度量,描述一個隨機變量中所包含另一個隨機變量信息量的大小,是 2個隨機變量之間相互依賴程度的度量。不同于皮爾遜相關系數只能反映變量之間的線性相關程度,互信息利用熵的概念,既可以衡量變量之間的線性相關性,也可以衡量變量之間的非線性相關性[24],故本文采用互信息作為時域特征提取方法,互信息計算公式如下:
式中I(X,Y)為變量X、Y的互信息,n為變量X中的元素個數,m為變量Y中的元素個數,p(xi)、p(yj)分別為xi、yj元素出現的概率,p(xi,yj)為xi、yj共同出現的概率,I(X,Y)數值越大,X、Y的相關性越高。
2)頻域特征提取
經改進的 VMD方法分解所得的各模態序列之間相互獨立,各模態的頻譜帶寬緊湊。因此,本文取各模態頻率中心所對應的模態周期作為各模態的頻域特征,計算公式如下:
式中fi為各模態的中心頻率,Hz;iT為各模態的中心頻率所對應的模態周期。
2.1.2 模態組合
模態組合是通過模態數據序列求和的方式,將多個模態序列整合成為一個組合模態序列。各個組合模態序列相加后可以得到原始的數據序列,符合數據的完整性原則。模態組合方法的流程圖如下圖所示:
為充分挖掘影響因素序列中隱含的特征信息,本文利用模態組合的方法,將與負荷頻域特性中體現出相似周期性的影響因素模態序列進行組合。組合之后,影響因素數目由一個拓展到多個,影響因素的數目與負荷頻域特性的顯著頻段個數相同,且組合后的影響因素模態與相應的負荷序列具有更強的相關性。
由于短期負荷預測的預測對象為日負荷,結合前期采用小波分析、評價指標優化的集合經驗模態分解法(Ensemble Empirical Mode Decomposition,EEMD)、VMD法等分解算法對大量負荷序列的分解結果得出,分解后的負荷頻譜主要在 3個頻段內呈現較高的周期性:周期大于24 h(不包括24 h)的負荷,體現在日期類型(如工作日、節假日)的周期變化,可以近似描述短期負荷的趨勢性;周期為12~24 h(不包含12 h)的負荷頻段,體現了1 d內用電習慣(如晝夜交替、日前電價)的變化,可以近似描述負荷的波動性;小于12 h的負荷頻段,體現了用戶在1 d內用電的隨機性(如天氣、電價不確定性對負荷的影響),可以近似描述負荷的隨機性和不確定性。根據以上分析,本文對上述影響因素拓展方法進行如下簡化:
1)將影響因素模態序列中周期變化大于24 h(不包含 24 h)的模態進行組合,組合模態作為影響因素趨勢分量,對應描述負荷的趨勢性;
2)將影響因素模態序列中周期變化為12~24 h(不包含 12 h)的模態進行組合,組合模態作為影響因素波動分量,對應描述負荷的周期波動性;
3)將影響因素模態序列中周期變化小于12 h的模態進行組合,組合模態作為影響因素隨機分量,對應描述負荷的隨機性與不確定性。
支持向量機方法具有較強的泛化能力,在尋找全局最優中有較大優勢。但考慮到支持向量機方法在參數設定方面存在不足,本文采用最小二乘支持向量機(LSSVM)作為預測算法,并利用粒子群(PSO)優化算法優化LSSVM的參數。
2.3.1 LSSVM基本模型
最小二乘支持向量機[25-27](LSSVM)是支持向量機(SVM)的一種變形,保留了傳統的支持向量機結構風險最小的特性[28]。將支持向量機優化模型中的不敏感損失函數設定為最小二乘損失函數,用等式約束替代不等式約束,減少需優化的參數個數,降低了求解復雜度[29-30]。
LSSVM的非線性函數式如下式所示:
式中k(x,xi)取不同的核函數就可生成不同的支持向量機。目前使用最多的核函數主要有多項式核函數、線性核函數、徑向基函數(Radial Basis Function,RBF)。其中,RBF核函數結構簡單,泛化能力強,僅核函數σ與正規化參數γ需進行優化。
2.3.2 適應度函數設置
粒子群優化算法中的每個粒子包含3個維度,分別代表需要優化的3個參數,本文利用粒子群算法優化LSSVM的核參數σ和正規化參數γ,適應度函數為
式中N為樣本數量;Pij、Rij分別為第i個樣本第j維觀測數據的預測值和真實值。
2.3.3 基于模態組合的 PSO-LSSVM 短期負荷預測方法
傳統的模態預測方法(以下稱原始模型)是將各影響因素的整體序列作為模型的輸入變量,得到負荷整體預測值。基于模態組合的預測方法在預測組合策略上主要分為 2種,一種是建立組合預測模型(以下稱組合模型),即分別利用各個影響因素的趨勢分量、波動分量、隨機分量預測負荷的趨勢模態、波動模態和隨機模態,得到負荷各模態的預測值之后,再將其加和得到最終的預測結果。另一種是僅建立一個預測模型(以下稱單一模型),將所有影響因素的趨勢分量、波動分量、隨機分量均作為模型的輸入變量,直接得到最終的預測結果。
2種預測策略各有優勢,建立組合預測模型的策略中,各影響因素分量與對應的負荷模態有更強的相關性,單個模型的預測精度可以得到有效保障。但由于多個預測模型預測值的疊加會累積預測模型本身存在的固有誤差,可能無法滿足短期負荷預測對預測精度的要求。直接預測最終負荷的預測策略,由于僅建立單個預測模型,因此不存在模型固有誤差的疊加,但可能存在重復性輸入的問題,需進行降維處理[31-32]。
將得到的影響因素拓展變量輸入PSO-LSSVM模型,即可得到預測日的負荷預測值。輸入變量主要包含歷史負荷、溫度、濕度、日前電價的原始序列,拓展出的分量序列以及經降維后的主成分序列,具體如下:
1)溫度。預測日當天、預測日前1 d、預測日前2 d的溫度原始序列、趨勢分量、波動分量與隨機分量;
2)濕度。預測日當天、預測日前1 d、預測日前2 d的濕度原始序列、趨勢分量、波動分量與隨機分量;
3)歷史負荷。預測日前一周同時刻、前1 d同時刻、前1 d前一時刻的負荷原始序列、趨勢分量、波動分量、隨機分量;
4)日前電價。預測日當天的日前電價原始序列、趨勢分量、波動分量、隨機分量;
5)主成分序列。針對影響因素的重復輸入,將降維后的主成分序列作為輸入變量。
為驗證上述所提基于模態組合的短期負荷預測方法的有效性,本文以美國新英格蘭地區 2016年全年 8760點實測負荷數據為數據源,利用基于評價指標優化的變分模態方法對負荷序列進行分解,以驗證基于評價指標優化的變分模態分解方法的有效性。同時,選用新英格蘭地區2016年1月2日-2月29日冬季以及2016年7月1日-8月31日夏季的工作日負荷、日前電價、溫度、濕度數據為數據源進行算例分析,以驗證模型預測的精度。
3.1.1 分解結果分析
利用基于評價指標優化的變分模態分解方法對上述負荷序列進行自適應的信號分解,分解后的各模態時序圖以及各模態的頻譜圖如圖2、圖3所示:
由圖2可知,本文方法分解出了3個模態分量,本征模函數(Intrinsic Mode Function,IMF)IMF1的能量占比最大,但波動性較小,與原始負荷序列表現出相同的變化趨勢,夏季負荷水平較高,且負荷差最大;IMF2的波動性較強,尤其在夏季時段最為顯著;IMF3的能量占比最小,但波動性最強,而其夏季時段(5 000 h左右時段對應7、8月)的波動性較弱。殘差分量的數值主要在-2~2間波動,在原始信號中的能量占比為 0.011%,幾乎可忽略不計。
從圖3中可以看出,IMF1的頻段主要集中在1.649e-6Hz左右,IMF2的頻段主要集中在1.157e-6Hz,IMF3的頻段主要集中在2.315e-5Hz,殘差分量無明顯頻段特征。IMF1的顯著頻段對應的模態周期為大于24 h(不包含24 h),IMF2的顯著頻段對應的模態周期為12~24 h(不包含 12 h),IMF3的顯著頻段對應的模態周期為小于 12 h,殘差沒有顯著頻段。且各模態之間未出現明顯的頻段重疊。由此可見,本方法能夠提取出原始序列中周期性較強的模態分量,信號分解的質量也較高。
3.1.2 與其他方法的比較分析
為驗證本文方法的有效性,將小波分析[33-34]、集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)[35]、VMD這3種在負荷分解中應用效果較好的信號分解方法進行比較分析。小波分析,利用小波函數db3(Daubechies,db),取分解層數為1~10,對相同數據源進行分解,選取效果最好的分解結果作為對比,最優的分解層數為3層,得到4個信號分量。評價指標優化的EEMD方法,利用PSO優化2個主要參數:白噪聲序列幅值系數k以及執行經驗模態分解(Empirical mode decomposition,EMD)的總次數M,以綜合評價指標最優為適應度函數,將原始數據序列自適應地分成了12個分量。未經優化的VMD,對相同數據集進行分解,分解出了 4個模態分量。各分解方法的指標對比結果如表1所示。
從表1中可以看出:在4種信號分解方法中,小波分析未通過真實性檢驗,其他2種方法均通過了真實性檢驗;優化后的VMD方法綜合評價指標比優化后的EEMD方法小 0.989;優化后的 VMD方法綜合評價指標比未優化的VMD方法小0.155。由此可見,本文所提信號分解方法在實際應用中具有明顯優越性。

表1 不同信號分解方法的指標對比Table 1 The index comparison of different signal decomposition methods
以美國新英格蘭地區2016年1-2月份的工作日負荷、日前電價、溫度、濕度數據為數據源,進行負荷結構辨識與影響因素拓展的算例分析。數據樣本為每日24個數據點,共計960個樣本點。
3.2.1 氣象因素拓展
經VMD分解后的溫度和濕度的時序圖如圖4、圖5所示:
考慮到溫度、濕度的累積效應,利用模態組合的方法對預測日前2 d、前1 d以及當天的氣象因素進行組合,組合結果見表2~表3。

表2 氣象因素的組合結果Table 2 Combination of meteorological factors

表3 模態組合因素與預測日負荷的相關性Table 3 Correlation between modal combination factors and forecast daily load
從表2可以看出,通過模態組合的方法,預測日前2 d溫度、預測日前1 d溫度、預測日當天溫度均被拓展成了2個,分別為溫度趨勢分量與溫度波動分量;濕度因素由于只存在 1個模態,沒有組合出更多的因素分量。
從表3可知,預測日前2 d溫度因素拓展出的趨勢分量和波動分量與負荷的相關性分別比原始序列高 0.25、0.06;預測日前1 d溫度因素拓展出的趨勢分量與負荷的相關性比原始序列高 0.14,波動分量低 0.01;預測日當天溫度因素拓展出的趨勢分量和波動分量與負荷的相關性分別比原始序列高0.21、0.05。預測日前2 d濕度因素拓展出的趨勢分量與負荷相關性比原始序列高 0.01;預測日前 1 d濕度因素拓展出的趨勢分量與負荷的相關性比原始序列高 0.02;預測日當天濕度因素拓展出的趨勢分量與負荷的相關性比原始序列高 0.01。由此可見,基于模態組合的方法不僅使影響因素的數目得到拓展,而且組合出的因素分量與負荷的相關性更高,有利于提升預測模型的精度。
3.2.2 歷史負荷因素的模態組合
由于負荷自身的周期性,歷史負荷也是常見的負荷預測影響因素變量。選取預測日前 1周同時刻負荷、預測日前1 d同時刻負荷、預測日前1 d前一時刻負荷作為歷史負荷因素,并利用模態組合的方法研究影響因素,結果如表4、表5所示。
從表4、表5可知,預測日前1周同時刻負荷、預測日前1 d同時刻負荷、預測日前1 d前一時刻負荷的原始序列均被拓展成了 3個分量,分別為趨勢分量、波動分量、隨機分量。預測日前 1周同時刻負荷拓展出的趨勢分量、波動分量和隨機分量與負荷的相關性分別比原始序列高0.34、0.55、0.27;預測日前1 d同時刻負荷拓展出的趨勢分量、波動分量和隨機分量與負荷的相關性分別比原始序列高0.43、0.48、0.26;預測日前1 d前一時刻負荷拓展出的趨勢分量、波動分量和隨機分量與負荷的相關性比原始序列高0.52、0.56、0.19。

表4 歷史負荷因素的組合結果Table 4 Combination results of historical load factors

表5 模態組合歷史負荷因素與預測日負荷的相關性統計Table 5 Correlation statistics between historical load factors of modal combination and forecast daily load
3.2.3 經濟因素拓展
日前電價分解后的時序圖如圖6所示。
利用模態組合的方法對日前電價因素進行組合的結果見表6、表7。
由表6、表7可知,日前電價因素被拓展成了3個因素分量,IMF1構成了趨勢分量,IMF2構成了波動分量,IMF3、IMF4、IMF5共同構成了隨機分量。拓展之后的分量中,趨勢分量與預測日負荷的相關性為 0.70,波動分量與預測日負荷的相關性為 0.78,高于原始序列與預測日負荷的相關性。隨機分量的相關性為 0.43,雖不如原始序列與負荷的相關性高,但也具有較強的相關性。

表6 日前電價因素的組合結果Table 6 Combined results of the previous electricity price factors

表7 模態分解的日前電價因素與預測日負荷的相關性統計Table 7 Correlation statistics between day-ahead electricity price factors and forecast daily load based on modal decomposition
日前電價中IMF3與負荷的相關性為0.33,IMF4與負荷的相關性為0.26,IMF5與負荷的相關性為0.21。經模態組合后,3個模態構成的隨機分量與負荷的相關性為0.43,均大于單獨的3個模態,證明了本方法的有效性。
為了說明本文所提基于模態組合的負荷預測方法的有效性,本文分別選用美國新英格蘭地區2016年1-2月冬季以及2016年7-8月夏季的工作日負荷、日前電價、溫度、濕度數據為數據源進行算例分析。分別建立基于 PSO-LSSVM的原始預測模型、單一預測模型和組合預測模型。原始預測模型,將歷史負荷數據和影響因素數據作為 PSO-LSSVM模型的輸入,得到預測日的負荷預測值。單一預測模型,將通過 VMD分解及主成分分析法降維處理后的各影響因素的趨勢分量、波動分量和隨機分量作為 PSO-LSSVM模型的輸入,得到預測日的負荷預測值。組合預測模型,采用PSO-LSSVM模型分別對負荷的趨勢模態、波動模態、隨機模態進行預測,對應的輸入為歷史負荷及其影響因素對應的模態分量,最后將各模態的預測值累加得到得到預測日的負荷數據。
圖7、圖8為冬季、夏季3種預測模型預測結果與實際值的對比。表8為預測精度對比。

表8 不同模型的日負荷預測精度對比Table 8 Comparison of forecasting accuracy between single model, combined model and original model
從表8中可以看出,除最小絕對誤差組合模型最高外,單一預測模型與組合預測模型在各精度指標上,都優于不進行模態組合的原始預測模型。組合預測模型相比于原始模型,最大相對誤差降低了3.36個百分點,平均相對誤差降低了1.71個百分點,最大絕對誤差降低了95 MW,平均絕對誤差降低了55.72 MW,證明了模態組合方法在負荷預測工作中的有效性。在本算例中,2種基于模態組合的預測模型均具有良好的預測精度。
針對本算例結果可知,單一預測模型和組合預測模型的的預測精度指標優于原始模型,但 2種模型的優越性比較還需要再進行更加廣泛的試驗驗證。但是組合模型存在的固有誤差累計現象不容忽視,這種組合預測模型中出現的固有誤差的累計,將嚴重影響預測精度,可能導致其無法滿足短期負荷預測對精度的要求。建議針對不同的數據集分別建立組合預測模型和單一預測模型,選取適合此數據集的精度較高的模型。
本文提出了一種基于模態組合的短期負荷預測方法,本文首先從建立信號分解的評價指標入手,針對負荷預測領域的信號分解特點,制定了包括真實性檢驗、獨立性指標和有效性指標 3部分的評價指標,為信號分解技術的優化方向提供了參考依據。繼而利用粒子群優化算法優化變分模態分解的參數,提出了改進的變分模態分解方法。將改進變分模態分解方法分解出的高質量模態進行組合,進行負荷結構辨識以及影響因素拓展。最后,建立了基于模態組合的 PSO-LSSVM 短期負荷預測模型。結合美國新英格蘭地區2016年的實測負荷數據進行算例分析,結果表明:
1)本文所提改進變分模態分解方法在信號分解的真實性、獨立性、有效性方面均具有顯著優越性,可以提供高質量的模態數據序列;
2)本文所提基于模態組合的PSO-LSSVM短期負荷預測方法在高質量影響因素變量的挖掘中能夠在數據集不變的基礎上顯著提升數據利用效率。同時證明了基于模態組合的 PSO-LSSVM 算法相比于直接采用PSO-LSSVM方法,最大相對誤差降低了3.36個百分點,平均相對誤差降低了1.71個百分點,最大絕對誤差降低了95 MW,平均絕對誤差降低了55.72 MW。
本文提出的基于模態組合的短期負荷預測方法提高了負荷預測精度,對電力系統調度和電力市場交易起到積極作用。未來可在本文研究結果的基礎上,將研究對象擴展至高比例可再生能源電力系統下的廣義負荷,深入分析廣義負荷的時頻特征,完善廣義負荷的解析方法;挖掘廣義負荷與電價、氣象等影響因素在時域、頻域的動態關聯關系,分析廣義負荷對于電價、氣象的響應特性,研究考慮互動響應的廣義負荷預測方法。