董新偉,卜智龍,陳鳴慧,鹿文蓬,年珩
(1.中國礦業大學電氣與動力工程學院,江蘇 徐州 221116;2.浙江大學電氣工程學院,浙江 杭州 310058)
準確的負荷預測不僅能為電力調度提供依據,而且對電網的規劃和穩定運行具有重要意義[1—3]。傳統的負荷預測可分為點預測和區間預測[4—7]。點預測是用來預測某一時刻具體的數值[8],通常以預測值和實際值的誤差最小為目標;而區間預測是預測某一時刻出力區間,通常以低區間帶寬和高區間覆蓋率為目標[9]。傳統的負荷預測大多是確定性點預測,但由于電力系統受不確定性因素影響,負荷功率也具有不確定性。單純的點預測無法應對負荷的不確定性。區間預測以概率的形式有效地應對出力的不確定性,通過預測負荷功率上下界,為決策者提供更多信息。因此提高電力負荷的區間預測精度成為目前研究的熱門方向。
國內外人員對區間預測進行了廣泛的研究。區間預測主要有統計方法[10—11]、上下區間估計[12—13]以及組合預測方法[14]等。文獻[9]采用長短期記憶(long short-term memory,LSTM)網絡進行點預測并且構建誤差的核密度估計,構造不同置信區間下的負荷區間。文獻[15]利用分位數回歸(quantile regression,QR)構建不同模型從而得到概率預測結果。單純利用QR很難以非線性擬合的方式去擬合復雜的函數。因此,為了提高區間預測效果,常將神經網絡模型和QR一起構建概率預測模型。文獻[16]將分位數回歸和隨機森林(random forest,RF)結合在一起以預測負荷的概率密度,效果遠高于傳統QR。除了隨機森林與分位數相結合,還有支持向量機(support vector machine,SVM)[17]以及徑向基函數(radial basis function,RBF)[18]等常見負荷預測方法。
為提高負荷預測的精度,常采用數據分解從數據本身出發對數據分解得到子數據,然后對子數據進行預測重構得到最終的預測結果。對數據進行分解的常見方法有小波分解(wavelet decomposition,WD)[19]、經驗模態分解(empirical mode decomposition,EMD)[20—22]等。文獻[23]采用經驗模態分解將負荷分解為多個模態,然后分別進行預測,但EMD易受模態混疊的影響。
傳統分解、求和預測的方法大多運用在點預測上,較少運用在區間預測上。同時,傳統的分解方法由于存在模態混疊的現象,導致預測精度較低。為進一步提高預測精度以及模型分解的泛化能力,文中利用變分模態分解(variational mode decomposition,VMD)提升分解效果,采用深度學習網絡長短期記憶神經網絡分位數回歸(long short-term memory neural network quantile regression,LSTMQR)提升預測精度,提出一種基于VMD-LSTMQR的滾動母線負荷區間預測。首先,采用中心頻率法確定VMD母線負荷的最佳分解數量,并將原始的母線負荷分解成一系列不同頻率特征的子序列;其次,采用區間預測指標確定不同子序列的最佳滾動步長;然后,分別對各子序列進行LSTMQR區間預測,得到不同子序列的預測結果;最后,將各子序列的區間預測重構,得到原始負荷序列的區間預測。
VMD能夠自適應地對信號進行分解[24]。不同于傳統EMD的遞歸方式求解模型,VMD通過采用非遞歸的方式將信號分解成若干層,有效消除欠包絡和過包絡問題,對噪聲具有更好的自適應性。對于一段時間序列x(t),通過迭代搜尋變分模型將時間序列分解成有限帶寬的模態分量。設第i個模態分量為ui(t),對應的中心頻率為ωi,具體的實現步驟如下。
(1)各模態的帶寬計算。對于每一個分解得到的模態分量ui(t),采用Hilbert變換得到單側譜。
(2)將每一個模態函數的中心頻率ωi的指數項進行混疊,將模態函數的頻譜調制到基頻帶。
(3)利用高斯平滑法對已經解調的信號估計其帶寬,即計算解調信號的L2 范數。轉化為求解帶約束的變分問題,目標函數為:
(1)
式中:?t為t的偏導;δ(t)為Dirac分布函數;K為分量個數;?為卷積運算。為了實現上述目標函數求解,引入二次懲罰項α和拉格朗日乘子λ將極值約束問題轉換為無約束問題,如式(2)所示。

(2)
對式(2)采用交替方向乘子法更新各模態量以及中心頻率,如式(3)所示。
(3)

基于QR的LSTM將QR作為LSTM中的一層。通過改變LSTM不同分位點下的損失函數,構建LSTM的不同條件分位數函數模型,其結構見圖1。

圖1 LSTMQR模型Fig.1 The model of LSTMQR
在不同分位點τi下的LSTM的損失函數,即:
(4)
式中:W(τi),b(τi)分別為LSTM的權重和偏置在分位點τi的集合;γ為正則項懲罰系數;Xt,Yt分別為LSTM的輸入和輸出;g(·)為映射函數;ρτi(a)為檢驗函數,如式(5)所示。
(5)
式中:a為整體性變量。
為獲得不同分位點τi下的最優W(τi),b(τi),采用梯度下降法進行求解[25]。
文中采用滾動模式對不同子序列區間預測。對于N維的負荷序列,采用VMD分解之后,各子序列的長度也為N維。
滾動模式的步驟為:已知第i個子序列的前n時刻真實數據序列為yi,1,yi,2,…,yi,n,根據已知的子序列前n時刻數據去預測n+1時刻的子序列數據出力區間;當達到n+1時刻,將該時刻的數據加入真實數據中并剔除離數據點最遠的那個數據,此時時間序列為yi,2,yi,3,…,yi,n+1;之后采用該時刻的時間序列去預測n+2時刻子序列的出力區間,按照這種滾動預測模式,完成子序列區間預測。
假設第i個子序列的滾動步長為Ni,采用LSTMQR方法進行區間預測,那么訓練集的輸入與輸出如式(6)所示。
(6)
式中:XTR,i為第i個子序列的訓練輸入樣本,訓練維度為m×Ni;YTR,i為第i個子序列的訓練輸出樣本,訓練維度為m維。
在進行LSTMQR區間預測時,根據所設置的分位數預測區間與輸入、輸出訓練集,得到不同分位數下的結果。在進行模型測試的過程中,根據不同的分位數得到所預測數值的區間。測試模型的90%置信區間含義為測試集區間輸出由0.05至0.95的分位數預測結果,如式(7)所示。
(7)
式中:XTE,i為第i個子序列的測試輸入樣本,訓練維度為(N-Ni-m)×Ni;YTE,i為第i個子序列的測試輸出樣本,訓練維度為(N-Ni-m)×2。
基于VMD-LSTMQR負荷區間預測是先將負荷時間序列分解成K個子序列,然后分別對K個子序列進行LSTMQR的滾動區間預測,根據各子序列區間預測結果進行子序列重構,得到最終的預測結果。基于VMD-LSTMQR負荷滾動預測的流程圖如圖2所示,具體的步驟如下:

圖2 基于VMD-LSTMQR滾動負荷區間預測流程Fig.2 The process of rolling interval load prediction based on VMD-LSTMQR
(1)對歷史的母線負荷數據進行VMD。采用中心頻率法確定最佳的分解數量K,并將原始負荷序列分解成K個不同頻率特征的子序列。
(2)根據區間預測指標分別確定不同子序列最優的滾動預測步長。
(3)采用滾動預測模式對分解的K個子序列分別進行LSTMQR區間預測。
(4)對預測完成的子序列進行子序列重構,得到原始的負荷區間預測。
文中用3個區間指標評價區間預測性能[13]。
(1)預測區間覆蓋率(prediction interval coverage probability,PICP)用于評估預測區間的可靠性。PICP越大表示越多的實際值落入區間概率中,預測效果越好,其表達如式(8)所示。
(8)
式中:N為預測樣本數量;ηi為布爾值,當所預測的區間包含實際功率數值時,記為1,否則記為0。
(2)預測區間平均帶寬(prediction interval normalized average width,PINAW)用于反映預測區間的清晰度。結合預測區間覆蓋率指標,PINAW越窄,區間覆蓋率預測越高,預測效果越好,其表達如式(9)所示。
(9)
式中:ymax為預測樣本中的最大值;Li為第i個樣本下邊界值;Ui為第i個樣本上邊界值。
(3)歸一平均偏差(normalized average deviation,NAD)用于評估實際功率遠離預測區間帶的程度。NAD越小表示未落入點離預測區間帶越近,其表達如式(10)所示。
(10)
其中:
(11)
式中:yi為第i個樣本的實測值。
文中以220 kV與10 kV的母線負荷數據分別驗證文中所提方法的有效性。所選取的220 kV母線數據時間是從2017年5月1日到2017年5月31日,采樣間隔為5 min。10 kV母線負荷數據時間從2017年1月1日到2018年1月1日,采樣間隔為1 h。220 kV和10 kV母線負荷時間序列如圖3所示。文中將220 kV母線負荷前25 d作為訓練數據,后6 d作為測試數據;10 kV母線負荷前300 d作為訓練數據,后65 d作為測試數據。文中所設置的分位數區間為[0.05,0.95],間隔為0.05。

圖3 220 kV和10 kV母線負荷Fig.3 Bus load power of 220 kV and 10 kV
從圖3可知,10 kV母線和220 kV母線的整體波動性比較大,具有非平穩性。因此,采用VMD將負荷序列進行分解得到K個不同頻率特征的子序列,以提高整體的預測效果。在分解前,采用中心頻率法確定最佳分解數量K,模態過多將導致模態重復,模態過少將導致模態分解不夠。為確定最佳分解數量K,文中將設定K的取值范圍,按照分解的模態數計算其中心頻率。若分解到K+1時,有2個模態的中心頻率比較相近,則說明出現了多模態的情況,最佳的分解個數為K。文中以220 kV母線負荷為例進行分析。不同分解數量下220 kV母線負荷中心頻率結果如表1所示。

表1 220 kV母線負荷不同分解個數下的中心頻率Table 1 The center frequency of different decom-position numbers of 220 kV bus load powe Hz
由表1可知,當分解到模態數為7的時候,模態2的中心頻率為61 Hz,模態3的中心頻率為92 Hz,2個模態的中心頻率比較接近。而分解到模態數為6的時候,6個模態之間的中心頻率相差比較大。因此,220 kV母線負荷的最佳分解模態數為6。并且,模態的中心頻率按照模態高低進行排序,模態1的頻率最低,模態6的頻率最高。圖4是經過VMD之后的模態1和模態6子序列能量。

圖4 經過VMD之后的模態1和模態6子序列結果Fig.4 The subsequence results of mode 1 and mode 6 after VMD
由圖4可見,模態1的子序列比較平穩,與原負荷序列的趨勢走向一致。并且分解之后的數值功率比較大,與原負荷功率的數值比較接近。而模態6的分解頻率最高,波動性比較大,分解之后的數值也比較小。因此,模態1的預測結果對最終原始負荷序列的影響最大,而其他模態影響相對較小。
在對不同的分解序列進行預測時,需找到合適的滾動步長。滾動步長過大,數據冗余;滾動步長偏小,無法體現數據的特征。合理的數據長度不僅能包含數據的特征,而且能夠避免無效信息。因此,文中設定不同的步長范圍,根據最優指標選取最后的滾動步長。不同子分解序列所設定的步長范圍為2~6。不同子序列的各步長指標見圖5。

圖5 不同步長下各模態區間數值指標Fig.5 Index values of each mode under different steps
圖5反映的是不同步長下不同模態的3個評價指標數值。由于模態1和模態2比較平穩,所以預測區間覆蓋率比較高,而模態3至模態6波動比較大,整體預測區間效果不佳。
根據3個指標選取最為合適的步長。在模態1中步長3在最窄的區間帶寬下有著更高的區間覆蓋率,偏離程度也最低。在模態2中,步長4的區間寬度略低于步長6,但預測區間覆蓋率以及偏離程度優于步長6,因此,模態2的最佳步長為4。
在模態3中,步長3的3個指標最佳。在模態4中,雖然步長5的覆蓋率比步長3的覆蓋率略高,但區間的寬度以及偏離程度比步長3小,故模態4的最佳步長為3。步長4在模態5和模態6中的3個指標最優。由于模態3到模態6的波動比較大,且數值也比較小,其預測效果不佳,可選取任一步長,文中僅挑選不佳結果中最好的步長。綜上,模態1到模態6的最佳滾動步長分別為3,4,3,3,4,4。
根據各模態的最佳滾動步長分別對各模態序列進行區間預測,根據區間預測結果進行重構,得到原始負荷序列的區間預測結果。為了驗證所提方法的有效性,文中將選取另外3種區間預測方法進行對比。3種區間預測方法分別采用LSTMQR直接對原始負荷序列進行區間預測、采用LSTMQR對EMD分解的負荷序列進行預測、采用非參數核密度誤差分布的概率區間進行預測。采用4種方法分別對10 kV和220 kV的母線負荷進行預測,不同置信區間3個指標數值如圖6、圖7所示,不同方法下置信區間的平均值如表2所示。


圖6 10 kV母線負荷下不同預測模型精確性比較Fig.6 Accuracy comparison of different prediction models for 10 kV bus load power
結合圖6和圖7可知,隨著置信區間變大,4種方法的區間寬度都在增大,越來越多的功率點落入區間帶內,區間覆蓋率增加,偏離區間帶的程度在不斷減小。對比圖6的4種方法可見,無論在哪一個置信區間,采用VMD-LSTMQR區間預測的區間寬度最窄,但區間的偏離程度最低。除了40%置信區間略低于EMD-LSTMQR外,余下任意置信區間下的區間覆蓋率均高于其他方法。

圖7 220 kV母線負荷下不同預測模型精確性比較Fig.7 Accuracy comparison of different prediction models for 220 kV bus load power
從表2的10 kV平均預測結果可知,采用VMD-LSTMQR方法的平均區間寬度相較其余3種預測方法低0.01~0.03的同時,平均預測區間覆蓋率要高出3%~4%,平均偏離區間帶降低了0.1左右。而基于非參數核密度誤差分布的概率區間預測方法,雖然平均區間寬度最寬,但平均預測精度相比于VMD-LSTMQR要低3%左右。雖然LSTMQR的平均區間寬度要高于VMD-LSTMQR和EMD-LSTMQR,但平均預測精度最低,整體的平均偏離程度也最高。

表2 220 kV和10 kV母線平均預測結果Table 2 Average prediction results of 220 kV and 10 kV bus load
對比圖7的4種方法,除了在10%置信區間,VMD-LSTMQR的區間寬度要略大于非參數核密度誤差區間預測的區間寬度,其余無論在哪一個置信區間,VMD-LSTMQR區間預測的區間寬度均要小于其余3種方法。由表2的220 kV平均預測結果可知,文中方法在平均區間寬度低于其他3種方法0.01~0.03的同時,平均的預測精度整體上提高了2%~4%。而采用EMD-LSTMQR雖然平均區間寬度最寬,但預測精度最差。
綜上,采用VMD-LSTMQR的區間預測方法無論對10 kV母線負荷進行預測,還是對220 kV母線負荷進行預測,都能保證在最低的平均區間寬度下有著更高的區間覆蓋率及更低的偏離程度。相對于傳統的區間預測方法,預測效果有明顯的改善。
圖8為90%置信區間下220 kV母線負荷某一天區間預測結果。

圖8 90%置信區間下的負荷預測Fig.8 Load prediction of 90% confidence level
由圖8可知,90%置信區間下實際的負荷功率大部分能很好地落入4種方法所預測的區間帶內。90%置信區間下的4種方法整體預測效果均較好,但對比圖8(a)、(b)、(c)、(d)可以發現,該天實際功率與所預測的區間帶下邊界更接近,而采用VMD-LSTMQR區間預測方法在樣本點50~100 以及200~288 的區間段內所預測的下邊界相比于其他3種方法低了5~10 MW,使得所預測的下邊界更偏離實際功率。其余3種方法的下邊界圍繞著實際功率上下波動。對比4種方法預測的上邊界可以看出,VMD-LSTMQR上邊界預測功率在240~260 MW,而其余方法上邊界預測在250~280 MW,下邊界預測4種方法預測均在210~220 MW,這也就意味著,采用VMD-LSTMQR預測的區間寬度更小,整體的預測效果更好。
負荷區間預測能夠更加全面地反映負荷變化的趨勢,為電網規劃和調度提供參考和依據。文中提出一種VMD-LSTMQR的區間負荷預測方法,在選取最合適分解模態的同時進行最優化的區間預測,以實際的案例證明文中所提方法的有效性。結論如下:
(1)相對于傳統的EMD 分解,文中采用VMD分解克服模態重疊的現象,并根據中心頻率法確定最合適分解模態。
(2)采用滾動預測的模式進行區間預測,并根據不同模態以3個指標最優為條件找出最為合適的不同模態預測步長。
(3)對不同模態采用LSTMQR進行區間預測,以分位數和LSTM結合的方法相對于傳統的QR預測效果更佳。
綜上所述,文中所提出的滾動區間預測方法不僅相對于傳統的區間預測方法有更窄的區間、更高的區間精度以及更低的偏離程度,而且所采用的滾動模式更加符合預測模式,能更好地實際作用于電力系統。