杜雅楠,齊敬先,施建華,王亞鵬
(南瑞集團有限公司(國網電力科學研究院有限公司),南京 211106)
電力系統負荷預測是電網調度管理、發電計劃制定的前提條件和關鍵環節,精準及快速的負荷預測能夠給電網企業帶來顯著的經濟效益,目前智能電網技術的快速發展需要電力系統具備更快的響應速度和更高的負荷預測效率,而超短期負荷預測具有耗時短、迭代頻率快、準確度高等特性,因此更加契合未來智能電網系統的發展趨勢和要求.通過超短期負荷預測可以使電力調度人員及時掌握電網負荷的變化趨勢情況,為電力調度人員管理用電計劃、實現電力電量平衡調度提供更加科學的指導和依據[1].
目前電力負荷預測的主要研究方向包含點預測[2-5]和區間預測[6-14],而近年來國家經濟的迅速增長使電力系統負荷構成更加復雜[3],各種不確定因素增多會使點預測負荷模型的復雜度增加、預測精度下降,而相比于點預測方法,區間預測方法能夠對負荷波動范圍進行比較精確的估計,更有利于負荷調度的評估與決策,也更加符合未來智能電網發展的需要.區間預測方法目前已有眾多學者研究,文獻[6-9]是基于概率性的區間預測方法,而概率性區間預測模型對樣本完整性要求較高,需要大量統計數據用于實驗,同時難以驗證預測模型是否符合工程實際.文獻[10-14]是基于機器學習的區間預測方法,常用預測方法有神經網絡(Artificial Neural Network,ANN)[10-13]、支持向量機(Support Vector Machine,SVM)[14]等.基于神經網絡的預測模型通常存在模型收斂速度較慢的問題,很難應用于實時性要求較高的實際工程應用中,文獻[14]提出一種基于SVM的區間預測模型,但其應用對象為貿易數據,而貿易數據與負荷數據特征差異較大.作為SVM的一種改進模型,最小二乘支持向量機(Least Squares Support Vector Machine,LSSVM)[15]模型具備更低的模型復雜度和更快的求解速度,將其應用于負荷預測能夠極大提升算法運算速度,其應用成效已有大量論文論證.
針對上述分析,本文提出一種基于LSSVM 模型的超短期負荷區間預測方法,該方法繼承了LSSVM預測模型計算簡單且快速的優點,計算成本較小.而在基于LSSVM的預測模型中,另外一個值得注意的問題是模型參數的選擇,由于在實際電網運行過程中統計出的負荷數據通常會含有大量噪聲,針對數據含有大量噪聲的特點,如果能夠合理地估計出數據的噪聲,將為此類數據驅動模型的參數優化工作提供良好的依據.Gamma Test[16]作為一種獨立于模型的基于數據的噪聲估計方法,可在不知道具體的輸入輸出的數學模型的情況下估計出樣本的最小有效噪聲,文獻[17]提出用Gamma Test 估計LSSVM 參數范圍,然后用于預測,取得了較好的效果.綜上所述,本文將使用Gamma Test方法計算的最小有效噪聲作為模型參數優化的訓練停止準則,最后通過優化后的參數和估計噪聲來計算預測區間.
為驗證本文方法的有效性,以某電網全網負荷數據為對象,使用所提的區間預測方法進行超短期負荷區間預測,并與文獻[14]方法進行實驗比較與分析.
LSSVM 回歸模型已發展較為成熟,本文僅做簡單介紹,其模型表示如下:

式中,x是模型輸入,y是輸出;φ (x):Rl→Rp是樣本空間到高維特征空間的映射;其中w∈Rp,b∈R分別表示高維特征空間中的系數和偏差.
基于LSSVM的回歸模為:

式中,γ是正則化參數,i表示第i個數據樣本,樣本總數為N,ei∈R是第i個樣本的擬合誤差.
引入拉格朗日乘子,將式(2)轉換為無約束優化問題并求解下列條件:

最終計算可得:

式中,K是核矩陣,Ki,j=k(xi,xj)=φ(xi)Tφ(xj),I是單位矩陣,并且=[1,1,···,1]T.y是包含輸出樣本的列向量.
求解式(4),可以得到回歸模型如下:
在核函數的選擇上,綜合考慮計算效率和預測效果,本文使用高斯徑向基函數[18]:

由式(2)~式(4)可得,LSSVM的輸入輸出模型為:

式中,w?=[α1,···,αN,b],i=1,···,N.
由式(5)可知,f(xi,w?)一階可導,因此對給定數據集中的任意一點其在很小的局部范圍里的一階泰勒展開式如下:


在LSSVM 模型中:

根據式(6)和式(7),系統真實值和一階泰勒公式估值的誤差可表示如下:

其中,ε0為擬合誤差,基于 ε0和的統計獨立性:


其中Jacobian 矩陣F有如下的一階微分形式:

通過式(11)和式(12),計算可得總方差為:




算法1.LSSVM 區間預測算法1)初始化LSSVM 模型的參數;2)通過式(4)求解LSSVM 回歸模型,得到核函數矩陣K 以及和,用式(5)計算出在樣本上的擬合值,同時通過對預測出的結果進行迭代,計算出未來一段時間的樣本輸出預計值 ;,α=0.05 t1?α/2 n?1 α b ?yin ?yout 3)給定置信度,如,查t-分布分位數表得到的值;4)通過式(9)、式(13)、式(14)、式(16)計算出最終預測區間.
基于LSSVM 模型的區間預測方法中,超參數的選取是否合理會極大影響預測精度,而電網運行過程中的負荷數據在采集終端精度不足、匯總計算誤差、電網事故異常等因素的影響下,通常含有固有噪聲,針對含有噪聲的樣本數據,往往很難在不考慮噪聲影響的情況下選取出最優參數組合.
根據式(16)可以證明,通過本文方法預測出的區間,其區間的寬度與樣本擬合誤差成正比,由于替代的是樣本噪聲方差,若以Gamma Test 估計出的樣本最小噪聲方差 v ar(r)作為樣本的噪聲方差,不僅能使模型的擬合程度最好,而且預測區間的寬度也較小.
基于上述分析,本文建立模型參數的優化目標函數為:

根據式(3),在LSSVM 回模型中,誤差ei可表示為:

假設ei均值為0 可以得出:

采用Gamma Test 來估計樣本的噪聲方差,記為var(r),則參數優化模型可表示為:

參數優化的算法步驟如算法2.

算法2.基于噪聲估計的參數優化算法1)計算在不同訓練樣本個數、嵌入維數 以及鄰近點個數 條件下使得Gamma Test 計算的噪聲方差最小的參數組合.并取、時的噪聲方差作為最小噪聲方差;n=n0m=m0 γ σ(γ0,σ0)nmP(n0,m0,P0)n=n0m=m0 2)在LSSVM 輸入輸出模型中,取初始化參數、,用網格搜索的方法確定在=1~800、=10~500 范圍下使式(20)取得最小值的點,并用其作為LSSVM 區間預測模型的最優超參數.
常用于評價預測區間的指標有預測區間覆蓋率、區間平均寬度以及考慮區間覆蓋率和區間寬度的綜合評價指標,具體描述如下:
(1)預測區間覆蓋率:PICP(Prediction Intervals Coverage Probability):

式中,

(2)平均區間寬度:NMPIW(Mean Prediction Intervals Width):

式中,R=Tmax?Tmin.
(3)考慮覆蓋率及寬度的綜合評價指標:CWC(Coverage Width-based Criterion)

式中,

其中,η是跳變點,μ是跳變幅度,本文實驗中選取η=50,μ=0.95.
PICP統計真實樣本落在預測區間內的概率,NMPIW統計預測區間上界和下界之間的平均寬度,通常在同一置信水平的條件下,預測結果的PICP越大、NMPIW越小,則認為預測效果越好[20].而PICP和NMPIW是一對相互矛盾的評價指標,因此可以使用兩種指標同時兼顧的CWC作為一種更為均衡的評價指標,CWC是一個負評價指標,其值越小越好.在本文實驗中,將使用以上3 個指標來量化預測區間的效果.同時,為驗證模型預測效率,實驗將統計區間預測耗時CT(Cost Time of interval forecasting).
取某省級電網調度負荷從2019年11月1日至2019年11月30日之間數據作為實驗樣本進行實驗(采樣頻率為5 分鐘),其負荷數據由省級電網從各地市局匯總計算生成,數據曲線如圖1所示.從圖中可以看出電網調度負荷隨時間變化呈現出一定的波動性和周期性特征,同時由于在采集、計算、匯總和上報等過程中的各種不確定性因素影響下,最終統計的負荷數據會含有大量噪聲.

圖1 某電網全網負荷曲線圖
為說明本文所提方法的有效性,實驗將本文區間預測方法(Least-squares Support Vector Interval Prediction,LSVIP)與文獻[14]所提區間預測方法(Support Vector Interval Prediction,SVIP)進行比較,實驗流程如圖2所示.
(1)參數優化
首先根據章節1.3的模型參數優化步驟對實驗樣本數據進行參數優化,通過算法2的步驟1)計算得到使噪聲方差最小的參數組合為n=600,m=72,P=14,通過算法2的步驟2)中網格參數優化方法進行搜索,可得LSSVM 模型的最優超參數為(γ,σ)best=(91.2,5.9).

圖2 實驗流程
(2)LSVIP 區間預測
選取置信度為95%,通過LSVIP 方法預測區間,其中一次區間預測結果如圖3所示.

圖3 區間預測結果
(3)比較實驗
根據圖2實驗流程,將本文LSVIP 方法與SVIP方法通過區間評價指標進行比較,結果如表1.
表1中比較實驗的統計結果表明,本文所提的LSVIP 區間預測方法在區間寬度、區間綜合評價指標和預測速度上均優于SVIP 方法.

表1 區間預測比較結果(20 次平均值)
(4)誤差分析
為更進一步說明本文預測方法的效果,取SVIP和LSVIP 預測區間的中值作為預測期望值,并計算平均絕對百分比誤差(MAPE),20 次試驗的誤差曲線如圖4所示.

圖4 誤差曲線
圖4誤差分析實驗結果表明LSVIP 方法在期望值的預測精度上也優于SVIP 方法.
負荷預測對電力系統的平衡調度和安全穩定運行具有重大意義,在未來電網智能化發展的趨勢和背景下,其重要性愈加凸顯.本文針對此問題,提出了一種基于LSSVM的超短期負荷區間預測方法,該方法具有LSSVM 模型計算速快速的特點,同時使用基于Gamma Test 估計出的最小有效噪聲作為優化目標來計算模型參數,在大大減少預測耗時的同時提高了預測區間的準確度.
通過電網用戶負荷數據的仿真實驗結果表明,本文提出的區間預測方法在預測區間的準確度和時效性上都能滿足實際工程應用的要求,將其應用于負荷預測系統可極大提升系統精度和靈敏度,可為電力調度工作者管理和分配發用電計劃提供更為合理的依據和參考,從而保障電網安全高效運行.