周思明, 段金長, 李穎杰, 覃 海
(1. 貴州電力科學研究院 電力調度控制中心, 貴州 貴陽 550007; 2. 國電南瑞南京控制系統有限公司 電網調控技術分公司, 江蘇 南京 211106)
隨著我國電力體制改革的推進以及電力市場的建設和發展,對電力市場需求的預測成為了電力現貨市場的基礎性支撐技術[1-2]。電力系統短期負荷預測是支撐電力現貨交易及輔助服務交易的重要技術保障,關系著電力市場各方利益[3]。
國內外學者對電力系統負荷預測也開展了廣泛研究[4-6]。王增平等[7]采用統計分析和機器學習的方法,引入門控循環單元的深度神經網絡處理方法,進一步提升了負荷預測的精度。史佳琪等[8]將長短記憶網絡算法嵌入Stacking集成學習的負荷預測模型,基于多模型集成學習的負荷預測方法其精度要優于傳統的單模型預測方法??紫橛竦萚9]基于最小二乘支持向量機模型,結合經驗模態分析與特征分析,實現了對外部因素敏感的短期負荷預測。張宇帆等[10]采用隨機搜索的方法研究了LSTM算法對負荷特征的提取情況及學習能力。彭文等[11]分析了電價、樣本數據和負荷的相關性,利用負荷的時序特性建立了Attention-LSTM負荷預測模型。郝曉弘等[12]研究了混沌優化的最小二次支持向量機在高滲透率分布式電源接入情況下的負荷預測模型,并利用仿真計算驗證了模型的有效性。
支持向量機是一種基于統計學結構風險最小化原則的人工智能算法,和其他人工智能算法相比,其可以在有限數據集情況下取得較高的預測精度。因此,為了進一步提高負荷預測的準確度和效率,文中在線性支持向量機回歸模型的基礎上,結合負荷影響因素差異度對負荷預測結果的影響,將權重系數引入支持向量機目標函數,提出了一種改進SVM短期電力系統負荷預測模型。
假設電力系統負荷預測模型為
f(x)=wφ(x)+b
(1)
式中:φ(x)為訓練數據集;w和b分別為方程參數。由此可建立目標函數為
(2)
yi-wφ(xi)-b≤ε+ξi
(3)
(4)
式中:yi為第i時刻負荷的真實值;ε為函數的誤差要求值。求解上述目標函數時,需要將其轉換為對偶形式,即
(5)
約束條件為
(6)

(7)
本文通過引入“差異度”的概念來描述不同時刻的負荷,即由于影響因素的差別而表現出的差異化程度,并以此為基礎建立權值系數計算公式。
假設有i,j兩個時刻,各自影響因素的量化指標分別為s(i,m)、s(j,m),則定義差異度值為
(8)
式中,M為影響因素的種類,文中考慮的負荷影響因素分別為平均溫度、降雨量、濕度、氣象類型、星期類型、日期差、日分類(即正常日和節假日)等7類。
將待預測時刻j記為0,則第i時刻和預測時刻之間的差異度為
(9)
差異度越大,說明樣本和預測時刻之間的相關性越小,對預測結果的影響也越小。因此文中選擇差異度的倒數作為支持向量機的權重系數。
負荷預測過程中影響因素的量綱各不相同,因此需要進行歸一化處理。歸一化處理過程中,同一類型影響因素對負荷的影響也存在一定的差異。以溫度變化為例,在20~25 ℃之間溫度變化對負荷影響有限,而在25~35 ℃溫度變化對負荷會有明顯影響,因此需要進行差異化處理。
若直接采用所有數據進行模型訓練,則數據量較大。為了優化預測模型,建立負荷和各影響因素之間的關系,本文利用主成分分析方法對負荷數據進行降維處理,并選擇累積貢獻率大于95%的主成分得到每日負荷數據的特征因子γ,即
γ=p1r1+p2r2+…+psrs
(10)
式中:p為各主成分元素;r為貢獻率,且滿足
r1+r2+…+rs≥0.95
(11)
根據灰色關聯分析法,可以利用特征因子和影響因素之間的相關關系來代替負荷數據與影響因素之間的關系。選定特征因子為參考序列z0(k),負荷影響因素為比較序列zm(k),計算特征因子與影響因素之間的關聯系數tm,即
(12)
式中,μ為參考序列和影響因素之間的灰色關聯度,其計算方法可參考相關資料。
在此基礎上,計算得到影響因素對于日負荷的權重值為
(13)
表1為2020年9月某周不同樣本數據對應的特征因子及各影響因素的權值系數,日期為待預測日。

表1 特征因子及日負荷影響因素的權值Tab.1 Characteristic factors and weight of influencing factors of daily load
由表1數據可知,影響因素和不同日期的負荷特征因子之間的權值存在差異,將這一變化引入差異度值,則更新后的差異度值為
(14)
對負荷數據按照差異度值升序排列,選擇差異度值最小的前10組數據作為模型預測負荷的輸入量,并利用更新后的差異度值計算新的權重。
負荷影響因素采用分段線性歸一化的處理方式并不是最優解,因此可以在此基礎上進行動態調整以期達到最佳預測目標。其基本思想是對影響因素歸一化處理之后產生正向或負向變化,比較變化后的計算結果,選擇最優解。假設所有各影響因素的取值為
S=[s(1,1,1),s(1,1,2),…,s(i,m,qm)]
(15)
式中,s(i,m,qm)為第m種影響因素中第qm個特征量的取值。影響因素特征值的正向變化步長為ρ1>1,反向變化步長為0<ρ2<1。
分段線性化處理方法首先計算初始預測結果,記為fopt,對產生正向和反向變化的特征量進行取值,即
ΔS′=(0,0,…,s(i,m,qm)ρ1,…,0)
(16)
ΔS″=(0,0,…,s(i,m,qm)ρ2,…,0)
(17)
然后求取迭代后的影響因素特征量為
S′=S(k)+ΔS′
(18)
S″=S(k)+ΔS″
(19)
式中,k為迭代次數。分別對每個特征量的取值進行循環迭代,直至滿足精度要求或達到了最大迭代次數為止。
綜上所述得到改進SVM模型短期電力系統負荷預測方法的計算流程,如圖1所示。

圖1 算法基本流程圖Fig.1 Basic flow chart of algorithm
對影響因素進行動態調整之后,可以采用方式1,即利用調整后的特征值重新計算SVM模型的權值系數,更新模型參數。此外,也可以采用方式2直接利用訓練好的模型對負荷預測結果進行計算。方式2與方式1相比,提高了計算效率,但對預測效果的影響不如方式1。除此之外,各影響因素是以日為單位變化的,在對日負荷各點進行預測時,影響因素可以看作模型參數,并采用PSO算法進行動態調整,即方式3。
模型計算過程中,影響因素特征值正向變化步長取1.15,反向變化步長取0.85,算法停止計算的精度為0.1%,PSO最大尋優次數為50次,影響因素最大訓練次數為20次。算法運行效率以方式3為基準進行比較。
利用相對誤差與負荷預測準確率衡量模型的預測性能,計算表達式分別為
(20)
(21)

為了比較影響因素特征值的變化對負荷預測結果的影響,以各影響因素變化較明顯的一周為例進行負荷預測。2020年9月2日某城市的極端高溫為31 ℃,平均溫度為25 ℃;9月3日為大雨轉多云天氣;9月6日為中雨轉陣雨天氣;9月5日和9月6日為周末。表2為負荷預測結果對比。將數據進行歸一化處理后,不同算法的負荷預測準確率對比結果圖2所示。

圖2 負荷預測準確率比較Fig.2 Comparison of load forecasting accuracy

表2 負荷預測結果對比Tab.2 Comparison of load forecasting results (kW·h)
由圖2可知,采用分段線性歸一化的處理方式較為合理,其負荷預測準確率略小于優化后的。經優化后的影響因素值有利于提升模型預測的準確率。
文中采用方式2對影響因素進行動態調整,并比較了文中所提出的加權SVM模型、SVM模型、最小二乘SVM模型(LS-SVM)的日內負荷數據預測結果,如圖3所示。

圖3 日負荷預測曲線Fig.3 Daily load forecasting curves
對比不同SVM的日負荷預測結果可知,SVM模型自身具有良好的負荷預測能力,只是不同預測模型在預測精度上存在一定的差異。文中所提出的改進SVM模型得到的日負荷預測數據的平均相對誤差為1.94%,而SVM模型和LS-SVM模型得到的日負荷預測數據平均相對誤差分別為3.49%和5.04%。
統計3種模型一個月的日均相對誤差對比結果如圖4所示。

圖4 負荷預測日均相對誤差Fig.4 Average daily relative errors of load forecasting
由圖4可知,改進SVM模型一個月內負荷預測的日均相對誤差在0.32%~3.57%范圍內波動;LS-SVM模型預測數據的日均相對誤差范圍為1.22%~5.95%;SVM模型預測數據的日均相對誤差范圍為1.05%~7.03%。由此可見,改進SVM模型負荷預測的穩定性要優于其他兩種模型。
文中在標準回歸支持向量機模型的基礎上引入了權重系數,用來控制誤差項方差不同造成的影響。并將影響因素對日負荷的權重計入差異度值,建立了一種新的SVM預測模型。文中所提出的改進SVM模型得到的日負荷預測數據的平均相對誤差為1.98%,而SVM模型和LS-SVM模型得到的日負荷預測數據平均相對誤差分別為3.91%和3.22%。改進SVM模型一個月內負荷預測的日均相對誤差在0.32%~3.57%范圍內波動,SVM模型和LS-SVM模型預測數據的日均相對誤差范圍分別為1.05%~7.03%和1.22%~5.95,可見改進SVM模型負荷預測的穩定性要優于其他兩種模型。