【摘要】電力負荷預測的準確性對電力系統安全運行和經濟建設有著越來越顯著的作用。本文提出一種基于支持向量機的電力系統短期負荷預測方法,將 SVM 引入短期負荷預測,通過不斷輸入新的負荷數據來更新回歸函數,以獲得更快的計算速度和較好的預測精度,以佛山地區的負荷數據,結果證明了該方法預測速度快,并且能提高電力負荷的預測精度。
【關鍵詞】電力系統;無功優化;潮流計算;簡化梯度法
1.引言
電力系統負荷預測是一項重要的基礎性工作,是電力系統規劃的核心問題之一,是制定發電計劃和輸電方案的主要依據。長期以來,在這一領域出現了多種負荷預測方法,主要可分為以時間序列為主的傳統方法和以神經網絡為主的機器學習方法。傳統方法具有運算簡單,運行速度快等優點,但是由于模型簡單,在電力發展的過程中難以模擬日益復雜的負荷;而機器學習方法有著強大的統計理論依據,在大規模信息處理和學習能力取得了較大進展,但其模型較為復雜,網絡結構難以確定,收斂速度較慢,得到的最終解過于依賴初值。20世紀90年代中期,Vapnik 等人在扎實的統計理論基礎上提出了一種基于結構風險最小化原則(Structural Risk Minimization, SRM)的新型機器學習算法——支持向量機(Support Vector Machines,簡稱SVM)方法。它的核心問題是尋找一種歸納原則以實現最小化風險泛函,從而得到最佳的推廣。支持向量機方法解決了兩個難題:(1)在分析過程中應用核函數的展開定理, 所以不需要核函數的完整表達式;(2)在高維特征空間中用線性回歸的方法來進行預測,幾乎不增加計算的復雜性,這也就避免了很多人擔心升維過程可能出現的維數災。它避免了人工神經網絡等方法的網絡結構難于確定、過學習和欠學習以及局部極小等問題, 被認為是目前針對小樣本的分類、回歸等問題的最佳理論,為解決非線性問題提供了一個新思路。SVM方法是目前統計學中較為年輕的內容,還處于發展當中。
在對一些數據進行統計分析過程中,降維(即把樣本空間向低維空間做投影)是首選,因為可以降低計算上的困難。而升維一般只會只會增加計算的復雜性, 甚至會引起維數災。但是作為分類、回歸等問題來說, 很可能在低維樣本空間無法線性處理的樣本集, 在高維特征空間卻可以通過一個線性超平面實現線性劃分(或回歸), 而與特征空間的線性劃分(或回歸)相對應的卻是樣本空間的非線性分類(或回歸)。自然發生的兩個問題是如何求得非線性映射和解決算法的復雜性。
2.支持向量機回歸原理
給定訓練集:
(1)
其中,為N維向量, ;根據訓練樣本集在Rn空間上尋求一個實值函數g(x),以便用y=g(x)來推斷任一輸入x所對應的輸出值y。
顯然,空間Rn上的線性函數對應于空間Rn×R上的一個超平面。所以從幾何上看,線性回歸就是在給定訓練集(1)的條件下尋找一個n+1維空間Rn+1上的超平面。給定>0,若超平面滿足,即,該超平面的-帶包含了訓練集T中的所欲訓練點,則稱該超平面為訓練集T的硬-帶超平面。
當充分大時,硬-帶超平面總是存在的。
2.1 線性可分問題情況
存在最優值,使當時,硬-帶超平面不存在;時,訓練集T的所有訓練點都在硬-帶超平面內。這時的硬-帶超平面可以看作完全正確劃分訓練集:
(2)
的超平面。其一般形式為,即超平面的法向量的形式應為,其中是與x對應的n維向量,是與y對應的實數。由此可得凸二次規劃問題:
(3)
求出其解后,便得到分劃超平面:
(4)
由此可得出線性回歸函數:
(5)
其中:
,
2.2 線性不可分的問題情況
通過引入一個懲罰變量和松弛變量來軟化約束條件,則原公式(3)可以等價轉化為:
(6)
2.3 核函數
在低維空間線性不可分的模式通過非線性映射到高維特征空間則可能實現線性可空間分。但是,如果直接采用這種技術在高維空間進行分類或回歸,則存在確定非線性映射函數的形式和參數、特征空間維數等問題,而最大的障礙則是在高維特征空間運算時存在的“維數災難”。核函數是支持向量機的精髓。采用核函數技術可以有效地解決這樣問題。
下面給出核函數的定義:
如果存在著從Rn到Hilbert空間H的變換
(7)
使得(其中(·)表示空間H中的內積),則定義在Rn×Rn上的函數K(x,x')是Rn×Rn的核函數。
下面提出幾種常用的核函數:
1)多項式核函數
設d為正整數,則d階齊次多項式函數K(x,x')=(x,x')d和d階非齊次多項式函數K(x,x')=((x,x')+1)d都是核函數。
2)Gauss徑向基核函數
以為參數的Gauss徑向基函數:
是核函數。
以上兩個基本核函數都由最基本的核函數K(x,x')=(x,x'),通過滿足K(x,x')=K1(x,x')K2(x,x')、K(x,x')=K1(x,x')=K2(x,x')兩個保持核函數運算的條件構造出來。
3)Sigmoid核函數
采用Sigmoid函數作為核函數時,支持向量機實現的就是一種多層感知器神經網絡,應用SVM 方法,隱含層節點數目(它確定神經網絡的結構)、隱含層節點對輸入節點的權值都是在設計(訓練)的過程中自動確定的[11]。支持向量機的理論基礎決定了它最終求得的是全局最優值,而不是局部最小值,也保證了它對于未知樣本的良好泛化能力而不會出現過學習現象。
3.基于SVM的短期負荷預測
用支持向量機的方法來進行功率預測的步驟如圖1所示:
圖1 SVM流程圖
1)對歷史數據進行歸一化處理(scaling),及在原始數據中找出最大值,再用所有數據去除,即可將原始數據均變為小于1的數值,方便在matlab軟件里面運行。
根據以往經驗可知,一般來說,核函數選擇高斯函數效果要好于其他兩個。并選擇參數C(一般取2的次方)和g。
2)輸入訓練數據,根據所編的程序運行,建立預測模型。
3)將訓練數據的預測結果與實際歷史數據比較,如果誤差結果符合預想,即可以進行預測。如果偏差較大,則返回步驟2重新修改C和g,再次預測。
4.算例分析
本文利用廣東省佛山市2011年10月29日至2011年11月9日的歷史負荷數據作為訓練數據,對2011年11月10日的全天96個點進行預測。96個點的預測數據如表1所示。
圖2
從以上圖表可以看出,用SVM進行負荷預測的平均相對誤差為3.11%,最大誤差為7.69%,在負荷的非高峰時期,可以看出,預測的結果與實際幾乎一致,但在負荷的峰處有一定的偏離。
與傳統的時間序列法、神經網絡進行負荷預測進行結果對比,在同樣的樣本下,隨機選取一天進行負荷預測,其預測結果如表2所示:
表2 預測結果
預測方法 平均相對誤差 最大相對誤差
時間序列法 6.07% 10.41%
神經網絡 5.89% 9.34%
支持向量機 4.43% 8.12%
圖3 時間序列法
圖4 神經網絡法
圖5 支持向量機法
從圖表可以看出,用時間序列法進行負荷預測時,預測負荷數據與實際負荷數據的整個趨勢基本相同,其主要差距在于其峰值,實際負荷的峰值更高一些。
造成這一現象的主要原因是時間序列法的主要思想是根據歷史負荷數據的變化趨勢及特點來預測未來負荷的趨勢和負荷值,歷史負荷包含的信息通過時間序列法所建立的模型存儲起來,并通過預測模型將這些信息表現在對將來負荷的預測上。
因此,時間序列法對于負荷中的基荷預測較為準確,而對于在峰荷時出現的變動則往往不能表現的很準確。上圖就表現出了時間序列法對于大變動的負荷預測不準確的結果,并造成了平均誤差較大的結果。
而用神經網絡進行負荷時,預測數據和實際數據在兩個負荷高峰有著比較好的預測效果。在曲線兩端,算法的預測效果不是非常明顯。
最后,用支持向量機進行負荷預測時,預測負荷數據能反映實際負荷的總體趨勢,但是其主要差距在于時間,預測的結果總比實際的要滯后。
造成這一現象的主要原因是由于支持向量機是根據歷史負荷數據的變化趨勢及特點來預測未來負荷的趨勢和負荷值,歷史負荷包含的信息通過所建立的模型存儲起來,并通過預測模型將這些信息表現在對將來負荷的預測上,選擇更為合適的訓練樣本將會使得負荷預測更為準確。盡管如此,從預測結果的統計上看,用支持向量機進行負荷預測是明顯優于其他兩種方法。
5.結論與展望
本文對短期負荷預測進行了一些研究,特別針對支持向量機負荷預測方法的發展歷史以及算法原理進行了深入的探討。并基于支持向量機編制仿真程序,對佛山市的負荷進行預測,將預測結果與真實負荷數據作對比和誤差分析。同時,與時間序列法、神經網絡法進行負荷預測的結果進行對比,從結果上看,支持向量機負荷預測方法具有較高的準確性。
由于支持向量機的預測精度很大一部分是依賴于對樣本的選取,目前采用的天氣聚類方法、分行業聚類方法對樣本進行預處理各有其優劣勢,如何綜合考慮,并采用有效的數據處理技術對樣本進行預處理是下一步的研究工作。
參考文獻
[1]李艷紅,雷金輝.電力負荷時間序列預測的應用與研究[J].科學技術與工程,2011,11(4).860-864
[2]王日見,張少華.一種應用時間序列技術的短期電力負荷預測模型[J].上海大學學報(自然科學版),2002,8(2):133-136
[3]李晗書.時間序列分析在電力負荷預測中的應用研究[D].秦皇島:燕山大學,2009.
[4]張穎,高中文.基于時間序列和神經網絡的電力系統負荷預測[J].哈爾濱理工大學學報,2003,8(1):30-36.
[5]鄒森.時間序列自適應短期負荷預測[J].山東工業大學學報,1988,18(2):43-49.
[6]王秋梅.時間序列法負荷預測的原理和應用[J].華東電力,1993(4):37-39.
[7]莫玲.基于時間序列和人工神經網絡的電力系統短期負荷預測[D].南昌:南昌大學,2006.
[8]Ren Boqiang,Jiang Chuanwen.A review on the economic dispatch and risk management considering wind power in the power market[J].Renewable and Sustainable Energy Reviews.2009(13):2069-2074.
[9]關薇.時間序列在電力系統負荷預測中的應用[D].北京:北方工業大學,2008
[10]謝忠玉.電力短期負荷時間序列混沌特性分析及預測研究[D].哈爾濱:哈爾濱工業大學,2010.
[11]劉霖雯,劉超,江成順.EMD新算法及其應用[J].系統仿真學報,2007,19(2):446-447.
[12]楊云飛,鮑玉昆,胡忠義,張瑞.基于EMD和SVMs的原油價格預測方法[J].管理學報,2010,7(12).
[13]祝志慧,孫云蓮,季宇.基于EMD和SVM的短期負荷預測[J].2007.33(5):118-121.
[14]段益群,劉國彥.基于EMD和SVM的虹膜識別方法[J].2010,46(30):188-194.
[15]孫志剛,翟瑋星,李偉倫,衛志農.基于EMD和相關向量機的短期負荷預測[J].電力系統及其自動化學報,2011.23(1):92-97.
作者簡介:熊焰雄(1963—),男,碩士,廣東電力投資有限公司工程師,從事變電繼電保護、運行檢修,電力工程及規劃等工作。