馬 歷 馬克雄
(1.中國長江三峽集團公司 市場營銷部,北京 100038;2.三峽大學 電氣與新能源學院,湖北 宜昌 443002)
在電力市場中,電價不僅和市場參與者的利益息息相關,也影響著社會和經濟的眾多方面,因此電價是電力市場的支點,無論對供應電力的一方還是需求電力的一方,電價都是直接關系到各市場參與者的最直接和最敏感的因素.電價作為電力市場的指針能夠自動引導資源的配置,它的導向力是直接和有力的.準確的電價預測,無論對于政府監管機構、電力企業還是公眾都具有深遠的意義[1].
電價具有一定的周期性,也存在一定的隨機性.影響電價的因素眾多,包括電力市場結構、市場成熟度、輔助服務市場、輸電約束、負荷大小以及市場總裝機容量.受這些因素的影響,電價隨時都可能發生一定的波動.在進行電力系統電價預測時,針對電價變化的這些特點,既要充分分析、掌握并利用其規律性,又要兼顧各種因素的影響.只有充分了解和掌握電價特點、制定方法及變化規律,才能建立符合實際情況的預測模型,提高預測精度[2].
目前國內外對電價預測的方法主要集中在模擬法和數學分析法.模擬法,即通過模擬電力市場實時運行狀況預測節點電價.用該類方法建模需要掌握大量的信息,如電力市場中的各機組狀態,輸電網絡運行狀態以及相鄰市場的相關信息;而且還必須計算系統潮流、經濟調度以及輸電物理阻塞等.預測的精確與否主要取決于數據是否充分和詳細.數學分析法,即數學統計方法,利用歷史電價、系統信息等建立模型來進行預測,利用統計方法進行建模所需要的信息可多可少,主要采用時間序列法、基于結構型計量學的方法以及神經網絡方法等.神經網絡方法是近年來發展比較成熟的方法,是模擬生物神經網絡進行信息處理的一種數學模型.利用外部環境的刺激,調整神經網絡的參數,是神經網絡以一種新的方式對外部環境做出反應的一個過程.
本文根據損失函數的通式,推導了基于迭代最小二乘支持向量機算法(簡稱IRWLS-SVM)的短期電價預測模型.首先針對不同的損失函數進行仿真比較,仿真表明Huber損失函數的回歸效果最好,這是由于Huber具有一定的魯棒性,能夠適應模型小的變化.然后比較了線性、徑向基、多項式3種核函數,仿真結果表明,多項式核函數的預測效果最好.最后提出了一種改進的非線性IRWLS-SVM算法,在完成預測全時段電價后,再次進行局部回歸預測,仿真結果表明改進后的算法提高了局部預測精度.
在統計學習理論上發展起來的新興機器學習算法—支持向量機(SVM),自從被Vapnik等人提出以來,在模式識別、回歸分析等研究領域中得到了廣泛的應用.它以結構風險最小化原則為理論基礎,通過核函數的方法,把線性不可分的模式輸入映射到一個高維Hilbert特征空間,然后利用線性可分的技術進行求解.它的核心算法實質上是一個凸的二次規劃問題,它能夠保證找到的極值解就是最優解,進而求出一個最優分類超平面,使問題得到解決.支持向量機與傳統的機器學習算法中普遍采用的經驗風險最小化的算法相比較,不僅結構簡單,而且各種性能特別是泛化能力明顯提高[4].
一般的SVM回歸算法希望通過對凸二次問題的求解來完成信號的非參數譜估計,但是這類解法的弊端是:這種凸二次規劃問題的運算量是隨著采樣序列的數量呈指數上升的.近年來人們針對該方法本身的特點提出了許多算法來解決對偶尋優問題.大多數算法的一個共同的思想就是循環迭代:將原問題分解成為若干子問題,按照某種迭代策略,通過反復求解子問題,最終使結果收斂到原問題的最優解.因此,凸二次規劃的運算量限制了它在實際中的應用.而本文使用的IRWLS-SVM算法可以大大減少運算時間,具有較好的實際應用價值.
假設有l個訓練數據,其中第i個數據包含變量xi和與之相對應的變量yi,且xi∈Rl,yi∈R,支持向量機定義了一種機器,用來確定x到y的映射關系.
在回歸問題中,定義映射函數y=〈ω,φ(x)〉,并要求找到最小的ω以保證曲線的平滑性,一種常用的方法是使得ω的歐氏二范數最小以及映射的誤差在允許的ε范圍之內(可以寫成下列數學模型):

滿足式(2)有時會使問題的求解變得非常困難,考慮到允許擬合誤差的情況,引入松弛因子≥0,這里引入損失函數∑L)(其中表示ξi或,以下沿用此用法),式(1)、(2)可以改寫為:

式中,C為回歸精度超過允許值的懲罰因子常數,且C>0.松弛因子的引入是在支持向量機的經驗風險和推廣性能之間求得某種均衡.對于回歸算法,松弛因子還解決了在某些點誤差大于ε的情形.

為了避免傳統的利用標準二次型優化技術解決對偶問題的弊端,可以使用迭代變權最小二乘法(IRWLS)對所述的問題進行求解[5-7].假設

將式(5)帶入式(4)得


根據KKT條件,在所求最大值所對應的點上,Lagrange常數與其對應的約束條件的乘積為零.將KKT條件代入,對式(6)求偏導獲得以下表達式:

其中Φ=[φ(xi),…,φ(xl)],解式(7)可得

準確的電價預測離不開對電價特點的準確把握和在此基礎上的成功建模.前文提到對電價的影響因素眾多,包括電力市場結構、市場成熟度、輔助服務市場、輸電約束、負荷大小及市場總裝機容量.如充分考慮這些因素,必然能得到較好的電價預測結果.然而,對同一電力市場而言,在短期內很多因素都是相對穩定或者是暫時不會改變的,如電力系統總體狀況、市場規則等,電價受這些因素影響不大,因此在建模時可以暫時忽略.此外,電力負荷的大小已經包含天氣的影響,因此,本文仿真僅考慮電力負荷為輸入變量.
本文以PJM電力市場為研究對象,電力負荷與電價數據來源于該市場公布信息.圖1為PJM電力市場2006年負荷變化圖,圖2為相應的電價變化圖.

圖1 2006年PJM電力市場電力負荷

圖2 2006年PJM電力市場實時電價
為了降低預測誤差和減少訓練時間,達到最佳的預測效果,必須選擇合適的訓練數據和測試數據.建模預測之前必須對變量先進行歸一化處理,以消除變量間不同的量綱影響,將變量映射到之間.負荷和電價分別按以下公式進行歸一化處理:



普遍使用的損失函數如圖5所示,其中圖5(a)是拉普拉斯損失函數;圖5(b)是線性ε-不敏感損失函數;圖5(c)是高斯損失函數;圖5(d)是Huber損失函數.
1)拉普拉斯損失函數


圖5 損失函數
2)不敏感損失函數

3)高斯損失函數

4)Huber損失函數

設p=2,σ=0.2,則上式可寫為

本文采用PJM 2006年全年的負荷與電價時點數據,考慮到短期電力負荷的變化趨勢較穩定,不確定影響因素較小,首先選取6~8月的數據作為模型的訓練數據,任意選擇9月某一天的數據作為模型的預測數據.其仿真結果如圖6所示.

圖6 損失函數的影響
從圖6可以看出,4種損失函數中只有Huber損失函數能夠較好地預測結果,拉普拉斯損失函數、線性ε-不敏感損失函數、高斯損失函數3種的損失函數的預測誤差較大.這是因為在回歸方法中,有必要選擇一個有代表性的損失函數,以及其它可能需要的附加控制.這需要對該問題有比較透徹的了解,并且掌握噪聲的分布.如果缺乏這些了解,那么Huber函數就是最佳選擇.
以下算例分析將采用Huber損失函數.
核函數是核技巧的基礎,而核技巧是支持向量機的重要組成部分.對非線性回歸問題,支持向量機總是首先通過某個映射將訓練點變換到某一個高維的Hilbert空間中去,然后在這個高維空間中用線性回歸機對映射后的訓練點進行回歸,并且通過核技巧把高維Hilbert空間中兩個訓練點的內積計算,用原來輸入空間中的兩個模式的簡單函數(核函數)來代替[10-11].
本文分別采用線性核函數、多項式核函數、徑向基核函數分析不同的核函數對短期電價預測的影響.為了更加充分地訓練短期電價回歸模型,本文加大訓練數據量,選取5~9月前3周的數據作為模型的訓練數據,選擇9月的某一天數據作為模型的預測數據.
從圖7可以看出,多項式核函數回歸的效果比線性核函數、徑向基核函數的回歸效果好.這是因為徑向基是有界函數,而多項式核函數沒有這個特性.在回歸過程中,無限制的訓練往往更加準確.仿真實驗說明用多項式核函數的回歸算法建模更加準確.

圖7 核函數的影響
從圖7(c)可以看出,多項式核的IRWLS-SVM算法能夠較好地預測短期電價,但是在變化較頻繁的時刻實際值與預測值之間還是存在一定誤差,因此,本文提出一種改進的IRWLS-SVM算法.具體算法如下:
1)從集合中取出一定數量的訓練數據,訓練模型權值;
2)輸入測試數據,預測全天的電價預測結果,如圖9(a)所示;
3)從圖9(a)中判斷誤差較大的時間段,即10時~16時,重新設定分析時段,采集訓練數據中10~16時段數據訓練模型,并選擇新的測試數據進行預測,如圖9(b)所示;
4)計算結束.


本文提出了一種基于IRWLS-SVM的短期電價預測模型,仿真結果表明:
1)不同的損失函數對預測模型的準確性存在一定影響,Huber損失函數比拉普拉斯損失函數、線性ε-不敏感損失函數、高斯損失函數的預測效果好,這是因為Huber損失函數具有一定的魯棒性,其最大的特點就是對于模型小的變化不敏感,而它同時使得所產生的支持向量稀疏,因此具有最佳性能.
2)多項式核函數回歸的效果比線性核函數、徑向基核函數的回歸效果好.這是因為徑向基是有界函數,而多項式核函數沒有這個特性.在回歸過程中,無限制的訓練往往更加準確.仿真實驗說明用多項式核函數的回歸算法建模更加準確.
3)改進后的IRWLS-SVM算法能夠進一步提高局部預測精度.
[1] 翁陳宇.基于神經網絡的短期電價預測[D].成都:西南交通大學碩士論文,2007.
[2] 孟凡青,解 大.基于盲數和神經網絡的電價預測模型[J].電力系統保護與控制,2009,37(16):11-15.
[3] Simon Haykin.神經網絡原理[M].葉世偉,史忠植,譯.北京:機械工業出版社,2004.
[4] 祝紅梅.支持向量機核參數選擇及其應用[D].西安:西安科技大學碩士論文,2007.
[5] Pérez-Cruz R,Navia-Vázquez A,Alarcón-Diana P L,et al.An IRWLS procedure for SVR[C].In Proc.EUSIPCO 2000,Tampere,Finland,Sept.2000.
[6] Holland W,Welch R E.Robust Regression Using Iterative Re-weighted Least Squares[J].Comm.of Stat.Theory Methods,vol.A6,no.9,pp.813.27,1977.
[7] Smola A J,Sch?lkopf B,Müller K R.General Cost Functions for Support Vector Regression[C].In Proc.9th Australian Conf.Neural Networks,Brisbane,Australia,1998:79-83.
[8] Joachims T.Learning to Classify Text Using Support Vector Machines:Methods,Theory,and Algorithms[M].Kluwer,2002.
[9] Cristianini N,Shawe-Taylor J.An introduction to Support Vector Machines and Other Kernel-based Learning Methods[M].Cambridge University Press,2000.
[10]Scholkopf B,Smola A J.Learning with Kernels-Support Vector Machines,Regularization,Optimization,and Beyond[M].The MIT Press,2002.
[11]Scholkopf B.Support Vector learning[M].R.Oldenbourg Verlag,1997.