羅默涵



摘 要:隨著全社會用電量的逐步增大以及國家雙碳戰略的逐漸落地,可再生能源的高效利用成為當前發展階段需要不斷探索的問題。由于存在無序性,風力發電難以大規模接入電網系統,若能有效預測風電場的出力并進行統一調度,將大幅提高風力發電利用率。基于此,首先闡述了支持向量機理論,然后針對其解決大樣本問題的低效性進行了優化,最后通過實驗對比了優化的支持向量機方法在風速預測中的有效性和準確性。
關鍵詞:風電場;風速預測;支持向量機
0??? 引言
風力發電作為波動性能源,大量接入電網時需要接受電網的統一調度,而對能源進行調度的前提是能掌握發電機的變化趨勢,當前的預測技術基本基于相似日數據以及天氣數據進行分析,并制訂相關調度計劃[1-2]。
難以直接對風力發電進行預測的原因在于風速變化的無序性,這直接導致了風機轉速的不穩定以及發電功率的無序變化,所以目前電網難以接受大量風力發電的并網運行[3]。因此,對風力發電進行更為準確的預測,是支持風力發電大規模并網的關鍵所在[4]。而究其根源,需要對風速進行有效預測,本文針對此問題進行了相關研究。
1??? 支持向量機基本理論
支持向量機(Support Vector Machine,SVM)是在20世紀90年代初提出的,它建立在統計學習理論的VC維概念和結構風險最小原理基礎上,可以根據有限的樣本信息實現計算量和計算能力之間的平衡性,是歸屬于統計學的新興分支[5]。其獨特的對于數據的歸類識別能力,使其能夠有效地應用到機器學習的相關領域進行預測分析。
對于群體在線性可分情況下的分類情況示意如圖1所示,由圖可知,兩類不同的樣本被分類線H分離,且存在兩條與H平行的直線H1和H2分別經過了兩組樣本最靠近分類線的樣本。針對此結果,可得出最優分類線的定義:針對兩樣本存在一條分類線能將其正確分類,而且H1和H2的距離最大。
針對以上基本理論,將分類線H的方程設為wx+b=0,并將該方程歸一化,有:
yi(w·xi+b)-1≥0????????????????? (1)
在方程(1)的樣本集(xi,yi)中有以下關系:xi∈Rd,yi={-1,+1},i=1,2,…,n。據此可知分類間隔(margin)為2/||w||。若要在計算中實現分類間隔最大化,則通過約束實現||w||2最小即可。
據此,最優分類線在數學上的定義可描述為滿足式(1)且使||w||2最小的方程表達式,而在H1和H2上進行訓練的樣本點則為對應的支持向量。
以上分析是基于二維平面概念而言的,那么在VC維空間里,則所分析的樣本理論上分布在一個超球范圍內,同樣存在一超平面能夠將超球內的樣本進行有效分類,將超平面表示為f(x,w,b)=sgn(wx+b)。若要實現有效分類,則該函數滿足以下關系:
h≤min(A2R2,N)+1?????????????????????? (2)
其中,R和N分別為超球半徑和空間的維數,且在超球中存在條件||w||≤A。與二維系統同理,當w最小時,VC維可取得最小值。
為了實現對最優分類面的求解,通常引用拉格朗日優化方法,利用該方法將此問題轉化為對偶問題,可得:
Q(α)=αi-αiαjyiyj(xi·xj)????????? (3)
式(3)中的αi對應于每個數據樣本中的拉格朗日乘子,且該因子有以下關系:
αiyi=0,αi≥0,i=1,2,…,n?? ?(4)
由于式(3)受到不等式的約束,所以能夠求解出該方程的唯一解。同時,對于系列解的結果中存在少部分αi不為零的數據樣本的合集便組成了支持向量。基于以上解的結果,可知分類曲面所對應的最優函數表達式為:
f(x)=sgn(w·x+b)=sgn
αi*yi(xi·x)+b*???????? (5)
據前文分析可知,大部分的求解結果αi均為零,所以式(5)中的有效求和只是有效支持向量的解的和。對應的分類閾值b*可通過將式(5)代入任一支持向量求得。
2??? 優化的支持向量機算法研究