黃 健,季克勤,陳梓翰,鄭 慶
(國網浙江電力有限公司 金華供電公司,浙江 金華 321000)
在當前高風電滲透率電網大背景下,精確的風電功率預測結果有助于改善電網內“源網荷”間的互動效率,對未來電網的建設發展以及提高電網內綜合能源利用率具有重要意義[1]。
現有風電功率預測技術分為物理預測法、統計預測法、學習預測法以及組合預測法等。物理預測法通過采集風電場所在位置的物理信息和氣象數據,建立風電轉換模型進行預測,因無需歷史運行數據常被用于新建風電場的功率預測。例如文獻[2]在新建風電場內建立了計及風電場局地效應與風電機組尾流影響的風電功率物理預測模型。統計預測法通過大量歷史風電功率數據在得出風電場運行規律的基礎上,建立風電功率預測模型。例如文獻[3]基于大量數據的統計分析研究,建立了基于自回歸滑動平均模型風電功率預測系統;文獻[4]利用風電場歷史運行數據,建立了基于馬爾科夫鏈的風電功率預測模型。學習預測法是基于人工智能技術興起的一種預測技術,通過準確地刻畫風速等數據與風電功率間的非線性關系得到最終的預測結果。例如文獻[5],采用深度學習算法深入挖掘了風電場歷史運行數據間的非線性關系,建立了基于深度學習算法的風電功率預測模型。組合預測法則是利用以上不同算法的優勢建立起的一種風電功率組合預測模型。例如文獻[6-7],通過將不同單一預測法進行優化組合,使預測模型能夠發揮不同預測方法在預測過程中的優勢,從而提高風電功率預測精度。
風電場輸出功率受風電場所在位置的氣候環境特征影響較大。不同的氣候環境特征,對風電場的出力情況具有不同程度的影響。傳統風電功率預測模型在進行風電功率預測時,并未考慮氣候環境的變化過程對風電場出力的影響,預測精度仍存在提升空間。基于此,本文建立了一種基于天氣影響的風電功率分類預測模型。根據各層高風速與風電場輸出功率間的相關性檢驗結果以及風電場輸出功率理論表達式確定了預測模型輸入量,并由風電功率和各影響因素序列的自相關檢驗結果確定了影響風電場輸出功率的時間尺度,以上2點為預測模型輸入數據內容的確定提供了理論依據。確定預測模型輸入數據內容后,在分類預測建模時,為簡化天氣過程聚類時的計算、實現分類結果的可視化,采用了深度學習自編碼技術對輸入數據進行降維處理,并利用改進的K-means聚類法進行了天氣過程的聚類劃分,根據聚類結果利用廣義回歸神經網絡(Generalized Regression Neural Network,GRNN)算法對風電場輸出功率進行分類預測。最后通過實際算例驗證了本文方法能夠獲得更加有效的風電功率預測結果。
分析風電機組的運行機理,有助于更好地挖掘影響風電場輸出功率的各類影響因素。風能是由大氣環境中的空氣流動所產生的,風力發電則是利用風電機組的葉片對流動的風能進行捕捉,進而實現能量的轉化,生產出日常生產生活所需的電能[8]。實際運行過程中,某一時刻的風能通常滿足式(1)所示函數表達形式。
E=0.5ρAv3
(1)
式中,E為對應時刻的風能;ρ為空氣密度;A為風機葉片的捕捉面積;v為風速。
根據貝茲理論[9]的研究可知,在式(1)所示的風能條件下,風機能夠獲得式(2)所示的最大輸出功率。
Pmax=0.296ρAv3
(2)
將式(1)和式(2)相結合,可以求得式(3)所示的風機極限轉化效率Cp。
(3)
以上均為理想條件下的風電機組電能生產過程,實際中受設備狀態等多重因素的影響,風機轉化效率必然小于0.593。為將理論模型與實際過程相結合,提出了式(4)所示的風機實際輸出功率函數表達式。
P=0.5CpρAv3
(4)
從以上風機的運行機理的分析過程中可以看出,風電場的輸出功率會受到風電機組的運行效率、風速、風向、空氣密度以及風機設備型號等多重因素的影響。
同時,空氣密度以及風電機組的運行效率等因素還會受到氣壓、相對濕度以及環境溫度等多重因素的影響,風電機組的各個影響因素間仍會存在有一定內部關聯關系。所以,在進行風電功率預測時,可以選取風電場所在位置的風速、風向、溫度、氣壓、相對濕度天氣預報數據,作為預測模型的輸入數據。
受場站內設備型號的影響,不同層高的風速與風電場輸出功率間存在一定的差異性,風速的選取過程中按照式(5)計算風電場內各層高風速與風電場輸出功率的皮爾遜相關系數進行選取,風向可以選取與風速相同層高的數據。
(5)

場站內各層高風速與風電場輸出功率的皮爾遜相關系數計算結果見表1。
根據表1,最終選取70 m層高風速作為最終的風速研究對象。將對應的70 m層高風向數據作為風向研究對象,同時為避免風向數據過0時的躍變對模型預測精度的影響,將風向數據轉化為了連續變化的正余弦值。除以上兩參量的選取外,由于其余各參量與風電場輸出功率間的相關系數較低,且這些參量的選取是通過風機運行機理的分析過程所確定的所以不在進行相關系數的計算。

表1 風速與風電場輸出功率皮爾遜相關系數計算結果
無論是風力發電系統還是天氣的變化過程,兩種均具有一定的慣性特征,也即當前的狀態量會受前一時刻甚至一定時段內的狀態量變化影響較大。基于以上原因,在進行風電功率預測時不能僅進行影響因素的選取,還需要分析各影響因素對風電場輸出功率作用的時間尺度。在進行時間尺度的選取時,本文首先利用式(6)所示的函數表達式計算延遲步長條件下的自相關系數。
(6)
根據式(6),計算得到圖1所示的各影響因素及風電功率序列的自相關系數計算結果。

圖1 自相關系數檢驗結果
此次樣本集中數據的采樣間隔為每15 min/次,1 d中對各影響因素的采樣量為96次。根據樣本數據的采樣特征繪制了圖1所示的延遲步長在0~96內各影響因素以及風電功率序列的自相關檢驗結果,以此得到1 d內各影響因素內部所具有的關聯特征。從圖1的變化過程可以看出,溫度和氣壓的自相關檢驗結果始終在大于0.9的高度自相關條件下,原因在于這2個參量受季節變化的影響較大,在1 d內差異性較小,可以忽略這2個因素對風電功率時間尺度的影響;濕度的自相關檢驗結果在1 d內呈先下降后上升的變化趨勢,由此可知濕度的變化特征在1 d內具有一定的規律性;除以上影響因素,其余的70 m層高風速、風向正余弦值以及風電功率序列的自相關檢驗結果則呈現出迅速下降的變化趨勢。
為了提高風電功率預測模型的預測精度,簡化預測模型建模時輸入數據的復雜性,本文以自相關系數0.8作為截斷選取了待預測點前16個觀測點的數據(4 h內的數據)作為輸入數據進行風電功率的預測。
根據上文風電功率主要影響因素以及時間尺度的選取結果,將風電功率預測過程所需的數據集進行整合得到式(7)所示第i個時間點所對應的風電功率預測模型輸入數據內容。
(7)
式中,Ti-15、Hi-15、Pi-15分別為時間點i之前4 h處的溫度、濕度、氣壓數據,三者均為一個點數據;V、usin、ucos分別為時間點i之前4 h內的風速、風向正余弦值,三者均為集合數據。
根據式(7)可以看出,對應于時間點i處的風電預測模型輸入數據集為一個1×51維的數據結構形式。
2.2.1 自編碼網絡技術
根據數據構建方式的介紹,為了找到一個天氣過程對風電場輸出功率的影響,構建了一個1×51維的樣本數據。高維樣本數據既不能在便于觀察分析的可視化二維空間能進行展示,也會因過高的樣本維度增加建模過程的計算量,進而影響到分析過程和預測模型的準確性。為了排除以上問題對預測過程的影響,本文采用自編碼技術對所構建的樣本數據進行了降維處理。
自編碼網絡技術(AutoEncoder,AE)通過輸入等于輸出的方式構建了一種典型的無監督神經網絡算法模型[10]。自編碼網絡的結構如圖2所示。

圖2 自編碼網絡結構
假設輸入數據為x,輸出數據為x′,x、x′∈Rn×1,n為輸入輸出數據的維數,自編碼網絡的編碼過程可以表示為式(8)所示的函數表達形式。
y=f(x)=s(ωx+b)
(8)
式中,s(·)為激活函數,為進一步簡化計算過程,選取具有一定稀疏能力的ReLU函數;ω和b為自編碼網絡中隱含層的權值和閾值,其結構與輸入數據相同;y為隱含層輸出,y∈Rr×1。
輸入數據在經過編碼計算后,還需要經過自編碼網絡的解碼計算,其函數計算過程如式(9)所示。
x′=g(y)=s(ω′x+b′)
(9)
式中,ω′∈Rn×r;b′∈Rr×1;r為隱含層節點數。
經過以上計算過程得到,自編碼網絡的網絡參數調整過程同傳統神經網絡相似[11]。經過自編碼網絡的降維處理后,最終得到了圖3所示的處理結果。
2.2.2 改進K-means聚類算法
具有高維特征的天氣變化過程在圖3所示的二維平面內得到了展示。為了能夠進一步提高風電功率預測模型的預測精度,本文在自編碼網絡降維處理的基礎上,采用K-means聚類算法對不同的天氣變化過程進行聚類劃分。K-means算法的聚類過程如下:①在圖3所示的樣本數據中選定K個樣本點作為樣本數據的初始聚類中心;②計算所有樣本點到①中所選定的初始聚類中心的距離,并將樣本點劃分到與其最近的初始樣本點所屬的類別中;③根據②中進行的聚類結果,重新計算每一類樣本的質心選出新的樣本聚類中心;④重新計算所有樣本同新樣本聚類中心的距離,并重新計算新聚類中心與原始聚類中心之間的距離,如果兩者距離小于一定的閾值則認為達到了預期聚類效果,終止聚類過程,否則重復進行②—④步,直到滿足最終的閾值設置結果。

圖3 自編碼網絡降維處理樣本
在K-means聚類過程中,選取了式(10)所示的2個樣本在二維空間中的歐氏距離作為樣本點間距離的計算依據。
(10)
式中,x1和y1分別為樣本1在第一維度和第二維度的值;x2和y2分別為樣本2在第一維度和第二維度的值;d為最終計算得到的2個樣本間的歐氏距離。樣本質心的計算為此類樣本中所有樣本點各個維度數值的平均值。
由于K-means聚類算法在進行聚類時K值為隨機設置的,不同的K值設置結果會對聚類結果產生很大的影響[12]。為了能夠得到最佳的聚類結果本文將不同K值設置條件下,聚類結果的類內平均距離與類間平均距離的比值作為最終的評價指標對比了不同K值設置結果的聚類效果。類內平均距離代表聚類后同一類樣本的聚集程度,類間平均距離代表聚類后不同類樣本間的離散程度,兩者的比值越小則證明獲得了更好的聚類效果。不同K值設置條件下聚類效果評價指標的變化情況如圖4所示。
從圖4的評價指標變化過程可以看出,當設置聚類數為8時能夠得到最佳的聚類效果。根據以上結果,最終得到圖5所示的樣本聚類結果,每一類樣本的質心用三角形進行了標注。

圖4 聚類效果評價指標

圖5 聚類結果
GRNN網絡是基于非線性回歸分析理論所形成的一種徑向基神經網絡,具有很強的非線性映射能力和穩定的柔性容錯網絡結構[13]。GRNN網絡包含有4層網絡結構,分別是輸入層、模式層、求和層以及輸出層[14]。
(1)輸入層。輸入層節點數與待學習樣本中輸入數據的維數相同,輸入層神經元間無連接結構,直接將輸入數據以線性傳遞的方式傳遞至下一層網絡中[15]。
(2)模式層。模式層的網絡節點數等于學習樣本數,模式層的網絡節點對應于不同的樣本數據[16],模式層的網絡傳遞函數如式(11)所示。
(11)
其中,i=1,2,…,N。
(3)求和層。在求和層中對所有模式層中的神經元進行算術求和以及加權求和[17],2種求和模式的函數表達形式如式(12)和式(13)所示。
(12)
(13)
式中,k為輸出向量維數;Yi為求和層節點i的權值矩陣;yij為求和層節點i在j維的權值。

(14)
根據式(14)可知,GRNN網絡的輸出為式(15)所示。
(15)

(16)
式中,xi和Oi為隨機變量的輸入和輸出;p為輸入量的維數。
根據以上GRNN網絡的介紹,按以下步驟進行風電功率預測。
(1)將降維處理后在圖5中展示的每一類天氣過程樣本數據作為輸入數據,對應的風電功率值作為輸出數據,進行不同天氣類型條件下GRNN網絡模型的訓練。
(2)聚類劃分處理后,每一類樣本數據的數據量相比于未分類時總的樣本數據量均減少了很多。為使預測模型得到更好的訓練效果,并獲得適用于每類樣本數據的平滑因子,采用交叉驗證的方式訓練適用于每一類樣本數據的GRNN模型。
(3)按照式(7)所示的方式對待預測日的樣本數據進行重構,并將重構后的數據采用自編碼網絡技術進行降維處理。
(4)計算降維處理后的待預測日數據與每一類樣本數據間的歐氏距離,將待預測日樣本數據劃入與其距離最近的一類中,最后采用對應類別內訓練好的GRNN模型進行風電功率預測。
根據以上預測流程,最終得到圖6所示的GRNN風電功率預測結果。

圖6 GRNN模型風電功率預測結果
為進一步驗證本文模型預測結果的有效性,選取相同的輸入輸出數據建立了BP神經網絡風電功率預測模型,預測結果如圖7所示。

圖7 BP神經網絡風電功率預測結果
本文采用均方根誤差、合格率以及累計電量損失作為預測結果的評價指標,通過以上指標的對比計算,進一步證明了本文模型預測結果的有效性。
(1)均方根誤差。均方根誤差反映的是預測結果總體偏離真實值的程度[19],其對應的計算方法如式(17)所示。
(17)

(2)合格率。合格率反映的是預測結果能夠應用于電網調度運行的數量[20],其對應的計算方法如式(18)所示。
(18)
其中,Bi為1時表示該點的預測結果合格,反之取0;T為合格閾值,一般取0.2。
(3)累計電量損失。電量損失是風電場實際運行過程中的一個重要考核指標。為衡量不同模型預測結果的有效性本文引入了累計電量損失這一評價指標,累計電量損失是整體預測結果偏離真實值的累計,通過計算該值得到不同預測模型最終的損失電量,其對應的計算方法如式(19)所示。
(19)
綜上所述,最終得到評價指標見表2。

表2 評價指標
根據以上風電功率預測模型的預測結果可以看出,本文采用GRNN網絡所建立的基于天氣過程影響的風電功率預測模型在均方根誤差上相比于傳統BP神經網絡所創建的風電功率預測模型降低了4.67%,預測結果的合格率方面提高了6.25%,共計減少了107.22 MW累計電量損失。由此可見,本文模型在進行風電功率預測時具有一定的有效性。