馮惠麗
(中國大唐集團科學技術研究總院有限公司,北京 100000)
隨著化石能源的枯竭,可再生能源的開發已經引起了全世界的廣泛關注。由于風能無污染、分布廣等優點,風力發電技術近年來發展迅速。然而,風能的間歇性和波動性將極大地影響電力系統的安全性和穩定性。因此,準確可靠的風電功率預測對于促進合理的電力調度和安排停機維護以保證電力系統的穩定運行至關重要[1-2]。
一般來說,根據預測范圍,風電功率預測可以分為4 種類型:超短期、短期、中期、長期[3]。超短期風電功率預測旨在保證電網實時穩定調度和高質量供電。短期預測的目的是制定發電計劃,安排區域調度,調整檢修計劃。中長期預測主要服務于對預測精度要求不高的風電機組和輸電線路的維護計劃。為了滿足風電功率預測的不同需求,研究開發了多種預測模型。一般來說,這些預測方法可以分為2 類:物理方法、統計方法。前一類方法主要依靠數值天氣預報(NWP)信息,這通常適用于中長期風電功率預測[4]。相反,統計方法試圖基于歷史時間序列數據開發經驗模型,適用于超短期及短期預測的數據驅動模型。其中每種風電功率預測類型又分為點預測和概率預測,點預測常見統計模型主要基于自回歸綜合移動平均法(ARⅠMA)[5]、人工神經網絡(ANN)[6]和卡爾曼濾波器[7]等。但點預測方法側重于未來某個時間點的預報,而不考慮預測不確定性的估計。而概率預測模型還可以提供預測的置信區間,適用性越來越強[8]。
本文基于貝葉斯神經網絡,結合LSTM 提取時序數據特征的優勢,構建了貝葉斯LSTM 網絡,通過多種仿真實驗可知,本文所提方法具有較好的概率預測效果。

對于依賴于新輸入樣本x及權重W有輸出y(x;W)的神經網絡模型來進行回歸預測時,其參數積分如下:

式(2)中:P(W|D)為權重的后驗分布。
設P(W)是在取得訓練數據前對神經網絡權重W的先驗分布,那么定義如下正則化器:

則基于貝葉斯規則并結合式(2)(3)可得:

式(4)中:const 為常數。
另貝葉斯神經網絡回歸預測模型的總誤差函數為U(W)=E(W)+R(W),則可依式(4)得:

式(5)中:Z為歸一化常參數。
將式(5)與式(2)合并可得:

則神經網絡的預測變為對式(6)的計算,可式(6)沒法直接求得其解析解,需要借助諸如馬爾科夫鏈蒙特卡洛(MCMC)等數值積分近似法來解。
假設馬爾可夫鏈具有遍歷性,那么通過在此鏈上的大量采樣所趨于的穩定分布便能夠表征式(5)的后驗概率分布。用結果馬爾可夫鏈上的樣本序列{Wt},則針對式(6)積分的近似計算式如下:

式(7)中:n0為為保證收斂性而舍棄的一些初始馬爾可夫鏈;ns為平衡后驗分布的權重向量樣本數。
LSTM 是目前機器學習領域中廣泛使用的深度學習方法,由 HOCHREⅠTER 等[9]在 1997 年提出。LSTM是專門用于處理時間序列數據的深度學習模型,其在網絡模型中加入門控制器,可以解決RNN 中的長期依賴問題(梯度爆炸或消失),結構如圖1 所示。

圖1 LSTM 結構圖
LSTM 模型在原有的短期記憶單元ht的基礎上,增加一個記憶單元ct來保持長期記憶,同時增加3 個門控機制來控制整個學習過程中的信息流。LSTM 單元在每個時間步長t的狀態被定義為一組5 個向量Rd:輸入門it、遺忘門ft、輸出門ot、隱藏狀態ht、存儲單元ct。d是LSTM 單位的數量。LSTM 傳遞函數為:

式(8)中:σ為sigmoid 函數;W和b為權重和偏置參數;xt為當前輸入。
遺忘門控制從存儲單元刪除不需要的信息,而輸入門控制向存儲單元添加新信息,輸出門控制內部存儲狀態的暴露。通過3 個門,存儲單元ct可以選擇性地更新、刪除和遺忘內部信息,從而更好地理解序列中的長期依賴性,提取時序數據中隱藏特征。
本文利用上述LSTM 網絡處理風電功率歷史運行數據,提取時序數據關聯特征,隨后將學習的趨勢特征送入貝葉斯神經網絡,構建了貝葉斯LSTM 預測模型。
風電功率與多種因素相關,包括歷史風電功率、各氣象因素,如風速、風向、溫度以及氣壓等。但各因素對風電功率預測的影響程度不一樣,如果把所有因素均送入深度學習網絡,一方面造成模型結構復雜、參數眾多,效率也會較低,同時與風電功率相關性較低的因素的加入對預測模型來說是一種噪聲干擾,會帶來負面影響,從而降低模型的預測精度。因此,需要對風電數據集進行相關性分析,剔除價值小的因素,同時也可降低數據維度。
本文采用Pearson 相關系數法計算風電歷史數據集中不同因素與當前時刻風電功率的相關程度,其中二維變量的Pearson 相關系數計算公式如式(9)所示:

通過Pearson 相關計算分析,比較前一時刻的各個因素與下一個時刻風電功率的相關性大小,選取合適的輸入變量。相關性分析結果如表1 所示。

表1 各因素與光伏功率的Person 相關系數
從表1 可知,各氣象因素與風電功率的Person 相關系數由大到小分別是風速、風向、溫度和氣壓,也即風速和風向與風電功率相關性最高,均大于0.5。
為了最大程度平衡訓練精度和訓練效率的關系,本文最終將Person 相關系數較高的前兩種氣象因素,風速和風向作為風電功率貝葉斯神經網絡預測模型最終的輸入變量,同時,如前文所述,通過LSTM 對風電歷史運行數據進行特征構建后亦作為輸入喂給貝葉斯神經網絡。
本文采用了2 種常用的概率評分方法。一個是彈球(pinball)失分,可以綜合表示可靠性和銳度,另一個是Winkler 評分,可以表示預測區間的銳度和無條件覆蓋度。
pinball 失分是對任何分位數q∈(0,1)的加權絕對誤差度量,可表述為:

概率預測的總體彈球損失分數可以通過累積預測范圍內所有目標分位數的彈球損失來獲得。彈球損失越低,預測效果越好。
對于(1-α)×100%置信水平,Winkler 得分定義為:

式(11)中:δ=Ui-Li為區間寬度;Li和Ui分別為預測區間的下界和上界。
如果實際功率值落入預測區間,那么Winkler 分數僅取決于預測區間寬度。否則,由于懲罰因子,分數會很高。分數越低,表示預測效果越好。
風力發電數據集取自2017 年至2019 年26 311 h的ERCOT 每小時總風力輸出[10]。數據顯示了德克薩斯州所有風力發電機的總輸出功率。總裝機風力發電量從16 246 MW 增加到22 607 MW,最大風力輸出為19 099 MW。負荷的最大風力輸出百分比為54.6%,出力百分比變化最大為280.6%。在26 311 h 的數據中,70%、10%和20%的部分分別用于訓練、驗證和測試集。
為了測試本文所述網絡的實際可行性和優越性,本文分別在80%和90%兩種置信水平下進行了光伏功率概率預測,并在80%置信水平下,與正態分布法和持續區間預測法進行了對比驗證。
80%置信水平下預測區間如圖2 所示,90%置信水平下預測區間如圖3 所示。從圖2 和圖3 可知,基于貝葉斯LSTM 神經網絡的風電概率預測模型可及時對功率波動作出響應,給出下一預測點功率可能的波動范圍,且準確率較高。

圖2 80%置信水平風電功率概率預測

圖3 90%置信水平風電功率概率預測
不同算法風電功率預測區間對比示意圖如4所示。風電概率預測性能對比如表2 所示。
結合圖4 以及表2 可知,將本文方法與正態分布法及持續區間預測法進行對比,從表2 的pinball 指標和Winkler 指標可知,本文所提方法的預測效果更好。

圖4 不同算法風電功率預測區間對比示意圖

表2 風電概率預測性能對比
針對風電功率確定性點預測無法對風電功率波動進行預測的問題。本文基于貝葉斯神經網絡,結合LSTM 提取時序數據關聯特征的特有優勢,構建了貝葉斯LSTM 預測模型。并以皮爾森相關系數法對影響風電功率預測的復雜氣象輸入因素進行了相關性計算,剔除了與風電功率相關性低的因子,降低了輸入維度和輸入噪聲,最后以降維后的氣象因子以及LSTM 處理后的功率歷史時序數據為最終輸入,通過80%和90%兩種置信度下的預測仿真以及與正太分布法和持續區間預測法的對比驗證,可知本文能更好地對風電功率波動性進行預測。