辛 征,王 琦,劉興然
(山東建筑大學信息與電氣工程學院,山東 濟南 250101)
近年來,隨著化石能源的短缺和環境問題的日益嚴重,清潔能源發電的規模迅速擴大。風力發電以其清潔、經濟、可持續發展的優點,已成為最重要的可再生能源發電方式之一。截至2021年底,全球風能總裝機容量超過837 GW,2021 年全球風能總裝機容量為93.6 GW[1]。雖然風力發電技術越來越成熟,但由于風力發電[2]的間歇性、隨機性和不確定性,影響了風力發電以及電網的穩定性、安全性和經濟性。同時,風電發電功率的不確定性也會對電力市場的設計、風電系統的規劃與部署、電網調度、輸電能力升級等問題產生影響[3]。因此,準確有效的風電功率預測技術是不可缺少的,對于風電的安全、穩定、經濟運行具有重要意義。
目前,國內外眾多學者對風電預測方法進行了綜合研究。根據預測原理的不同,風電功率預測方法可以歸納為三大類:物理模型、機器模型和統計模型[4,5]。其中,物理模型依賴數值天氣預報(NWP)提供的天氣和風速信息,需要建立大數據模型。該方法適用于大范圍的長期預測,不適用于小范圍和短期預測。機器模型基于研究數據的時空分析進行預測,主要包括卡爾曼濾波(KF)[6]、回歸方法[7,8]、指數平滑方法[9]和時間序列分析方法[10]。雖然機器模型在簡單的時間序列預測和短期預測中表現良好,但在非線性數據處理方面存在不足。一般來說,統計模型在短期風電預測中優于物理模型。
風能作為風力發電的源動力,在空間的分布上是呈分散的,在時間的分布上是呈不穩定與不連續的,所以風能資源的時而大時而小、時而有時而無的特點決定了風速具有不穩定性與間歇性。
風機輸出的可用功率由于受風速、風向波動等各種因素的影響會進一步的減小。圖1為風速與風力發電功率的關系,風機的功率和風速的大小是正相關的。當風速愈大時,風機的功率也愈大,并且風速出現極大地時刻和風機的功率出現極大的時刻基本保持相同。

圖1 風速與風力發電功率的關系
影響風電功率的氣象信息還包括溫度、濕度等,這些因素主要通過空氣密度而導致風電功率發生變化。溫度、濕度與風力發電功率的關系如圖2、圖3 所示。空氣密度ρ是決定風電機組發電功率的重要因素,特別是在高海拔地區,空氣密度對風能得影響較為明顯。相同風速下,隨著空氣密度的增大,風電機組的發電功率也相應變大。

圖2 氣溫與風力發電功率的關系

圖3 濕度與風力發電功率的關系
風電功率轉化過程中,風速、風向、氣溫、氣壓、濕度等氣象因素都會對預測功率產生影響。單一的輸入變量往往達不到預測精度的要求,而將所有特征作為預測模型的輸入變量,將會影響模型的性能。因此,在建模時需要充分考慮影響風電功率的重要性特征。采用Spearman方法做相關性分析。計算兩個n維向量x,y 的Spearman 相關系數方法如式⑴。其中x,y 表示進行相關性分析的兩個變量。

其中,Ri和Si分別是向量x,y進行排序后觀測值i的秩次分別是向量x和y的平均秩次;N是i的總數量;di=Ri-Si表示兩個變量中i的秩次之差。Spearman 相關系數中ρs是[-1,1]中的實數。當ρs>0時,兩個變量成正相關,反之,則負相關。|ρs|越大,變量x和y的相關程度越高。
采用相關性分析的方法,計算國內某風電場2019年的風電功率以及影響因素各變量數據間相關系數,分析情況如表1 所示。由表1 可知,發電功率和風速這個變量的相關性最大,相關系數為0.9405;而與風力發電功率相關程度最低的為氣壓,為0.0898,經過分析,將獲取的實測數據中影響發電功率的主要變量為:風速、氣溫以及風向。

表1 風電功率與影響因子間相關性分析情況
卷積神經網絡(Convolutional neural networks,CNN)是一種前饋神經網絡,具有參數共享和稀疏連接兩大特點,可以有效捕捉原始數據的特征。與傳統的神經網絡相比,它引入了卷積層和池化層。對輸入數據進行壓縮,通過卷積運算提取重要特征。最大池化層的目的是通過減小特征映射的大小來獲取特征,降低計算成本。圖4是CNN的結構。

圖4 卷積神經網絡結構
卷積層與輸入特征進行卷積,通過濾波器生成特征映射。卷積運算可以表示為:

其中,f、k、u和*分別是得到的特征映射、卷積核、輸入特征和卷積算子。偏差和激活函數由b和φ表示。激活函數在多層神經網絡中發揮非線性映射作用,可在歷史風數據的時空特征與預測值之間建立復雜的函數關系。
LSTM 模型利用前向信息來預測后續信息,雙向LSTM 在LSTM 的基礎上,結合輸入序列的前向和后向信息來提高預測精度。對于某一時刻的輸出,前向LSTM 層有當時及之前的輸入序列信息,后向LSTM層有當時及之后的輸入序列信息。兩個LSTM 層的輸出向量可以通過相加、平均或鏈接的方式進行處理。水平方向同時計算每個時間步t的正向LSTM隱藏向量和反向LSTM隱藏向量垂直方向表示從輸入層到隱藏層再到輸出層的單向流動。本文采用連接兩個隱態的方法,得到Bi-LSTM 模型的最終預測結果,如式⑶~式⑸所示。

其中,LSTM(·)表示LSTM 函數分別為正向LSTM 的權重和反向LSTM 的權重,輸出層的偏置用表示。Bi-LSTM的網絡結構如圖5所示。

圖5 雙向長短期記憶網絡結構
CNN-BiLSTM預測模型
針對風電功率時間序列的隨機性、非平穩性,本文提出了一種基于CNN-BiLSTM 風電功率預測方法。
模型預測步驟如圖6所示。

圖6 CNN-BiLSTM模型結構
模型中每層的敘述如下。
⑴輸入層 對長度為n的歷史風電數據進行預處理,將其作為模型的輸入,表示為

⑵CNN 層CNN 層的作用是提取歷史輸入序列的特征。此模型的CNN層設計為二層卷積層、二層池化層與一層全連接層。卷積層均為一維卷積,池化層均為最大池化方法。全連接層把處理之后的數據輸出,該層使用Sigmoid 激活函數。CNN 層的輸出Hc=[hc1…hct-1…hct…hcj]T的表示如下:

其中,卷積層1 與2 的輸出分別是C1和C2;池化層1 與2 的輸出分別是P1和P2;W1、W2與W3均為權重;b1、b2、b3、b4與b5均為偏差;?是卷積運算。
⑶ BiLSTM 層 構建BiLSTM 層,以學習CNN 層輸出的規律。BiLSTM層的輸出ht的表示如下:
通過前文對負荷影響因素的分析結果,選擇風速、風向、溫度、濕度、氣壓數據構成輸入特征集合。使用的數據來自國內某風電場,選取2019年10月8日——2020 年10 月8 日的數據,采樣間隔是5min,即每天有288 個采樣點,共計105409 個采樣點。采用2019年10 月8 日——2020 年9 月1 日的數據作為訓練集、2020年9月2日——2020年10月8日的數據作為測試集。
本文對風力發電功率進行預測,選取均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percentage error,MAPE)作為評價指標。RMSE和MAPE的公式如下:

其中,m是樣本的個數;yi與分別是樣本i風電功率的實際值和預測值。
RMSE和MAPE這兩個評價指標可以衡量模型的預測性能。在風電功率預測中,如果RMSE 和MAPE的值越小,則代表預測值和實際風電功率值的差別越小,預測精度越高。
為了更好地驗證所提出模型的有效性,分別使用LSTM 模型、CNN-LSTM 模型、CNN-BiLSTM 模型進行短期風電功率預測,4 種模型的預測結果分別如圖7~圖9所示。
由圖7~圖9可知,在風電功率的預測中,四種模型均能大致預測風電功率的趨勢,其中LSTM 模型的性能最差。LSTM 模型處理平穩變化的風電數據的能力較弱,LSTM 模型處理急速變化的風電數據的能力較弱。CNN-LSTM 模型由于結合了CNN 和LSTM 兩個單一模型的優點,因此其預測誤差較小。

圖7 LSTM風電功率預測比較

圖8 CNN-LSTM風電功率預測比較

圖9 CNN-BiLSTM風電功率預測比較
實驗結果使用RMSE、MAPE 兩個評價指標進行評估,結果如表2 所示,本文提出的CNN-BiLSTM 預測方法在RMSE 指標上和其他方法相比較,比LSTM、CNN-LSTM 分別提升了0.9656、0.262。在MAPE 指標上和其他方法進行相比較,比LSTM、CNN-LSTM分別提升了0.2699、0.1489。因此經過實驗驗證CNNBiLSTM模型相對于其他模型有較好的預測性能。

表2 不同預測模型的預測誤差對比
為了更好的預測風電短期發電量,本文首先采用斯皮爾曼相關性分析的方法選取高度相關的指標。然后提出了一種基于卷積神經網絡和雙向長短期記憶神經網絡的混合短期風電功率預測模型,該模型考慮了風電短期預測輸入數據的明顯時空特征。最后,應用各種深度學習模型進行仿真,驗證模型的性能。實驗結果驗證CNN-BiLSTM 模型提高了風電功率的預測精度。