王紅君,謝煜軒,趙 輝,2,岳有軍
(1.天津理工大學 天津市復雜控制理論與應用重點實驗室, 天津 300384;2.天津農學院 工程技術學院, 天津 300392)
隨著世界能源危機的加劇,風能作為可再生環保型能源日益受到世界各國的重視。然而,風能隨機波動的特點會導致各種問題,造成風電并網和調度管理存在很大困難[1]。因此,精確的風功率預測對于電網安全和發電策略制定至關重要[2]。
傳統預測風功率的方法主要是物理方法和統計方法[3]。這些方法雖有成熟研究,但對于風電這類波動性較強的數據預測效果較差,操作難度較大,在識別復雜模式方面效果并不理想。為獲得更好的預測效果,一些人工智能和深度學習模型逐漸被應用到風電預測領域[4]。如極限學習機(ELM)[5]、支持向量回歸機(SVR)[6]和長短時記憶網絡(LSTM)[7]等。由于單一模型的局限性,其在預測隨機性較強的風功率數據時不能獲得很好的效果,直接使用原始風電數據可能會導致較大的誤差,因此組合預測應用越來越廣泛。白鵬[8]將小波分解(WT)與SVR結合,將原始序列分解后再進行預測,提高了預測精度,但WT缺乏自適應。Yan等[9]提出了一種基于集合經驗模態分解(EEMD)與LSTM混合的風速預測模型。謝麗蓉等[10]利用EEMD對原始序列進行分解,預測模型采用了最小二乘支持向量回歸機(LSSVR);LSSVR是對SVR的改進,優化了計算量,但存在參數選取困難的問題;EEMD會產生模態混疊現象。Du等[11]提出了一種基于鯨魚優化算法(WOA)優化LSSVR的預測方法,利用智能算法解決預測模型參數選取困難的問題。任俞霏等[12]利用自適應白噪聲完全集合經驗模態分解(CEEMDAN)對歷史風功率序列進行分解處理,并采用灰狼優化算法(GWO)對LSSVR參數進行尋優。Hu等[13]將CEEMDAN與LSTM相結合建立超短期風電功率預測;CEEMDAN克服了EEMD的缺陷,但將含噪聲較多的分量直接舍棄,易造成信息缺失。王渝紅等[14]利用雙向長短時記憶網絡(BiLSTM)進行風功率預測,BiLSTM是LSTM的延伸,相較于LSTM能更進一步提高模型的預測精度。Vishalteja等[15]提出了一種基于改進自適應白噪聲完全集合經驗模態分解(ICEEMDAN)和BiLSTM混合模型的預測方法,相較于CEEMDAN,ICEEMDAN對信號的分解效果更為理想。
根據上述所述,大多數研究使用相同的預測方法對風電序列進行分解后的所有子序列進行預測,沒有考慮每個不同頻率子序列的獨特特性。使用傳統的優化算法自動調整模型參數時,容易陷入局部最優、后期收斂速度慢等缺陷。因此,本文中提出了一種基于改進黑猩猩優化算法和LSSVR-BiLSTM雙尺度深度學習模型的短期風功率預測方法。首先,利用ICEEMDAN在模型預處理過程中對原始風電序列進行分解,得到多個模態分量(IMF)和一個殘差(Res);其次,通過排列熵(PE)重構所有分量,并根據熵值將其分為高頻分量和低頻分量;再分別建立LSSVR和BiLSTM模型預測低頻子序列和高頻子序列,采用4種改進措施增強的改進黑猩猩優化算法(ICHOA)對LSSVR和BiLSTM模型參數進行了優化;最后,疊加各分量預測值得出最終的風功率值。通過具體算例分析,驗證本文方法的優勢。
ICEEMDAN是對CEEMDAN的進一步改進,克服了模態混疊問題,并降低了分解出來的IMF殘余噪聲,對于波動性較強的風功率序列具有良好的分解效果[16]。ICEEMDAN算法具體步驟如下:
步驟1對于初始信號x(t),向其中引入白噪聲E1(wi),表達式為
xi=x+β0E1(wi)
(1)
步驟2對原始序列進行分解,計算第1個IMF值表達式為

(2)

步驟3計算第2個IMF值表達式為

(3)

步驟4同理,計算第n個IMF值表達式為

(4)

PE應用排列的思想對子序列進行重構,是一種計算簡單、具有較強抗噪能力的算法,可以減少計算復雜度[17]。采用相空間方法重構序列{x(i),i=1,2,…,N}得到新序列為
Yj=[x(j),x(j+τ),…,x(j+(m-1)τ)]
(5)

1.3.1基礎黑猩猩優化算法
黑猩猩優化算法(CHOA)是針對叢林當中黑猩猩的捕獵活動而提出的一種啟發式搜索算法,與傳統GWO、WOA等優化算法相比,其收斂速度和尋優精度更好。黑猩猩種群在捕獵時有不同的分工,一般分為攻擊者、障礙者、驅趕者和追逐者4種類型[18]。黑猩猩驅趕和追逐獵物的數學模型如下:
D=|C·Xprey(t)-m·Xchimp(t)|
(6)
Xchimp(t+1)=Xprey(t)-A·D
(7)
A=f(2r1-1)
(8)
C=2r2
(9)
f=2(1-(t/tmax))
(10)
式中:D為黑猩猩與獵物之間的距離;Xprey和Xchimp分別為獵物和黑猩猩位置;t和tmax分別為當前和最大迭代次數;r1和r2為[0,1]的隨機數;f為收斂因子,其值隨迭代次數增加從2.5非線性減小到0。A、m、C為控制系數。其中m為混沌映射矢量,表達式為m=Chaotic_value。
種群初始化后,種群中黑猩猩的位置圍繞上述4類黑猩猩的最優位置Xattacker、Xbarrier、Xchaser、Xdriver進行更新:

(11)
X(t+1)=(X1+X2+X3+X4)/4
(12)
式中:X為當前黑猩猩的位置,X(t+1)為更新后的位置。
1.3.2改進黑猩猩優化算法
1) 佳點集種群初始化
針對CHOA收斂速度慢、易陷入最優局面的缺陷,引入佳點集初始化黑猩猩種群,避免種群隨機分布。與logistic映射[19]、拉丁超立方映射[20]等方法相比,佳點集能夠使種群分布更加均勻。佳點集理論表達式為
Pn(k)={({r1k},…,{rik},…,{rtk})}
(13)
式中:ri=2cos(2πk/p);k=1,2,…,n;1≤i≤t;P為滿足p≥2t+3的最小質數。
設置二維空間,黑猩猩種群規模為500,在區間[0,1]內隨機分布、拉丁超立方映射、logistic映射和佳點集生成的種群分布如圖1所示。

圖1 初始化種群分布圖
由圖1可知,通過引入佳點集可使算法性能明顯優于其他方法,使種群分布更加均勻,可以獲得更好的效果。
2) 非線性收斂因子
CHOA中線性收斂因子f易導致搜索時間增加,不能很好地協調全局和局部搜索。將其改進為非線性收斂因子,均衡CHOA的搜索能力,縮短搜索時間。改進后的收斂因子表達式為
f=-2(t/tmax)3+2.5
(14)
3) 反向學習策略
將反向學習策略應用到CHOA中,更新最優黑猩猩個體,提高算法的收斂精度和尋優速度,擴大搜索范圍。表達式為
Xopbest=ub+r⊕(lb-Xattacker)
(15)
式中:Xopbest為最優解Xattacker的反向解;ub、lb分別為種群上、下界;r為1×d矩陣。
4) 水波動態自適應因子
在4類黑猩猩位置變化中引入水波動態自適應因子,降低黑猩猩的盲目性,提高算法尋優能力,避免陷入最優局面。改進后位置更新表達式為

(16)
式中:λ=r1·sin(4πεt)+r2·cos(6πεt)為水波動態自適應因子,ε為控制參數,本文取值為2。
LSSVR是對SVR的延伸,在約束問題上,從不等式轉變為等式,降低了計算復雜度,適用于風功率非平穩序列的建模。其中,正則化系數和核函數寬度的選取對LSSVR模型的學習能力及預測準確度影響很大。具體見文獻[21]。
BiLSTM由前向LSTM層和后向LSTM層組成。傳統的神經網絡總是在訓練期間從前向后進行傳播訓練。這種訓練方式不能最大化序列所包含的固有信息,數據利用率低。BiLSTM網絡可以利用過去和未來的狀態提高預測的準確性,彌補LSTM網絡中數據信息不足的缺陷,能更好地挖掘風功率序列中的高頻特性[22]。LSTM計算式為

(17)

步驟1設置ICHOA參數。
步驟2佳點集初始化黑猩猩種群。
步驟3分別建立LSSVR和BiLSTM預測模型,設置LSSVR的正則化系數和核函數寬度,以及BiLSTM的2個隱含層節點、訓練次數和學習率的尋優范圍,并劃分訓練集和測試集。
步驟4將預測模型輸出的均方差作為適應度值,利用ICHOA對LSSVR和BiLSTM的參數進行優化,根據式(16)確定黑猩猩是否更新位置,通過式(15)確定最優解。
步驟5若滿足最大迭代次數,則建立最優參數LSSVR和BiLSTM模型;否則繼續步驟3。
步驟6利用獲得的最優ICHOA-LSSVR模型和ICHOA-BiLSTM模型進行預測。
結合上述各方法的優勢,提出一種基于ICEEMDAN-PE-ICHOA-LSSVR-BiLSTM雙尺度深度學習模型的短期風功率預測方法,結構如圖2所示。
運算步驟如下:
步驟1收集原始風功率數據,對于缺失數據采用平均值修正。根據pearson方法對風功率數據與氣象因素進行相關性分析,確定相關天氣輸入特性。
步驟2利用ICEEMDAN將原始風功率序列分解為IMF和Res。根據PE重構IMF和Res減少計算復雜度,并根據排列熵值將重構的分量劃分為高頻序列和低頻序列。
步驟3將ICHOA算法應用于LSSVR和BiLSTM模型的參數優化,建立最優ICHOA-LSSVR和ICHOA-BiLSTM模型進行訓練和測試。
步驟4將高頻分量和低頻分量分別用作最優BiLSTM模型和LSSVR模型的輸入。
步驟5將各預測結果疊加得到最終預測結果。
為更好地評估風功率預測結果,使用均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和模型決定系數R2四種誤差評價指標。

(18)

(19)

(20)

(21)

實驗采用愛爾蘭某風電場2019年的風功率數據集。為驗證所提模型的準確性和普適性,選取春季3月1日—31日、夏季6月1日—30日、秋季9月1日—30日、冬季12月1日—31日的原始風功率數據及同期天氣數據。采樣間隔為15 min,3月份和12月份各包含2 976個數據點,將每個數據集劃分為兩部分,即訓練集和測試集。使用前2 880個數據點進行訓練,剩余的96個數據點用于測試。6月份和9月份各包含2 880個數據點,使用前2 784個數據點進行訓練,剩余96個數據點用于測試。各月風功率如圖3所示。編程環境為Matlab 2022b。

圖3 各月風功率曲線
利用ICEEMDAN對原始風功率序列進行分解。經實驗驗證,分解過程中,設置白噪聲標準差為0.2,最大迭代次數為1 000,平均次數為100。以9月份的風功率數據集為例,風功率序列被劃分為9個IMF和1個殘差Res,使用ICEEMDAN分解結果圖4所示。
根據ICEEMDAN分解結果,若對分解出的每個子序列進行預測,計算復雜度會增加,最終預測的累積誤差也可能變得更大。為提高預測效率,根據PE理論將相似熵值的各子分量序列重新組合。考慮本文的分解結果,設置PE嵌入維數為3,延遲時間為1 s。根據各序列PE值結果,原始序列的PE值為0.554 3,IMF1-IMF4的PE值大于原始序列,隨機性強,不進行合并。IMF5-IMF9和Res的PE值小于原始序列,隨機性弱,將它們合成一個序列。因此將IMF1、IMF2、IMF3、IMF4、IMF5-6-7-8-9-Res重構為新的序列F1、F2、F3、F4和F5。其中F1-4為高頻分量,F5為低頻分量。9月份各序列排列熵值及重構序列如圖5所示。
根據pearson方法來分析歷史風功率與同期天氣數據之間的聯系。pearson表達式為:

(22)


表1 風功率與天氣因素相關性系數
由表1可知,風功率與風速有極強相關性,與風向為中等相關性,與溫度為弱相關性,與濕度極弱相關性。為提高預測精度,將風速、風向和溫度3種氣象因素作為特征輸入。根據分析結果,在LSSVR和BiLSTM預測模型中設置輸入變量維數為4,包括風功率、風速、風向和溫度;設置輸出變量維數為1,為風功率。
建立ICEEMDAN-PE-ICHOA-LSSVR-BiLSTM模型進行仿真實驗。為突出本文方法的優勢和改進黑猩猩優化算法在LSSVR和BiLSTM當中的有效性,將LSSVR(模型1)、CHOA-LSSVR(模型2)、ICHOA-LSSVR(模型3)、ICEEMDAN-PE-ICHOA-LSSVR(模型4)、ICEEMDAN-PE-ICHOA-BiLSTM(模型5)、CEEMDAN-PE-ICHOA-LSSVR-BiLSTM(模型6)與本文方法(模型7)比較。并采用上述4種評價指標對各類模型進行對比分析。
設置ICHOA的種群數量為50,最大迭代次數為50,參數A、m、c的值分別為0.5、1、1.2。對于ICHOA-LSSVR模型,ICHOA對LSSVR的正則化系數和核函數寬度的尋優范圍均為[0.001,1 000]。對于ICHOA-BiLSTM模型,BiLSTM中選用Adam優化器。ICHOA對BiLSTM的2個隱含層節點、訓練次數、學習率的尋優范圍分別為[1,100]、[1,100]、[0.001,0.01]。經過ICHOA尋優得到的LSSVR最優參數取值分別為:正則化系數為17,核函數寬度為43。BiLSTM最優參數取值分別為:隱含層節點1為97,隱含層節點2為56,訓練次數為82次,學習率為0.008。按同樣方法設置GWO和CHOA,其中9月份風功率數據集中GWO、CHOA和ICHOA優化LSSVR參數的迭代收斂曲線如圖6所示,適應度值越低,模型預測精度越高。各模型最后96個采樣點的風功率預測結果如圖7所示,評價指標如表2所示。

表2 各模型評價指標

圖6 迭代收斂曲線

圖7 各模型預測結果
由圖6可知,ICHOA相較于GWO、CHOA收斂速度更快,得到最佳適應度值時所用迭代次數最少且低于其他算法,說明了改進CHOA算法具有更好的效果。
從圖7可以看出,本文模型相較于其他模型,短期風功率預測效果最好。從局部放大圖看,預測曲線與真實曲線最貼近,擬合度程度最高,表明ICEEMDAN-PE-ICHOA-LSSVR-BiLSTM模型能夠更好地擬合風功率數據,取得更好的預測效果。
根據表2可得,在風功率預測中,算法優化模型的性能優于單一模型。以9月份為例,與LSSVR相比,CHOA-LSSVR的RMSE降低26.560 4%,MAE降低28.433 5%,MAPE降低6.030 1%,R2增加0.048 1,表明添加算法優化可以提高模型的預測性能。與CHOA-LSSVR相比,ICHOA-LSSVR在9月份的RMSE降低2.964 1%,MAE降低2.925 3%,MAPE降低0.982 9%,R2增加0.001 4。在3月、6月和12月預測效果同樣提升。這表明本文提出的改進CHOA算法可以進一步提高模型的預測性能。與ICHOA-LSSVR相比,ICEEMDAN-PE-ICHOA-LSSVR預測精度進一步提高。同樣,其他3個月也有顯著改善。可以發現,分解方法可以提高模型的預測能力。將ICEEMDAN-PE-ICHOA-LSSVR-BiLSTM與CEEMDAN-PE-ICHOA-LSSVR-BiLSTM相比,預測精度進一步提高,這表明ICEEMDAN方法更適合于風功率的預測。顯然,使用混合LSSVR-BiLSTM模型比單一LSSVR和BiLSTM模型具有更好的預測結果,表明所提方法在風功率預測方面是有效的,可以獲得更好的預測精度。
1) 利用ICEEMDAN-PE對具有非平穩性的風功率序列進行處理,降低了計算復雜度;劃分為高低頻預測方法可以有效地提高預測精度。同時,采用LSSVR和BiLSTM的雙尺度模型在精度方面優于單一尺度預測模型。
2) 通過引入佳點集、非線性收斂因子、反向學習策略和水波動態自適應因子,提高了CHOA算法的尋優精度和收斂速度,有利于優化LSSVR和BiLSTM的參數。
3) 相較于其他模型,本文方法可以擬合實際風功率曲線,且預測精度更高。