遼寧工程技術大學電氣與控制工程學院 焦家俊 河北工業大學國際教育學院 劉田園
現有的負荷預測方法可分為兩大類:一類為物理方法,其通過對光伏發電設備進行數學建模預測,因其無法獲取時間相關性,不適用于短期發電預測;一類為統計及人工智能方法,其利用神經網絡的非線性擬合能力,結合天氣、氣象因素對光伏處理進行建模與預測[1]。文獻[2]提出基于長短期記憶網絡算法(Long and Short Memory Network,LSTM)的光伏發電功率短期預測方法,對廣西某額定裝機容量為20MW的光伏電站的歷史數據進行預處理分析,結果發現采用LSTM方法較BP方法預測結果更加準確。文獻[3]提出一種卷積神經網絡(Convolutional Neural Network,CNN)-LSTM的混合預測模型對澳洲某光伏系統進行了仿真分析,結果表明該方法較單一模型相比,對于不同天氣類型具有更高的預測精度。
CNN用于數據特征提取,在卷積層中,采用濾波器對輸入進行卷積操作,得到相應的特征圖;后經過池化層進行最大值降維,進而降低數據特征的尺寸,減少網絡參數,降低運算過程中CPU資源耗費。結構圖如圖1所示。

圖1 CNN結構圖
LSTM神經網絡由時間循環神經網絡(RNN)改進得來,在RNN結構的基礎上增加了三種門控單元用以控制信息,其結構圖如圖2所示。遺忘門將t-1輸出的無用信息遺忘,由t時刻的遺忘門狀態Ft和t-1時刻的單元狀態ct-1共同決定保留有用信息。輸入門負責讀取t時刻的輸入xt及t-1時刻的中間狀態ht-1,在輸出門中經sigmoid函數、tanh函數作用后產生it、gt,其共同決定單元狀態中應該保留的信息。輸出門將數據處理后,向下一個時刻傳遞信息。由ht經tanh函數處理后的ct及ot共同決定。

圖2 LSTM原理結構圖
LSTM的核心表達式如下式所示:
式中:WF,Wi,Wg,Wo分別為遺忘門、輸入門、輸入節點、輸出門的權重矩陣,其與xt、ht-1相乘;bF,bi,bg,bo分別為遺忘門、輸入門、輸入節點、輸出門的偏置;ht-1為t-1時刻的中間狀態輸出,xt為t時刻的輸入,ct為輸入節點的狀態;Ft為遺忘門狀態;it、gt為t時刻輸入門及輸入節點狀態;σ為sigmoid激活函數tanh代表雙曲正切激活函數。
貝葉斯優化是在函數方程未知的情況下根據已有的采樣點預估函數最大值的一種算法,在本文中利用貝葉斯算法對CNN-LSTM的多個超參數進行尋優,從而提高光伏發電預測的有效性及準確性,其流程圖如圖3所示。

圖3 貝葉斯優化流程圖
本文提出了一種基于貝葉斯優化的CNNLSTM混合神經模型的短期光伏出力預測。首先運用CNN進行特征提取。而后采用尋優算法對預測模型CNN-LSTM尋優,最后對基于貝葉斯優化的CNN-LSTM混合神經模型的短期光伏出力預測信息進行非線性擬合,進而實現光伏出力的精準預測,得到預測結果。其算法模型結構如圖4所示。

圖4 Bayes-CNN-LSTM模型結構圖
本文選取新疆某光伏電站數據集作為研究對象,數據集包括光伏發電功率、氣象條件,時間跨度為2019年1月1日至2019年6月30日,采樣間隔為15min,共17376組樣本,個別缺失數據已采用線性插值填補??紤]到光伏出力的間歇性,截取每天6:00~21:45共64個采樣點數據作為試驗數據,總樣本量為11584組,將其按照8∶2的比例劃分為訓練集與測試集,由于光伏出力影響因素較多,如若特征選擇不合理易導致信息丟失,故本文采用mRMR方法來進行分析。
使用mRMR方法計算所得各特征與光伏出力的互信息值如下:組件溫度0.1923、環境溫度0.0579、氣壓0.2399、濕度0.1030、總輻射0.3222、直射輻射0.1016、散射輻射0.1908。由此可見,光伏出力與總輻射之相關性最大,達到0.3222;氣壓、組件溫度、散射幅度次之;再次是另外三個氣象因素,其中環境溫度對光伏出力之影響很小,互信息值僅為0.0579,為減輕數據冗余程度和預測模型擬合負擔,本文將其剔除,不再納入后續工作考慮的范疇。
傳統的尋優方法多為試湊法,考慮到手動調參主觀性強,隨機性大,在歸一化數據后,基于貝葉斯優化算法對CNN的一、二層卷積層卷積核大小k1、k2,一、二層卷積層通道數n1、n2、第二層卷積層后所接的池化層大小p以及LSTM的學習率lr、第一和第二隱藏層神經元個數L1和L2、最大迭代次數N共9個超參數進行尋優。尋優過程中采用提前終止策略,如若20輪迭代擬合效果仍無改善則提前終止訓練過程。LSTM的批樣本大小設置為256,采用Adam優化器進行訓練。尋優范圍設置及最終尋優結果見表2。

表1 CNN-LSTM超參數尋優范圍及結果

表2 不同模型的預測效果
為了準確評估本文模型的精度,選取平均絕對誤差(MAE)、均方根誤差(RMSE)這2個指標對預測結果進行評估。各評估指標的計算式如下所示:、,式中:RMSE和MAE的單位均為MW,n代表測試集數據的個數;yi為第i個預測樣本的預測值;yi為第i個測試樣本的真實值。
為了驗證本文所提方法的有效性與準確性,參考相關文獻分別構建了Bayes-GRU、Bayes-LSTM、Bayes-CNN、CNN-LSTM和LSTM5組對照算法模型,針對相同的預測數據集與本文所提算法模型Bayes-CNN-LSTM(BCL)進行對比分析。本文采用時間窗口滑動的策略進行預測,滑動窗口預測時間步長設為32h,即將前128組樣本作為輸入特征,對第129個數據點進行預測,然后滑動窗口,將第129個預測點預測值作為新的特征,實現滾動預測。由于數據眾多,為體現預測效果,本文隨機選取6月27、28兩日共128個數據點的預測值進行展示,各個預測模型的預測結果評價指標值見表2,預測結果如圖5所示。

圖5 不同模型的預測結果對比
由表2可見,本文所提方法各項評價指標均為最優。直接利用LSTM進行預測效果最差。僅利用CNN對多個輸入特征進行局部特征提取而未采用尋優算法對預測模型LSTM尋優,致使預測模型LSTM的性能難以得到充分體現,其預測效果僅優于LSTM,這說明了本文所用尋優算法的有效性;而單純利用CNN、LSTM、GRU等基準模型對負荷進行預測,并輔以尋優算法進行超參數優化,其預測效果雖優于CNNLSTM與LSTM,但仍然劣于本文所提方法,這說明了本文使用CNN模型用以特征提取的必要性;結合圖5來看,本文所提方法與原始負荷曲線最為貼合,能夠很好地擬合出光伏出力與各種氣象dier因素之間的非線性關系,尤其在氣象條件突變所致光伏出力強烈波動時間段,仍然能夠捕捉到光伏出力特性。
圖6還給出了6種方法預測結果誤差的小提琴圖,從圖中可以明顯看出,不同于Bayes-GRU的極端異常值較多,Bayes-LSTM的左偏分布,Bayes-CNN、CNN-LSTM、LSTM的右偏分布,本文所提方法的預測誤差基本上呈對稱分布,且極端誤差值小。綜上所述,本文所提Bayes-CNN-LSTM模型的有效性得以驗證。

圖6 不同模型預測誤差對比分析