盧忠山, 袁建華
(三峽大學電氣與新能源學院,湖北 宜昌 443002)
隨著傳統化石能源的日益緊缺和環境污染問題的日益嚴重,清潔可再生能源,特別是太陽能得到了大規模的開發和利用[1]。在光伏發電系統中,發電功率主要取決于天氣情況,但天氣情況類型各異、數量差異巨大,個別地區天氣突變較快,使得發電功率的波動較大,給電力系統的安全穩定運行帶來了挑戰[2-3]。因此,研究太陽能的波動特性,在1 h或更短的時間內獲得精確的超短期光伏功率預測,有助于電網部門通過預測值確定實際發電量的不足來確定必要的備用發電容量,對于促進光伏電站融入電力系統,提高電網的安全性和穩定性具有重要意義[4-5]。
一般來說,光伏發電功率的預測主要有物理預測模型和統計模型兩大類。物理預測模型利用太陽輻照度預報值,結合光伏電池板傾角以及電站所處位置等信息,按照光伏功率的物理成因建立模型[6]。文獻[7]使用傳統光伏電池的數學模型進行建模,增加了光輻射強度對溫度的修正,從而對傳統模型進行了改進。文獻[8]選取5種參數模型,對光伏器件的仿真模型進行測試,利用新的組合方法對模型求解。文獻[9]利用傳感器收集光伏陣列和氣象站上的相關數據,提出一種可對學習速率進行回溯調整的預測算法,提高了模型的收斂速度。
統計模型依托光伏電站歷史功率數據,分析多種外界因素對發電量的影響,最后建立輸入與輸出的映射模型實現光伏功率的預測[10]。文獻[11]提出了一種基于小波變換和深度卷積神經網絡的混合模型,該模型基于比利時光伏發電農場的光伏輸出時間序列數據。計算結果表明,所提供的預測模型的平均誤差在季節、預測期和光伏發電位置方面優于其他模型。文獻[12]提出了一種基于深度循環神經網絡-長短期記憶神經網絡的SPV光伏發電負荷預測模型,并證明了該模型與傳統的支持向量機工具相比性能良好。文獻[13]利用深度信念網絡預測短時間光伏發電的輸出功率。該模型的輸入變量為太陽輻照度、大氣壓力、相對濕度和過去4天太陽輸出功率數據。文獻[14]利用氣象數據和歷史光伏輸出數據作為輸入,訓練和測試深度神經網絡,提出了一種高精度的基于DNN的“PVPNet”模型來預測24 h光伏系統輸出功率。文獻[15]提出了一種深度deep-RNN模型預測一天中每小時的太陽輻照度水平。
以上研究取得眾多成果,但兩類方法都存在部分局限性。物理預測方法需要依托詳細的電站及歷史氣象數據信息,且計算過程中容易產生偏差,導致預測結果不理想。統計模型方法在建模時更為簡單快捷,但部分模型難以收斂,且多數統計模型并未根據天氣類型將不同天氣下的光伏功率分別預測,而天氣類型對光伏發電功率影響較大。為更好地提高模型的預測精度,本文將天氣變化情況分為非突變天氣及突變天氣兩大類,利用EEMD分解法對光伏電站歷史數據進行模態分解,將相關性較強的分量送入高精度的LSTM神經網絡。為驗證所提模型預測精度,建立BP、SVM、KNN和LSTM共4種模型與所提模型進行比較,比較結果清楚地表明了所提出預測方法的有效性。
本文選用某光伏發電系統2017年1月1日-2017年12月31日整年的光伏功率數據,每天采集52個樣本點。僅選擇光伏功率穩定輸出的時段(08:00-18:00)進行分析,不同天氣下光伏發電功率如圖1所示,當天氣較為穩定時,晴天天氣光伏發電功率最高,其他依次是多云、陰天和雨雪天氣。穩定天氣,光伏系統功率波動較小,輸出較為穩定,整體接近拋物線。突變天氣情況下,光伏發電功率波動較大,此時對整個電網的穩定運行有較大的影響。因此,區分天氣類型對于光伏發電功率預測意義重大。
圖1 不同天氣下光伏發電功率
統計光伏電站歷史功率數據可知,輸出功率不僅與天氣類型有關,而且受溫度影響。圖2是28 d內每天14:00的光伏發電功率與溫度對比情況,第1 d、2 d、3 d 均為晴天,但發電功率略有差別,即溫度可影響光伏發電系統功率。但整體而言,光伏系統功率變化趨勢與溫度變化趨勢大致相同。
圖2 光伏發電功率與溫度對比圖
當光伏發電輸出功率波動較大時,預測模型的精度會受到影響,故采用EEMD分解法對歷史數據進行模態分解。
2.1.1 EEMD 分解原理
EEMD分解混疊法主要是為了綜合改善類似經驗模態分解法(EMD)中的模態混疊現象,是在EMD分解法的基礎上改進而來的一種新的模態分解法[16]。EEMD分解法將光伏功率數據加入高斯白噪聲之后進行多次EMD分解,然后對分解出來的IMF分量進行一個總體上的平均化定義。在原始信號中加入高斯白噪聲有效改善了模態混疊問題。由于EEMD法是在EMD法的基礎上改進而來,故EMD分解次數M與高斯白噪聲幅值k直接影響模型的預測精度。本文經過多次調試參數值,最終取M值為150,k值為0.25。
EEMD分解流程如下:
1)向信號內部加入幅值為k=0.25的正態高斯噪聲,設置EMD分解次數M=150,迭代次數m=1。
2)開展第m次EMD分解。EMD分解流程為:
①發電功率的數據序列中加入高斯白噪聲得到新的功率序列為:
式中:x(t)——發電功率的原始數據序列;
m——添加白噪聲的次數;
qm(t)——高斯白噪聲;
xm(t)——新的功率序列。
②對新的功率序列xm(t)進行EMD分解,得到n個IMF分量和1個剩余分量:
式中:Cmi(t)——第m次分解得到的第i次IMF分量;
Rm(t)——剩余分量。
3)計算得到各個分解量的均值:
其中Ci(t)為分解的最終結果。
4)輸出EEMD的分解量。
2.1.2 EEMD 分解結果
采用EEMD法對光伏輸出功率序列分解,得到IMF1~IMF5和剩余分量。分解后的功率序列如圖3所示。第一行為光伏原始輸出功率,IMF1~IMF5為分解后序列,最后一行為剩余分量。觀察分解后的序列可知,IMF1~IMF5分量整體波動趨勢呈現出一定的相似性,但波動的細節有所不同。IMF1~IMF5和剩余分量加入其他氣象因素作為LSTM模型的預測條件。
圖3 功率序列分解結果
長短期記憶神經網絡[17]作為一種循環邏輯神經網絡的特殊變體,它的拓撲結構在充分保留傳統的循環反饋機制功能的同時,通過引進門控單元的方式來控制信息累計和增減的速度,包括用戶有選擇地添加新的信息以及遺忘先前已經累計和增減的信息,徹底解決了功率序列建模中普遍存在的長期依賴性問題。
LSTM拓撲神經網絡同樣由輸入控制層、輸出控制層和隱含層組合構成,與傳統的RNN網絡相比,LSTM神經網絡的隱含層使用門控記憶模塊替換普通的輸入神經元,拓撲結構如圖4所示。
圖4 LSTM記憶模塊結構
門控記憶模塊單元是LSTM系統結構中最重要的核心組成部分,其在某一特定t時刻的記憶狀態記為ct,包涵了該記憶序列的一些長期性的記憶數據信息。隱含層在某一特定時刻t的記憶狀態ht包含了該記憶序列的一些短期性的記憶數據信息。前者的記憶數據周期更新率遠遠要低于后者。整個記憶模塊通過輸入門、輸出門和遺忘門實現。
在某一時刻,LSTM中一個記憶單元模塊的輸入主要包括:序列輸入xt、隱含層前一個時刻的狀態ht-1及記憶單元前一個時刻的狀態ct-1;記憶單元模塊的序列輸出主要包括:該時刻隱含層的狀態ht和記憶單元狀態ct。輸入門控制xt對ct的影響程度;輸出門控制ct對ht的影響程度;遺忘門控制和處理記憶單位中的歷史數據信息。三者的計算公式如下式:
式中:it、Wt、bt——輸入門的計算結果、權重矩陣和偏置項;
io、Wo、bo——輸出門的計算結果、權重矩陣和偏置項;
ft、Wf、bf——遺忘門的計算結果、權重矩陣和偏置項;
在t時刻記憶模塊輸出結果為ct與ht,公式如下式所示:
tanh——雙曲正切激活函數;
Wc——輸入單元權重矩陣;
bc——輸入單元狀態偏執項;
·——按元素相乘。
光伏電站的功率序列受多個氣象因素的影響,是典型的非線性、非平穩信號,為此本文提出EEMD-LSTM耦合模型。該模型通過EEMD分解將功率序列分解為一系列IMF分量,篩選出強相關的子序列送至不同深度的LSTM網絡,最后將子序列預測結果重構得到最終預測結果,模型結構如圖5所示。
圖5 EEMD-LSTM模型框架結構圖
具體建模流程如下:
1)EEMD 分解
通過EEMD分解法將信號x(t)分解為5個IMF和剩余分量Rn。
2)IMF 分量提取
計算IMF分量和剩余分量Rn與x(t)的Pearson相關系數,記為 P ={p1,p2,···,pn}。將Pearson相關系數和的1 / (2(n+1))作為相關系數閾值p0,其中n為IMF分量個數和剩余分量Rn個數之和。
其中pi表示兩個連續變量的Pearson相關性系數。
由式(11)可知,pi大小在-1~1 之間,當 pi的絕對值接近1時,表現為具有強相關性;當pi的絕對值接近0時,則被稱為無相關性。根據閾值p0可篩選出相關性較大的IMF分量或Rn分量。
3)LSTM網絡預測
為避免功率序列經過EEMD分解后不同量綱帶來的影響,將篩選出來的相關性較大的分量進行歸一化處理后,輸入至LSTM神經網絡得到子序列預測結果。將子功率預測分量反歸一化后進行疊加得到最終的光伏功率預測結果。
本文采用的LSTM模型結構如圖6所示,為一階兩層的結構,模型的具體參數設置如下:訓練次數設置為1 000次,LSTM層節點數設置為50,批大小設置為72,選取平均絕對誤差函數作為損失函數,adam作為優化函數,tanh作為激活函數。由于數據量較大,為緩解過擬合現象,設置Dropout為0.2。
圖6 LSTM模型結構圖
搭建EEMD-LSTM預測模型對光伏發電系統功率進行超短期(15 min)預測。根據天氣因素分類指標,將天氣情況分為非突變天氣和突變天氣兩大類。由于光伏發電系統在突變天氣和非突變天氣情況下輸出功率有較大區別,所以本文搭建EEMDLSTM預測模型對兩類天氣分別進行預測。同步建立BP、SVM、ANN、LSTM 4種單一模型與所提模型進行計算精度對比。
選擇希爾不等系數eTIC、均方根誤差eRMSE和平均絕對百分比誤差eMAPE對模型精度進行評價,表達式如式(12)~(14)所示。eTIC介于 0~1之間,系數越小表明預測功率和真實功率之間的差異越小,預測精度越高。當eTIC=0時,表示預測功率曲線和真實功率曲線完全擬合。eRMSE用來評價功率預測值與真實值之間的偏差,對功率序列中特大誤差反映較為敏感。eMAPE常用于時間序列的預測,用來衡量預測模型的準確度,eMAPE值越小,預測精度越高。
式中:Z——測試樣本數目;
y′ ——光伏輸出功率的預測值;
y——光伏輸出功率的實際值。
使用BP、SVM、ANN和LSTM單一模型對光伏功率進行預測時,直接將氣象因素作為輸入量,光伏功率作為輸出量。
基于EEMD-LSTM模型的光伏發電系統超短期功率預測流程見圖7。將天氣情況分為突變天氣和非突變天氣兩大類。由圖1可知,突變天氣時光伏電站的輸出功率波動較大,該電站輸出功率最大時刻為午間14:00左右,故將該時刻的輸出功率進行EEMD模態分解,使之成為平穩的輸出功率序列。非突變天氣細分為晴天、多云、陰天和雨雪4種天氣類型,將不同天氣類型光伏發電系統的歷史功率數據進行EEMD模態分解,對分解后的IMF1~IMF5和剩余分量加入不同的氣象因素作為LSTM模型的預測條件。在搭建預測模型時,在原始功率序列中加入150組k=0.25的高斯白噪聲,對新的功率序列進行150次EEMD模態分解。
圖7 預測流程圖
利用目前收集的某光伏發電系統2017年整年的天氣及功率數據驗證EEMD-LSTM模型的有效性,并分別對突變天氣以及非突變天氣進行預測驗證。數據來自于同一大型光伏發電系統,總裝機容量約50 MW。選取光伏功率穩定輸出的時段(08:00-18:00)進行預測。根據數據統計情況,該光伏電站所在地區 2017 年中晴 139 d,多云 50 d,陰31 d,雨雪 67 d,突變天氣 78 d。非突變天氣中以晴天和陰天為例進行分析,在139 d的晴天數據中,選取 120 d 作為訓練樣本,19 d 作為測試樣本;31 d 的陰天天氣中,26 d作為訓練樣本,5 d作為測試樣本。驗證突變天氣預測準確性時,選擇晴轉雨雪天氣為例進行分析,其中14 d作為訓練樣本,2 d作為測試樣本。
1)晴朗天氣光伏功率預測結果如圖8所示,預測誤差如表1所示。在晴朗天氣情況下,光伏輸出功率曲線波動較小,功率變化具有一定的規律性。除SVM模型外,其余4種模型均呈現出較好的預測效果。分析eMAPE、eRMSE、eTIC3個指標可以發現,所提的EEMD-LSTM預測模型的誤差均小于單一預測模型,且在午時,功率曲線出現輕微波動時,單一模型預測的準確性略有降低。對比單一預測模型,所提EEMD-LSTM預測模型整體上能更好地貼近實際功率曲線,擬合效果最佳。
表1 晴朗天氣光伏功率預測誤差
圖8 1月8日晴天光伏功率預測結果
2)陰天天氣光伏輸出功率預測結果如圖9所示,誤差如表2所示。在陰天天氣情況下,受多種氣象因素影響,光伏輸出功率曲線波動較大,各模型的預測功率與實際功率產生偏差,其中BP神經網絡和SVM的預測誤差明顯增大,而EEMDLSTM模型經過集合經驗模態分解減小了功率數據波動對模型精度的影響,在天氣狀況發生波動時段改善了模型的預測性能。在4月2日陰天天氣下,EEMD-LSTM的 eMAPE值相較于 BP、SVM、ANN和 LSTM分別降低了 0.148、0.259、0.13和 0.047,即EEMD-LSTM模型性能較好,預測準確度最高。
表2 陰天天氣光伏功率預測誤差
圖9 4月2日陰天光伏功率預測結果
3)突變天氣預測結果如圖10所示,誤差如表3所示。天氣發生突變后,BP神經網絡的預測功率明顯低于實際功率,準確度難以保證。在2 d的突變天氣情況下的BP、SVM和ANN 3種預測模型誤差較大。EEMD-LSTM模型較LSTM模型的eMAPE值分別降低0.091和0.048,EEMD分解在一定程度上改善了模型預測性能。對比晴朗天氣和陰天天氣誤差指標,突變天氣的預測誤差雖略有變大,但EEMD-LSTM模型的預測效果仍是最好的。
圖10 2月20日突變天氣預測結果
表3 突變天氣光伏功率預測誤差
本文統計了該光伏電站所有測試樣本的預測值和有效值,分別在LSTM和EEMD-LSTM兩種不同的算法下評估其eRMSE、eMAPE和eTIC,結果見表4。
表4 LSTM和EEMD-LSTM預測誤差對比
對比LSTM預測模型的表現,EEMD-LSTM耦合模型在eRMSE、eMAPE、eTIC上分別提升了21.23%、11.92%、25.67%,即光伏輸出功率曲線數據經過EEMD模態分解后,使得LSTM預測算法更加精準。
文章對天氣類型進行劃分,提出基于EEMDLSTM方法的光伏功率超短期預測模型,直接對輸出功率數據進行EEMD模態分解,找出數據局部特征進行功率預測,建立4種單一模型與所提模型進行對比,并根據eMAPE、eRMSE、eTIC評價預測誤差。所提模型解決了傳統預測方法在功率波動時準確性低的問題。主要結論如下:
1)光伏輸出功率具有較大的隨機性,特別是天氣類型對光伏輸出功率的影響較大。
2)將光伏輸出功率曲線數據進行EEMD模態分解,通過提取曲線細節分量,充分表征曲線的局部特征,使得LSTM預測算法更加精準,EEMDLSTM模型較LSTM模型在eRMSE、eMAPE、eTIC上分別提升了21.23%、11.92%、25.67%;而BP和SVM模型結構較為簡單,在各類天氣下都表現出較大誤差,不適合光伏功率序列的預測;ANN模型在功率波動較大的突變天氣下準確度難以保證。
3)經過晴天、陰天及突變天氣的預測結果可知,EEMD-LSTM模型預測的精度滿足光伏發電系統輸出功率的超短期預測要求,其預測的功率與實際功率差值較小,預測誤差值不影響系統正常工作。