李忠紅, 何樂生, 汪 靜, 李路遲, 楊 航
(云南大學信息學院,云南 昆明 650500)
在世界經濟快速發展和可再生能源發電成本下降的推動下,各國加大對可再生能源的開發力度[1]。作為清潔可再生能源技術,光伏發電在最近幾年得到較大程度的發展。同時大量光伏并網也給電力系統運行調度帶來一定的挑戰[2-3]。
近年來,國內外對光伏功率預測已經取得一定的進展。為了解決光伏功率預測易受環境影響的問題,有學者通過主成分分析法對氣象影響因素進行降維處理[4],簡獻忠[5]等人基于卷積神經網絡對氣象因素進行時域及頻域特征提取,徐先峰[6]等人通過K近鄰算法挖掘氣象因素中的關鍵因素構造成多元數據序列。為了降低光伏功率時間序列的波動性與非周期性,有較多學者通過經驗模態分解、集合經驗模態分解以及互補集合經驗模態對光伏功率序列進行分解,分別對分解后的分量進行訓練再疊加重構[7-9],余向陽[10]等人通過變分模態分解算法將光伏功率時間序列分解成有限帶寬的分量,降低了時序序列非平穩性。在預測模型方面,傳統機器學習算法反向傳播神經網絡(back propagation, BP)以其較強的非線性處理能力被廣泛應用于預測領域[11],但該算法缺少對時序數據時間相關性的考慮。為了充分考慮光伏功率序列時序特性,長短期記憶神經網絡(long-short-term memory, LSTM)被廣泛用于預測[12],但該方法缺乏對未來時刻信息的考量。
通過以上研究分析,本文提出一種基于氣象信息充分挖掘的多尺度光伏功率預測模型。首先通過因子分析算法對輸入氣象特征進行特性因子提取,以降低復雜環境因素的影響程度;然后通過CEEMDAN算法將特性因子與光伏功率時間序列進行分解重構為不同尺度的分量矩陣;最后通過BILSTM網絡對不同尺度的分量矩陣數據進行時序特征挖掘并訓練,最終得到預測結果。實驗結果表明,與其他模型相比,本文模型在不同天氣類型下皆有較高的預測精度。
光伏發電旨在將太陽能轉換為電能,發電功率與氣象信息存在一定的相關性。而不同氣象信息對發電功率的影響程度又不盡相同。因此選取關聯性較高的氣象信息作為功率預測的特征向量顯得尤為重要。選取天氣變化較為明顯的江蘇某發電廠2017下半年數據進行相關性分析,結果如表1所示。
表1 光伏發電功率與氣象信息相關性表
通過對光伏功率與不同氣象信息之間作相關性分析,為降低模型復雜度,選取總輻射、直接輻射、散射輻射、組件溫度、環境溫度作為預測模型的氣象特征向量。
不同天氣類型下光伏功率輸出差異性較大,因此對不同天氣類型下的預測日作相似日選取可提高預測精度[13]。相似日選擇取流程如下:
1) 選取每日氣象特征向量,構造氣象特征日相似向量,定義如下:
環境溫度平均值,℃。
式中: Δj(i)=χ0(i)-χj(i);為分辨系數,取值在[0,1]之間,本文取0.5。
從預測日開始,逐一計算各歷史日與預測日之間的相似關聯度,選取大于0.8的歷史日作為相似日。取值的江蘇省2017年下半年某光伏發電站部分相似日如圖1所示。
圖1 四種天氣類型下的預測日及其部分相似日光伏發電功率圖
輸入氣象特征總輻射與直射輻射以及散射輻射之間的相關性分別為0.632、0.543,環境溫度與組件溫度相關性為0.861,表明自變量之間存在較強的相關性,在作回歸分析時會存在一定程度的共線性問題。為減少信息重疊度,提高模型預測精度,有必要對輸入氣象特征進行因子提取。
通過對經過數據預處理后的輸入氣象特征進行KMO檢驗和Bartlett球形檢驗,KMO檢驗值為0.812>0.800,Bartlett球形檢驗值為 0.00<0.01,十分適合進行因子分析,因子分析結果如表2和表3所示。
表2 5個變量的方差貢獻率與累積貢獻率
表3 旋轉后的因子矩陣
如表2所示,前 2個因子的累積貢獻率達82.514%,已經大于80%,且特征值皆大于1,可以解釋原始數據大部分信息,因此提取前2個因子,剔除后面3個因子。
表3旋轉后的因子矩陣,代表提取的主要因子對原始數據的影響程度。如表3所示,因子包含72.7%的總輻射信息、86.4%的直射輻射信息以及92.1%的散射輻射信息,因子包含87.4%組件溫度信息以及94.6%的環境溫度信息。因此,因子、可分別命名為輻射因子、溫度因子。
經過因子提取,不僅解決了輸入氣象特征之間的共線性問題,也提高了氣象因子與光伏功率之間的相關性。
EEMD算法有效解決了EMD算法在分解信號時易出現模態混疊的問題,但仍具有無法抵消噪聲的缺陷。Torres等人提出CEEMDAN算法,有效解決了EEMD算法在分解信號時存在的問題。CEEMDAN算法具體步驟如下所示:
Step2:分解R1(t)+ε0E1(ωj(t))至第1模態分量,表示進行EMD分解后的IMF分量。則第二個模態分量為:
Step3:重復上述實驗,得第k個殘差及第個IMF分量
Step4:重復上述實驗,直至殘差信號為單調函數,分解停止,原始信號為:
為降低光伏功率和因子序列的非平穩性,本文先對不同天氣類型下的相似日和預測日數據中的自變量因子信息和因變量光伏功率的時間序列進行CEEMDAN分解,再計算各子序列的PE值,將PE值大于0.55的序列構建為高頻序列,PE值在0.25至0.55的序列構建為中頻序列,PE值小于0.25的序列構建為低頻序列。以陰天光伏功率數據分解重構為例,將陰天預測日(11月15日)與相似日構建陰天預測數據集(共14天),因為晚上光伏發電功率為0,所以僅考慮每天6:00-20:00的數據,采集間隔為15 min,得到798個陰天光伏功率數據,對其分解重構后的時間序列如圖2所示(橫坐標表示798個光伏功率數據采樣點,每15 min采樣一次)。
圖2 分解重構后時間序列圖
提取不同天氣類型下的因子信息與光伏功率分解重構后的結果,構建不同頻段輸入矩陣分別對應高頻、中頻、低頻矩陣,其中和分別對應t時刻的輻射因子及溫度因子,對應于時刻的光伏功率值。
光伏發電功率預測,當前時刻的功率值同時與過去時刻信息及未來時刻信息相關聯。按從前往后時序進行單向訓練的LSTM無法充分挖掘時間序列間的內在聯系,因此,本文引進BILSTM作為光伏功率預測的底層網絡。結構圖如圖3所示。由圖3可知,輸入層的輸入矩陣經過前向蘊含層與反向蘊含層進行運算,并將對應時刻的結果進行融合,得到最終輸出。計算過程如下所示:
圖3 BILSTM網絡結構
光伏功率不僅與過去時刻功率值有關,而且與當前時刻氣象信息也有較強的相關性。本文充分考慮影響光伏功率的多種因素,并建立不同天氣類型下的數據集,搭建適合不同天氣類型的預測模型。基本流程如圖4所示,可分為以下幾步完成。
圖4 預測流程圖
1) 獲取預測日氣象特征,選取與光伏功率具有強相關性的氣象信息,根據日公式(1)在歷史日數據集中選取相似日,構建基于不同天氣類型下的數據集。
2) 對相似日與預測日的輸入氣象特征進行因子提取,獲得代表性較高的輻射因子與溫度因子。
3) 對因子信息與光伏功率序列分別進行CEEMDAN分解,然后根據各分量PE值進行重構,構建高頻、中頻、低頻分量。
4) 將當前時刻各頻段因子信息與前一時刻相應頻段光伏功率構建輸入矩陣。
5) 分別對高頻矩陣、中頻矩陣、低頻矩陣建立雙向長短時記憶神經網絡,經過多次實驗探求適合不同輸入矩陣的網絡超參數。
6) 最后將高頻、中頻及低頻序列預測結果進行疊加,得到預測日預測結果。
光伏功率預測的準確性至關重要,在實際建模過程中,由于測量工具、預測方法的不完善,難免存在預測誤差。為了量化預測誤差,本文選用均方根誤差(RMSE)、平均相對誤差(MRE)、平均絕對誤差(MAE)作為模型評價準則,其公式如下所示:
1) 均方根誤差(RMSE)
2) 平均相對誤差(MRE)
3) 平均絕對誤差(MAE)
為了驗證本文預測模型的可行性,本文選取江蘇某地2017年下半年的光伏功率數據及氣象信息。采樣間隔為15 min,采集時區為每天6:00-20:00。選取11月16日(晴天)、11月7日(多云)、11月15日(陰天)、11月20日(雨天)作為預測日。基于預測日,選取關聯系數大于0.8的歷史日作為相似日。最終構建不同天氣類型下的預測數據集。對同一天氣類型分別建立了BP、LSTM、BILSTM和本文模型進行預測得到仿真結果如圖5所示。
圖5 4種天氣類型下的模型預測結果
由圖5可知,在晴朗天氣時,光伏功率波動性較小,光伏發電功率較大。在多云與陰天天氣下,光伏功率非平穩性一般。在雨天時,光伏功率波動性較大,且光伏發電功率小。在4種天氣模型下,本文模型相較于其他3種模型預測精度都高,在光伏功率時間序列波動較大或平穩階段,本文模型預測值與真實值皆有較高擬合度。在光伏功率波動性較大時段,BP和LSTM網絡都出現較低的預測精度,特別是在陰天和雨天預測效果更是大打折扣。單獨的BILSTM預測模型,在無光伏功率輸出時段存在預測值不準的情況,在晴天和多云天氣類型下表現較好。
為了進一步驗證本預測方法的優越性,對預測模型進行適應性分析,得到誤差結果。由表4可知,在晴天時4種模型的MRE值皆小于10%,說明在光伏功率波動性小的晴天4種模型預測效果都不錯。在多云和陰天時,LSTM和BP模型已經出現預測乏力的情況。在雨天時,LSTM和BP模型的已經超過30%,BILSTM模型也存在一定的誤差。而本文模型在4種不同天氣類型下,預測誤差皆最低。以陰天為例,本文模型相較于LSTM、BP、BILSTM模 型 ,分 別 減 少 了 6.525 9 MW、4.699 5 MW、1.727 2 MW,分別降低了 20.171 2%、16.941 3%、6.038 0%,MAE 分別減少 3.554 9 MW、3.308 6 MW、1.297 0 MW。
表4 四種模型誤差指標表
光伏功率輸出影響著電力系統的調度計劃,精準的預測對電力調度有極大幫助。本文充分利用歷史光伏功率數據及其影響因素中蘊含的有效信息,建立適合不同天氣類型的預測模型。通過理論分析與實驗,得到以下結論。
1)光伏功率輸出與氣象信息之間存在較為復雜的關系,選取相關性強的氣象信息作為光伏功率氣象信息,并對選取的氣象信息進行特性因子提取,可以減少氣象信息之間的信息重疊問題,以及降低光伏功率與氣象信息之間的關系復雜度,進而降低模型復雜度。
2)不同天氣類型下光伏功率輸出差異性較大,本文借助灰色關聯分析法選取預測日的相似日,構建不同天氣類型下的數據集。對不同天氣類型下的特性因子與光伏功率序列分別進行CEEMDAN分解處理,解決了模態混疊現象,降低了時間序列的波動性與隨機性,提高了光伏功率預測精度,特別是功率波動較大的時段。
3)將分解后的模態分量分別按排列熵值重構為高、中、低頻分量矩陣,對不同分量矩陣分別建立BILSTM模型,同時從前向和后向兩個方向進行模型訓練,有效解決了長期依賴問題,且能更好地挖掘數據內部的深度時序特征。