常振成,游國棟,肖梓躍,李興韞
(天津科技大學 電子信息與自動化學院,天津 300222)
由于一次能源的大量使用,全球出現能源危機。太陽能作為一種來源豐富的清潔能源,利用太陽能進行光伏發電受到各個國家的重視。2022 年全球光伏新增裝機230 GW,同比增長35.3%,累計裝機容量約1156 GW,同時也反映了光伏發電技術具有廣闊的應用前景[1]。
按照預測時間期限的不同,光伏發電功率預測方法可分為長期預測、中期預測、短期預測、超短期預測[2]。短期預測的預測時間尺度為4~72 h,預測結果時間分辨率為15 min;超短期預測的預測時間尺度為0~4 h,預測結果時間分辨率為15 min,每15 min滾動預測。以長遠發展的眼光來看,短期功率預測算法的研究不僅有助于減少光伏發電棄用量,還能夠幫助優化電力系統的度與管理[3]。
按照預測原理的不同,光伏發電功率預測可劃分為物理預測、統計預測及人工智能預測等方法[4]。文獻[5]中提出一種基于自適應神經模糊推理系統(adaptive network-based fuzzy inference system,ANFIS)的光伏發電功率預測模型在不斷變化的天氣條件下預測光伏發電功率;文獻[6]中提出一種基于確定性預測的概率模型對光伏電站日前逐時發電進行預測。在深度學習中,由于可以從大量的樣本中挖掘出更多的規律,因此,深度學習一直是國內外研究人員關注的熱點。長短期記憶網絡(long-short term memony,LSTM)是循環神經網絡(rerrent neural network,RNN)模型的一種變體形式,解決了RNN 模型在訓練過程中容易出現梯度消失而無法繼續提高模型精度的問題。
為解決電力系統中對未來發電功率的預測不準確的問題,本文提出一種基于LSTM 網絡模型的光伏發電功率短期預測系統。通過對采集的數據進行預處理,利用相關系數法計算各個天氣因子與光伏發電功率間的相關系數,篩選出對光伏發電功率影響較大的因子,將這些因子作為LSTM 網絡模型的輸入變量。
影響光伏發電功率的天氣因素主要包括:光照輻度、溫度、相對濕度、風速、云量和氣壓等。本文通過STM32 單片機采集模塊,對河北某發電站2022年7 月1 日至2023 年6 月30 日的光照輻度、溫度、相對濕度、風速以及太陽能電池板的光伏發電功率進行采集。光伏發電廠的輸出功率和氣象數據均為全天記錄,采樣時間間隔15 min。
利用光伏發電數據采集裝置實時獲取數據并記錄,采集裝置如圖1 所示。該設備是以STM32 單片機為基礎,通過搭載光照輻度、溫度、相對濕度、風速傳感器,可以完成對太陽能電池板周圍的光照輻度、溫度、相對濕度、風速等信息的數據的實時采集,并且本文采用的各種傳感器相互獨立,不易出現數據失真、相互干擾等問題,在接收到數據以后,STM32 單片機還可以將其進行長時間的存儲。采集系統的具體工作流程為

圖1 光伏發電數據采集裝置Fig.1 Photovoltaic power generation data acquisition device
(1)每日從6:00~20:00,每隔15 min 進行一次數據采集,經模數轉換器(analog to digital converter,ADC)變換后,存儲于STM32 單片機內;
(2)通過微控制單元(microcontroller unit,MCU)對電流和電壓兩者數據進行相乘,從而獲得光伏發電功率,并進行記錄存儲;
(3)將采集的數據返回至終端并在OLED 屏幕上實時顯示上述數據;
(4)一天中的其他時間,系統并不工作;
(5)每次工作結束后,利用串口將STM32 單片機中的數據進行記錄并存儲入PC 機里。
1.2.1 數據集分析介紹
本文以河北某光伏發電廠為例,數據包含2022年7 月1 日至2023 年6 月30 日整一年的氣象數據(光照輻度、溫度、相對濕度、風速以及光伏發電功率等),現隨機選擇一天(如2022 年7 月30 日)的采集數據如表1 所示。

表1 河北某光伏發電系統運行日志Tab.1 Operation log of a photovoltaic power generation system in Hebei
1.2.2 數據歸一化處理
為了消除數據計算過程中出現的維數不一致、結點飽和、數據量綱之間影響過大以及計算量較大等問題,該方法針對各項數據的特性,采用歸一化處理的方法。將數據集中的所有特征變量和輸出變量都統一歸一化到[0,1]范圍內。歸一化公式為
式中:x′為各組數據的歸一化處理后的結果;xmax和xmin分別為每組數據的最大值和最小值;x 為各組數據的實際值。
1.2.3 氣象因素相關性分析
影響光伏發電功率的氣象因素眾多,若是全部都進行考慮,勢必會影響到預測模型的運行速度[7],為了減少數據維度過高、統計指標過多對預測模型運行速度的影響,需要在進行LSTM 預測模型訓練前先篩選出光伏發電的主要氣象影響因素。
本文采用Pearson 相關系數對所得氣象數據與光伏發電功率之間進行相關性分析,其中Pearson相關系數公式表示如下:
隨著pxy的增大,數列x 與數列y 的關系將會變得更加密切。越趨近于1,表明兩者之間的相關程度越好反之則相關程度越差。
計算各影響因子與光伏發電功率間的相關系數,計算結果如表2 所示,各因素影響趨勢如圖2所示。

表2 氣象因素與光伏功率之間的相關系數Tab.2 Correlation coefficient between meteorological factors and photovoltaic power

圖2 各因素影響趨勢Fig.2 Factors influence trends
通過表2 可知,光照輻度、溫度與光伏發電功率呈正相關,尤其光照輻度對光伏發電功率的影響最大,其次是溫度,而相對濕度和風速與光伏功率呈負相關關系。通過對比各氣象因子的相關系數,本文選擇光照輻度、溫度、相對濕度作為LSTM 網絡模型的輸入變量。
1.2.4 基于層次分析法確定權重
層次分析法是在進行定量分析時經常使用的一種客觀賦權法,在進行光伏發電短期功率預測綜合評價的時候,這種方法能夠根據各個指標本身的離散性進行賦權,是一種解決多目標的復雜問題的定性與定量相結合的決策分析方法,結果比較公正客觀,避免了主觀因素的影響[7-8]。本文使用層次分析法對幾種天氣情況進行權重確定,結果如表3 所示。

表3 光伏發電中氣象因子的各項權重Tab.3 Weights of meteorological factors in photovoltaic power generation
通過表3 可知,本文通過層次分析法對氣象因子進行權重計算,用算術平均法、幾何平均法、特征值法分別得出各氣象因子的權重,所得權重的平均值分別為0.4748、0.2950、0.2302。其中光照輻度所占光伏發電功率的權重影響最大,其次是溫度,相對濕度所占光伏發電功率的權重影響最小。通過計算得出這3 種方法所求權重的平均值,并將其作為網絡模型的更新權重。
長短期記憶網絡是RNN 模型的一種變體,RNN 模型由于梯度消失的原因只具有短期記憶,無法繼續提高模型精度,LSTM 網絡模型通過精妙的門控制將短期記憶與長期記憶結合起來[9]。LSTM 網絡模型的單元結構如圖3 所示。

圖3 LSTM 單元結構Fig.3 LSTM unit structure
建立LSTM 短期光伏功率預測模型有兩個關鍵因素,一個是選取模型輸入變量以及各項數據的預處理,另一個是模型參數的構建[10]。構建光伏發電短期功率預測的LSTM 網絡模型,要對網絡的4 個參數分別進行選擇,即輸入層的單元個數、輸入層的時間步長數、隱藏層的數量以及輸出層個數,然后對參數進行驗證。
在此基礎上,對已有的數據進行預處理,采用基于隨機梯度的批量算法對訓練得到的LSTM 算法中的權重等參數進行動態調節,最終得到損失最小的LSTM 網絡模型。光伏發電功率預測LSTM 模型建立流程如圖4 所示。

圖4 光伏發電功率預測LSTM 模型建立流程Fig.4 Photovoltaic power generation prediction LSTM model establishment flow chart
對預測模型的評估以及對實驗數據進行的定量分析,可以反映光伏功率預測的有效性。本文選擇的評價指標為均方根誤差(root mean square error,RMSE)、平均絕對誤差(mean absolute error,MAE)和平均百分比誤差(mean absolute percentage error,MAPE)。
本文采用LSTM 網絡模型對晴天、多云兩種不同天氣條件下的光伏發電功率進行預測,并將預測結果與RNN、門控循環單元(gate recurrent unit,GRU)兩種預測模型以及實際功率進行比較。本實驗選擇4 月11 日、4 月21 日這兩天作為預測日期,天氣類型為晴朗、多云。選取4 月1 日至10 日、4 月11 日至20 日的歷史發電數據作為兩種天氣類型的訓練數據。實驗過程以15 min 為采樣時間間隔,采樣時間段為6:00~20:00,并采用滾動預測。以次日各預測點的實際輸出功率與預測功率進行對比,當預測精度不滿足要求時,以預測點的實際功率和實測天氣數據重新作為模型輸出量,下一個預測點的功率進行修正預測[11-13]。晴天與多云天氣的預測結果如圖5、圖6 所示。預測模型誤差指標數據如表4所示。

表4 預測模型誤差指標數據Tab.4 Predictive model error metric data

圖5 晴天天氣下光伏發電模型預測曲線Fig.5 Prediction curve of photovoltaic power generation model in sunny weather

圖6 多云天氣下光伏發電模型預測曲線Fig.6 Prediction curve of photovoltaic power generation model in cloudy weather
在晴天天氣中,光伏發電功率較大,規律性強,多云天氣下,由于太陽能電池板上的光強較弱、大氣溫度較低且有云層遮擋,光伏系統的發電效率較低,規律性弱。但無論在晴天天氣還是多云天氣,LSTM預測曲線比其他兩種預測模型更接近實際輸出功率曲線,預測效果最好。RNN 和GRU 的預測曲線比較接近,但與實際曲線偏離較大,說明RNN 和GRU模型的預測結果較差。
由表4 可知,LSTM 網絡模型的預測誤差波動相對較小。與GRU 模型和RNN 模型相比,在晴天天氣下,均方根誤差分別降低2.508%和3.605%,平均絕對誤差分別降低2.161%和2.913%,平均絕對百分比誤差分別降低3.751%和5.594%。在多云天氣下,均方根誤差分別降低2.802%和3.872%,平均絕對誤差分別降低2.479%和3.112%,平均絕對百分比誤差分別降低4.628%和7.570%。且LSTM 網絡模型的平均絕對百分比誤差(MAPE)在不同天氣下均小于5%,預測精度較高,誤差較小,訓練有效且符合實驗需求。
針對電力系統中對未來發電功率的預測不準確的問題,本文提出一種基于LSTM 網絡模型的光伏發電功率短期預測系統,并通過仿真模擬進行驗證。
結果表明,利用Pearson 相關系數篩選相關度較高的因素對光伏發電功率影響較大的天氣因子,為LSTM 網絡模型的輸入變量提供了可靠的數據支撐。對光伏發電功率影響較大的變量數據輸入預測模型,并對LSTM 模型參數進行調整,提高了模型的預測精度。將RNN、LSTM、GRU 三種網絡模型在晴天和多云天氣下進行仿真實驗,本文所提出的LSTM網絡模型具有較小的誤差值,得到的預測精度最高,實驗符合預期結果。