浙江浙能嘉華發電有限公司 劉 剛 韋向忠 南京朗儀物聯網技術有限公司 金心竹
光伏功率的主要特點為間歇性、波動性,太陽能的大規模開發會導致電網存在挑戰。所以,通過光伏發電可靠預測的方法避免出現棄光問題。傳統功率預測模型要求使用大量神經元,擬合結果敏感。
本文針對以上問題,以及目前光伏發電功率預測技術中提取特征不充分、沒有考慮氣象因素等問題,提出了將LSTM 神經網絡作為基礎的光伏發電功率預測方法。通過設計LSTM 神經網絡模型,對神經網絡模型進行合理優化,實現組合功率預測方法的創建,從而對光伏功率進行預測。通過仿真結果表示,本文預測模型在日類型天氣為晴朗天氣的時候具有良好的預測結果,對比傳統方法的精度提高了13%[1]。
LSTM 網絡是指RNN 網絡的改進結構,通過設計特殊結構解決長時間記憶能力梯度消失的情況,處理時間序列預測問題,神經網絡細胞典型結構詳見圖1。

圖1 LSTM 神經網絡細胞典型結構
圖1中的神經網絡結構:h=[h1,h2,h3,...,hT],t 時間相應輸出指的是ht,x=[x1,x2,x3,...,xT],時間步長通過T 表示,t 時間的輸入通過xt表示,指的是t 時間記憶細胞狀態。LSTM 記憶單元指的是細胞狀態,對所有狀態的信息進行保存。
遺忘門和遺忘階段:遺忘門決定要通過細胞狀態中對什么信息遺忘,讀取ht-1與x,通過sigmoid函數處理,決定細胞狀態上個時間信息被遺忘比例,計算公式為:ft=σ(wf[ht-1,xt]+br),公式中的權重矩陣通過Wf表示,br為偏置向量。
輸入門和選擇記憶階段:記憶選擇是指將選擇性記憶進行輸入,篩選重要信息,輸入當前的狀態。在此狀態下,對x 圖與ht-1進行讀取,通過sigmoid函數確定新記憶,實現記憶細胞狀態ct比例的寫入,通過以下公式表示,公式中的權重矩陣表示Wi,Wc為tanh 層權重矩陣,偏置向量表示為bi,bc是指tanh 層偏置向量,tanh 是指雙曲正切函數:

輸出門和輸出階段。通過sigmoid 函數計算輸出層細胞狀態的輸出比例,乘以激活后細胞狀態得到輸出結果,計算公式為:

公式中的Wo指的是輸出門權重矩陣,bo是指偏置向量[2]。
光伏發電功率的波動性、隨機性比較大,使預測難度得到增加。對光伏發電功率影響的因素比較多,主要包括兩種:其一,因為電氣零件老化、內部損耗、參數設置與安裝角度等內部因素導致;其二,因為太陽輻射強度、風速、溫度和季節特性等外部因素導致。因為出廠時光伏電池已經進行檢測,根據國家標準執行使用年限和安裝角度。
本文可控常量為光伏電站的內部因素,使太陽輻射因素、天氣類型和環境溫度等作為影響光伏發電功率的主要因素。為了對模型預測結果精準性保證,在光伏發電功率預測模型設計過程中要充分考慮氣象因素的影響。但是因為氣象因素影響的強度不同,輸入過多的強度影響低的氣象因素會增加數據冗余,對預測結果是非常不利的。
單純是某氣象因素和光伏發電功率得相關性分析,會泄露氣象因素隱含價值信息。以此表示,使用PCA 處理主要影響因素,能夠對有價值的信息進行提取,對預測精度進行保證,降低輸入變量維度,節約運算的時間[3]。
PPCA 能夠使m 維空間中的因素群在p 微空間(p<m)中投影,在具備原始數據信息的時候降低因素整合重構維度數據,計算步驟如下:
定義元素矩陣X=(x1,x2,...,xm)通過m 個因素和n 組樣本數構成,X 原始矩陣表示為:

原始矩陣中的變量xi和xj相關系數rij(i,j=1,2,...,m)與相關系數矩陣R 計算公式為:

公式中xsi和xsj指的是第s 行元素。
利用相應系數矩陣R 特征方程計算m 個特征根λ1,λ2,...,λm和單位特征項向量e1,e2,...em,實現累計貢獻率閾值a 設置,那么閾值中前p 個成分就是主成分。特征根的特征方程表達公式為:|R-λpI|=0,公式中的I 指的是單位向量。累計貢獻率閾值表達公式為,公式中的λj表示特征根。
使初始樣本數據序列在p 個特征向量所創建新序列進行投影,此新序列主成分表達公式為:Yij=xiTej(j=1,2,...,p),公式中的Yij指的是降維之后p 維主成分,ej指的是特征向量。
累計貢獻率閾值a 取值以原始數據維數和降維之后試驗精度需求進行確定,因為降維之后數據矩陣包括原始數據大部分的信息,還具備降維作用。所以,本文使用累計貢獻率的降維參考維度為85~95%。主成分表征數據在新維度中轉換的維度信息,和初始各維度原始變量物理含義并不對應[4]。
深度學習問題要尋找神經網絡的最小損失函數點,通過優化算法對輸出網絡、模型訓練的影響進行計算,和最優值接近,尋找最小損失點,得到模型的精準度。通過PMSProp 算法對LSTM 網絡進行優化,根據累計平方梯度實現迭代,迭代之后具有較大的梯度權重,利用模型丟棄梯度,對收斂速度得到加快。使用算法對學習速度進行動態調整,利用衰減系數控制模型計算累積平臺梯度,得到歷史信息,算法過程為:
其一,計算梯度g,權值Nabla 算子為Δw,訓練樣本數為m,公式為:y(i));其二,對累積平方梯度r 計算:r=ρr(1-ρ)g·g,公式中ρ 指的是衰減速率;其三,對權值更新計算:,公式中的δ 指的是接近于0的極小數,ε 指的是學習速率;其四,更新權值:w=w+Δw。
通過以上算法實現光伏發電功率預測模型的設計,本文所提出的改進LSTM 網絡光伏發電預測模型進行樣本訓練,訓練后將輸入輸入到模型中實現預測。在預測模型訓練時實現參數和誤差的更新,在迭代時進行計算,一般在高性能計算機中實現模型訓練,或者通過云計算的計算能力在云服務器中部署模型,快速得出訓練模型。之后,使模型在一般計算機中移植并且預測[5],模型整體流程詳見圖2。

圖2 模型的整體流程
針對某光伏電站2020年5月~8月四個月的歷史統計數據進行計算,將每天早晨6點到下午7點作為樣本數量。另外,通過相似日指標劃分日類型相似天數,統計日類型為晴天天數一共80天、霧霾天氣共5天、多云天氣共20天、陰雨天氣共15天。為了對各影響因素相互關系進行驗證,創建相應預測模型、兩個對比模型開展分析,各個預測模型如下:
其一,預測模型。光伏影響因素對太陽輻射強度、溫度、濕度、日類型的影響進行考慮;其二,對比模型1。光伏影響因素包括太陽輻射強度、溫度和日類型等;其三,對比模型2。光伏影響因素包括太陽輻射強度、濕度、日類型和溫度等。通過三種預測模型計算預測結果,圖3為預測結果和對比情況。

圖3 預測結果和對比情況
通過圖3可以看出,晴天時光伏功率預測結果是最佳的。三種預測模型對于預測結果的適應性良好,主要是因為晴天的光伏功率影響因素相同、數據波動比較小,從而提高預測輸入信息的平滑性,預測結果良好。另外就是多云天氣,要充分考慮日類型對預測結果的影響,對預測結果一致性進行保證。其他預測結果比較差,是因為光伏預測時的影響因子會受到多種因素的影響,包括云層、降雨量和霧霾等,使預測模型巡游能力得到降低,影響光伏功率預測的結果精度。
為了對各天氣中不同預測模型適應性進行分析,利用光伏功率預測評價模型適應性,不同預測模型的預測誤差指標詳見表1。通過表1可以看出來,預測模型的預測效果良好,不同日類型的預測模型光伏預測結果具有不同的偏差。但是存在相同變化規律數據時候的晴朗天氣,預測結果良好[6]。

表1 不同預測模型預測誤差的指標分布
本文分析了光伏功率預測技術,對基于優化LSTM 算法的光伏發電預測模型進行設計,針對實際工程數據,對本文方法在不同天氣類型中的精準功率預測進行分析。通過測試結果顯示,天氣類型存在明顯變化,日預測中的模型預測精度改善比較明顯。