于海龍,劉國巍
(安徽理工大學 電氣與信息工程學院,安徽 淮南 232001)
近年來,太陽能、風能等一些清潔能源走進大眾視野,成為一些行業領域不可缺少的能源。太陽能發電近些年得到快速發展,而相較于煤炭發電有污染小、容易獲取等優點。我國光伏裝機容量近年持續增長,2021年上半年全國光伏新增裝機1301萬kW,光伏產業穩步發展。而由于太陽輻照具有周期性和間歇性,夜晚期間不發電,導致光伏電站的發電量并不穩定,是一種波動性能源[1,2]。大范圍的光伏電站在并入電網時會對電力系統的穩定運行帶來危害。因此準確的光伏發電預測可以為光伏電站合理調度電能分配計劃提供重要參考,為整個電力系統的安全穩定運行提供重要保障[3]。
光伏功率預測方法有多種,一般可分為兩種:一是利用光伏電站各設備的詳細參數等用數學方法建立一種物理預測模型;二是根據光伏電站統計的歷史氣象因素建立與輸出功率之間的一種規律進行直接預測[4]。由于傳統方法預測精度達不到期望效果,人工神經網絡、循環神經網絡等人工智能方法不斷發展,在這些預測問題上有較好的解決問題能力。長短時記憶網絡(LSTM)在處理時間序列的問題方面更表現出了自身的優點,利用LSTM對風電場功率進行預測,取得了較好的預測效果[5]。在LSTM的基礎上加入卷積神經網絡(CNN),通過組合模型對光伏功率進行預測,相比于單一模型具有更好的預測精度[6]。隨著深度學習的發展,不在局限于單一模型來處理問題,而是采取不同模型的優點取長補短,通過組合模型來達到更好的預測效果[7]。
本文利用深度學習強大的自主學習能力,有效建立氣象因子與光伏輸出功率之間的規律進行輸出預測。在CNN和LSTM的基礎上利用CNN和BiLSTM進行結合實現光伏功率精確預測。選取與光伏發電輸出功率相關性高的太陽輻照、溫度和濕度等氣象因素作為輸入,CNN利用自身優勢提取輸入數據空間特征,BiLSTM在時間序列上對過去和未來分別計算依次儲存,最后得到預測結果。
卷積神經網絡(CNN)是一種深度學習模型,憑借其優越的特征提取和非線性擬合能力,已經被廣泛應用到諸多領域中[8,9]。CNN由卷積層、池化層、全連接層和邏輯回歸層四類神經元層構成。卷積層通常由多個卷積核構成,每個卷積核計算一個對應的特征映射,用于提取輸入數據信息。池化層緊跟卷積層之后,采取最大池化的方法,挖掘數據有效特征信息,減小卷積層輸出特征向量的大小。全連接層連接池化層和邏輯回歸層,將提取到的數據特征匯聚一起后進行分類。邏輯回歸層最后進行所有特征組合輸出。
光伏功率此刻的輸出不僅受前一時刻而且還可能與未來時刻的因素有關,因此在模型中采用BiLSTM,即雙向長短時記憶網絡,由上下兩個LSTM組合而成。對輸入數據進行時間序列上特征挖掘并且向前向后兩個方向進行訓練,最后由這兩個LSTM狀態共同決定輸出值[10,11]。由于其內部加入的輸入門、遺忘門和輸出門特殊神經元結構,解決了傳統循環神經網絡產生的梯度爆炸等問題,能夠高效地自主學習輸入與輸出信息之間的依存規律,在多變量時間序列預測問題上得到了廣泛的應用。
LSTM,即長短時記憶網絡。在循環神經網絡基礎上改進,加入特殊門控結構[12]。通過輸入門、遺忘門和輸出門單元有選擇性地取舍數據時間序列上的有效信息,大大提高了模型數據挖掘的高效性,解決了梯度消失問題。圖1為LSTM神經元內部結構圖,引入的3種門各自信息處理過程如下。
圖1 LSTM神經元結構
2.2.1 信息的丟棄
在激活函數Sigmoid的作用下輸入的h(t-1)和此時刻的x(t)會輸出一個介于0到1之間的值,決定是否通過前一時刻所學信息,0表示遺忘所有信息,1表示儲存所有信息。計算公式如下:
f(t)=σ{wf·[h(t-1),x(t)]+bf}
(1)
式(1)中wf為權重矩陣;bf為偏置向量;σ為Sigmoid激活函數。
2.2.2 信息的更新
該過程先是由上一步產生的值決定輸入門更新的信息,然后tanh激活函數作用于h(t-1)和x(t)得到i(t),與遺忘門輸出信息結合得到更新的神經元狀態c(t)。計算公式如下:
i(t)=σ{wi·[h(t-1),x(t)]+b1}
(2)
g(t)=tanh{wg·[h(t-1),x(t)]+bg}
(3)
c(t)=f(t)·c(t-1)+it·gt
(4)
2.2.3 信息的輸出
LSTM在信息的更新基礎上,利用Sigmoid激活函數得到輸出o(t),然后o(t)與經過tanh激活函數處理的c(t)逐對相乘得到最終的輸出y(t)。計算公式如下:
o(t)=σ{wo·[h(t-1),x(t)]+bo}
(5)
y(t)=h(t)=o(t)·tanh[C(t)]
(6)
本文所采用的預測算法架構如圖2所示,選取光伏電站采集的太陽輻照、組件溫度等數據作為輸入,先利用CNN卷積層對輸入數據進行特征提取,然后通過BiLSTM進行特征學習,最后通過訓練建立輸入輸出之間的規律之后輸出預測結果。
圖2 CNN-BiLSTM算法結構
本文選取國內某光伏電站2020年7月份采集的
氣象功率等數據進行實驗,選用MatlabR2020b進行仿真驗證。光伏數據的采集時間分辨率為15min,預測的有效時段為早上7:00至下午19:00。用不同模型分別對選取數據進行訓練,選取最后3 d為測試集。
為了更科學的評價所采用模型的優越性,使用平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)作為兩個評價指標。MAPE和RMSE的公式如式(7)、(8)所示:
(7)
(8)
式(8)中:pireal表示第i個采樣點的真實輸出功率值;pipre表示第i個采樣點的預測輸出功率值;n代表采樣點個數。
通過實驗平臺用不同模型對數據訓練之后,選取測試集早上7點到晚上7點共計147個樣本點進行預測,不同實驗模型預測結果的評價指標如表1所示,不同模型預測值與實際光伏輸出功率對比圖如圖3所示。
表1 不同模型評價結果對比
圖3 不同預測模型對比結果
通過實驗結果對比,從表1中可以看出單一模型的MAPE和RMSE較大,這表明單一模型的預測結果與實際輸出功率誤差較大,預測效果不理想。而組合模型的預測結果精度明顯高于單一模型,組合模型的MAPE和RMSE均最小,這表明采取組合模型可有效發揮各單一模型的優點來達到理想的預測效果。組合模型CNN-LSTM的MAPE和RMSE分別比CNN和LSTM降低了13.04%、6.18MW和17.32%和7.70MW。
本文采取的CNN-BiLSTM模型預測精度達到了更好的效果,MAPE和RMSE降低到了1.96%和0.68MW,比CNN-LSTM降低了0.76%和0.29MW。由此表明本文所采取的組合預測方法對提高光伏功率預測精度有一定的效果。
為了提高光伏輸出功率的預測精度,本文采取了CNN-BiLSTM算法進行預測。首先利用CNN提取輸入數據之間的空間特征,再送入BiLSTM中挖掘數據之間時間序列上的關系,用CNN-BiLSTM建立輸入與輸出之間的一種規律進行輸出預測。最后通過實驗仿真對不同的模型進行驗證,實驗結果表明所采取的預測算法取得了良好的預測效果。精準的光伏功率預測,對于降低光伏并網時對電網穩定運行帶來的危害有重大意義,還能夠為電網部門制定合理配電調度計劃提供參考依據等。