吳詩芹,陸豪乾
(1.江蘇林洋新能源科技有限公司林洋新能源研究院,南京 210004;2.江蘇林洋光伏運維有限公司,南京 210004)
太陽輻射能是光伏發電系統的唯一能量來源。由于受到晝夜交替、季節更迭、天氣變化、地理位置等因素的影響,導致光伏發電具有間歇性、隨機性、波動性的特點。因此,準確預測并網型光伏發電系統的輸出功率,對電網調度,以及電網的安全穩定和經濟高效運行具有重要意義。
目前已有許多預測并網型光伏發電系統輸出功率的方法,并以各類神經網絡算法及將神經網絡算法與粒子群算法、遺傳算法等相結合的算法為主[1-2]。而且由于神經網絡算法的學習能力與泛化能力較強,該算法得到了更為廣泛的應用[3]。
文獻[4]提出了一種基于Elman神經網絡模型的光伏發電系統輸出功率的短期預測方法。結果顯示,晴天條件下,該模型的預測精度較高;但在陰雨天氣條件下,該模型的預測結果不理想。文獻[5]提出了通過提高氣象數據的聚類效果來提高訓練集與待預測日的相關度,從而提升光伏發電系統輸出功率短期預測精度的方法。但由于氣象數據維度較多,很難采集到所有維度的氣象數據,導致相關度的提高受到限制。文獻[6]基于思維進化算法和反向傳播(BP)神經網絡算法建立了一種光伏發電系統輸出功率的短期預測模型,提高了BP神經網絡算法的預測精度。但BP神經網絡算法易出現局部最優和迭代收斂慢的問題。文獻[7]提出了通過對不同時刻氣象因子賦予不同的影響權重來改進相似樣本的輸出選取與特征提取,從而進行光伏發電系統的功率預測。但由于此方法需要對不同時刻的氣象因子賦予不同的權重,存在聚類過程較為復雜、計算量太大的缺點。文獻[8-9]提出了小波分析和神經網絡相結合的預測方法,降低了神經網絡模型的預測誤差,更適合光伏發電系統輸出功率的超短期預測。文獻[10]建立了基于遺傳算法-模糊徑向基神經網絡算法的預測模型,但該模型中相似日的選取過于簡單,未考慮空氣相對濕度等氣象因素對光伏發電系統輸出功率的影響。
為進一步提高光伏發電系統輸出功率的預測精度,本文提出了一種基于相似日理論和LIBSVM軟件中支持向量機回歸(SVR)算法的光伏發電系統輸出功率預測方法,并與同樣采用相似日理論的反向傳播(BP)神經網絡算法、徑向基(RBF)神經網絡算法和Elman神經網絡算法的仿真結果進行了比較分析,對本文所提出的預測方法的有效性進行了驗證。
眾所周知,太陽輻射能是光伏發電系統輸出功率的唯一能量來源。而研究發現,影響光伏發電系統輸出功率的因素很多,其中氣象因素包括太陽輻照度、大氣溫度和相對濕度、風速及氣壓等。不同的季節、天氣類型或地理位置,均會導致光伏發電系統的輸出功率不同。
相似日理論的基本原理是:對于氣象特征參數相似的日期,這些日期的光伏發電系統輸出功率曲線也會近似相同。因此,選擇一個與待預測日具有相似氣象數據的日期作為相似日,將相似日的光伏發電系統輸出功率作為參考值,可以得到待預測日的光伏發電系統輸出功率。
1)按春季(3~5月)、夏季(6~8月)、秋季(9~11月)、冬季(12~次年2月)4個季節的時間序列將光伏發電系統的輸出功率及與其相關的氣象數據分為4個樣本集;然后再根據太陽輻照度、大氣溫度和相對濕度這3個氣象因素,采用聚類方法將各個樣本集內的數據分為晴天、多云、陰天、雨(雪)天等幾個樣本子集。
2)由于在實際工程中,風速、氣壓等物理量的采集數據嚴重缺失,但這些數據不是影響光伏發電系統輸出功率的主要因素,因而本文將太陽輻照度、大氣溫度和相對濕度作為相似日提取時的輸入參數。根據數值天氣預報提供的待預測日的氣象數據,在上述樣本子集中找出3~5個與待預測日具有相似氣象數據的日期。
3)將相似日的氣象數據輸入LIBSVM軟件中的SVR模型,并進行訓練。
在光伏發電系統的實測數據中會存在少量數據缺失的情況,可以通過線性插值的方法補全缺失值;對春季、夏季、秋季、冬季4個樣本集中的離群值,可以通過與該值臨近的實測值進行補正。同時,由于太陽輻照度、大氣溫度及相對濕度等物理量的量綱不同,取值范圍不等,因此需要先對太陽輻照度、大氣溫度、相對濕度等數據進行歸一化處理,然后再用聚類算法提取相似日。
LIBSVM軟件是由中國臺灣大學林智仁教授等開發設計的一款簡單、易于使用和快速有效進行支持向量機(SVM)模式識別與回歸的軟件包,該軟件可用于解決分類和回歸等諸多問題。
本文案例采用LIBSVM軟件中的SVR算法,SVR算法是指利用SVM逼近函數的方法。
SVR算法為:給定一個數據序列{xi,yi}∈ (x,y),其中i=1, 2, …,n。n表示總的訓練樣本個數,x是xi的集合,y是yi的集合。其中,x為影響光伏發電系統輸出功率的因素,包括太陽輻照度、大氣溫度、相對濕度、風速等;xi為n個影響因素樣本中的第i個樣本;y為光伏發電系統輸出功率;yi為n個輸出功率樣本中的第i個樣本。
基于光伏發電系統運行歷史數據庫,提取出系統采集到的太陽輻照度、大氣溫度、相對濕度及光伏發電系統輸出功率等歷史數據。根據SVR算法,建立光伏發電系統輸出功率預測模型,即尋找影響輸出功率的因素與輸出功率之間的關系,回歸函數的公式為:

支持向量機的本質是基于核函數的方法,核函數的選擇會直接影響到分類結果的準確性。常用的核函數包括:1)RBF核函數,比如K(xi x)=exp(-||x–xi||2/σ2),其中σ是寬度系數。2)線性核函數,比如,K(xi x)=xi x。3)多項式核函數,比如K(xi x)=(xi x+1)d,其中d為多項式的次數,默認值為3。4)Sigmoid核函數,比如K(xi x)=tanh[γ(xi x)+θ],其中γ的默認值為1/k,k為類別數;θ用來設置核函數中的coef0,默認值為零。上述常用的核函數中,RBF核函數的運算復雜度相對較低,因此本文選用RBF核函數[15-18]。
對于模型參數如何選擇,目前尚無統一的理論方法,一般是結合具體問題,憑借經驗或通過反復試驗確定相關參數[16,19]。采用LIBSVM軟件中的SVR算法進行計算時,需要設置nu、v和ε等參數,其中,nu的不同取值分別表示設置不同的計算模式;v表示交叉驗證模式,v值必須大于2;ε表示終止閾值。對于本文的算例,通過驗算比較,最終選擇的參數是nu=0.5,v=5(表示5折交叉驗證),允許的終止閾值ε=0.0001。
本文以江蘇省某光伏電站的實測數據為例進行仿真計算。測試時間為2018年12月~2019年11月,每天07:00~17:00,每隔15 min采集1組數據,采集內容包括太陽輻照度、大氣溫度、相對濕度和光伏發電系統的輸出功率。由于7月受國家電網安全大檢查的影響,導致部分數據未能上傳,存在數據缺失;此外,由于少數日期采集到的樣本數據缺失太多,所以這些日期的樣本數據直接舍棄。因此,采集數據實際的有效天數為334天,每天采集41組數據,每組數據包括太陽輻照度、大氣溫度、相對濕度、光伏發電系統輸出功率這4個氣象參數,共計54776個樣本數據。
為了驗證本文所提預測方法的有效性,在每個季節不同天氣類型的每個樣本子集中各選擇3個日期作為待預測日的相似日,組成測試集。將測試集中每個日期的太陽輻照度、大氣溫度及相對濕度作為輸入參數,分別采用SVR算法、RBF神經網絡算法、BP神經網絡算法及Elman神經網絡算法預測光伏發電系統的輸出功率,并將預測值與實際的光伏發電系統輸出功率(實際值)進行對比。
春季、夏季、秋季、冬季這4個季節不同天氣類型時利用不同算法預測的光伏發電系統輸出功率曲線,以及實際的光伏發電系統輸出功率曲線情況,分別如圖1~ 圖4所示。
由于采用BP神經網絡算法和Elman神經網絡算法時,二者初始化時的權值和閾值是隨機的,因而采用這2種算法進行預測時,每次預測的結果會不一樣。

圖1 春季不同天氣類型時各種算法的光伏發電系統輸出功率預測值與實際值曲線Fig. 1 Curves of predicted output power and actual output power of PV power generation system of various algorithms in different weather types in spring

圖2 夏季不同天氣類型時各種算法的光伏發電系統輸出功率預測值與實際值曲線Fig. 2 Curves of predicted output power and actual output power of PV power generation system of various algorithms in different weather types in summer


圖3 秋季不同天氣類型時各種算法的光伏發電系統輸出功率預測值與實際值曲線Fig. 3 Curves of predicted output power and actual output power of PV power generation system of various algorithms in different weather types in autumn

圖4 冬季不同天氣類型時各種算法的光伏發電系統輸出功率預測值與實際值曲線Fig. 4 Curves of predicted output power and actual output power of PV power generation system of various algorithms in different weather types in winter
由圖1~圖4可知,采用LIBSVM軟件中SVR算法預測的光伏發電系統輸出功率曲線與實際的光伏發電系統輸出功率曲線最為接近。
本文采用均方誤差MSE作為評價預測結果的標準,MSE值越小,表明預測的準確度越高。

表1為分別采用4種預測方法時得到的MSE值。

表1 4種預測方法得到的MSE值Tabel 1 MSE value obtained by four predicted methods
從表1中可以看出,采用SVR算法預測光伏發電系統輸出功率時得到的MSE值明顯低于采用其他3種預測方法時得到的MSE值,這說明SVR算法的預測準確度最高。
仿真計算過程顯示,由于采用BP神經網絡算法和Elman神經網絡算法時引入了隨機數,因此采用這2種算法時每次的預測結果均不一樣。而采用SVR算法不僅預測結果明顯優于其他2種算法,且每次的預測結果均一致。
用于模型訓練的樣本數量及其與待預測日的相似程度對預測結果有顯著影響,樣本數量越多,預測結果就越準確;樣本與待預測日的相似度越高,預測結果也越準確。
針對提高并網型光伏發電系統輸出功率預測的準確性,有助于電網的安全穩定和經濟高效運行,本文提出了一種基于LIBSVM軟件中SVR算法的光伏發電系統輸出功率預測方法,并與同樣采用相似日理論的BP神經網絡算法、RBF神經網絡算法和Elman神經網絡算法的仿真結果進行了比較分析,得出以下結論:
1)采用SVR算法時得到的MSE值明顯低于采用BP神經網絡算法、RBF神經網絡算法及Elman神經網絡算法時得到MSE值,這說明SVR算法的準確度最高;
2) 用于模型訓練的樣本數量及其與待預測日的相似程度對預測結果有顯著影響,樣本數量越多,預測結果就越準確;樣本與待預測日相似度越高,預測結果也越準確。