卞海紅,孫健碩
(江蘇省主動配電網重點建設實驗室(南京工程學院),江蘇 南京 211167)
我國光伏資源十分豐富。隨著光伏產業規模的不斷擴大,為了改善環境,實現可持續發展,提高光伏能源利用率,研究精確度更高的光伏發電量預測技術已成為未來趨勢[1—3]。如今,基于歷史運行數據和歷史氣象數據相結合的光伏發電量預測模型應用廣泛,其中天氣因素對光伏系統及光伏發電預測量影響最大,所以在進行光伏發電量預測時,構建特定地區典型氣象年數據非常重要[4—7]。
文獻[8]選取中國南海地區7個數據較完整的氣象觀測點,通過3種方法構建典型氣象年數據,綜合分析比較3種生成結果,發現The Festa-Ratto Method是生成中國南海地區典型氣象年的適用算法。文獻[9]通過構建中國不同氣候區域的35個代表性城市的典型氣象年數據,分析對比3種典型氣象年的生成方法,提出了一種混合典型氣象年構建方法,提高了在不同氣候區域形成典型年數據的精確度。文獻[10]通過皮爾遜相關系數和灰色關聯分析選取最佳相似日,將最佳相似日中相關氣象參數和光伏輸出功率作為廣義回歸神經網絡(general regression neural network,GRNN)模型的輸入參數,預測出各個時刻的輸出功率,解決了天氣類型改變時預測精度下降的問題。
針對上述文獻未考慮典型氣象周數據與歷史長期平均數據之間誤差關系的缺點,文中利用改進的平均絕對百分比誤差(mean absolute percentageerror,MAPE)方法,構建改進典型氣象年方法(typical meteorological year method,TMY Method)下的典型氣象年數據,使用因子分析法(factor analysis,FA)篩選氣象指標進行標準化處理,結合GRNN預測模型進行日光伏發電量預測。文中選取江蘇省南京市2000年—2015年歷史氣象數據和日光伏發電量數據進行算例分析,驗證模型的預測精度。
典型氣象年通常是由歷年氣象數據中選擇出的12個典型氣象月組合成一個“虛擬年”[11]。構建典型氣象年的常用方法有:The Danish Method[12],The Festa-Ratto Method[13]和TMY Method等。
TMY Method最早由美國的Sandia National Laboratories提出,主要通過Finkelstein-Schafer[14]統計方法來選取和確定典型氣象年數據。
為提高基于改進TMY Method-GRNN的光伏發電預測模型的預測精度,文中針對標準TMY Method進行以下改進:
(1)文中介紹的光伏發電量預測模型是為了提高短期光伏發電量預測精度。相較于按月度劃分,對歷年氣象數據按照一周7 d進行劃分可以提高模型的預測精度,因此文中選擇從歷年氣象數據中選取52個典型氣象周組合構成一個“虛擬年”。
(2)為了使構建出的典型氣象年數據與長期氣候數據有較高的擬合度,采用計算候選周數據與歷史長期平均數據間MAPE值的方法選取典型氣象周,構建改進TMY Method下的典型氣象年。
在歷史氣象指標中,由于日太陽總輻射、日最高 大氣干球溫度、日平均大氣干球溫度、日最低大氣干球溫度、日平均風速和日平均大氣相對濕度對光伏系統和光伏發電量預測的影響最大,所以選取上述6種氣象指標作為形成典型氣象年的歷史氣象數據。
首先針對歷年每周短期與長期的累積分布函數進行分析比較[15]。累積分布函數計算如下:
(1)
式中:Tn(s)為氣象指標s的累積分布函數值;n為氣象指標s的總個數;i=1,2,3,…,n-1。
各個參數指標的Finkelstein-Schafer統計值計算如下[16]:
(2)
式中:Fs(y,w)為氣象指標s的第y年第w周統計值;Lw(si)為氣象指標s的各周歷年長期累積分布函數值;Ly,w(si)為氣象指標s的各周第y年短期累積分布函數值;N為一周的總天數,取7。
根據6種歷史氣象指標的F(y,w)值進行綜合統計,計算得出加權統計值,加權統計值最小的周被選取為標準TMY Method下的典型氣象周。加權統計值的計算如下:
(3)
(4)
式中:C(y,w)為第y年第w周的加權統計值;Ws為氣象指標s的權重系數;氣象指標個數M為6。
考慮到空間尺度對于光伏發電功率有一定影響,文中使用位于亞熱帶(區域年積溫為4 500~8 000 ℃)的江蘇省南京市的歷史氣候數據,且構建的典型氣象年數據主要用于光伏發電量的預測。因此,給日太陽總輻射這一氣象指標設定較高的權重系數,大小為50/100,即0.5[15]。文中選用的6種氣象指標的權重系數經過仿真檢驗表明在中國亞熱帶城市效果較好。具體權重系數見表1[20]。

表1 氣象指標的權重系數Table 1 Weight coefficients of meteorological parameters
在標準TMY Method下生成典型氣象周的過程中,未考慮典型氣象周數據與歷史長期平均數據之間的誤差。為了使構建出的典型氣象年數據與長期氣候數據的分布規律類似且有較高的擬合度,文中提出相應的改進方法。
將計算得出的各周加權統計值按照升序排列,選取加權統計值最小的3個周作為候選周。
日太陽總輻射是光伏發電量預測中最為關鍵的因素,因此計算候選周日太陽總輻射與歷史長期平均數據間的MAPE值,選取MAPE值最小的候選周作為改進TMY Method下的典型氣象周。MAPE值的計算如下:
(5)
式中:Mw為第w周太陽總輻射的MAPE值;Ky,w,d為第y年第w周第d日的日太陽總輻射;Kw為第w周的日太陽總輻射量歷年的均值。
將獲得的52個典型氣象周組合起來構建成在改進TMY Method下的典型氣象年。
GRNN是一種非線性回歸的前饋式神經網絡[16]。通常是由輸入層、模式層、求和層和輸出層構成。GRNN算法在運算速度與學習能力上比徑向基函數神經網絡(radial basis function,RBF)、反向傳播神經網絡(back propagation,BP)更強,廣泛應用于系統辨識、預測、控制等領域中[17—18]。
GRNN網絡模型如圖1所示,含有四部分:

圖1 GRNN模型Fig.1 Model of GRNN
(1)輸入層。輸入層作用是將樣本數據傳送到模式層且不運行計算,輸入向量的維數為m。文中通過FA法確定在南京地區使用該模型時輸入向量的維數m=7,7種數據分別為平均大氣干球溫度、最高大氣干球溫度、最低大氣干球溫度、平均相對濕度、平均風速、日太陽總輻射和日光伏發電量。輸入向量為:
X=[x1,x2,…,xm]
(6)
(2)模式層。模式層中含有的神經元數目和學習樣本的數目相同,均為n,神經元i的傳遞函數為:
(7)
式中:Xi為神經元i所對應的學習樣本;σ為平滑參數,將平滑參數σ代入神經網絡訓練過程,以Δσ的間距在[σmin,σmax]尋取最優平滑參數。
(3)求和層。求和層含有2種類型的神經元,分別表示如下:
(8)
(9)
式中:Yi為第i個樣本觀測值。
(4)輸出層。在輸出層進行如下計算:
Y=SN/SD
(10)
式中:Y為具有最大概率的輸出變量。
文中使用的氣象數據為2000年—2015年江蘇省南京市某氣象觀測站點的實測氣象數據,選取平均大氣干球溫度、最高大氣干球溫度、最低大氣干球溫度、平均相對濕度、平均風速和日太陽總輻射6種氣象指標作為構建典型氣象年的歷史氣象數據。文中使用的歷史發電數據為2000年—2015年江蘇省南京市某分布式光伏電站的日光伏發電量。
文中選用相對誤差(relative error,RE)和均方根誤差(root mean squared error,RMSE)評價基于改進TMY Method-GRNN的光伏發電預測模型的預測效果。RE和RMSE的計算如下[19—21]:
(11)
(12)
式中:X為實際測量的日光伏發電總量;Y為預測的日光伏發電總量;Xi,Yi分別為元素個數為i時實測和預測的日光伏發電總量;n為測試樣本中的元素個數。
根據上文介紹的TMY Method算法,文中建立標準和改進TMY Method下的典型氣象年模型,對生成的典型氣象年數據進行對比分析。
由于篇幅原因,文中只展示典型氣象周第25~30周的選取結果,結果如表2、表3所示。

表2 南京地區第25~30周典型周(標準TMY Method)Table 2 Typical meteorological week 25~30 in Nanjing area (using the original TMY Method)

表3 南京地區第25~30周典型周(改進TMY Method)Table 3 Typical meteorological week 25~30 in Nan-jing area (using the optimized TMY Method)
對比典型氣象周的周平均數據與2000年—2015年長期周平均數據,選擇日太陽總輻射和平均大氣干球溫度2種關鍵氣象指標進行展示,具體對比如圖2、圖3所示。

圖2 典型周日平均太陽總輻射值對比Fig.2 Comparison of the average solar radiation values on a typical week

圖3 典型周日平均大氣干球溫度對比Fig.3 Comparison of average atmospheric dry bulb temperature on a typical week
分析圖2和圖3可知:改進TMY Method較標準TMY Method在典型氣象年數據中的日太陽總輻射和平均大氣干球溫度2種關鍵氣象指標上和長期平均數據之間誤差較小。
3.4.1 選擇輸入的氣象指標
使用統計學中常用的FA法對光伏發電量和典型年數據中的6種氣象指標進行相關性分析。選取因子載荷矩陣中絕對值超過0.8的氣象指標作為預測模型的數據輸入。因子載荷矩陣如表4所示。

表4 因子載荷矩陣Table 4 Correlation coefficient of factor analysis
分析表4可知典型年數據中6種氣象指標都和光伏發電量有較高相關性,所以文中選取典型氣象年數據中全部6種氣象指標作為預測模型的輸入。
3.4.2 數據預處理
根據上文FA法結果,文中使用標準和改進TMY Method典型氣象年中的6種氣象指標,結合日光伏發電量作為GRNN光伏發電量預測模型的輸入數據。由于輸入數據間單位不一致,因此需對數據進行標準化處理,具體如下:
(13)
式中:bi為指標i的實際數據;bi,max,bi,min分別為指標i的最大、最小值。
3.4.3 樣本選擇
(1)訓練樣本的選擇。文中選取預測日前7日典型氣象年數據中6種氣象指標數據和日光伏發電量作為訓練樣本輸入,預測日光伏發電預測量作為訓練樣本輸出。采用改進TMY Method典型氣象年中第1~299天的相關數據對預測模型進行訓練。
(2)測試樣本的選擇。測試樣本的輸入、輸出與訓練樣本類似。采用改進TMY Method典型氣象年中第300~364天的數據對預測模型進行測試。
為了驗證基于改進TMY Method-GRNN的光伏發電量預測模型性能,將改進和標準TMY Method下光伏發電預測量與日光伏發電量分別進行對比,計算RE值和RMSE值。標準和改進TMY Method下光伏發電預測量與日實測光伏發電量對比如圖4所示。標準和改進TMY Method下光伏發電預測量相對誤差對比如圖5所示。

圖4 改進和標準TMY Method下光伏發電預測量與日光伏發電量對比Fig.4 Comparison of forecasted photovoltaic power generation and daily photovoltaic power genera-tion under optimized and original TMY Method

圖5 標準和改進TMY Method下光伏發電預測量相對誤差對比Fig.5 Comparison of relative errors of forecasted photovoltaic power generation under the original and optimized TMY Method
分析圖4和圖5可知:標準與改進TMY Method-GRNN光伏發電預測模型輸出的光伏發電預測值和日光伏發電實際值之間曲線趨勢相同且數值接近,使用改進TMY Method比使用標準TMY Method預測效果更佳。在與日光伏發電實際值進行對比時,使用改進TMY Method下光伏發電預測量比使用標準TMY Method下光伏發電預測量的相對誤差更小。
通過計算比較可得:使用標準TMY Method-GRNN模型輸出的光伏發電預測量與日光伏發電量之間RMSE為12.73 (kW·h)/m2;使用改進TMY Method-GRNN模型輸出的光伏發電預測量與日光伏發電量之間RMSE為5.28 (kW·h)/m2。改進TMY Method-GRNN預測模型的預測均方根誤差小,預測準確度高。
文中介紹了使用TMY Method生成典型氣象年的具體方法,并針對光伏發電量預測方向進行改進,提出了基于改進TMY Method-GRNN的光伏發電預測模型。
選取對光伏發電預測影響最大的6種歷史氣象指標,生成在標準和改進TMY Method下的典型氣象年數據,并與長期平均數據進行對比分析。將標準和改進TMY Method下生成的典型氣象年數據中6種氣象指標和日光伏發電量作為GRNN的輸入數據,得到預測日光伏發電量,進行對比分析后得到以下結論:
(1)標準和改進TMY Method的典型氣象年數據中日太陽總輻射和平均大氣干球溫度都與長期平均數據十分接近,其中改進TMY Method下典型氣象年數據與長期平均數據更接近。
(2)基于改進TMY Method-GRNN的光伏發電預測模型輸出的預測值與日光伏發電量實際值的曲線趨勢相同且數值接近。改進TMY Method-GRNN預測模型與標準TMY Method-GRNN預測模型相比,其預測準確度更高,預測效果更佳。
本文得到2020年江蘇省研究生科研創新項目(SJCX20_0718),2019年度南京工程學院校級科研基金(CKJB201904)資助,謹此致謝!