嚴華江,章堅民,胡瑛俊,張力行,焦田利,,聞 安
(1.國網浙江省電力有限公司電力科學研究院,杭州 310014;2.杭州電子科技大學 自動化學院,杭州 310018;3.國網浙江寧波市鄞州區供電有限公司,浙江 寧波 315100;4.浙江華云信息科技有限公司,杭州 310012)
大力推進分布式光伏應用,已成為新能源重點發展方向之一[1]。分布式光伏電站大規模并網,使配電網面臨電能質量、諧波、經濟運行等一系列問題[2-3],因此科學地進行分布式光伏出力分析和預測十分必要。
目前,國內外學者對光伏發電出力預測問題已做了很多研究。分布式光伏功率預測不同于集中式光伏電站[4]:一是位置分布分散且裝機容量較??;二是無法獲取就地日照和溫度等氣象數據。因此分布式光伏出力難以實現基于氣象數據的預測,只能采取基于歷史數據來預測。
目前光伏出力預測方法主要分為直接預測法和間接預測法:
(1)間接預測法,是基于相關氣象數據的光伏預測方法。由于日照幅度與光伏出力具有最強的相關性[5],文獻[6-8]對云團采取分析建模并預測其演變過程,達到間接預測光伏所在地日照幅度的目的,為后續的功率預測提供參數支持。文獻[9-10]基于歷史氣象數據和天氣預報數據,分別采用神經網絡算法和多元線性回歸法對輻照度進行建模分析,進而預測輸出功率。
(2)直接預測法,是主要依靠光伏實際出力數據實現出力預測的一種方法,如通過“相似日”出力數據時序關聯預測未來出力[11-16],其中關聯關系采取多元線性回歸法[11-12]、灰色理論預測法[13];文獻[14-16]對相似日數據的選擇采用了不同方法,文獻[14]篩選出氣象與出力間呈弱或強相關的相似日數據,文獻[15]提出基于粒子群和BP 神經網絡的相似日訓練方法,文獻[16]提出基于Kmeans 聚類的相似日分類方法。
氣象作為影響光伏出力的主要因素,在其局部區域存在相關性,使該區域的分布式光伏出力存在空間相關性[17]。近年來有一系列關于不同光伏電站相關性的判定方法研究,如基于不同光伏電站實測出力時間序列以及輻照度數值的相關性系數[18],出力時間序列間的歐氏距離在閾值范圍內[19],分布式光伏站點間輻照度的空間相關KL散度距離[20]??臻g相關性研究方法主要分為兩類:一類為無氣象數據電站建立的與具有氣象數據支持電站空間數據相關的“相似電站”,進而通過“相似電站”來進行無氣象數據電站的出力預測[21];另一類是形成具有相似性的電站群,如文獻[22]取距離待預測目標電站最近的N 個電站作為相關性從站加入AR 預測模型中,結合自身和周圍具有相關性電站的出力數據,從而提高預測精度。
本文作者在文獻[23]提出了一種基于空間相關性的大規模分布式光伏群的劃分方法。首先將氣象對光伏出力的影響程度劃分為大氣候和小氣候2 類:前者為日照或5 類天氣類型影響,其中天氣類型依據光伏實際出力占額定出力的比例來劃分,相應地將歷史數據時段劃分為5 類天氣類型樣本群;后者為光伏安裝高程、溫度、濕度以及周圍地理環境等廣義小氣候影響,基于歷史5類天氣類型樣本群,對光伏空間位置進行聚類分析,從而劃分分布式光伏區域。綜合考慮區域不合群的光伏點數量和區塊的氣象一致性來選擇最優地域分塊方案,已達到最少部署氣象站點的目的或為大規模分布式光伏空間-時間相關的功率預測提供依據。文獻以具有豐富氣候帶地貌特征的某縣級市遍布全境的2 887 個分布式用戶光伏群為案例,很好地驗證所提的方法。
基于文獻[23],本文提出基于空間相關性和ARIMA 模型的分布式光伏功率預測方法,首先利用已提出的大規模區域分布式光伏分群方法篩選分群電站中與待預測電站的出力具有空間相關性的光伏電站,建立不同天氣類型下的ARIMA模型,并與日天氣預報信息匹配,利用相應模型實現光伏功率預測。
廣義天氣類型的分類方法很多,文獻[24]提出了劃分天氣類型的原則,即典型性和代表性。而日照幅度作為光伏出力的影響要素之一且其影響最大[25],譬如晴天的日照幅度最大,相應的光伏出力曲線變化平滑且能取到最大值;雨天因云層的遮擋作用,光伏整體出力和波動較?。欢嘣坪完幪鞎r的光伏出力介于兩者之間,光伏出力變化較大且不穩定。圖1 反映了不同天氣類型下的光伏出力水平,研究了不同天氣類型下光伏的出力特征,本文將廣義天氣類型分為4 類,分別為晴天、多云、陰天和雨天。
光伏日平均出力是指光伏在可發電時間內發電的平均值。由實際光伏出力的統計數據可得,在理想條件下光伏出力曲線具有對稱的特點,因而光伏日平均出力可反映全天光伏出力水平[26],用公式表示為:


圖1 不同天氣類型的光伏日出力特征曲線
式中:n 為可發電時間的長度;Pi為第i 時刻光伏的出力值,對廣域分布式光伏用戶,為去除不同裝機容量等量綱對光伏出力造成的差異,應首先對Pi標幺化處理。光伏日平均出力的大小直接反映了光伏的發電效率和天氣狀況的關系,若光伏的發電效率高,代表其日出力平均值較高,日照幅度較高,天氣晴朗;反之,發電效率低代表日出力水平較低,則表明日照幅度較低,天氣狀況較差。
ARIMA(自回歸移動平均)模型是一類常用的擬合平穩時間序列的模型,體現了系統對歷史自身狀態和進入系統的噪聲的記憶,即序列在t時刻的取值是關于前p 個歷史觀測值和前q 個隨機干擾的多元線性函數,記為ARIMA(p,q):

式中:誤差項εt為均值為零的白噪聲序列代表t時刻的隨機干擾。而ARIMA(p,d,q)模型是d 階差分和ARIMA(p,q)的組合。在數據預處理時,需對序列首先進行平穩性檢測,非平穩時間序列可通過有限次的差分形成平穩時間序列再進行建模。文獻[27]通過觀察自相關系數和偏自相關系數的性質進行模型定階,但這種人為識別的方法具有不確定性,本文使用AIC(赤池信息量準則)來進行定階,選取AIC 值最小時的p,q 作為模型階數,AIC 計算公式如下:

模型參數可通過最小二乘估計或最大似然估計、矩估計確定,對于足夠長時間序列的訓練樣本,3 種方法所得參數漸進相等,因此本文選用最小二乘估計法,即對目標函數:

之后檢驗殘差序列{εt}的白噪聲,若殘差序列為白噪聲序列,即表明模型參數提取正確,為有效參數模型;若非白噪聲序列,則表明序列中還殘余待提取的有用信息,需重新擬合模型。ARIMA模型建模流程如圖2 所示。

圖2 ARIMA 建模步驟
光伏單站的實際出力時間序列按天氣分類后,分別對不同天氣類型的數據樣本進行ARIMA模型建模,作為預測參考模型對比本文提出的引入空間相關性后的光伏出力預測模型。
廣域分布式光伏電站因其具有較多且長時間出力序列數據,歐式距離的計算量較大,因此本文中使用Spearman 秩相關系數來計算2 個電站之間的相關性,公式如下:

提取同一區域中所有電站同維度的歷史出力數據,基于不同天氣分類的數據樣本,分別計算其與待預測電站歷史出力數據的Spearman 秩相關性系數,篩選相關系數大于某一設定閾值的電站或值最高的N 個光伏電站作為待預測電站的相關性從站。本文以其中一個光伏用戶為例,篩選相關值大于0.8 的光伏電站作為此用戶的相關性從站,其地理位置(經緯度)及Spearman 秩相關系數分布如圖3 所示,其中R 代表待預測光伏電站,其余為相關性從站,可得相關性較高的電站均分布在與待預測電站地理相近的位置,距離越近相關性越高,這也驗證了局部氣象的一致性。

圖3 相關性電站的經緯度分布
本文改進了單一時間序列的ARIMA 模型,引入多個相關性光伏電站實際出力數據建立待預測電站的ARIMA 模型,進而提高了模型的預測精度。
假設待預測電站X 有N 個相關性光伏電站,p,q 為ARIMA 模型的階數,其出力預測模型為:

式中:εt是當前時刻的隨機干擾;系數γ=[α0,α(l,x),β(l,x),α(l,i),β(l,i)],1≤i≤N,0≤l≤Ls;可由最小二乘估計法計算出:


為避免X 矩陣維度過高而導致模型計算復雜,在匹配相關性電站時可調整設定相關性系數的閾值,從而控制相關性從站數量,以達到簡化模型計算的目的。
數據樣本選自某省份地級市具有豐富天氣類型的6—9 月共92 天的分布式光伏實際出力數據,截取8:00—18:00 為光伏出力的有效時間,采用文獻[23]基于空間相關性的大規模分布式用戶光伏分群方法得到的具有氣象一致性區域劃分,如圖4 所示;在此基礎上,以其中1 個區域的232 個光伏用戶為例驗證模型的有效性。

圖4 按空間相關性光伏分群方法得到的具有氣象一致性區域劃分
首先對每一個用戶的實際出力數據進行標幺化,根據日出力平均水平劃分天氣類型,基于不同天氣類型的光伏出力數據,計算待預測電站與其他電站歷史出力數據的秩相關系數,選取且相關性最好的5 個電站為相關性從站引入基于空間相關性的ARIMA 模型中,建立不同天氣類型的預測模型,與氣象部門給出的日預報天氣類型對照,選擇相應天氣類型的預測模型進行出力預測。若未匹配到相關性電站,則利用待預測電站自身出力數據劃分天氣類型進行ARIMA 建模。其預測流程如圖5 所示。
以某區域某一光伏用戶為例,其歷史最大功率為3.175 9 kW,出力數據經標幺化后,根據日出力平均水平對其出力數據按天氣分類并分別建立只利用本站出力歷史數據而建立的ARIMA 模型(參考模型),其不同天氣類型的分類指標和模型參數如表1 所示。

表1 天氣類型和對應模型參數
含本站以及空間相關電站功率歷史數據建立的本站ARIMA 功率預測模型,稱為基于空間相關性的預測模型,并將其與參考模型進行對比:圖6(a)給出了某一典型光伏某月31 天實測和預測功率曲線,圖6(b)顯示了其中某天的實測功率和2 條預測功率,可得引入空間相關性后,光伏出力預測精度有了明顯提高。

圖5 基于空間相關性的ARIMA 模型預測框架

圖6 某典型電站預測與實測功率曲線
從圖6 可得出,某些時刻的相關性預測出力仍存在一定的偏差;而日發電量是光伏電站發電有效時間出力的累計值,它表征光伏一天的運行狀態和工作效率,因此本文在此基礎上統計了光伏用戶的日發電量的預測結果,對比曲線如圖7所示,可得在日電量預測上模型的精度很高,可滿足工程應用的需求。

圖7 日發電量對比曲線
本文研究統計了區域中所有光伏電站為期一個月的出力預測誤差,并使用預測模型中常用的誤差指標來評估模型對于區域整體的預測效果,其計算公式如下。
均方根誤差為:

平均絕對誤差為:

引用誤差為:

式中:PE為光伏電站的額定功率。
預測曲線與實際曲線的相關性系數為:

圖8 描述了該區域232 個電站連續滾動預測曲線與實際曲線的多誤差指標按照電站額定功率的對比情況,表2 給出了誤差指標均值和離散度,表3 計算了RMSE 和MAE 2 項指標與電站額定功率的關聯關系,結合圖8、表2 和表3,可得:
(1)RMSE 和MAE 具有很大的關聯性。
(2)在為期31 天的預測里,陰天和多云天氣占比較多,且2 種天氣下光伏的出力波動較大,從而導致RMSE 和MAE 波動較大。
(3)RMSE 和MAE 隨額定功率增加逐漸增大,且呈現出正相關,因此RMSE 和MAE 作為預測評價指標較為片面。
(4)引用誤差作為分布式光伏預測新的評價方法,很好地規避了在出力較小時刻的誤差影響,體現了高功率輸出的預測精度,因而更為合適。

圖8 區域內所有電站的月預測誤差統計

表2 誤差指標均值和離散度

表3 誤差指標相關度
通過分析,光伏日出力曲線高功率部分的預測精度更為關鍵,因此本文提出采取引用誤差作為預測模型的評價計算方法,且通過與均方根誤差、平均絕對誤差、相關性系數進行對比,驗證了引用誤差的優勢。
在分布式光伏預測方面,本文首先基于作者提出的空間相關性大規模分布式用戶光伏分群方法劃分氣象一致性區域;之后基于不同天氣類型下光伏實際出力數據,選取同一區域中具有空間相關性的光伏電站,改進了ARIMA 模型,并結合算例分析驗證了模型對廣域分布式光伏用戶預測出力的實用性和準確性。