蔣艾町,李小雨,夏 雪,李嘉逸
(中國電力工程顧問集團西南電力設計院有限公司,四川 成都 610021)
隨著化石能源等不可再生能源的不斷消耗,資源緊張、環境污染和氣候變化等問題日益加劇。風力發電以其清潔安全、可持續、技術成熟、開發價值高等優勢,迅速在各國的能源戰略中占據重要位置[1-3]。但由于風力資源固有的隨機和波動特性,不論采用何種風電功率預測方法,風功率預測都具有一定的不確定性,對風電系統的電網調度、棄風限電、備用容量配置以及安全運行都會產生影響[4-5],因此,中國各省陸續推出風電功率預測誤差考核政策。儲能作為改善風電功率預測誤差的一種有效手段在工程中被廣泛應用,有效估計風電功率預測誤差,不僅能為風電并網系統的調度和運行提供參考,還能對風電場儲能系統容量的合理配置進行指導,因此有必要對風電功率預測誤差估計方法進行研究。
目前國內研究最為廣泛的是采用概率分布擬合的方法對風電功率預測誤差進行估計計算。該方法通過統計風電功率預測誤差歷史數據,對統計數據進行擬合,建立其概率密度分布模型,進而求取預測誤差的估計區間[6-13]。文獻[6]利用混合高斯分布對風電功率預測誤差進行擬合研究分析,結果表明不同預測方法下產生的功率預測誤差的分布特性不同,但混合高斯分布對于應用不同預測方法的風電功率預測誤差均具有高精度的適應性。文獻[7-8]基于貝塔分布對風電場實際風電功率進行分析,得到其貝塔分布的概率密度函數,然后建立相應的最優解模型,求取風功率預測誤差的最小概率區間。文獻[9-12]采用非參數概率區間估計方法,不對總體分布進行先驗假設,通過滑動分塊百分位數Bootstrap法、核密度估計等方法直接求取預測誤差的置信區間。文獻[13]首先采用聚類算法將預測誤差采樣數據進行分類,然后針對每類數據計算其概率密度函數,求取分布模型,進而得到風電預測誤差估計區間。
此外,特征值提取法也經常被用于風功率預測誤差估計模型的建立[14-18]。文獻[14-16]根據風電場的歷史運行數據和日前預測數據提取數據中的有效特征值,如當日功率波動、近期功率波動及預測方法精度等,通過多元線性回歸法建立回歸方程,進而求取預測誤差的估計區間。文獻[17-18]在直接提取數據特征值的基礎上,加入小波分析、粗糙集理論及字典學習等算法,對風電功率預測數據進行處理后采用多元線性回歸方程,建立風電功率預測誤差的估計模型。然而,這些方法雖然能夠改善預測誤差估計效果,但增加了算法的復雜程度,工程實用性較低。
綜上所述,下面選取適用范圍較廣的基于混合高斯分布擬合法和特征值提取法的風電功率預測誤差估計算法,針對這兩種方法進行了詳細的對比研究。同時提出了一種結合高斯混合模型(Gaussian mixture model,GMM)和馬爾可夫模型(Markov model,MM)的MM-GMM優化預測誤差區間估計算法并驗證其有效性。
基于混合高斯分布擬合法的風電功率預測誤差估計方法首先假設誤差數據的概率密度函數符合混合高斯分布,然后通過對歷史風電功率預測誤差數據的統計分析,進行數據擬合,得到樣本數據的混合高斯模型,進而設置合理的置信水平求得預測誤差的估計區間。該方法適用范圍廣、精度高[6]。
一維混合高斯分布模型由多個正態分布線性組成,其概率密度函數表達式為
f(x;μ1,…,μN,σ1,…,σk)=
(1)
式中:k為正態分布的個數;ai(1≤i≤k)為各正態分布的權值;μi為各正態分布的均值;σi為各正態分布的標準差。
根據風電場歷史誤差數據,利用期望最大化(expectation maximization,EM)算法對混合高斯模型進行參數估計,求解式(1)中的ai、μi和σi[6, 19]。
設θj=(aj,μj,σj),j=1,2,…,k為GMM中各正態分布模型的參數,Θ=(θ1,θ2,…,θk)為GMM中的所有參數。EM算法主要包含以下兩個步驟:
1)計算樣本數據X的對數似然函數的最大似然估計值,其對數似然函數如式(2)。
(2)
式中:T為樣本總數;k為正態分布的個數;Θ(q)為第q次迭代時計算得到的參數的最大似然估計值。
2)最大化上一步得到的最大似然估計值,求解參數。
(3)
重復迭代上述步驟至Θ(q+1)和Θ(q)之間的差值無窮小,即收斂時,則為最優的模型參數。
根據上述步驟建立基于混合高斯分布擬合法的風電功率預測誤差估計模型,然后設置合理的置信水平,即可求得風電功率預測誤差估計區間。
基于特征值提取法的風電功率預測誤差估計是通過分析與預測誤差相關的特征值,將這些特征值與風電功率預測誤差聯合建立多元線性回歸方程,進而求取預測誤差的估計區間。
獲得風電場的歷史運行數據,包括歷史預測功率和實際功率以及風電場日前預測功率,從統計學角度出發,利用各種統計學參數提煉出與預測誤差相關的特征值,如日前預測功率波動性、近期風電功率波動性、風功率幅值及預測方法的預測精度等,進行相關性分析[14-15]。選取相關性較強的特征值,利用多元線性回歸方程建立預測誤差估計模型。其中,相關性計算使用卡爾·皮爾遜對相關系數r的表述如式(4)所示[14,17]。
(4)

風電功率預測誤差估計模型為
E=b0+b1·x1+b2·x2+...+bn·xn
(5)
式中:E為當日風電功率的平均絕對誤差;x1,…,xn為與E強相關的各個特征值;b0,…,bn為估計模型的回歸系數。
通常來講,與風電預測功率的平均絕對誤差相關性較強的因素有當日風電功率波動、當日風電功率水平和預測方法的預測精度等[14-16]。其中,當日風電功率波動和當日風電功率水平對預測誤差的影響較大[13]。
用當日的日前預測風電功率的標準方差ST表示當日風電功率波動,ST越大,表明當日風電功率波動越大,風電功率預測難度增加,預測精度下降,風電功率預測誤差則會增大[14-16]。ST的具體表達式為[14-16]
(6)

用當日預測功率平均值表示當日風電功率水平Pave,若當日風電功率水平較大,則風電功率容易變化,增大風電功率預測誤差[14-16]。當日風電功率水平Pave如式(7)所示[14-16]。
(7)
同樣地,若風電功率預測系統的預測精度較低,風電功率預測誤差也會較大[14-16]。風電功率近期預測精度Pre如式(8)所示[14]。
(8)
式中:Pmt為每一時刻的實際功率;N2表示近幾日預測時刻數,取96的正整數倍。
根據風電場歷史運行數據計算得到ST、Pave和Pre,并利用式(4)計算各特征值與平均絕對誤差的相關性,選取相關性強的因素和平均絕對誤差帶入式(5),利用Matlab進行求解,即可得到風電功率預測誤差估計模型并求解誤差估計區間。
為了驗證評估上述兩種方法的有效性,利用西北地區某風電場2018年6月1日至2018年7月30日的風電預測功率數據和實際功率數據,根據前50日的數據樣本,分別采用兩種方法對2018年7月21日至2018年7月30日進行風電功率預測誤差估計。
基于得到的風電場功率數據,對風電場的功率預測誤差數據進行歸一化,利用Matlab軟件,根據第1節的誤差估計模型建立步驟,對預測誤差進行混合高斯分布擬合,分別建立二權值和三權值的混合高斯模型,得到的結果如表1所示。

表1 二權值和三權值的混合高斯模型參數值
根據表1分別繪制二權值和三權值的混合高斯模型曲線,對比其概率密度分布圖(如圖1所示)。可以看出,對于該風電場的功率預測誤差分布,較二權值混合高斯模型而言,三權值混合高斯模型擬合的概率分布曲線更加準確。
因此,風電功率預測誤差模型采用三權值的混合高斯模型,設置95%的置信水平,得到風電功率預測誤差估計區間為[-25.235 1,24.507 5],其與實際風電運行數據的對比如圖2所示。

圖1 不同權值混合高斯模型分布擬合圖

圖2 基于混合高斯分布擬合法的風電功率預測誤差區間估計結果
同樣地,基于得到的風電場功率數據,根據式(6)、式(7)、式(8)分別計算得到特征值ST、Pave和Pre,通過式(4)計算得到3個特征值與日平均絕對誤差E的相關性有:rST_E=0.516 9、rPave_E=0.785 0、rPre_ E=0.126 4。
可以看出,對于該風電場,當日風電功率波動ST和當日風功率幅值Pave與誤差的相關性較高。因此,以當日風電功率波動和當日風功率幅值兩個特征值作為線性回歸方程的自變量來建立如式(5)所示的風電功率預測誤差估計模型。
基于以上分析,利用Matlab軟件,計算得到風電功率預測誤差估計模型的線性回歸系數及其95%的置信區間,如表2所示。

表2 基于特征值提取的風電功率預測
根據表2和式(5),求得風電場2018年7月21日至2018年7月30日這10天的風電功率預測誤差估計區間,結果如圖3所示。

圖3 基于特征值提取的風電功率預測誤差區間估計結果
風電功率預測誤差估計區間是決定風電場儲能容量配置的關鍵。利用兩個指標對得到的誤差估計區間進行評估:區間覆蓋率RPICP和區間平均帶寬RPINAW,這兩個指標的數學表達式如式(9)[9,12]所示。
(9)
式中:N為樣本總數;kt為布爾量,當t時刻的誤差值位于誤差估計區間內,kt為1,否則為0;R為實際值的變化范圍;Ut(xt)為t時刻誤差估計區間的上限;Lt(xt)為t時刻誤差估計區間的下限。
可以看出,對于風電場儲能的容量配置,RPICP決定了容量配置的有效性,RPINAW決定了容量配置的經濟性。對于一個理想的誤差估計區間,RPICP越大,覆蓋率越高,儲能容量配置則越有效;RPINAW越小,區間精度越高,儲能容量配置則越經濟。根據前兩個小節的分析計算,兩種方法的誤差估計區間的RPICP和RPINAW如表3所示。

表3 兩種方法的誤差估計區間的指標結果
由表3可知,基于特征值提取法的風電功率預測區間估計的區間覆蓋率和基于混合高斯分布擬合方法的風電功率預測區間估計的區間覆蓋率分別為58.85%和92.08%,后者的區間覆蓋率遠高于前者。但是基于混合高斯分布擬合方法得到的估計區間的帶寬較大,為80.37%,因此根據該區間配置儲能容量的經濟性較差,而基于特征值提取法得到的估計區間的RPINAW則較小,為25.43%。
根據前面的分析可以看出,若根據混合高斯分布擬合得到的誤差估計區間進行風電場儲能容量配置,其有效性較高但經濟性較差;若根據特征值提取法得到的誤差估計區間進行儲能容量配置,其經濟性較好但有效性較低。為了解決上述問題,兼顧儲能容量配置時的有效性和經濟性,基于混合高斯模型,結合馬爾可夫模型,提出了一種MM-GMM優化預測誤差區間估計算法。
由于風本身固有的隨機性和波動性,風電功率預測誤差也具有較強的不確定性,風電功率預測通常只與相鄰時段有關,而與過去所處的狀態無關,因此,考慮在風電預測誤差區間估計中引入馬爾可夫模型。
若隨機過程具有“無后效性”,即在已知現在狀態的前提下,其未來的狀態與過去的狀態無關,則稱其為馬爾可夫過程[20-21]。
定義P為馬爾可夫過程的一步狀態轉移概率矩陣,Pij為狀態轉移矩陣P中由狀態Si一步轉移到狀態Sj的概率,根據其無后效性有[20-21]:
Pij(t)=P{S(t+1)=j|S(t)=i}
(10)
式中:S(t)=i表示t時刻的狀態為i;S(t+1)=j表示t+1時刻的狀態為j。
根據上述分析,結合第1節的混合高斯模型的求解過程,MM-GMM優化預測誤差區間估計算法的具體步驟如下:
1)利用EM算法求出樣本數據中每個時刻的功率預測誤差處于混合高斯分布中的具體分布及其均值和標準差;
2)根據計算得到的每個時刻誤差所處的分布狀態,計算馬爾可夫過程的一階狀態轉移矩陣PE;
3)根據最近時刻所處的狀態,利用計算得到的一階狀態轉移矩陣PE,預測未來一天各時刻誤差所處的分布狀態;
4)設置置信水平,計算預測狀態所處分布的對應置信區間即為該時刻的預測誤差估計區間。
對所提的優化算法進行算例驗證,同樣地,利用西北地區某風電場的數據樣本,采用所提的優化算法對2018年7月21日至2018年7月30日進行風電功率預測誤差估計。每個狀態采用95%的置信區間,得到的結果如圖4所示。

圖4 MM-GMM優化預測誤差區間估計算法的區間估計結果
根據如圖4所示的估計區間,計算該區間RPICP為71.56%,RPINAW為26.01%。3種方法的誤差估計區間指標結果的對比如表4所示。可以看出,與前兩種方法相比,所提的優化算法不僅有效性較高,且區間較窄,能夠為風電場的儲能容量配置提供有效的指導信息,經濟性較好。

表4 3種方法的誤差估計區間的指標結果
對混合高斯分布擬合法和特征值提取法這兩種典型的風電功率預測誤差估計算法進行的詳細研究表明:基于混合高斯分布擬合的誤差估計方法得到的誤差估計區間進行儲能容量配置的有效性高但經濟性較差;基于特征值提取的誤差估計方法得到的誤差估計區間進行儲能容量配置的經濟性好但有效性較低。
為了有效估計風電功率預測誤差,上面給出對于風電場儲能配置具有指導意義的預測誤差估計區間,在混合高斯模型的基礎上,對風電功率預測誤差進行狀態劃分,結合馬爾可夫模型,提出了一種MM-GMM優化誤差區間估計算法并進行了算例驗證。結果表明,基于所提的優化算法得到的估計區間不僅覆蓋率較高,而且帶寬較小,兼顧了風電場儲能容量配置時的有效性和經濟性,具有較好的綜合性能,能夠為改善風電功率預測誤差的儲能系統容量配置提供理論依據。