文 | 范曉旭,付果,張艷峰,楊錫運(yùn)
隨著環(huán)境問(wèn)題的日益突出,風(fēng)能作為一種綠色可再生能源已經(jīng)在世界各國(guó)得到廣泛應(yīng)用。但風(fēng)能的隨機(jī)性和不穩(wěn)定性導(dǎo)致風(fēng)電功率具有波動(dòng)性和間歇性的特點(diǎn),使得大規(guī)模風(fēng)電接入給電網(wǎng)安全穩(wěn)定運(yùn)行帶來(lái)一定挑戰(zhàn)。準(zhǔn)確有效的風(fēng)電功率預(yù)測(cè)有助于及時(shí)調(diào)整調(diào)度計(jì)劃,降低風(fēng)電并網(wǎng)風(fēng)險(xiǎn),減少系統(tǒng)備用容量,降低電力系統(tǒng)運(yùn)行成本。
目前,已有眾多國(guó)內(nèi)外學(xué)者對(duì)風(fēng)電功率預(yù)測(cè)做了大量研究工作,主要包括物理預(yù)測(cè)法和統(tǒng)計(jì)預(yù)測(cè)法。物理預(yù)測(cè)法利用數(shù)值天氣預(yù)報(bào)信息以及風(fēng)電機(jī)組附近的地貌等物理信息建立預(yù)測(cè)模型,計(jì)算過(guò)程較為繁瑣。統(tǒng)計(jì)預(yù)測(cè)法是指采用數(shù)學(xué)統(tǒng)計(jì)方法建立歷史數(shù)據(jù)與風(fēng)電功率之間的某種映射關(guān)系,以此來(lái)進(jìn)行風(fēng)電功率預(yù)測(cè),現(xiàn)有的統(tǒng)計(jì)預(yù)測(cè)法可分為時(shí)間序列法、人工智能法。常用的時(shí)間序列法有卡爾曼濾波法和自回歸滑動(dòng)平均(ARMA)法,此類預(yù)測(cè)方法運(yùn)算簡(jiǎn)單,但針對(duì)嚴(yán)重非平穩(wěn)性數(shù)據(jù)的適應(yīng)性較弱。人工智能法是指利用智能算法的自學(xué)習(xí)、自組織、自適應(yīng)能力實(shí)現(xiàn)預(yù)測(cè)。人工神經(jīng)網(wǎng)絡(luò)作為一種具有較強(qiáng)魯棒性與容錯(cuò)性的智能算法,在風(fēng)電功率預(yù)測(cè)領(lǐng)域得到了廣泛應(yīng)用。人工神經(jīng)網(wǎng)絡(luò)的泛化能力會(huì)受到網(wǎng)絡(luò)結(jié)構(gòu)(隱含層數(shù)、隱含層節(jié)點(diǎn)數(shù)、隱含層函數(shù))的影響,導(dǎo)致訓(xùn)練結(jié)果往往不穩(wěn)定且易產(chǎn)生過(guò)擬合現(xiàn)象,貝葉斯定理能有效克服模型過(guò)擬合問(wèn)題,貝葉斯神經(jīng)網(wǎng)絡(luò)BNN(Bayesian neural network,BNN)已在光伏陣列功率短期預(yù)測(cè)中獲得較好的應(yīng)用效果。此外,訓(xùn)練數(shù)據(jù)對(duì)于人工神經(jīng)網(wǎng)絡(luò)的泛化能力有關(guān)鍵影響。由于訓(xùn)練數(shù)據(jù)間存在較大的差異,通過(guò)聚類思想,對(duì)聚類后不同性質(zhì)的訓(xùn)練數(shù)據(jù)分別建立神經(jīng)網(wǎng)絡(luò)模型,能夠有效提高建模精度。
本文考慮到風(fēng)電功率數(shù)據(jù)存在的時(shí)空特性,采用模糊C均值聚類FCM(fuzzy c-means,F(xiàn)CM)來(lái)分析風(fēng)電功率數(shù)據(jù),針對(duì)經(jīng)FCM處理后的聚類數(shù)據(jù)分別建立適應(yīng)不同功率特性的貝葉斯神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型得到風(fēng)電功率預(yù)測(cè)值,并對(duì)風(fēng)電功率的預(yù)測(cè)誤差進(jìn)行分析,采用核密度估計(jì)法得出風(fēng)電功率可能波動(dòng)范圍等更多的預(yù)測(cè)結(jié)果。
聚類其實(shí)是將一個(gè)數(shù)據(jù)集遵從某種策略分為多個(gè)不同的類,達(dá)到這樣的效果:聚在同一類的樣本相似度盡可能高,沒(méi)有聚在一類的樣本相似度盡可能低。1969年,Ruspini首先提出了模糊聚類算法。1974年,Dunn在模糊聚類算法的基礎(chǔ)上提出了模糊C均值聚類算法,并得到廣泛應(yīng)用。隨后,Bezdek對(duì)這種算法進(jìn)行了推廣。
該算法的基本思想為對(duì)于一個(gè)樣本集X={x1,x2,x3,…,xn},其中,xi={xi1,xi2,xi3,…,xil},i=1,2,…,n(n 為待聚類數(shù)據(jù)維數(shù)),采取聚類算法的規(guī)則將其分為規(guī)定的c個(gè)子集,即Z={z1,z2,z3,…,zc},zk(k= 1,2,…,c)是c個(gè)子集的中心點(diǎn)。模糊聚類算法的目標(biāo)函數(shù)為:
m表示模糊指數(shù),其滿足,該值對(duì)模糊聚類算法的性能影響很大。dik為點(diǎn)xi到聚類中心zk的距離,這里選擇歐幾里得距離;uik為點(diǎn)xi到中心點(diǎn)zk的隸屬度,滿足。隸屬度矩陣為:
若要使目標(biāo)函數(shù)達(dá)到最小,則隸屬度函數(shù)與聚類中心點(diǎn)需要滿足以下條件:
該算法流程為:
(2)根據(jù)公式(3)計(jì)算出各數(shù)據(jù)到各中心點(diǎn)的隸屬度值uik,進(jìn)而得到隸屬度矩陣U。
(3)由公式(4)更新聚類中心點(diǎn)zk(k=1,2,…,c)。
(4)若|J(t+1)-J(t)|<ε或者t>T,則停止迭代,否則t=t+1,轉(zhuǎn)入流程(2)。
BP神經(jīng)網(wǎng)絡(luò)是一種多層網(wǎng)絡(luò)的誤差反向傳播算法。常見的BP神經(jīng)網(wǎng)絡(luò)一般有3層:輸入層、隱含層和輸出層。其算法包括正向傳播過(guò)程和反向傳播過(guò)程。
貝葉斯神經(jīng)網(wǎng)絡(luò)對(duì)BP神經(jīng)網(wǎng)絡(luò)的反向傳播過(guò)程進(jìn)行了改進(jìn),利用貝葉斯定理來(lái)計(jì)算BP神經(jīng)網(wǎng)絡(luò)的參數(shù),其能夠處理信息的不確定性,然后對(duì)數(shù)據(jù)信息進(jìn)行分析并作出推理,同時(shí)對(duì)部分未知的信息可以采用概率估計(jì)表達(dá),然后利用貝葉斯公式對(duì)已經(jīng)發(fā)生的概率進(jìn)行修正,最后再根據(jù)期望值和修正概率做出最優(yōu)決策。其基本思想是:
(1)根據(jù)歷史數(shù)據(jù)的已知信息對(duì)類條件概率密度參數(shù)進(jìn)行計(jì)算,得出其參數(shù)表達(dá)式和先驗(yàn)概率。
(2)利用貝葉斯公式把步驟(1)所得公式轉(zhuǎn)化成后驗(yàn)概率表達(dá)式。
(3)分析處理后驗(yàn)概率后作出判斷并進(jìn)行決策。
設(shè)D1,D2,…,Dn為樣本空間域S的一個(gè)劃分,P(Di)為一個(gè)樣本發(fā)生的概率,則對(duì)于任一事件x,P(x)>0有:
已知給定的歷史數(shù)據(jù)D,可以利用貝葉斯正則化算法通過(guò)最大化后驗(yàn)概率來(lái)估計(jì)未知參數(shù)。即:
為方便計(jì)算,對(duì)后驗(yàn)概率取對(duì)數(shù),得到:
假設(shè)其先驗(yàn)概率滿足高斯分布,即:
由此可得:
在對(duì)風(fēng)力進(jìn)行預(yù)測(cè)和誤差分析之后,使用非參數(shù)估計(jì)方法來(lái)建立風(fēng)力預(yù)測(cè)誤差分布模型。非參數(shù)估計(jì)方法可以在不考慮外部干擾因素的情況下對(duì)特定條件執(zhí)行統(tǒng)計(jì)分析,并且可以得到更好的結(jié)果。非參數(shù)核密度估計(jì)(nonparametric kernel density estimation,NKDE)方法是一種非參數(shù)估計(jì),它很好地描述了連續(xù)密度函數(shù)。該方法不會(huì)對(duì)數(shù)據(jù)分布添加任何假設(shè),只從數(shù)據(jù)本身的特征中研究其分布特征。
假設(shè)x1,x2,…,xn是由FCM-BNN模型輸出的預(yù)測(cè)值與其所對(duì)應(yīng)的風(fēng)電功率實(shí)際值相減后得到的預(yù)測(cè)誤差序列,則利用核密度估計(jì)此誤差序列的概率密度函數(shù)為:
式中,xi為給定的樣本;K(x,h)為核函數(shù);n為樣本總數(shù);h為帶寬。選擇高斯函數(shù)作為核函數(shù),其公式如下:
將公式(11)的核函數(shù)帶入公式(10)后的預(yù)測(cè)誤差概率密度函數(shù)可表示為:
該模型為雙層預(yù)測(cè)模型:內(nèi)層模型首先以模糊C均值聚類對(duì)風(fēng)電功率歷史數(shù)據(jù)進(jìn)行分類,然后用分類好的風(fēng)電數(shù)據(jù)來(lái)訓(xùn)練貝葉斯神經(jīng)網(wǎng)絡(luò)模型,得到各個(gè)訓(xùn)練好的貝葉斯神經(jīng)網(wǎng)絡(luò);外層模型將FCM-BNN模型輸出的預(yù)測(cè)功率與實(shí)際功率相減,得到功率預(yù)測(cè)誤差序列,再通過(guò)非參數(shù)核密度估計(jì)對(duì)功率預(yù)測(cè)誤差序列進(jìn)行擬合,得到誤差序列概率密度函數(shù),在預(yù)測(cè)誤差概率密度函數(shù)上選取滿足置信度要求的上下分位點(diǎn),結(jié)合FCM-BNN所得預(yù)測(cè)功率,從而得到預(yù)測(cè)功率區(qū)間,此區(qū)間即為最終得出的基于模糊C均值聚類的BNN-NKDE預(yù)測(cè)功率區(qū)間。
采用如圖1所示的模型結(jié)構(gòu)進(jìn)行預(yù)測(cè),具體步驟如下:
(1)對(duì)風(fēng)電數(shù)據(jù)進(jìn)行預(yù)處理,包括補(bǔ)全缺失數(shù)據(jù)、剔除壞點(diǎn)等。
(2)初始化BNN神經(jīng)網(wǎng)絡(luò)模型的參數(shù)以及模糊C均值聚類算法的模糊指數(shù)、閾值、迭代次數(shù)等參數(shù)。
(3)根據(jù)模糊C均值聚類算法的目標(biāo)函數(shù)公式(1),計(jì)算出每次迭代中的目標(biāo)函數(shù)的值,判斷是否滿足模糊C均值聚類算法迭代條件。
(4)達(dá)到終止條件后停止迭代,得到聚類中心C和隸屬度矩陣U。
(5)根據(jù)聚類中心C和隸屬度矩陣U對(duì)風(fēng)電數(shù)據(jù)進(jìn)行分類。
(6)將分類好的風(fēng)電數(shù)據(jù)帶入貝葉斯神經(jīng)網(wǎng)絡(luò)模型中,訓(xùn)練得到貝葉斯神經(jīng)網(wǎng)絡(luò)模型。
以西北某總裝機(jī)容量為199.5MW的風(fēng)電場(chǎng)為例,取該風(fēng)電場(chǎng)的標(biāo)桿機(jī)組2014年8月6日到2014年9月23日的風(fēng)電數(shù)據(jù),時(shí)間分辨率為15min,將2014年8月6日到2014年9月6日的數(shù)據(jù)作為訓(xùn)練集,利用2014年9月7日到2014年9月23日的數(shù)據(jù)對(duì)本文模型進(jìn)行測(cè)試。
選取實(shí)際風(fēng)速、預(yù)測(cè)風(fēng)速、實(shí)際功率作為模糊C均值聚類的聚類中心,即z={z1,z2,z3},劃定樣本子集c=4,根據(jù)公式(2)計(jì)算隸屬度矩陣值,并根據(jù)圖1中的FCM算法流程得出聚類結(jié)果(如圖2和圖3所示,藍(lán)、紅、黑和黃分別代表某一分類結(jié)果)。
把經(jīng)過(guò)模糊C均值聚類分析后的分類風(fēng)電數(shù)據(jù)分別作為訓(xùn)練數(shù)據(jù)帶入貝葉斯神經(jīng)網(wǎng)絡(luò),建立不同的貝葉斯神經(jīng)網(wǎng)絡(luò)模型。把預(yù)測(cè)風(fēng)速Vt+1和Pt(t時(shí)刻功率)作為貝葉斯神經(jīng)網(wǎng)絡(luò)的輸入,待預(yù)測(cè)時(shí)刻的功率Pt+1作為貝葉斯神經(jīng)網(wǎng)絡(luò)的輸出,帶入測(cè)試數(shù)據(jù)對(duì)BNN模型和FCM-BNN模型進(jìn)行檢驗(yàn),其預(yù)測(cè)結(jié)果如圖4所示。
表1顯示了在相同數(shù)據(jù)下FCM-BNN模型和BNN模型

表1 不同點(diǎn)預(yù)測(cè)方法的誤差指標(biāo)
圖4 BNN模型和FCM-BNN模型預(yù)測(cè)結(jié)果所得預(yù)測(cè)風(fēng)電功率的平均絕對(duì)誤差eMAE、均方根誤差eRMSE。從誤差指標(biāo)對(duì)比來(lái)看,F(xiàn)CM-BNN方法的預(yù)測(cè)精度高于BNN神經(jīng)網(wǎng)絡(luò)法。
結(jié)合圖4分析可知,由于在FCM-BNN神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中對(duì)數(shù)據(jù)進(jìn)行了分類,使其通過(guò)每個(gè)分類數(shù)據(jù)所建立的BNN模型更加貼近實(shí)際情況,預(yù)測(cè)功率的誤差更小,預(yù)測(cè)曲線也能更加貼合實(shí)際功率曲線的變化情況。
通過(guò)上述步驟,將FCM-BNN所得出的點(diǎn)預(yù)測(cè)功率與實(shí)際功率值相減,得到預(yù)測(cè)誤差序列,通過(guò)非參數(shù)核密度估計(jì)該誤差序列的概率密度曲線,如圖5所示。由圖可知,采用非參數(shù)核密度估計(jì)風(fēng)功率預(yù)測(cè)誤差所得的概率密度曲線并非呈現(xiàn)出特定的分布曲線,如正態(tài)分布等,因此,其相對(duì)于參數(shù)法能夠更好擬合預(yù)測(cè)誤差的實(shí)際概率特性,具有更高的建模精度。
為了驗(yàn)證基于FCM-BNN-NKDE區(qū)間預(yù)測(cè)模型的有效性和普適性,將本文提出方法與利用正態(tài)分布擬合預(yù)測(cè)誤差的概率分布得出的預(yù)測(cè)區(qū)間進(jìn)行對(duì)比,分別在80%和90%置信度下進(jìn)行功率預(yù)測(cè),結(jié)果如圖6和圖7所示。
表2顯示了利用核密度估計(jì)法和正態(tài)分布預(yù)測(cè)風(fēng)電功率區(qū)間的覆蓋率和平均帶寬。由表可知,在80%和90%置信度、核密度估計(jì)法和正態(tài)分布得出的預(yù)測(cè)區(qū)間的區(qū)間覆蓋率相接近的前提下,核密度估計(jì)法的區(qū)間平均帶寬指標(biāo)比正態(tài)分布分別降低54.58和23.38,說(shuō)明核密度估計(jì)法得出的預(yù)測(cè)區(qū)間更加準(zhǔn)確。從圖6和圖7可以看出,采用核密度估計(jì)法所得的預(yù)測(cè)區(qū)間能夠在滿足置信度的前提下更準(zhǔn)確地包含實(shí)際功率,同時(shí)隨著置信水平的提高,預(yù)測(cè)區(qū)間的范圍也相應(yīng)變寬,這也與理論相符合。
本文考慮到風(fēng)電在不同功率段下的特性差異,提出了基于聚類分析的貝葉斯神經(jīng)網(wǎng)絡(luò)和核密度估計(jì)相結(jié)合的風(fēng)電功率區(qū)間預(yù)測(cè)模型。仿真算例表明本文提出的經(jīng)過(guò)聚類分析的點(diǎn)預(yù)測(cè)方法優(yōu)于未經(jīng)過(guò)聚類分析的預(yù)測(cè)方法,針對(duì)聚類后的風(fēng)電數(shù)據(jù),貝葉斯神經(jīng)網(wǎng)絡(luò)具有更好的泛化能力,從而使得預(yù)測(cè)精度更高。同時(shí),本文中應(yīng)用核密度估計(jì)法得出風(fēng)電預(yù)測(cè)區(qū)間的準(zhǔn)確性明顯高于正態(tài)分布法得出的預(yù)測(cè)區(qū)間,說(shuō)明核密度估計(jì)出的預(yù)測(cè)誤差概率分布更加符合真實(shí)情況,從而使得預(yù)測(cè)區(qū)間更好地包含了實(shí)際功率曲線。