田 德, 張 琦
(廣東工業大學 自動化學院,廣東 廣州 510006)
基于優化核極限學習機的光伏出力短期預測
田 德, 張 琦
(廣東工業大學 自動化學院,廣東 廣州 510006)
光伏出力的精確預測有利于確保電力系統的可靠運行,減小投資者的利益風險??紤]到光伏出力的不確定性和非平穩性,首先采用自適應白噪聲的完整集合經驗模態分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)將原始光伏出力序列分解為一系列相關性較強、較平穩的子序列,再使用核極限學習機(Kernel Extreme Learning Machine,KELM)分別對每一子序列進行預測。由于KELM學習參數選取對其預測性能有較大影響,提出了基于改進蝙蝠算法(Improved Bat Algorithm, IBA)對KELM模型參數進行尋優。最后,將每一子序列預測結果通過求和相加獲取最終的預測值。實際算例表明,該IBA算法收斂速度快,全局搜索能力強,所提的CEEMDAN-IBA-KELM組合方法能有效提高光伏出力的預測精度。
光伏出力預測; 自適應白噪聲;集合經驗模態分解; 核極限學習機; 參數優化; 改進蝙蝠算法
綠色清潔能源特別是太陽能和風能是目前最具商業發展前景的發電方式之一,已受到了越來越多的重視。然而,隨著并網光伏發電技術的不斷發展,給電力系統的運行穩定性帶來了嚴峻的挑戰。因此,并網光伏出力的準確預測不僅能有效降低大規模光伏發電接入對電網的影響,提高電網對光伏的接納能力,而且太陽能資源的充分利用可以獲得較高的經濟效益和社會效益。
目前,光伏輸出功率預測方法主要集中于單一的人工智能預測方法,包括人工神經網絡、支持向量機等。但以上單一預測的方法均受到自身特性的限制,根據相似日原理選取預測樣本,建立徑向基神經網絡預測模型,雖然徑向基神經網絡優于一般的BP神經網絡,但其仍存在中心矢量和隱層節點數難以確定的問題[1-3]。文獻[4-5]根據光伏出力及其影響因素建立了基于支持向量機回歸預測模型,適合于多變的復雜天氣情況下光伏預測,但支持向量機模型參數選取對預測性能存在較大影響。組合預測方法結合了各單一預測方法的優勢,因此受到了越來越多的關注?,F階段,組合預測方法主要有:1)將各單一模型預測值根據某種權重關系篩選出最佳的權重組合系數,從而建立權重組合預測模型[6]。2)基于單一預測模型參數優化的組合方法,如文獻[7]采用遺傳算法對人工神經網絡的權值和閾值進行優化。3)基于信號分解技術的組合預測方法,其中,信號分解技術主要包括小波分解[8-9](Wavelet Decomposition,WD)、經驗模態分解[10](Empirical Mode Decomposition,EMD)和集合經驗模態分解[11](Ensemble Empirical Mode Decomposition,EEMD)等,即通過將原始數據信號分解為一系列子序列,對其分別采用人工智能算法進行預測并求和得到最終的預測結果。
考慮到光伏出力序列的波動性和隨機性特點,本文采用一種自適應白噪聲的完整集合經驗模態分解[12](Complete Ensemble Empirical Mode Decomposition with Adaptive Noise, CEEMDAN) 方法,通過在分解的各個階段添加自適應白噪聲,并根據計算剩余的余量信號以得到各個分量信號,該方法克服了傳統EMD方法模態混疊缺點以及EEMD分解低效率的問題,且可以有效降低光伏序列的非平穩性。基于此,提出一種基于CEEMDAN與IBA-KELM組合預測方法, 充分考慮了KELM模型參數選取對預測結果精度的影響[13],采用改進的蝙蝠算法對其參數進行優化。最后,以美國俄勒岡州某光伏電站數據為例,驗證了本文采用的CEEMDAN-IBA-KELM組合預測方法具有優良的預測精度。
光伏功率預測[14-16]是一個復雜的非線性問題,因此決定功率大小的因素有許多。實際工程中,光伏輸出功率可表示為[17]:
P=ηIsA[1-0.005(T+25)]
(1)
式中:η為光伏陣列的轉化效率;Is為輻照強度,(W/m2);A為陣列的總面積,(m2);T為大氣溫度,(℃)。
通常對既定的光伏電站其安裝角度及光伏陣列轉換效率已包含在歷史輸出功率數據中,因而無需考慮。因此,從上式可知光伏功率輸出受太陽輻照強度和環境溫度的影響。而實際中,除了這2個影響因素外,對于光伏出力預測還需考慮天氣類型、風速、季節等。
為分析太陽輻照、環境溫度和風速對光伏輸出功率的影響,以美國某光伏電站的歷史數據為例,隨機選取2015年某3天的歷史數據繪制光伏輸出功率與太陽輻照強度、溫度和風速的關系示意圖,如圖1~3所示。由圖可知,太陽輻照強度與光伏輸出功率曲線變化趨勢基本一致,耦合程度高,說明太陽輻照是影響光伏功率輸出最為主要的因素;圖2和圖3中溫度、風速均與光伏輸出功率呈現一定的相關性,且風速隨機性較強,對光伏輸出功率影響較弱。因此,本文將光伏輻照強度、溫度均作為IBA-KELM模型的輸入變量[18-19]。

圖1 光伏輸出功率與太陽輻照曲線圖

圖2 光伏輸出功率與溫度曲線圖

圖3 光伏輸出功率與風速曲線圖
圖4為2015年5~6月某3天的晴天、突變天氣、雨天3種主要天氣類型下的光伏輸出功率。從圖中可以看出,晴天的光伏輸出功率曲線相對平穩;而突變天氣、雨天的光伏功率曲線波動性、隨機性較強,這一情況不僅增加了光伏功率預測的難度,而且對光伏電站運行的安全穩定性造成影響[20]。因此,針對不同天氣類型數據分別進行預測尤為重要。

圖4 不同天氣類型下的光伏功率曲線
以晴天為例,選取春、夏、秋、冬四季下的光伏功率曲線如圖5所示。由圖可知,春季與夏季日照時間長,其光伏功率輸出值相對較大;秋季與冬季溫度低、日照時間相對較短,其光伏功率輸出值相對較小。因此,不同季節的光伏輸出功率對預測存在一定的影響。

圖5 不同季節下的光伏功率曲線
考慮到光伏輸出功率在不同天氣類型下差別較大,為準確選取與預測日最為相似的歷史功率輸出日以減小預測誤差,采用數據挖掘中應用較廣泛的K-means算法[21]。
假設原始光伏功率數據樣本為xi={x1,x2,…,xn},將樣本聚類為c類,其具體過程如下[22]:
(1)從原始樣本中隨機選取c個輸入樣本作為初始聚類中心,c即代表1.2節中3種不同天氣類型。
(2)以距離中心最近原則,計算樣本xi與kc間的歐氏距離,將該樣本分配至最鄰近聚類集合εk中。
(3)計算εk中各樣本的平均值,重新生成新的聚類中心。
(4)重復步驟(2)、(3),直至相鄰2次計算中的聚類中心不變時算法結束。

(2)
因此,根據CEEMDAN將原始u(t)信號分解為:
(3)
式中:i=1,2,…,K,K為模態分量的總數。
KELM算法[24]是依據傳統極限學習機(Extreme Learning Machine, ELM)的基礎而提出的。因傳統ELM的輸入層權值及隱層權值均隨機設定,其預測性能較差,因此,根據支持向量機的原理引入核函數,從而提出了KELM算法,其具體證明過程可參見文獻[25]。其中,KELM模型的輸出及其核函數公式為:
(4)
K(μ,ν)=exp(-(μ-ν2/g))
(5)
式中:C為懲罰系數;I為單位稀疏矩陣;核函數K(μ,ν)一般采用為RBF核;g為核系數。
該算法克服了傳統ELM在處理低維數據時線性不可分的缺點并提高了算法的學習速率和泛化能力。但KELM模型的預測性能仍受其學習參數的影響較大,所以本文采用全局搜索能力強的IBA進行參數優化。

fi=fmin+(fmax-fmin)·rand
(6)
(7)
(8)
(9)
式中:ωini、ωter分別為慣性系數的初始值和最終值;c為慣性權重相關系數;τ為當前迭代次數;τmax為最大迭代次數。
根據改進后的BA優化KELM的步驟描述如下:
1)設置IBA相關參數,主要包含:種群數目N,最大迭代次數τmax,最小頻率fmin、最大頻率fmax,最大音量A,最大脈沖率r,慣性系數的初始值ωini和最終值ωter;慣性權重相關系數c1。
2)隨機初始化蝙蝠位置xi,其由懲罰因子C和核參數g組成,并根據適應度函數f(xi)值尋找當前最優位置x*。
3)位置更新。根據公式(6)~(9)更新每一個體脈沖頻率、速度與位置。
4) 設定隨機數rand,若rand>r,則隨機產生新解。
克什米爾地區一直是印度和巴基斯坦的爭議地區,其歸屬權之爭由來已久,導致政局一直不穩定。20世紀中期的兩次印巴戰爭使得礦區無法勘探和開掘,本計劃于1990年實施的新礦區開發項目也因政治動亂而沒能進行。同時由于地理環境也比較特殊——平均海拔超過4000米,人類生存條件惡劣,常年處于低溫嚴寒狀態,適宜開采的時間每年僅2-3個月。加之山上基本設施匱乏,大型開采機械又無法運到山上,這些因素都造成克什米爾藍寶石開采成本巨大。以至于克什米爾矢車菊、皇家藍,很多人也只聞其名不見其物!