摘 要:大量風電并入電網將導致風力發電的不穩定增加,甚至可能造成電網崩潰。因此風電功率的精確預測對合理制定發電計劃、保證電力系統穩定運行有著重要意義。本文提出了基于風電功率和基于風速及風電功率的混合殘差預測模型,并借助BP、LSSVM及OPELM模型檢驗混合模型的預測精度。采用承德市風電站的實際功率序列進行預測性能檢驗。實驗結果證實了本文所提出模型的可行性和有效性。
關鍵詞:殘差修正 優化極端學習 最小二乘法 風功率預測
隨著常規能源的日益枯竭以及環境問題的日益突出,風能的開發利用受到了世界各國的廣泛關注。這些年來我國也在大力發展風能,2010年我國已以45GW的風電總裝機容量成為世界上風電裝機容量第一的國家; 預計到2020年, 全國風電總裝機容量將達到300GW。
風功率作為風能資源評估過程中的關鍵指標,它的準確預測有利于解決風電輸出功率難以控制、含新能源的電網安全經濟的調度工作以及開放電力市場環境下的風電競價交易等問題。由于風力發電具有波動性、間歇性及隨機性等特點,預測風電功率時需要考慮眾多不確定因素的影響。在眾多影響因素中,風速影響最大。如果可以比較準確地預測風速以及風功率,就能夠有效減輕風電對整個電網的不利影響,提高風的利用率。對此,國內外專家學者進行了深入地探索并提出了多種預測方法。
按照預測機制來劃分,風電功率預測方法可分為全局預測法和局部預測法。全局預測法是指利用預測前的歷史數據對模型進行訓練擬合,從而得到預測結果;局部預測法則是先對當前數據進行預處理,然后依據當前數據所呈現的狀態,從歷史數據中尋找相近的點來進行擬合預測。按照預測模型來分,風電功率預測模型又可以劃分為物理預測模型、統計預測模型、人工智能預測模型和組合預測模型。由于傳統的神經網絡由于其本身算法的缺陷,經常會遇到收斂速度慢、易陷入局部最優解等問題,最小二乘支持向量機(LSSVM)和極端學習機(ELM)是目前應用在風功率預測領域的新型智能算法,能很好的避免傳統算法收斂速度慢等缺陷。
文獻[4]主要介紹了支持向量機 (SVM)算法的一些缺陷,并在此基礎上引出了最小二乘支持向量(LSSVM)的概念。最小二乘支持向量機(LSSVM)是一種基于結構風險最小化原理的機器學習技術,具有較好的泛化性能和較高的精度,相比于傳統的SVM方法,最小二乘支持向量機采用了不同的損失函數, 用等式約束代替了不等式約束,使問題得到了簡化, 明顯提高了運行效率。
文獻[5]所介紹的極端學習機(ELM)是一種比較新穎的單隱層前饋神經網絡,極端學習機將傳統的神經網絡參數的訓練的迭代調整成為線性方程組的求解,根據Moore-Penrose 廣義逆矩陣理論,求解出具有最小范數的最小二乘解為網絡權值,網絡的訓練過程可一次完成,不需要多次迭代。相比于傳統的神經網絡算法需要經過多次迭代調整才可以得到最終的網絡權值,極端學習機的訓練速度有著顯著的提高。
文獻[6]對常用風功率的預測方法進行了簡述,指出傳統的預測方法要么預測結果偏差太大,要么就是存在維數災難或局部極值等方面的問題。此文從常用的風功率預測方法出發,把支持向量機(SVM)回歸預測應用到了風功率預測,建立了相應的數學模型,并對多種核函數的選擇方法進行了分析。支持向量機在處理非線性問題時,首先將非線性問題轉化為高維空間中的線性問題,然后用一個核函數來代替高維空間中的內積運算,從而巧妙地解決了復雜計算問題,并且有效地克服了維數災難以及局部極小問題。但是SVM模型對于缺失數據十分敏感,并且對于不同的非線性問題沒有通用的解決方案。
文獻[7]根據風電的隨機性強的特點和BP網絡預測精度低的特點,提出了基于小波分解和多模型極限學習機的風電功率預測模型。此模型首先通過小波分解將風電功率時間序列分解為不同頻段的子序列,然后再用多模型極限學習機分別對子序列建立模型,對于每一個子序列再利用設定的掛起準則將子序列的模型分為兩個部分;對于誤差大的子序列模型更新模型。
本文給出了基于LSSVM、OPELM方法的新型混合預測模型,通過結合兩種殘差預測方法,對承德市風力發電數據進行了預測,數據采集辨識度為15min。之后,建立了BP、OPELM和LSSVM模型檢驗混合模型的預測精度。
一、預測基本模型
1.極端學習機。Huang等人提出了一種名為極端學習機的算法,該算法基于單隱藏層的神經網絡結構,并在參數優化方面提出了創新。首先,ELM方法隨機初始化了網絡隱藏層權值和閾值;接著通過訓練數據,建立相應的輸入輸出方程;最后借助于Moore-Penrose廣義逆矩陣理論來求得輸出層權值。
考慮一個具有 N 個樣本的集合,設單隱藏層網絡擁有m個隱藏層神經元,記為輸出層閾值向量, f為隱藏層函數, 為輸入權重,輸入層閾值向量。則單隱藏層網絡可構建如下的輸入輸出方程:
(1)
記
(2)
則該方程可寫成矩陣的形式 HB=Y。 之后,極端學習機可以借助廣義逆矩陣理論求得相應的權值向量B。
由上述計算可以見得,由于該模型主要依賴于求解線性方程組的理論,相比于傳統的誤差反向傳播算法,極端學習機模型可以成倍地減少運行時間。同時,注意到ELM模型的準確度很大程度上依賴于權值向量W的選取,因此如果當W的選取不當,矩陣B有可能會變得奇異, 從而使得模型精度大幅度降低。因此,修剪多余的隱藏層神經元是一個值得關注的問題。
2.優化極端學習機。為了達到修剪多余神經元的目的, OPELM模型首先利用多稀疏響應回歸 (MRSR)算法對隱藏層神經元的重要度進行了排序。之后,借助留一法(LOO)對排序后的模型進行篩選,為了簡化運算,我們采用了PRESS準則作為篩選指標:
(3)
其中H為隱藏層權值,D為對角矩陣,其對角元素定義如下:
(4)
3.最小二乘支持向量機。最小支持向量機(LSSVM)是對支持向量機的改進算法,相比于SVM, 該算法擁有更快的計算速度,因此可以用于解決分類、回歸等問題,并具有良好的泛化能力。
其算法描述如下:
記l個訓練樣本,其中代表輸入值,代表輸出值;
將樣本從映射到特征空間中,則估計函數為
(5)
式中: 為加權向量;b 為常值。
根據結構風險最小化原則,求、b 的估計值,有
(6)
約束條件由SVM 中的不等式改為等式約束為
(7)
式中:為懲罰系數,控制對超出誤差樣本的懲罰程度;為估計誤差。
引入拉格朗日乘子,求解該問題,則有
(8)
其中,為拉格朗日乘子。
通過拉格朗日乘數法,可得下述方程:
(9)
消去與,則有
(10)
為解決高維計算問題,利用核函數代替內積計算,則式(10)可轉化為
(11)
LSSVM具有非常多的核函數,其中RBF以及多項式函數被研究者廣泛的采用。在論文中,我們采用了RBF核函數,并且,LSSVM的主要參數(正則參數c及)通過粒子群算法確定。粒子群算法參數參考文獻[16],其中c的變化范圍在10-8 到106之間,的變化范圍在10-8 到106之間,其余粒子群的參數參表1。
二、殘差預測方法
1.基于風功率序列的殘差預測模型。已知風功率序列為,首先以風功率為輸入、風功率為輸出建立Network1,通過對網絡訓練并預測得預測值
計算相應殘差值:
(12)
之后,對于所獲得的相對殘差序列,再以殘差為輸入、殘差為輸出建立Network2進行建模訓練。
2.基于風功率及風速序列的殘差預測模型。設風速序列為 ,風功率序列為,首先以風速為輸入、風速為輸出值建立Network1,可得相應預測值; 接著,以風速為輸入,風功率為輸出建立Network2,可得相應預測值;通過對網絡二的預測結果與真實值做差來獲得相對殘差序列;最后以殘差為輸入、殘差為輸出建立Network3。
三、實例分析
本文選取河北省電網內若干典型風電場的全維數據進行特性分析,以承德市2013年1月至2014年11月風電站數據為例分析模型的預測性能,數據采集辨識度為15min。在數據采集過程中,部分缺失數據用NAN表示。我們選用了平均絕對誤差(MAE)和相對均方根誤差(rRMSE) 作為模型評價依據。其計算公式分別為:
(13)
(14)
模型建立流程參圖1。
1.異常數據處理。由于技術局限性,風電場站點中存在部分異常數據。圖2顯示了某站點風速及風功率數據分布圖。其中,X軸為風速數據,Y軸為風功率數據,有圖中可以明顯看出,當風速接近為0,有部分風功率數據不為0,這明顯與實際不符(當風速小于電場的啟動風速時,電場實際不發電);此外,部分風功率數據在風速較小時超過了該站點的裝機容量,這在實際使用過程中也并不正常。如果不對異常數據進行檢測和剔除,將使得樣本的質量下降,神經網絡的學習受到影響,進而將會導致實驗精度的降低。
此外,通過數據統計發現,部分站點中NAN數據過多,從表2可以看出,站點NAN數據比例在10%-30%之間,缺失數據嚴重的站點可到達40%,這導致數據之間不連貫,數據的規律程度降低。
為此,本文提出了一種切實有效的解決方案:
1.1建立合理的異常值評價措施:(1)對于X正半軸及Y正半軸上的數據進行檢測,異常數據標記為NAN;(2)對于取值為負的點,標記為NAN;(3)對于明顯超過裝機容量的數據,標記為NAN。
1.2如果相鄰四個點均為NAN,則從原始數據中剔除此四個NAN值,如果說不全為NAN, 則對該四個點中非NAN的數據進行加權平均,作為該小時的代表值。
2.對比模型。為了增強實驗的科學性和合理性,我們采用了BP、PSO-LSSVM和OPELM作為對比模型。其中, BP隱藏層設置為兩層,隱藏層神經元個數通過經驗公式給出。LSSVM正則化參數由PSO算法計算得出,算法參數參表1。
3.實驗結果分析。表3到表6記錄了承德市某四個風能發電場詳細預測結果,表格7記錄了四個站點相對均方根誤差。相對均方根誤差是風力發電站最重要的考核指標之一,因此下文我們主要以此作為模型評價依據。
根據風力發電系統的需求,風電場功率預測系統提供的實時預測相對均方根誤差不超過15%。全天預測結果的相對均方根誤差應小于20%。
由表7可以看出,我們所提出來的混合殘差模型在短周期預測中顯現出良好的精度,均可以達到風力發電要求。在所有的混合殘差預測模型中,OPELM+LSSVM表現最優,其rRMSE在1步預測時可以保持在1%以下,1至8步平均相對誤差為14.135%,較原始模型有很好的改進。此外,我們可以看到,基于風功率的混合殘差模型結果略優于基于風功率與風速的混合殘差預測模型,盡管前者利用到了更多的樣本信息,但由于風電場數據采集的錯誤,部分情況下記錄下來的風速數據也并不完全準確,因此基于風速及風功率的殘差預測模型在使用過程中,可能會出現誤差放大的情況,此預測結果也是合理的。
圖3分別記錄了提前2步、4步、6步及8步預測結果。其中,灰帶線代表了當前真實功率上下振幅20%的數值范圍。為了增強對比性,圖中僅記錄了對比模型及兩種不同殘差預測方法中預測性能最優的兩個模型,由該圖可以看出,混合殘差模型可以很好地跟上風功率的變動,預測值基本落于灰帶之間,符合實際發電的需求。
圖4 a,c和d記錄了在三個站點預測中平均均方根誤差,b記載了各模型達到最小mRMSE誤差的頻率。由圖可很明顯地看到,混合殘差模型的均方根誤差小于對比模型,兩種不同的殘差預測方法在不同的站點中分別達到了誤差最小值;兩種殘差預測方法相比于原始模型有更高的頻率達到五個模型中的預測最佳值,兩種方法之間并沒有明顯的優劣之分。因此,在實際使用中本文認為OP+OP+OPLEM或LS+OPELM都具有比較好的預測性能。
四、結語
電能的生產和消耗是同時進行的。準確的風功率預測模型,有利于合理的進行電力系統的規劃發展,幫助相關人員合理安排和修訂運行計劃。這對提高風力發電系統的穩定性、提高發電的經濟效益都有著重要意義。本文提出了OP+OP+OPELM 及LS+OPELM 兩種不同的混合殘差預測模型,此模型較適用于風電場短期預測情形,應用承德市風電場的數據顯示,與BP、LSSVM及OPELM 模型相比,新模型具有優越的預測精度及良好的穩定性,適用于風功率短期預測。因此,新型混合模型的提出具有一定的實用性。
參考文獻:
[1]廖輝英, 鄭世才, 全成文. 基于人工神經網絡和粒子群算法的風能預測模型[J]. 微計算機信息, 2012, 10期(10):148-149.
[2]王穎, 魏云軍. 風電場風速及風功率預測方法研究綜述[J]. 陜西電力, 2012, 39(11):18-21.
[3]郭創新, 王揚, 沈勇,等. 風電場短期風速的多變量局域預測法[J]. 中國電機工程學報, 2012, 32(1):24-31.
[4]馮學軍. 最小二乘支持向量機的研究與應用[J]. 安慶師范學院學報:自然科學版, 2009, 15(1):112-113.
[5]張弦, 王宏力. 具有選擇與遺忘機制的極端學習機在時間序列預測中的應用[J]. 物理學報, 2011, 60(08): 4-4.
[6]戚雙斌, 王維慶, 張新燕. 基于SVM的風速風功率預測模型[J]. 可再生能源, 2010, 04期(04):25-28.
[7]黃庭, 王昕, 李立學,等. 基于小波-極限學習機的短期風電功率預測[J]. 控制工程, 2012, S1期.
[8]Guang-Bin Huang, Qin-Yu Zhu, and Chee-Kheong Siew. Extreme Learning Machine: A New Learning Scheme of Feedforward Neural Networks, in Proceedings of International Joint Conference on Neural Networks (IJCNN2004):25-29.
[9]Rao, C. Radhakrishna, Mitra, Sujit Kumar. Generalized inverse of a matrix and its applications. Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability 1972; 1:601-620.
[10]Timo Simil¨a and Jarkko Tikka. Multiresponse sparse regression with application multidimensional scaling. Artificial neural networks: formal models and their applications 2005; 3697:97–102.
[11]Bradley Efron, Trevor Hastie, Iain Johnstone and Robert Tibshirani. Least angle regression. Annals of Statistics 2011; 32:407-499.
[12]G.C. Tiao, R.S. Tsay. Some advances in non-linear and adaptive modelling in time-series. Journal of Forecasting 1994; 13 (2):109–131.
[13]傅美平,馬紅偉,毛建容. 基于相似日和最小二乘支持向量機的光伏發電短期預測 [J].電力系統保護與控制,2012:65-69.
[14]S.Z. Chamkalani, R. Chamkalani, A. Lohi, A. Elkamel, I. Chatzis Utilization of support vector machine to calculate gas compressibility factor, Fluid Phase Equilib, 358 (2013) 189–202.
[15]J.V. J.A.K. Suykens, Least squares support vector machine classifiers, Neural Process. Lett., 9 (1999) 293-300.
[16]A.Chamkalani, S. Zendehboudi, A. Bahadori, R. Kharrat, R. Chamkalani, L. James, I. Chatzis, Integration of LSSVM technique with PSO to determine asphaltene deposition, J Petrol Sci Eng, 124 (2014) 243-253.