徐蓓蓓 章正國 鄭新龍 何旭濤 敬 強
(浙江省電力公司舟山電力局,浙江 舟山 316000)
目前,國內外對于風力發電各種課題的研究越來越深入,但其中關于風電場風速和功率預測的研究還達不到令人滿意的程度[1-2]。準確預測風速可以減少電力系統運行成本,對于電網調度和資源配置有重要意義[3]。短期風速的預測核心是根據預測對象的歷史數據選擇適當的數學算法,建立相應的模型推導出其發展規律。目前,風速預測的方法主要有持續預測法、卡爾曼濾波法(Kalman filters)[3]、隨機時間序列法(ARMA)[4-5]、人工神經網絡法(ANN)[6-7]、模糊邏輯法(Fuzzy Logic)[8]、空間相關性法等(Spatial Correlation)[8]。人工神經網絡法曾一度成為預測領域的研究熱點,但也存在著許多至今無法解決的問題。支持向量機是一種基于結構風險最小化原理的預測模型,其泛化能力要好于神經網絡和自回歸模型,近些年來也被一些專家學者用于風速預測[8]。
LS-SVM(Least Square Support Vector Machine)被稱為最小二乘支持向量機,是在支持向量機的基礎上發展起來的,是支持向量機的一種延伸,是在二次損失函數下支持向量機的一種形式。最小二乘支持向量機只對線性方程進行求解,并且求解速非常迅速,在函數估計以及逼近中的應用非常廣泛[9]。
算法的具體過程見文獻[10-12],最后得到的用于函數回歸估計的最小二乘支持向量機為

式中,K(xi,xj)稱為核函數,K(xi,xj)=φ(xi)?φ(xj),即等于2個向量xi和xj在其特征空間φ(xi)和φ(xj)的內積。
對于給定的風速時間序列{X(t),t=1,2,…,n},最小二乘支持向量機在選擇輸入輸出變量前需對數據序列進行相空間重構,即將時間序列組轉化為矩陣來尋找數據間的關系。假設t時刻的風速X(t)可由(t-1,t-2,…,t-m)時刻的歷史風速值X(t-1),X(t-2),…,X(t-m)進行預測,則預測模型可表示為

式中,m為嵌入維數。m的確定采用以均方根誤差最小化為原則的增長法。
由式(2)可以構造出一個多輸入單輸出的最小二乘支持向量機預測模型。根據以上方法建立最小二乘支持向量機模型訓練樣本的輸入和輸出矩陣。采用LS-SVMlab工具箱編程,用數據滾動的方法對模型進行訓練和預測,即將當下預測的風速數據值視為已知數據滾入訓練樣本集,于此同時將距離目前時間最遠的數據刪除,并重新對網絡進行訓練,對下一個小時的風速數據進行預測,以此類推,直到完成全部的風速預測。文獻[8]和[11]將最小二乘支持向量機的風速預測結果分別與常規支持向量機模型、BP神經網絡模型以及Elma神經網絡模型的風速預測結果進行比較表明,LS-SVM 不僅在預測精度上要高于其他模型,且在模型訓練和收斂速度上較其他模型要快。
基于最小二乘支持向量機是以歷史數據作為訓練樣本來預測未來時間的風速,因此對于訓練樣本的輸入直接影響著預測的精度,輸入變量的選擇成為了風速預測數據預處理的關鍵。考慮風速相關性是目前常用的選擇輸入變量的方法。文獻[8]將與風速相關的溫度、氣壓也作為輸入變量,對 LS-SVM模型進行訓練,而文獻[12]提出了一種利用灰色關聯分析法篩選出與預測日特征相似的風速數據歷史樣本作為LS-SVM模型的訓練樣本,提高了預測結果的可信度和精確度。
對于最小二乘支持向量機來說,核函數是直接影響支持向量機性能的主要元素。所有數據間的經驗知識和依賴關系都需要經過核函數的攜帶和度量。常用的核函數有多項式核函數、(RBF)徑向基核函數和Sigmoid核函數[13]。目前,對于核函數的選擇沒有一定的定論,文獻中應用最廣泛的是能直接反映兩參數距離的徑向基核函數(RBF),但它也存在著對樣本各個屬性的重要性區分不夠以及局部泛化風險等問題[14],因此,對核函數參數選擇的優化算法被大量運用到優化LS-SVM的風速預測中。
1)優化參數選擇的算法
在確定好核函數后,LS-SVM 需要選擇的只有超參數γ和核參數σ2。目前對于這兩個參數的選擇沒有有效的結構性方法,主要采用的方法有:窮舉法、交叉驗證法、梯度下降法、網格搜索算法等[14]。文獻[9, 11-12]等均采用的是交叉驗證法,文獻[4]采用的是網格搜索結合交叉驗證的方法。從本質上來說,LS-SVM 模型參數的選擇問題可以歸結為一個優化搜索的問題,近期得到較多應用的主要有如下幾種優化方法。
(1)粒子群(PSO)算法
粒子群優化算法(PSO)是一種基于種群的隨機優化法,其具有簡單、快速、易實現等優點,并且對優化的目標函數解空間中的較多區域可進行同時搜索,可以很好的解決 LS-SVM 的參數選擇問題[15]。文獻[15-16]將PSO算法與LS-SVM結合對風速進行預測,其模型預測精度要高于LS-SVM模型與SVM模型。但是粒子群算法存在著易于陷入局部最優點的缺陷,目前提出的各種改進方法如基于平均粒距的自適應粒子群優化算法(ASPO),基于物種概念的動態多種群粒子群優化算法(DMPSO)[17]已經在電力系統負荷預測中得到應用。
(2)遺傳算法
遺傳算法是一種建立在自然選擇和基因遺傳學原理基礎上的優化搜索技術。與傳統算法相比,遺傳算法GA(Genetic Algorithm)能使種群達到全局最優收斂,不需要先驗知識,并且對初始參數選取也沒有很高的要求,所以不會像傳統的優化算法一樣陷入局部極小點[18]。因此引入遺傳算法對最小二乘支持向量機模型參數進行優化選擇(GA-LSSVM),得到了較優化前較好的預測結果[19]。
(3)蟻群優化算法
蟻群優化算法是一種應用范圍廣泛的新型優化算法,能實現參數優化和智能搜索等,其原理是根據螞蟻尋找最短路徑所采用的信息反饋機制進行計算的[20]。文獻[20]用蟻群算法來優化選擇 LS-SVM的參數,得到了小于10%的平均相對誤差,驗證了蟻群算法對LS-SVM參數選擇的有效性。
2)風速時間序列優化算法
在風速預測中,由于風速的隨機性較大,為非平穩性時間序列,而風速的這種特性會對利用預測模型進行風速預測的結果產生較大的影響,因此需對原始風速數據進行平穩化處理。
(1)文獻[9]和[20]采用一次差分的方法對風速時間序列進行平穩化處理。
(2)小波分解法
小波變換是一種基于多尺度信號分析的自適應的時頻局部化方法,是分析非平穩信號的有力工具。通過對小波基的伸縮和平移,可以在保留信號時域特征和頻域特征的同時實現信號的時頻分析局部化[21]。利用小波分解對風速進行預測主要可分為以下三步驟:首先確定小波基,并根據選定的小波基將風速時間序列分解成相應的低頻序列和高平序列;然后對分解后的低頻序列和高頻序列建立相應的LS-SVM預測模型進行預測;最后,將各分量的預測結果進行疊加[22-23]。
(3)EMD分解法
經驗模式分解法從本質上講,是對時間序列進行平穩化處理,其結果是將信號中不同尺度的波動或趨勢逐級分解開來,產生一系列具有不同特征尺度的數據序列,每一個序列稱為一個本征模式函數(Intrinsic Mode Function, IMF),最低頻率的IMF分量通常情況下代表原始信號的趨勢或均值[23-24]。將EMD與LS-SVM做結合,對風電場風速進行預測,其模型預測步驟主要可分為3步:首先將風速時間序列進行經驗模式分解,將非平穩性時間序列分解成不同頻帶的高頻和低頻平穩時間序列;然后建立相應的高頻和低頻時間序列 LS-SVM 預測模型;最后將不同頻帶預測值疊加得到最終預測結果[24]。文獻[24]采用EMD分解結合遞推LS-SVM,應用歷史年份的小時平均風速數據,對下一年度逐月的風速進行預測,其平均誤差為16.25%,驗證了此方法在長期風速預測中的有效性。
與傳統最小二乘支持向量機算法相比,增量式模糊最小二乘支持向量機算法更高,速度更快,并具有遞推式的特點,更有利于實際應用。文獻[25]將增量式模糊最小二乘支持向量機用于短期風速的預測,其預測結果要好與標準LS-SVM。
文獻[26]提出了一種新型的變權組合模型,將BP神經網絡、RBF神經網絡、粒子群神BP神經網絡的預測值作為LS-SVM組合預測模型的訓練輸入樣本,實際值作為訓練輸出樣本,建立基于LS-SVM的組合預測模型。
由于經驗模式分解法在非平穩數據處理以及遺傳算法在最小二乘支持向量機參數選擇上的突出優勢,本文提出將EMD與GA-LSSVM三種算法相結合,對風電場風速進行預測,其模型預測步驟如下:
1)將風速時間序列進行經驗模式分解,使非平穩性風速時間序列分解成不同頻帶的高頻和低頻的平穩時間序列。
2)建立相應的高頻和低頻時間序列 GALSSVM預測模型。
3)將不同頻帶預測值等權求和集成得到最終預測結果。
本文較全面的總結了LS-SVM在短期風速預測中的應用概況,最后對基于LS-SVM在短期風速預測中所需注意的關鍵問題做出總結,并提出以下建議:
1)歷史風速數據的修正。
風速的歷史數據將直接影響預測的精度,因此在建立樣本集前應采用數學方法來修正歷史數據中的不良數據,而對其進行較現在的方法的更有效處理需要進一步的探討。
2)輸入向量和訓練集的選取。
風速變化時刻受外界因素的影響,為能較全面的考慮各種因素對風速的影響,應將氣象、溫度等因素同時作為輸入向量,并充分利用短期風速的特性進行選擇。而對于訓練集來說,對訓練樣本集得大小及冗余度并沒有一種明確的選取機制,大多是根據經驗離線的進行選擇。
3)LS-SVM核函數的最優選擇。
如何能利用合適的算法針對風速預測問題選擇LS-SVM 的核函數和參數,是一直都有待于解決的問題,盡管目前已有遺傳算法、蟻群算法、粒子群算法的運用,但各種算法都有其適用的范圍和實際應用狀況,應當更進一步的尋找出更適合的核函數和參數。
[1] 王曉蘭,李輝.風電場輸出功率年度預測中有效風速預測研究[J].中國電機工程學報, 2010, 30(8):117-122.
[2] 丁明,張立軍,吳義純.基于時間序列分析的風電場風速預測模型[J].電力系統自動化設備, 2005, 25(8):32-34.
[3] 楊秀媛,肖洋,陳樹勇.風電場風速和發電功率預測研究[J].中國電機工程學報, 2005, 25(11): 1-5.
[4] 陳樹勇,戴慧珠,白曉民,等.風電場的發電可靠性模型及其應用[J].中國電機工程學報, 2000, 20(3): 26-29.
[5] 楊錫運,孫翰墨.基于時間序列模型的風電場風速預測研究[J].動力工程學報, 2011, 31(3): 203-20.
[6] 范高鋒,王偉勝,劉純.基于人工神經網絡的風電功率短期預測系統[J].電網技術, 2008, 32(22): 72-76.
[7] 楊剛,陳鳴.基于BP神經網絡的風速預測和風能發電潛力分析[J].華東電力, 2010, 38(2): 304-309.
[8] 杜穎,盧繼平,李青,等.基于最小二乘支持向量機的風電場短期風速預測[J].電網技術, 2008, 32(15): 62-66.
[9] 張寧,許承權,薛小鈴,等.基于最小二乘支持向量機的短期負荷預測模型[J].現代電子技術, 2010, (18):131-133.
[10] 王慧勤.基于支持向量機的短期風速預測研究[J].寶雞文理學院學報:自然科學版, 2009, (1): 79.
[11] 曾杰,張華.基于最小二乘支持向量機的風速預測模型[J].電網技術, 2009, 33(18): 144-147.
[12] 陳倩,徐宏銳.考慮相關因素的最小二乘支持向量機風速預測方法栗然[J].電力系統保護與控制, 2010,38(21): 146-151.
[13] 常群.支持向量機的核方法及其模型選擇[D].哈爾濱:哈爾濱工業大學, 2007.
[14] 付陽,李昆侖.支持向量機模型參數選擇方法綜述[J],電腦知識與技術, 2010, 6(28): 8081-8082, 8085.
[15] 龔松建,袁宇浩,王莉,張廣明.基于PSO優化LS-SVM的短期風速預測[J].可再生能源, 2011, 29(2): 22-25.
[16] 孫斌,姚海濤.基于PSO優化LSSVM的短期風速預測,電力系統保護與控制, 2012, 40(5): 85-89.
[17] 王奔,冷北雪,張喜海,單翀皞,從振.支持向量機在短期負荷預測中的應用概況[J].電力系統及其自動化學報, 2011, 23(4): 115-120.
[18] 周同旭.基于遺傳算法的支持向量機短期風速預測[J].皖西學院報, 2010, 26(5): 106-109.
[19] 楊洪,古世甫,崔明東,孫禹.基于遺傳優化的最小二乘支持向量機風電場風速短期預測[J].電力系統保護與控制, 2011, 39(11): 44-48.
[20] 曾杰,張華.基于蟻群優化的最小二乘支持向量機風速預測模型研究[J].太陽能學報, 2011, 32(3): 296-299.
[21] 吳俊,張榆鋒.經驗模態分解和小波分解濾波特性的比較研究[J].云南大學學報(自然科學版), 2012, 34(3):285-290.
[22] 張華,郁永靜,馮志軍,孫科.基于小波分解與支持向量機的風速預測模型[J].水力發電學報, 2012, 31(1):208-211.
[23] 王婷.EMD算法研究及其在信號去噪中的應用[D].哈爾濱:哈爾濱工程大學, 2010.
[24] 王曉蘭,李輝.基于EMD與LS-SVM的風電場短期風速預測[J].計算機工程與設計, 2010, 31(10): 2303-2307.
[25] 王曉蘭,康蕾.在線模糊最小二乘支持向量機的時間序列預測[J].計算機工程與應用, 2010, 46(9): 215-216.
[26] 周臘吾,陳靜,戴浪.基于最小二乘支持向量機的風速組合預測模型[J].科技導報, 2011, 29(7): 66-68.