王為國,竇震海,劉小煜,劉偉,申晉
(1.山東理工大學 電氣與電子工程學院,山東 淄博 255000;2.青島理工大學 琴島學院,山東 青島 266106)
風電在給我國的環保事業、能源結構調整等方面帶來利益的同時,也伴隨著一些問題的出現[1-2]。風電作為一種間歇性能源,風速、風量的不可控性會使風電輸出缺乏穩定性。不穩定的風力發電上網,使電力系統運行中的不確定性因素增多,這對電力系統的供需平衡與安全穩定運行提出了新的挑戰[3]。
風電場功率預測的準確性主要取決于短期風速的預測精度,由于風速本身既存在著規律性的變化趨勢,又具有因不確定性因素造成的隨機波動,使得對其進行精確預測具有較大的難度[4-5]。在目前研究中,短期風速預測模型主要有時間序列法和智能算法,而每種方法對風速預測的絕對平均誤差一般在25%~40%之間,還未達到電力系統所要求的滿意程度[6]。時間序列模型是對風速等隨機變量進行擬合建模的一種常用方法,持續法是其中最簡單的方法,更高級的時間序列模型主要有自回歸滑動平均(ARMA)、卡爾曼濾波等模型[7]。智能算法是預測精度較高的風速預測方法,主要包括神經網絡、灰色模型、支持向量機等方法[8]。時間序列分析建模幾乎完全基于原始數據進行預測,算法過于簡單;智能算法與黑匣子原理相似,雖然精度較高,但推導具體的預測解析式比較困難,并且在實際建模過程中需要大量的樣本數據。從目前研究成果看,因為風速兼有隨機波動性和趨勢性,加大了短期風速預測的難度,如何提高風速模型的預測精度仍然是一個亟待解決的問題。
文獻[9]嘗試將在氣象學中應用較為廣泛的均值生成函數模型運用到風電場的短期風速預測中,該方法有效地提高了風速預測模型的精度,對序列極值的跟隨性也較好,但在構造均值生成函數過程中,因為周期算法的緣故常導致樣本序列尾部數據的作用失效。并且從預測經驗及物理意義上考慮,越靠近起報時刻的數據值包含對預測有用的信息越多,對預測越有價值,以均值生成函數為基函數建立的風速預測模型并沒有考慮到這些因素,預測精度仍有待提高。針對上述研究現狀,文中在深入剖析均值生成函數預測模型特性的基礎上,對均值生成函數模型進行了改進和完善,建立了一種基于模糊均生函數(Fuzzy Mean Generating Function, FMGF)[10]和最優子集回歸(Optimal Subset Regression, OSR)[11]相結合的短期風速預測模型。通過定量對比表明,文中所構建模型能夠獲得較好的預測效果,有效地提高短期風速預測精度。
均值生成函數的基本思路是將原始時間序列樣本轉化為一系列可反映不同周期性質的基函數,然后根據不同情形選用不同的建模方案,既能夠向外多步進行預測,又能實現對極值的較好預測。其基本原理如下:
設一組樣本序列:
x(t)={x(1) ,x(2),…,x(n)}
(1)
式中n表示樣本序列所包含的元素數量。接著,由式(2)定義其均值生成函數:
式中i=1,2,…,l; 1≤l≤m;nl=INT(n/l);m=INT(n/2);INT為數據整數。
易知,均值生成函數處理樣本序列的思路是先按照一定的間隔挑選樣本,然后計算其平均值,從而得到一組周期函數。接著,將一個周期上的均值生成函數延拓至整個區間:
式中i=1,2,…,n;mod為同余算子。
于是得到均值生成函數的延拓矩陣:
F=(fi,j)n×l,fi,j≡fl(t)
(4)
式中n×l為矩陣階數。

為敘述方便,令起始預測時刻為tn,對時刻點tn+1,tn+2,…,tn+q進行預測。在馬爾柯夫預測中,只有tn時刻的數據對預測有用,tn以前的數據不發揮作用。若樣本序列符合馬爾柯夫特點,則隸屬度函數可定義為:
AM=0/u1+0/u2+…+1/un
(6)
式中AM為具有馬爾柯夫特點的隸屬度函數。
若從統計學角度考慮,則把樣本序列X(1),X(2) ,…,X(n)等概率對待,則隸屬度函數定義為:
AS=1/u1+1/u2+…+1/un
(7)
式中AS為統計學意義下的隸屬度函數。
在實際問題中,既不能舍棄過多以往的信息,又要使近期觀測值對預測起到較大作用。因此,設計了隨觀測值的遠近以指數形式遞減的隸屬度,即:
式中β依據對過去數據的重要性提前給出,一般為0.01.
若樣本序列具有周期性,則令隸屬度為:
式中l為周期長度;r為由經驗提前確定的常數。
若既考慮觀測值隨起報時刻遠近效用逐漸下降又要體現周期性,則令隸屬度為:
(10)
式中β,l,r表示的含義同上。
基于均值生成函數的時間序列預測模型與自回歸滑動平均、卡爾曼濾波、指數平滑等傳統時間序列模型相比,解決了隨預測期延長預測值趨于平均化的問題,并可以向外推多步進行預測,對極值的擬合預測效果也較好。可是,這些建模方案仍不完善,文中在傳統均值生成函數預測模型的基礎上,對其進行了改進和完善。
具體改進如下:
(1)從預測經驗及物理意義上考慮,距離起報時刻越近的觀測值包含對預測有用的信息越多,對預測越有價值,而以均值生成函數為基函數建立的預測模型忽視了這些因素。由于模糊均生函數計算方法能夠有效體現出近期的樣本數據對預測值的較大影響,并能夠充分利用樣本數據中所隱含的有用信息,自提出以來,該理論在短期負荷預測、降水量預測、天然徑流預測、飛行事故率預測等領域已取得成功應用。而目前尚未見使用模糊均生函數計算方法來進行風電場短期風速預測的報道,因此文中嘗試用隨指數形式遞減的隸屬度構造模糊均生函數,進而將其引入到短期風速預測研究中,以提高風速預測的精度;
(2)由于均值生成函數是由樣本數據按照一定的間隔計算均值而獲得的周期函數,因此在生成均值生成函數過程中,常出現時間序列的尾部樣本值無法發揮作用的問題。而大量實驗表明,時間序列的尾部樣本值在整個實際預測過程中具有重要的意義。為了解決這一問題,文中引入了文獻[11]推導出的逆推算法,使用該算法對均值生成函數的定義過程進行了完善,以使得尾部樣本值在均值生成函數延拓序列中的作用能夠實現。
上述過程在保留均值生成函數預測模型的主要優勢(多步預測和極值預測效果好)的基礎上,進一步考慮了近期數據對風電場短期風速預測結果的較大影響,并妥善解決了傳統預測模型中周期算法的尾部樣本值失效的問題,為如何預測兼有隨機波動性和趨勢性的短期風速提供了一條新思路。
針對風速兼有隨機波動性和趨勢性的特點,文中在改進均值生成函數構造原理的前提下,將其與最優子集回歸模型相結合,建立基于FMGF-OSR的短期風速預測模型。改進模型的具體建模流程如下:
2.3.1 推導時間序列樣本的FMGF延拓序列
推導步驟如下:
步驟一:為了充分挖掘以往信息,又能使近期數據對數值的預測發揮較大作用。因此,文中選用了隨觀測值的遠近以指數形式遞減的隸屬度,即:

步驟二:對于式(2),根據指數形式的隸屬度和逆推算法構建FMGF如下:
(12)
式中Rl=n-nl·l;i=1,2,…,l; 1≤l≤m;nl=INT(n/l);m=INT(n/2);l為函數的周期;INT為數據取整;Rl為樣本總項n的余項。可見,在定義FMGF過程中通過逆推算法調整了處理樣本序列的順序,即從樣本序列的第Rl+i項開始,一直計算到最后一項。通過改進FMGF定義過程,確保了時間序列的尾部樣本值在各周期所對應的FMGF序列中均能發揮作用。
步驟三:對FMGF序列進行周期延拓:
式中i=1,2,…,n;mod為同余算子。即可得到FMGF的延拓矩陣:
F=(fi,j)n×l,fi,j≡fl(t)
(14)
步驟四:為了擬合原序列的高頻分量,對原序列分別進行兩次差分處理:
x(1)(t)={Δx(1) ,Δx(2),…,Δx(n-1)}
(15)
x(2)(t)={Δ2x(1) ,Δ2x(2),…,Δ2x(n-1)}
(16)

步驟五:為了對原始序列中的變化趨勢進行擬合,將一階差分周期延拓序列進行累加處理:
式中fl(3)(1)=x(1);t=2,3,…,n;l=1,2,…,m。
2.3.2 雙評分標準CSC (Couple Score Criterion)
由2.3.1節可以得到約4m個FMGF延拓序列,每個序列將作為預測模型的一個預測因子。因為短期風速樣本數據具有隨機波動性和趨勢性的特點,所以文中使用同時考慮趨勢和數量的雙評分標準[12]進行預測因子的篩選:
CSC=S1+S2
(18)
式中S1表示數量評分;S2表示趨勢評分。
數量評分定義為:
式中R2表示復相關系數;n表示風速序列長度;QK和QX分別表示殘差平方和、總離差平方和。
趨勢評分定義為:
S2=2[R1+(n-1)·ln(n-1)-R2-R3]
(20)

2.3.3 粗選預測因子
因為預測模型中含有大約4m個FMGF延拓序列,若把它們都當作自變量,并按不同的自由組合與因變量建立回歸方程,這將導致計算量偏大,也沒有這樣進行的實際意義。因此,文中首先使用雙評分標準對上述變量進行篩選,剔除CSC值較低的預測因子。

2.3.4 精選最優子集
將生成的2h-1個子集分別進行多元線性回歸計算,并再次計算所有回歸結果的CSC值,然后從2h-1個子集中挑選得到CSC值最大的子集,即獲得風速預測模型的最優子集。
2.3.5 建立短期風速預測模型
若最優子集回歸方程由k個自變量組成,則得到的基于FMGF-OSR的短期風速預測模型為:
若要進行q步的風速預測,將式(21)中的FMGF序列fi(t)(i=1,2,…,k)仿照式(13)完成q步延拓,然后將其代入短期風速預測模型,即可完成對風速值的預測。
文中實驗樣本來自中國北方某風電場2017年2月份某一天的風速值,按照10分鐘級的時間尺度對風速進行采樣,一共獲得144個數據,實測風速數據如圖1所示。考慮到仿真的復雜性,文中截取了前4 h的風速值,并將獲得的24個實測值作為原始時間序列樣本,然后采用文中所構建模型對其后1 h的風速值進行預測。為比較文中提出的預測模型的優越性,文中同時采用了均值生成函數-最優子集回歸模型(MGF-OSR)、均值生成函數-主成分回歸模型(MGF-PCA)和經典的自回歸滑動平均模型(ARMA)對未來風速值進行預測。其次,為了突出對MGF-OSR模型的改進之處,文中將FMGF-OSR模型與MGF-OSR模型的建模流程進行了對比,如圖2所示。

圖1 原始風速信號Fig.1 Original wind speed series

圖2 兩個模型的建模流程Fig.2 Flowcharts of two models
為了有效和全面地對各預測模型的準確率進行量化評價,誤差評價函數選用相對誤差(Relative Error, RE)、平均絕對百分誤差(Mean Absolute Percentage Error, MAPE)和均方根誤差(Root of the Mean Squared Error, RMSE),其表達式分別為:

使用MATLAB編程進行仿真,分別采用4種預測模型得到的風速預測值如圖3所示。

圖3 4種預測模型的風速預測結果Fig.3 Wind speed prediction results by four models
由圖3可見,根據FMGF-OSR模型得到的風速預測曲線與實際的風速數據更為接近,預測精度最高。下面進一步結合誤差評價函數來詳細說明文中所建立預測模型的有效性和優越性,依據式(22)~式(24)得到各種模型的預測誤差結果如表1和表2所示。

表1 風速預測結果比較Tab.1 Comparison of wind speed prediction results

表2 各預測模型的誤差對比Tab.2 Errors comparison of different prediction models
由表1和表2可知,文中預測模型將實際風速值與預測值之間的相對誤差基本控制在2.5%左右,表明該預測模型的有效性。同時通過3種典型的預測誤差量化指標,可知文中提出的FMGF-OSR模型較MGF-OSR模型、MGF-PCA模型、ARMA模型均明顯更優。這是由于FMGF-OSR模型在保留MGF-OSR模型的優勢基礎上,結合模糊理論和逆推算法對其進行了進一步的改進和完善,使得改進后的模型能夠充分挖掘原始數據中隱含的有用信息,對原始數據中的高頻分量及趨勢性都進行了較好地擬合,有效降低了風速預測的誤差。在文中實際算例仿真中,推導出的風速預測模型方程包括1個原始序列、1個一階差分序列和2個累加延拓序列的模糊均生函數序列。
文中提出了一種基于模糊理論和逆推算法改進均值生成函數的短期風速預測模型,該模型有效解決了傳統均生函數預測模型中由于周期算法導致的鄰近數據無法發揮作用的問題,也使得距離預測點越近的風速值對實際預測起到的影響越大,并引入了能夠體現不用周期特性的模糊均生函數序列作為預測因子,這對極值的擬合和預測都取得了比較理想的效果。實例表明,與常用的幾種風速預測方法相比,該模型的風速預測誤差基本控制在2.5%左右,其有效性和優越性均得到了驗證,具有較高的實際應用價值。