任建龍 ,趙巧娥,嚴志偉,高金城
(1.山西大學 電力工程系,太原 030013;2.國網山西省電力公司檢修分公司,太原030006;3.中國電纜工程有限公司,北京100079)
大數據是一種避免隨機分析(即抽樣調查)而采用所有數據進行處理的一種捷徑[1]。如果我們通過分析全部的數據得到風力發電實際運行風速數據和輸出功率數據之間的函數關系,并通過預測風速映射之后實現風力發電輸出功率的預測,那么具有大數據4V特性的風力發電實際運行大數據勢必會使我們投入大量的人力、物力以及時間,甚至最后都得不到準確的結果[2]。
研究風速、功率預測的文獻很多,如文獻[3]利用帶有核函數的極限學習機(KELM)對風速預測,通過給定核函數的參數就可以避免由于隨機設置初始權值造成極限學習機 (ELM)性能不穩定的問題,但是沒有對核函數的參數進行尋優設置,導致最后的預測誤差很大;文獻[4]利用混沌學中的相空間重構(PSR)理論對風速進行預處理,然后再利用ELM預測風速,雖然考慮了風速數據空間及時間上的相關性,提高了預測精度,但是并沒有考慮ELM初始權值隨機設定造成ELM學習性能不穩定給最后預測精度帶來的影響,也沒有對相空間重構中的延遲時間τ和重構維數m進行尋優處理;文獻[5]利用粒子群算法(PSO)對PSR理論中的延遲時間τ和重構維數m進行尋優處理,嘗試尋找相空間重構參數和的優化值,但是并沒有從全局考慮,很容易得到局部最優解;文獻[6]利用PSO對正則化參數γ和核函數寬度σ進行尋優,再用KELM預測,雖然對核函數參數進行了優化處理,但是并沒有考慮風速數據空間及時間上的相關性,也沒有克服PSO容易陷入局部最優解這一缺點。本文考慮風電場實際運行數據異質值的存在,利用優化粒子群算法(IPSO)優化模糊PSR-KELM模型預測風速,同時提出改進移動平均平滑算法(IMASA)濾除異質值擬合風速-功率曲線。根據山西北部某風電場(簡稱晉北風場)的實際運行數據進行風速及功率的預測分析。
大數據背景下的風力發電運維數據的主要特點是那些偏離正常運行主體數據的異質值會對風力發電的研究造成嚴重的影響,并不能被隨意忽略或者刪除[7]。
由于風的隨機性、間歇性和不確定性,風電場的實際運行風速-功率數據可以看作是大量數據組成的波動序列{ys(i)},其呈條帶狀分布在標準風速-功率曲線兩側[8]。為了方便研究,可將風電場視為一個輸入風速、輸出功率的簡化系統[9]。
移動平均平滑算法(MASA)通過跨度內定義的相鄰數據點的平均值代替每個數據點來平滑數據[10]。這個算法的通用表達如式(1)所示:

式中:ys(i)是第 i個數據的平滑值;N 是 ys(i)鄰近數據點的個數;2N+1是跨度。
考慮到風電場實際運行數據異質值對擬合風速-功率曲線準確度的影響[11]以及MASA存在的不足,提出(IMASA),即為跨度內的數據點定義一個權重函數,通過權重函數值判斷要平滑的數據點是否具有最大權重值以及對擬合曲線的影響程度。通過把跨度以外的數據點的權重值定義為零來避免異質值對擬合曲線準確度的影響,其數學表達如式(2)、式(3)所示:

式中:x是與數據點平滑相關的平滑值;xi是x通過跨度定義的最鄰近數據點;d(x)是x沿橫軸到跨度內最遠的距離。
最后,利用最小二乘法將所得平滑值點擬合成一條映射曲線如式(4)所示:

總結以上算法,其原理流程如圖1所示。

圖1 擬合風速-功率曲線原理Fig.1 Principle of fitting wind speed power curve
在風速樣本數據進行分組劃分時,采用常規的K-means聚類算法雖然也能對風速樣本數據進行分類劃分,但是由于大數據下風速數據具有空間和時間相關性,對具有高相關性的風速數據進行聚類劃分時,很容易產生不穩定的聚類結果,對準確劃分風速數據具有一定的影響。模糊C均值聚類算法(FCM)能夠有效地改善風速數據的空間和時間的相關性對最后聚類結果的影響,改善風速數據聚類劃分結果的合理性。
FCM是經典聚類算法之一,它通過隸屬度矩陣表示每個樣本與各個分類之間的關系[12],其原理如圖2所示。
但是FCM也有不足的地方:①聚類中心隨機選取,比較難確定,且聚類中心的選取對聚類結果影響很大;②容易得到次優解。可見,模糊C均值聚類算法雖然在風速預測中得到了應用,但仍需改進。
風電場不同機組采集的風速可以看作一組按照一定時間分辨率記錄的多變量時間序列數值[13],即:

式中:時間 t=1,2,…,n;變量 i=1,2,…,m;變量 vi(t)表示第i臺風機在t時刻的捕獲值。所以可將風電場不同機組捕獲的風速數據記為一個m×n的多變量時間序列矩陣M,即

式中:t=1,2,…,n(n 為時間點數);i=1,2,…,m(m為風機編號);對M進行相空間重構,其空間中的相點可以表示為 vq,如式(7)所示:

Guang-Bin Huang在2004年率先提出ELM,其實質是單隱層前饋神經網絡(SLFN)學習算法的一種[14]。而以強大的非線性映射能力著稱的核函數在處理非線性映射問題上具有很好的應用[15]。將Huang所提ELM隱含層結點映射用核函數等效代替,便可得到穩健性和非線性逼近能力更好的KELM。求解KELM 如式(8)、式(9)所示:

令ELM隱含層輸出矩陣如式(10)所示:

從而可以將求解ELM寫成式(11):

令

那么基于核函數的ELM就可以用式(13)表示:

通常,工程上選取的核函數為高斯核函數,其數學表達式如下所示:

針對Kennedy和Eberhart先前提出的PSO[16-17]在工程應用中存在搜索精度不高,容易陷入局部最優解等不足,本文率先利用IPSO克服以上算法存在的不足并應用到風速預測的實踐當中[18]。粒子移動的下一時刻的速度如式(15)所示:

式中,vd′(t+1)表示任一粒子在維度d上下一時刻的速度;xd(t)表示任一粒子在維度d上t時刻的位置;w為慣性權重;pd(t)為任一粒子當前搜索到的最優解;pgd(t)為整個粒子群當前的最優解;c1、c2是可以改變 pd(t)和 pgd(t)相對重要性的學習因子;rand()為隨機數,取值一般在0~1之間。式(15)中常數能對慣性權重值、學習因子進行權衡,避免c1、c2過增,避免粒子更新偏向粒子局部或粒子整體,同時也避免了速度過增,使粒子群算法表現出更好地搜索性和收斂性還不增加計算量。粒子移動的下一位置為vd′(t+1)=xd(t)+vd(t)。
在利用IPSO進行優化時,以ARE作為衡量優化效果的標準。那么

為了降低程序迭代次數和計算量,設定尋優參數的約束條件如下所示:

最后,編寫程序,利用IPSO進行優化處理。具體程序原理如圖3所示。
本文根據晉北風場現場實際運行數據進行實例分析。晉北風場位于山西盛風嶺地區,總跨度約12.2 km,平均海拔在 1692~2120 m 之間,場址中心位于東經 114°~116°之間, 北緯 114°~116°之間,分為一、二期,共66臺機組,總裝機容量99 MW。由于該風電場位于山西以北典型山嶺地帶,所處地理環境復雜,綜合考慮,該風電場的地理位置布置情況如圖4所示。

圖3 IPSO優化模糊PSR-KELM模型預測風功率流程Fig.3 Flow chart of IPSO optimized fuzzy PSR-KELM model for predicting wind power

圖4 晉北風場風機地理分布圖Fig.4 Geographical distribution map of the north wind fan
晉北風場在不同時間段內的2個月實際運行風速-功率數據統計散點結果如圖5所示。

圖5 晉北風場實際運行風速-功率散點圖Fig.5 Actual wind speed power dispersion diagram of Shanxi north wind field
本文以晉北風場10天的數據為例,根據晉北風場每10 min采集一次、總長度1440個的實際運行數據樣本點進行實例分析,前十分之九的數據作為訓練數據,后十分之一的風速數據作為測試數據。利用IPSO優化模糊PSR-KELM模型預測風速并將預測結果與實際運行數據、不同模型 (模糊PRS-KELM模型和PRS-KELM四參數優化模型)進行比較,如圖6所示。

圖6 不同模型的風速預測結果Fig.6 Wind speed prediction results of different models
將IPSO優化模糊PSR-KELM模型、不同模型(模糊PRS-KELM模型和PRS-KELM四參數優化模型)預測風速與實際運行數據進行比較,分析誤差結果如圖7所示。

圖7 不同模型的風速預測誤差分析結果Fig.7 Analysis results of wind speed prediction error of different models
將預測風速映射到利用IMASA濾除異質值后擬合的風速-功率曲線上預測功率并與MASA、不濾除異質值處理預測結果比較如圖8所示。

圖8 基于映射不同擬合曲線預測功率結果Fig.8 Predicting power results based on different fitting curves
利用式(16)計算晉北風場利用不同模型預測風速及功率的平均相對誤差如表1所示。

表1 風速及功率的預測ARE值Tab.1 ARE value of wind speed and power
通過分析表1可以看出,基于IPSO優化模糊PSR-KELM模型預測風速的預測誤差值較小,IPSO優化模糊PSR-KELM模型與模糊PRS-KELM模型和PRS-KELM四參數優化模型相比,精確度大大提高,說明IPSO優化模糊PSR-KELM模型的有效性。同時,預測功率誤差說明IMASA濾除風電場實際運行風速-功率數據異質值的必要性和有效性。
根據晉北風場的實際運行數據分析,利用PSR-KELM四參數優化模型訓練IPSO優化模糊C均值聚類算法生成的模糊樣本進行風速預測,克服了大數據下風電場實際運行數據中的異質值對風速預測模型準確度和穩定性的影響。另外,由于大數據下風電場運行數據異質值的存在,通過分析晉北風場實際運行數據發現,IMASA可以很好的避免異質值的影響并準確的擬合出一條基于實際運行數據的風電場風速-功率曲線。
另外,通過表1中不同模型對風速以及功率的預測誤差對比還可以看出,利用本文提出的風功率預測模型完全可以對風電場出力變化趨勢進行準確預測,并對風電場的運行并網目標實現可預測調控監視。