王粟, 邱春輝, 曾亮
(湖北工業大學 太陽能高效利用及儲能運行控制湖北省重點實驗室, 湖北 武漢 430068)
風能的不可控制性使準確預測其輸出功率的難度較大[1-3].采用反向傳播(BP)神經網絡預測模型能夠較好地預測基于影響因素的輸出功率,但其預測精度低、運行速度慢,需要進行改進[4-5].文獻[6]提出一種在傳統的BP神經網絡中加入更有利于處理非線性誤差和大噪聲的最大熵準則(MCC)算法,與傳統的均值誤差執行功能相比,MCC算法預測精度更高,但該模型的網絡結構過于復雜.文獻[7]針對傳統的神經網絡風電預測模型較為復雜且預測精度低等問題,通過平均影響值計算出某個影響因素與輸出功率的關系值,選出與輸出功率關系較大的變量,建立預測模型,但該模型易陷入局部極值.文獻[8]采用改進的人工魚群算法對BP神經網絡進行優化,克服了傳統BP神經網絡預測誤差較高、易陷入局部極值等缺點,在短期風電輸出功率預測方面具有良好的效果,但其收斂速度較慢.本文采用組合預測的方法,提出一種基于互信息的自適應變異粒子群優化BP的短期風電功率預測模型(互信息-改進粒子群算法-反向傳播(MI-IPSO-BP)預測模型).
風電場輸出功率,即風力機的輸出功率P為
P=CPSρv3/2.
(1)
式(1)中:CP為功率系數;S為風力機掃過的面積,m2;ρ為空氣密度,kg·m-3;v為風速,m·s-1.
某風電場風速與輸出功率的關系,如圖1所示.在風電場的實際運行過程中,只有當風速在某個限定區間時,隨著風速的增加,風力機的輸出功率隨之增加,之后趨于穩定;當低于或高于該風速區間時,風力機的輸出功率為零[9].
不同空氣密度下輸出功率的變化,如圖2所示.由圖2可知:其他環境條件一致,當3 m·s-1≤v≤12 m·s-1時,輸出功率隨著空氣密度的增大而增大;當v>12 m·s-1時,輸出功率保持不變[10].

圖1 風電場風速與輸出功率的關系 圖2 不同空氣密度下輸出功率的變化 Fig.1 Relationship between wind speed and Fig.2 Changes in output power at output power of wind farms different air densities
風力機的輸出功率受到風速和空氣密度的影響,但無法直接判斷出其他因素與輸出功率的關系.若將所有影響因素作為模型的輸入,則會增大計算的復雜度;若人為選取某些因素作為模型的輸入,則難以保證預測精度.因此,需要采用一些方法對原始數據中的影響因素進行篩選.
互信息(MI)表示兩個或多個變量間的相關性[11].假設有兩個變量X,Y,二者間的相關度表示為

(2)
式(2)中:N為變量X的觀測樣本數;j為觀測樣本的編號;FX,Y(x,y)為X,Y的聯合概率密度函數,FX,Y(x,y)=FX(x)FY(y),FX(x),FY(y)分別為X,Y的邊緣概率密度函數,x為樣本中任一影響因素序列,y為輸出功率序列;當X與Y互不相關時,MI值將趨近于0,當X與Y的相關程度越大時,MI值將趨近于1[12-13].
計算各影響因素與輸出功率間的MI值.首先,求出聯合概率密度函數和邊緣概率密度函數.由于影響輸出功率的因素都是離散性變量,故需要對變量進行離散化處理.將風速、風向正弦值、風向余弦值、槳距角等因素序列從小到大進行排列,把各因素等分為[xmin,xmax]這樣的區間,在選取的影響因素樣本數據中,統計出落入各區間的概率,即為邊緣概率密度.同理,將輸出功率序列等分為區間[ymin,ymax],統計同時落入區間[xmin,xmax]和[ymin,ymax]的概率,即為聯合概率密度.
通過式(2)計算出影響因素與輸出功率之間的MI值,篩選出與輸出功率相關度較大的8種影響因素,即風速、風向正弦值、風向余弦值、槳距角、相對濕度、溫度、海拔高度、空氣密度,其相應的MI值分別為0.964 5,0.854 3,0.826 8,0.802 3,0.432 6,0.571 5,0.671 9,0.483 6.
BP神經網絡是一種多層前饋網絡模型,是人工神經網絡的算法之一[14-15].BP神經網絡首先將輸入量由各層之間的連接關系傳遞到隱含層,再傳遞到輸出層,得到輸出層輸出;然后,將輸出層輸出與期望輸出進行比較,得出誤差;最后,通過誤差的反向傳播,對各層之間的權重和閾值進行反復修正,以完成學習的過程.
粒子群優化(PSO)算法是一種模仿鳥類運動規律的優化算法.在優化過程中,粒子在空間中不斷更新位置和速度,搜索最優位置,然后,與其他粒子搜索的最優位置進行比較,找到全局最優位置[16].梯度下降法是求解無約束優化問題的迭代算法,其利用負梯度方向決定每次迭代的新的搜索方向,使每次迭代都能朝著函數最小的方向前進.在解決實際問題時,如果函數不是凸函數,則很可能陷入局部極值.粒子群優化算法可用于解決大量非線性、不可微和多峰值的復雜函數優化問題,可以有效地克服傳統優化算法收斂速度慢、易陷入局部極值等缺點.由于智能優化算法的迅猛發展,且其優越性已在其他應用中得到驗證,故不采用梯度下降算法,而采用粒子群優化算法.


(3)

(4)

粒子不斷更新位置和速度,直到粒子在搜索空間中找到全局最優位置,或者算法達到最大迭代次數時,算法才結束搜索.
在風電輸出功率預測問題中,粒子群優化算法結構簡單、易于實現,但在優化過程中,一旦粒子找到1個最優位置,其他粒子則會趨于該最優位置,很難跳出該局部極值.針對這些問題,通過自適應慣性權重系數和變異擾動的方法對傳統粒子群進行改進,提高粒子的全局搜索能力.
實際問題大多數是復雜、非線性的,選擇合適的慣性權重系數可以均衡粒子的全局搜索和局部搜索能力,使粒子擺脫早熟.傳統的慣性權重系數對非線性問題的處理能力有限,故引入自適應慣性權重系數ω,以避免粒子陷入局部最優,即

(5)
式(5)中:α分布于[15,30];ωmax,ωmin分別為自適應慣性權重系數值的上、下限;Mmax為最大迭代次數.
為避免粒子早熟收斂,并提高種群的多樣性,引入變異思想對粒子進行擾動.當粒子一直陷入局部最優,停止向新的方向搜索時,引入變異擾動,迫使粒子進入其他區域繼續搜索.假設1個變異概率為qo,若r (6) 粒子群算法的實現有以下5個步驟. 步驟1隨機初始化粒子的位置和速度. 步驟2將均方誤差函數作為其適應度函數,計算出各粒子的適應度值fi. 步驟3將各粒子的適應度值fi與該粒子目前搜索到最優位置時的適應度值f(pbest)進行比較,若fi>f(pbest),則更新pbest;否則,保持不變.將fi與全部粒子搜索到最優位置時的適應度值f(gbest)進行比較,若fi>f(gbest),則更新gbest;否則,保持不變. 步驟4對粒子的自適應慣性權重系數、位置和速度進行更新,若r 步驟5判斷是否已滿足約束條件,若滿足,則算法結束,輸出最優解;否則,返回步驟2,繼續迭代. MI-IPSO-BP預測模型的建立有以下8個步驟. 步驟1數據的預處理.對選取的樣本數據進行補全和修正,對樣本數據進行歸一化處理. 步驟2模型參數的設置.對粒子群優化算法中的參數進行設置,并初始化粒子的位置和速度,確定粒子各維度上的數值與神經網絡中輸入層、隱含層、輸出層之間的權重相對應. 步驟3建立BP神經網絡,采用單隱層結構,輸入層神經元8個,輸出層神經元1個,隱含層神經元的個數h可通過試湊法或經驗公式確定,即 (7) 式(7)中:a,b分別為輸入層、輸出層的個數;c為常數,分布于[1,10]. 步驟4采用均方誤差函數,計算出各粒子的適應度值fi. 步驟5將粒子的適應度值fi與該粒子目前搜索到最優位置時的適應度值f(pbest)進行比較,若fi>f(pbest),則更新pbest;否則,保持不變.同時,將各粒子的適應度值fi與全部粒子搜索到最優位置時的適應度值f(gbest)進行比較,若fi>f(gbest),則更新gbest;否則,保持不變. 步驟6對粒子的位置、速度和慣性權重系數進行更新,并假設變異概率qo=0.95,若r 步驟7判斷誤差是否達到誤差標準,以及迭代次數是否達到最大,若達到最大,則停止迭代,得出最優解;否則,返回步驟4,繼續迭代. 步驟8將粒子群優化算法得到的最優參數設置為BP神經網絡的權值和閾值,并對預測模型進行訓練.根據實際輸出功率和預測輸出功率,不斷調整權值和閾值,直到滿足結束條件,算法結束. 在選取的樣本數據中,由于監控系統出錯或人為原因,往往存在明顯的數據錯誤或數據缺失等問題,如果未能很好地處理這些問題,預測結果會有更大的誤差.通常選取該缺失數據或錯誤數據的前一個和后一個數據的平均值作為替代數據. 此外,在這些數據中,有些影響因素的數據不在同一個量級上,需要對數據進行歸一化處理,即 (8) 由于風電輸出功率受風速、風向、溫度等隨機性天氣因素的影響較大,因此,為了驗證文中模型的預測性能,選取平均絕對誤差(EMA)、均方根誤差(ERMS)和平均絕對百分比誤差(EMAP)作為評價指標[18],其計算式分別為 (9) (10) (11) 式(9)~(11)中:n為預測樣本數;Pc為預測輸出功率;Pr為實際輸出功率;j為預測輸出功率的個數. 選取該風電場2014年4月1日-30日的氣象數據和歷史輸出功率數據(4 320個)作為預測模型的輸入樣本數據,其中,前3 800個數據作為訓練樣本,其余數據作為測試樣本.將風速、風向正弦值、風向余弦值、槳距角、相對濕度、溫度、海拔高度、空氣密度這8種影響因素作為預測模型的輸入.根據經驗公式,將隱含層神經元數設置為輸入層神經元數的2倍加1;最大迭代次數設置為100;種群規模為25;ωmax,ωmin分別為0.9,0.2;c1,c2均為2. 通過MATLAB軟件對MI-IPSO-BP預測模型進行仿真,為了對比研究,同時采用遺傳算法-反向傳播(GA-BP)預測模型和粒子群優化算法-反向傳播(PSO-BP)預測模型對輸出功率進行預測.GA-BP預測模型采用遺傳算法對個體進行篩選,尋找最優個體作為BP神經網絡的初始權值,對短期輸出功率進行預測.PSO-BP預測模型采用傳統的粒子群優化算法對BP神經網絡進行優化. 預測模型輸出功率的對比,如圖3所示.預測模型平均絕對誤差的對比,如圖4所示. 圖3 預測模型輸出功率的對比Fig.3 Comparison of output power of prediction models 圖4 預測模型平均絕對誤差的對比Fig.4 Comparison of mean absolute error of prediction models 由式(9)~(11)及圖3,4可以得到以下2個結論. 1) 3種預測模型都可以對風電短期輸出功率進行有效的預測,但MI-IPSO-BP預測模型的預測曲線能夠更好地逼近實際的輸出功率.與PSO-BP預測模型相比,MI-IPSO-BP預測模型具有更高的預測精度,說明改進后的粒子群優化BP神經網絡具有更好的預測能力;與GA-BP預測模型相比,MI-IPSO-BP預測模型的優化效果更好. 2) MI-IPSO-BP預測模型的EMA,ERMS分別為20.869 4,35.622 4 kW,EMAP為8.96%.相較于GA-BP預測模型,MI-IPSO-BP預測模型的EMA,ERMS分別減少了27.651 9,24.703 7 kW,而EMAP減少了6.78%;相較于PSO-BP預測模型,MI-IPSO-BP預測模型的EMA,ERMS分別減少了84.853 7,103.323 9 kW,而EMAP減少了18.50%.由此可知,MI-IPSO-BP預測模型的預測精度最高,效果最佳. 采用互信息對原始數據進行降維,可以保留有用的特征信息,舍棄冗余的特征信息,降低算法的復雜性.加入自適應慣性權重系數和變異因子改進粒子群算法,不僅優化BP神經網絡,解決傳統粒子群算法存在的問題,還可以提高粒子的全局搜索能力.結果表明,MI-IPSO-BP預測模型比GA-BP預測模型、PSO-BP預測模型具有更高的預測精度,預測結果更接近實際值.
2.4 粒子群算法的實現步驟
2.5 MI-IPSO-BP預測模型的建立

3 算例與分析
3.1 數據預處理

3.2 預測模型的評價指標



3.3 預測結果及分析


4 結束語