齊琦,陳芳芳,徐天奇,孫祥晟
云南民族大學 電氣信息工程學院,云南 昆明 650504
近年來,隨著能源需求的快速增長、化石能源的日益枯竭及核能的限制性發展,清潔能源因其自身的優勢而被大規模應用于電力系統中[1]。現今,如何合理地解決環境問題和能源問題已經成為世界各國的研究熱點[2]。太陽能是現在熱門的清潔能源,盡管它占有很大優勢,但還是受到環境的制約,如風速、溫度、光照強度等。因此,對光伏發電進行準確的預測,可以節約資源,保證電力系統運行的穩定性,對清潔能源應用很有意義。
光伏出力預測的研究方法主要有統計法與物理法2 種[3?4]。物理法主要通過建立物理模型來進行預測;統計法則依靠大量的數據,通過優化算法進行預測。文獻[5]只采用了一種預測模型,由于環境影響因素較大,這種單一預測模型預測結果的準確度較差。文獻[6]使用SVM 對數據進行分類后使用BPNN 和自回歸與滑動平均模型分別預測,但SVM 的分類誤差較大。本文的研究對象是小型光伏發電站,構建基于BP 神經網絡的預測模型,由于BP 神經網絡易陷入局部極小值,并且具有收斂速度慢等缺陷,提出基于EMD 分解的GA-BP 神經網絡預測模型,優化網絡結構中的權值和閾值。然后利用某光伏電站的歷史數據作為輸入變量,輸入到搭建好的預測模型中,最后經過對比得出結論。
本文通過記錄某小型光伏發電站2015 年5 月3 日—7 月3 日的溫度、海拔、云層密度、空氣濕度以及發電量數據,通過SPSS 數據分析軟件,選用Person 相關系數進行分析。在對數據進行聚類討論時,首先確定變量的相似性程度 x的取值:

式中: xi為溫度、海拔等因素變量, yi為發電量變量,R 為總樣本,person 相關系數為

式中: n為 樣本量; x、 y 分別為變量的均值; xi、 yi為當前變量,其中 i ∈n。r 描述的是2 個變量間線性相關強弱的程度, r∈(?1,1)。若 r>0,表明2 個變量是正相關;若 r<0,表明2 個變量是負相關。r 的絕對值越大,表明相關性越強。
由此可得,光伏發電量與溫度以及濕度具有較強的相關關系,與海拔、氣壓等因素相關較小[7]。在分析了相關因素的基礎上,本文為了提高預測的精度往往會在天氣因素變化大體相同的基礎上采用相似日的選取原理。
經驗模態分解是根據數據自身的時間尺度把信號分解,不用預設其他基函數。由于該方法具有這樣的優點,它可以應用在任何的信號分解,在處理數據時有很大的優勢,廣泛應用于分析非平穩信號,信噪比很高。經驗模態分解方法假設任何復雜信號都是由簡單且獨立的固有模態函數(intrinsic mode function,IMF)組 成 的[8]。EMD分解法能將不平穩數據進行平穩化處理,然后進行希爾伯特變換獲得時頻譜圖,獲得有意義的頻率。這種方法較直觀、具有自適應性[9]。所謂經驗模態分解就是從非平穩、非線性的原始信號里面拆分出特征尺度各不相同的信號,從而獲取多個不一樣的本征模函數及一個剩余分量。具體分解步驟如下[10]:
1)假設原始信號為 x(t),找出局部極大值與極小值點,利用三次樣條插值的辦法,使上包絡線與極大值連接,下包絡值與極小值連接。
2)求上包絡線與下包絡線的均值 m1(t) , x1(t)與m1(t)的差為

若 h1(t) 為 IMF,那么 h1(t)為第一個分量。
3)如 h1(t)不是IMF,則把它作為原始信號,重復步驟2),得出

然后經過重復的篩選,得到h1k(t)達到IMF 的條件,即

4)從 x(t)中 分離出 c1(t), c1(t)是原始信號的第一個IMF 成分, 代表 x(t)最高頻率的分量,得到:

r1(t)為 新的信號,然后把 r1(t)當作原始信號重復步驟1)~步驟3),得到第2 個IMF 的 c2(t), 代表 r1(t)的最高頻率分量,重復 n次得到:

從記錄的小型光伏發電站中選取10 天的光伏數據,把原始信號做EMD 分解處理。由于外界因素影響,如溫度、濕度和云層變化的隨機性等特點,經驗模態分解法的自適應性與完備性等特點與優勢才得以顯現出來[11]。EMD 分解圖如圖1 所示。

圖1 EMD 分解
從圖1 中可知,原始光伏數據與IMF1 形狀有明顯的日周期性,體現了光伏出力的特點。由于光照強度的影響,早上和傍晚的力度較弱,正午時光照強度大、出力強。IMF2、IMF3 與IMF4 為低頻周期分量,它們的幅值較低,而剩余信號(residual, RES)分量占比較高,可以體現出整體光伏發電趨勢。
神經網絡則是一類相對復雜的計算網絡。BP 神經網絡由輸入層(input),隱含層(hidden),輸出層(output)和權重(weight)組成。
BP 神經網絡的整個學習過程為信號正向傳播和誤差的方向回傳[12]。假設訓練樣本數為 N,最 大 訓練 次 數為 T,ω (t)為 第t次 迭 代的 權 值。BP 算法具體步驟如下:
1)將權值 ω進行初始化處理。
2)輸入 N 個樣本,假設當前為第 n個樣本,計算得到網絡實際輸出與希望輸出的誤差。
3)如果 n 4)得到的誤差逐層反向傳回之前的各層,并將誤差信號加載到連接的權值上,使得整個神經網絡誤差減小。 5)重復訓練每一個輸入與輸出樣本,直到誤差符合要求為止。 2.2.1 輸入層、輸出層與隱含層設計 由前文可知,光伏出力強度受多種因素的影響。在眾多因素中,光照強度、溫度、風速3 個為主要影響因素,因此考慮進輸入層結點。而光伏出力受時間的影響,集中在上午6 點到下午18 點之間,所以我們將光伏電站的光伏出力限制在此區間,選取1 h 為周期,所以共取13 個功率數據與13 個溫度數據。此外太陽輻照強度與日平均風速也是2 個重要影響因素,應加入研究,因此共28 個輸入層節點數。輸出層的神經元傳遞函數通常采用線性傳遞函數,公式如下: 在BP 神經網絡中,有一個公式可以確定隱含層節點數目: 式中: m為 輸出層節點數; n為 輸入層節點數; h為隱含層節點數; a是調節常數,范圍為[1,10]。按照公式,隱含層節點數 l的范圍應該為從8 到17,經過多次試驗,取13 時誤差最小。 2.2.2 BP 神經網絡光伏出力預測 將收集的數據作為訓練樣本,然后將誤差反向傳播到神經網絡中,對第1—9 日的數據進行訓練,再利用第9 日的數據預測第10 日的發電值,然后將預測的結果與實際值比較,結果如圖2所示。 圖2 BP 神經網絡預測光伏出力數據與期望值對比 從圖2 可知,BP 神經網絡的預測值與期望值之間的誤差較大,尤其在中午時,光照強度較強,誤差較為明顯。 遺傳算法(GA)的思想基于達爾文的進化論、魏茨曼的物種選擇學說和孟德爾的群體遺傳學說[13]。遺傳算法模擬生命進化,在自然選擇中交配、繁殖、突變。在GA 中,有選擇、交叉、變異3 種遺傳算子。選擇算子依據規則從群體中選出部分個體作為下一代種群個體;交叉算子按照遺傳模擬充足、選取最佳的基因轉移給下一代中,從而獲得新個體;變異算子模擬在自然進化中出現的基因突變現象,依據變異的概率獲得新個體。 為了克服神經網絡的缺陷,一些學者提出采用GA 優化BP 神經網絡的權值和閾值的方法,建立了GA-BP 模型[14]。GA-BP 模型構建如圖3 所示。然后選擇數據作訓練樣本,進行仿真模擬,得到GA-BP 神經網絡預測模型,如圖4所示。 由圖4 可知,GA-BP 神經網絡的預測精確度要較單一BP 神經網絡的高,但是該模型在太陽出力強的階段仍具有較大誤差,因此還需要進一步改進。 圖3 GA-BP 構建流程 圖4 GA-BP 預測光伏出力數據與期望值對比 由于GA-BP 模型雖然優化了精度,但是耗費了一定的時間,于是建立基于EMD 組合預測模型。EMD 能夠分解出不同頻率特性的信號,然后對每一個信號用GA-BP 算法進行預測,基于EMD 分解的組合預測模型流程圖和結果如圖5、6 所示。 圖5 EMD-GA-BP 預測流程 圖6 3 種模型預測光伏出力數據與實際值對比 由圖6 可知,EMD-GA-BP 的擬合效果較其他2 種預測方法更精確,但模型預測結果與實際值仍存在一定誤差,經過反復訓練,表1 為各模型均方誤差(mean squared error,MSE)與平均絕對誤差(mean absolute error,MAE)的對比。 表1 3 種模型預測誤差對比 由表1 可知,BP 神經網絡的預測結果誤差較大,GA-BP 模型的預測結果較單一BP 模型精確,而EMD-GA-BP 組合預測模型的預測精度高于前兩者,說明本文的組合預測模型具有較強的適應性。 利用神經網絡對光伏系統進行短期的出力預測是當今的熱點,也是電網正常運行的基礎,對電力的發展與電力部門的經濟效益有著重要的意義。本文通過收集某光伏電站的數據,進行仿真預測,結果證明,使用本文的基于經驗模態分解算法改進BP 神經網絡的光伏出力預測結果,誤差較單一使用BP 神經網絡與GA-BP 神經網絡的小,雖然與實際發電量相比,仍有一定的誤差,但是隨著樣本的增加和實驗次數的增加,誤差會逐漸變小,預測值也會變得更加精準,最終達到要求。


3 基 于EMD 分 解 的GA-BP 光 伏 出力預測
3.1 遺傳算法
3.2 GA-BP 模型光伏出力預測


3.3 基 于EMD 分 解 的GA-BP 神 經 網 絡 光 伏 出 力預測



4 結論