閆 帆,李傲燃
(云南大學,昆明 650504)
電力系統規劃調整的具體過程將通過實時檢測、數據綜合分析、反饋決策及決策優化4個部分來實現,其中風速的準確預測是電廠提高效益并擴大規模的關鍵。雖然國內已做過大量有關風力預測的研究并提出大量模型,如數值天氣預報預測法、統計回歸預測法等,但基于風速的間歇性、波動性和不確定性,以上方法都有一定缺點。如數值天氣預報預測法[2]需要大量天氣環境數據;單一的統計回歸預測模型[3]存在低階模型精確度低、高階模型結構復雜、需要繁重的運算資源等缺點[4]。
該文通過將風速原始數據輸入模型,以分解時間序列,優化機器學習預測算法為解決思路,建立預測誤差較小的風速預測模型。針對風速時間序列不確定性和單一預測模型預測精度不高的問題,提出了以經驗模態分解(empirical mode decomposition, EMD)改進算法為基礎的分解算法進行風速預測的思路,即通過集合經驗模態分解(ensemble empirical mode decomposition, EEMD)對時間序列進行分解,建立優化粒子群優化算法(particle swarm optimization, PSO)優化支持向量機(support vector machine,SVM)模型組合預測算法,將各模態分量預測值疊加與重構得到預測結果。將預測結果與傳統預測模型進行預測效果的比較,并進行定量誤差分析。
為深入分析非平穩時間序列數據的局部頻率特征,N. E. Huang等基于瞬時頻率概念提出一種自適應非線性信號去噪技術——經驗模態分解算法[5]。該方法的核心是將原始信號分解成一組振蕩模式的單個分量信號,即固有模態函數(intrinsic mode function,IMF),這一分解過程可以得到平穩的、線性的IMF。
經驗模態分解的核心是篩選固有模態函數,而對于非平穩數據,EMD分解也存在缺陷,主要原因是容易出現模態混疊。模態混疊是指一個IMF分量中包含差異極大的特征時間尺度。EEMD是一種基于噪聲輔助分析的集合經驗模態分解,可以消除模態混疊現象[6-8]。集合經驗模態分解的步驟如下:
1)將標準正態分布的白噪聲n(t)加到原信號,得到信號X(t):
X(t)=x(t)+n(t)
(1)
2)對加入白噪聲的信號Xi(t)進行經驗模態分解,得到j個IMF分量:
(2)
式中:Xi(t)表示第i次附加白噪聲所得信號;ci,j(t)是第i次試驗的第j個IMF;ri,j(t)為余項。
3)重復步驟1)、2)M次,通過加入不同正態分布的白噪聲ni(t)得到IMF集合。
小麥新品種展示示范安排在我區東關街道辦五一村大田中,前茬作物為玉米,該地地勢平坦,灌溉方便,肥力中等。
4)將上述得到的IMF進行集成平均運算得到最終結果:
(3)
支持向量機(support vector machine, SVM)是一種基于二分類算法思想和監督決策思想的機器學習算法,用于尋找根據坐標特性分割二維數據點的理想直線,該直線在進行清晰劃分的同時具有較強的魯棒性和泛化能力。相比邏輯回歸等方式,支持向量機提供一種更優的分類方式。而當待處理的數據集是三維及高維時,該數據不具有線性可分性,因此希望通過加入相關參數將數據輸入高維空間,使數據集變成線性可分的形式,這個過程是由引入松弛變量和非線性映射實現的。在這個高維空間中,通過尋找超平面以進行最優分類:
(4)
r為樣本到超平面的距離,在超平面中,w取(w1,w2),x取(x1,x2),可以將超平面寫成直角坐標中直線y-y0=k(x-x0)的類似形式。w為平面法向量,b為平面與原點的距離。
粒子群算法是一種以鳥類捕食行為為原理的隨機搜索算法[10]。在迭代進行時,粒子具有一個速度值以決定前進方向和距離,同時通過參考個體極值(ibest)和群體極值(gbest)更新相關參數。計算機實現模擬捕食的第一步是初始化粒子群位置、速度、gbest和ibest,迭代時不斷更新ibest和gbest,當gbest符合要求時結束,反之繼續進行更新。
為找到支持向量機模型中合適的參數以提高分類性能和泛化能力,該文嘗試使用PSO優化SVM的參數。該優化方法基于交叉驗證優化,交叉驗證的思想是將訓練樣本分類,分別用于模型的預測和評估,再選擇性能較好的樣本作為模型,以達到評估和選擇模型的效果。選擇對其進行十倍交叉驗證,并將均值作為算法精度的估計。
以中國北方某風電場2020年1月1日0時至12月23日24時,采樣間隔為5 min的全年風速數據為實例進行風速預測與分析。考慮到時間跨度和采樣間隔造成的影響,為減小試驗干擾并保證結論普適性,選取2月1日0時至3月6日6時內,采樣間隔為1 h的數據集共800組。其訓練數據數量的選取約為樣本數量的80%,剩余測試數據在時序上體現為訓練數據的延拓。
采用誤差分析的不同模型對預測效果進行分析和評估,使用到的分析模型包括均方根誤差(root mean squared error, RMSE)、平均絕對誤差(mean absolute error, MAE)和決定系數r2等。
將風速原始序列進行EMD分解,根據不同尺度或趨勢分量進行逐級分解得到7個相互獨立的IMF分量和余項res,分解結果如圖1所示。

圖1 EMD分解結果及分量對應頻譜圖
觀察EMD分解得到的各分量,IMF2與IMF3包含差異較小的特征時間尺度。為克服較嚴重的模態混疊現象,通過配置0.2白噪聲、集合次數100的EEMD分解,得到8個IMF分量,如圖2所示。觀察分解結果可以看到,在EEMD分解結果中,不同分量的時間尺度差距更加明顯。

圖2 EEMD分解結果及分量對應頻譜圖
由于風速的間歇性與波動性,采用單一的預測方法難以取得較好的預測結果,提出一種EEMD-PSO-SVM組合預測模型。根據不同尺度、特征的趨勢分量,分別使用PSO對粒子樣本進行學習訓練,自適應選擇最優參數,得到各分量對應SVM模型中的c和p,c、p分別為懲罰系數、核函數參數。對上文所得模態分解結果進行歸一化,再將分量輸入模型得到預測結果。分別計算平均絕對誤差MAE和決定系數r2,得到各IMF預測模型的參數及誤差評估結果,如表1所示,其中cbest和pbest分別為最佳懲罰系數和最佳核半徑。

表1 PSO-SVM模型參數表
為驗證EEMD-PSO-SVM組合預測模型的優越性,將原始序列及EEMD分解序列分別輸入向量機預測模型進行對比試驗,得到SVM、EEMD-SVM模型風速預測結果。其中對EEMD-SVM模型進行定量精確度評估,得到模態分量預測參數及精度表,如表2所示。

表2 模態分量預測參數及精度表
最后將預測結果進行反歸一化和重構,將225個測試樣本的前70例數據預測結果與原始序列進行比較。圖3反映了分別使用EEMD-PSO-SVM,EEMD-SVM,SVM這3種模型分別進行1 h風速預測的結果(局部)和誤差分布情況。

圖3 不同模型預測結果對比(局部)
對于預測結果需要進行定量分析,結合不同模型的預測結果,分別使用均方誤差(MSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)進行計算,3種模型的誤差指標如表3所示。

表3 不同模型的預測精度表
圖3和表3給出了不同預測模型的預測結果和統計誤差指標。可看出,該文提出的方法的預測曲線擬合程度較好、誤差較小。相比SVM模型,EEMD-SVM模型在引入模態分解的同時大幅提升了預測曲線與原序列的擬合度,避免了不同頻率尺度的相互干擾,體現了模態分解在處理非平穩序列的優越性。EEMD-PSO-SVM模型在上述基礎上優化了向量機懲罰參數和核函數參數的選取,這是因為PSO具有的全局搜索特性使向量機具有合適的學習能力和較強的泛化能力,同時也減小了處理部分數據時陷入局部最優的可能性。
結合圖3和表3,對比傳統單一預測模型和EEMD-SVM模型,后者的統計誤差指標相比單一預測模型分別降低6.11 m/s、1.50 m/s和37.23%,而對比EEMD-SVM模型和EMD-PSO-SVM模型,后者的平均絕對誤差和平均絕對百分比誤差相比前者分別降低0.28 m/s和18.17%。
對于風速序列中的極值點和發生較大波動的數據點,提出的組合預測模型相較于傳統預測模型有更好的擬合效果,相關誤差指標均顯著降低,這也表明結合EEMD預處理和PSO優化支持向量機能夠有效提高模型可靠性,實現較高精度的短期精度預測。
基于風速的波動性和間歇性,提出了EEMD-PSO-SVM組合預測模型。該預測模型將原始序列分解為具有不同尺度的IMF分量,分別建立PSO-SVM預測模型,優化得到最佳向量機參數,從而建立對應的最優預測模型。該組合預測模型實現了在保證精度和可靠性的同時避免復雜的模型結構。
通過對實例數據進行預測,對比傳統單一預測模型與該文提出的EEMD-PSO-SVM組合預測模型,改進模型的MAE、MAPE等統計誤差指標大幅度降低,預測精度能更好地滿足工業和生產需要,具有較強可行性和工程應用價值。