(華北電力大學控制與計算機工程學院 北京 102206)
近年來風力發電目前已逐漸成為各個國家重點發展的可再生能源發電技術之一[1]。但由于風速自身的隨機性特點導致在風電并網后對電力系統的穩定運行造成了較大的影響[2]。針對這一問題目前主要有兩種解決方案:一是增加風電裝機總容量,即在不穩定時通過備用機組進行互補從而減小對電網運行帶來的沖擊;二是利用較好的模型算法對風速做出準確的預測,從而及時對電網運行進行調度。第一種方法增加裝機容量提供額外的備用機組需要投入較大的成本,第二種通過模型預測可以降低成本提升風力發電的經濟性。
針對短期風速預測[4]國內外學者進行了廣泛的研究,其中包括自回歸滑動平均(ARMA)模型、自回歸求和滑動平均(ARIMA)模型[5,6]等線性預測模型以及包括支持向量機(SVM)[7]等非線性預測模型。基于自回歸的ARMA、ARIMA等模型適合線性時間序列的預測,SVM、神經網絡等模型適合非線性預測。但由于各種模型自身存在局限性,單一的預測模型預測誤差較大,不能很好的滿足預測的需求。因此本文提出了一種ARIMA模型與SVR相結合的組合風速預測模型[8~10],通過ARIMA模型預測風速的線性序列,將實際風速與ARIMA預測的風速做差值得到非線性殘差序列,然后利用SVR模型預測非線性殘差進序列,最后將ARIMA預測的線性序列與SVR預測的非線性殘差序列相加得到最終的預測風速序列,從而達到提高預測精度的目的。
ARIMA模型通過對非平穩序列進行若干次差分處理,將非平穩序列變換為平穩序列然后進行處理,可以理解為是一種ARMA針對非平穩數據的推廣,即針對不平穩數據差分d次轉化為穩定序列,然后使用以p、q為參數的ARMA模型對該平穩序列建模,最后通過反變換的方式得到原序列,則以p、d、q為參數的ARIMA模型預測方程可表示為:
yt=θ0+φ1yt-1+φ2yt-2+…+φpyt-p+εt
-θ1εt-1-θ2εt-2-…-θqεt-q
(1)
式中,yt為時間序列的樣本值,θi,φi為模型的參數,εt為獨立正態分布的白噪聲。
通過差分處理平穩化時間序列后,計算原始序列的自相關函數ACF,偏相關函數PAC,對于時間序列yt,自協方差可表示為:
(2)
自相關函數為:
(3)
偏相關函數為:
(4)
實際使用中可以通過ρk、αk值對模型進行初步的定階。
支持向量機(Support Vector Machine,SVM)是一種監督學習的機器學習方法,能夠處理樣本數據較少情況下的規律學習。SVM在處理非線性、小樣本、高維等問題時具有良好的泛化能力和表現。將SVM方法應用到求解回歸問題時稱為支持向量回(Support Vector Regressive,SVR)。
對樣本(x,y),傳統回歸模型直接基于模型輸出f(x)與真實值y之間的差別來計算損失,當且僅當f(x)與y完全同時,損失才為零。與此不同,SVR則是通過f(x)=wtx+b去擬合所有的樣本點,使得所有的樣本點離最優超平面的總方差最小,即假設我們能容忍f(x)與y之間最多有ε的偏差,即僅當f(x)與y之間的絕對值大于ε時才計算損失。
則SVR問題可形式化為:
(5)
式中C為正則化常數,eε是ε不敏感損失函數。
(6)
(7)
本文短期風速混合預測模型主要步驟如下:
設短期風速實際值序列為{s(t),s(t-1),…,s(t-m)},將該序列作為通過歷史數據訓練好的ARIMA模型的輸入,經ARIMA模型處理后的得到風速預測值序列{p′(t+1),p′(t+1),…,p′(t+h)}。
根據短期風速實際值序列{s(t),s(t-1),…,s(t-m)}及對應的ARIMA模型預測序列
{s′(t),s′(t-1),…,s′(t-m)}計算短期風速的殘差序列{E(t),E(t-1),…,E(t-m)}。
利用訓練集數據得到的殘差序列訓練SVR模型,使用滾動殘差方式逐步預測t+1~t+h的殘差序列{e′(t+1),e′(t+2),…,e′(t+h)}。本文滾動預測殘差時的滾動步長為3。
將步驟(1)中得到的風速預測序列{p′(t+1),p′(t+2),…,p′(t+h)}于步驟(3)中得到的風速殘差序列{e′(t+1),e′(t+2),…,e′(t+h)}求和得到最終的風速預測序列{p(t+1),p(t+2),…,p(t+h)}。
實驗選取某風電場1月份風速數據,采集間隔時間為1h,經處理之后選取225條數據,其中前200條構建訓練集用于模型訓練、剩余25條數據作為測試集驗證模型。
對原始風速按照ARIMA模型步驟進行建模,建立后的模型為:ARIMA(3,1,2)。
在SVR模型中影響模型的主要參數有ε、C、σ,參數的選擇很大程度上決定了算法的學習能力和預測的準確度。
不敏感損失函數參數ε,影響支持向量機的擬合情況,同時也影響支持向量的個數從而影響算法的泛化能力。ε過大,會導致支持向量的數目減少,模型學習精度不夠,建立的模型相對簡單。ε過小,則會導致回歸精度過高建立的模型相對復雜。
懲罰系數C,也稱為正則化參數,反映了算法對分類錯誤的樣本數據的懲罰度。懲罰系數C過小,表明對數據懲罰越小,數據訓練誤差變大;懲罰系數C過大,則有可能出現過學習的問題。
核函數σ,核函數的不同會導致輸入空間構建的非線性決策函數不同。目前常用的核函數線性核函數、多項式核函數、徑向基核函數等,本文實驗中選擇徑向基核函數作為算法的核函數。
預測模型參數確定后,利用測試集25組數據對模型進行驗證,ARIMA預測值和基于SVR的混合預測值如圖1所示。

圖1 ARIMA預測值與混合預測模型預測值
為進一步說明本文預測方法預測精度的提高,表1給出了與常見的幾種預測方法對比預測結果的均方根誤差(RMSE)與平均絕對誤差(MAE)的結果。

表1 幾種預測模型預測指標對比
由圖1預測結果及表1幾種預測模型的預測指標可知,本文提出的基于SVR的混合預測模型在預測效果和準確度方面優于其它預測方法。
針對短期風速預測,本文結合不同預測模型的優缺點提出了一種基于線性預測模型ARIMA與非線性預測模型SVR相結合的混合預測模型。通過ARIMA模型預測風速的線性部分,使用SVR模型預測非線性殘差序列,最后將ARIMA預測值與SVR預測值求和得到優化的結果。仿真實驗及模型算法對比表表明,本文提出的混合預測模型具有較好的預測效果。