曹敏 巨健 白澤洋 劉駿濤
(1 國網(wǎng)陜西省電力公司 陜西西安 710048 2 蘇文電能科技股份有限公司 江蘇常州 213000)
相關(guān)學(xué)者已經(jīng)對用電量的預(yù)測進行了深入的研究, 取得了顯著的成果。 文獻[4]和文獻[5]在傳統(tǒng)的灰色預(yù)測模型的基礎(chǔ)上,提出了改進的灰色模型電量預(yù)測方法;文獻[6]和文獻[7]將偏最小二乘回歸分析方法用于中長期電力負荷預(yù)測;文獻[8]和文獻[9]將神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于電力預(yù)測當中。
除了上述方法外, 另外最具代表性的就是自回歸移動平均(Auto-Regressive and Moving Average Model,ARMA)模型和支持向量機(Support Vector Machine,SVM)模型。 已經(jīng)有許多研究將它們應(yīng)用于電力預(yù)測當中[10-11]。ARMA 模型由自回歸模型(AR)和移動平均模型(MA)組成,采用歷史數(shù)據(jù)和白噪聲序列進行預(yù)測, 是一種精確度較高的線性時間序列預(yù)測模型。SVM 模型是根據(jù)統(tǒng)計學(xué)理論提出的一種機器學(xué)習(xí)方法, 是一種性能優(yōu)異的非線性分析模型。 用電量預(yù)測的不確定性主要是因為影響其預(yù)測結(jié)果的各種內(nèi)在和外在因素較多, 只通過單一的線性或者非線性描述進行預(yù)測的結(jié)果精準度較低。 因此本文提出一種基于ARMA 和SVM 模型的用電量組合預(yù)測方法,對售電公司下用電企業(yè)的用電量進行預(yù)測,通過將預(yù)測結(jié)果與單一ARMA 和SVM 模型的預(yù)測結(jié)果進行比較,驗證本文模型的有效性和可行性。
自回歸移動平均模型的預(yù)測過程有模型定階、參數(shù)估計、求解等步驟。 模型的數(shù)學(xué)表達式為:

式中:Lt為預(yù)測結(jié)果,i(1≤i≤p)和θj(1≤j≤q)為系數(shù),p、q 分別為自回歸部分模型和移動平均部分模型的階數(shù),αt是白噪聲序列,Xt是歷史數(shù)據(jù)序列。
預(yù)測結(jié)果與前p 次的歷史數(shù)據(jù)有關(guān), 同時也受到前q 次以及當前的隨機干擾項的影響。
采用從低階到高階逐步試探的方法確定模型階數(shù), 并確定最優(yōu)參數(shù)。 根據(jù)已確定的階數(shù)和參數(shù),得到最優(yōu)模型,得到t時刻的線性部分的預(yù)測結(jié)果Lt。
4)水利部門資料。水利普查成果等資料,可作為地理國情信息普查中水體、水工設(shè)施信息獲取的重要輔助資料,提高普查結(jié)果精度。水利部門的流域單元邊界數(shù)據(jù)及流域單元名稱,河流空間分布數(shù)據(jù)及相關(guān)屬性信息,湖泊空間分布數(shù)據(jù)及相關(guān)屬性信息,水庫、塘壩屬性;水電站、水閘、堤防名稱及編碼、級別屬性;取水口、地表水源地、入河湖排污口的空間分布數(shù)據(jù)及相關(guān)屬性信息;水文站和水位站空間分布數(shù)據(jù),為地理國情普查數(shù)據(jù)采集及統(tǒng)計分析提供數(shù)據(jù)來源。
ARMA 模型對線性數(shù)據(jù)的處理較有優(yōu)勢, 但是對非線性數(shù)據(jù)的信息較難捕捉, 其預(yù)測只考慮時間序列本身的變化規(guī)律,幾乎不考慮其它相關(guān)變量的變化情況,而現(xiàn)實中的時間序列受到眾多非線性因素的影響且含有復(fù)雜的噪聲, 其確定的階數(shù)和參數(shù)往往并非最優(yōu),從而導(dǎo)致預(yù)測精度不高。
支持向量機模型的預(yù)測過程包括支持向量確定、 核函數(shù)選擇、核參數(shù)確定、求解等步驟。 模型的數(shù)學(xué)表達式為:

式中:SVS 為支持向量個數(shù),αi為每個訓(xùn)練樣本的拉格朗日系數(shù),yi(-1 或1)為向量標簽,K(xi,x)為所選擇的核函數(shù),b0為偏置量。 核函數(shù)代替了傳統(tǒng)線性方程中的線性量,將數(shù)據(jù)映射到高維空間處理, 選擇合適的核函數(shù)直接影響預(yù)測模型的性能和準確性,完成核函數(shù)的選擇后,計算核函數(shù)的最優(yōu)核參數(shù),隨后對樣本進行訓(xùn)練預(yù)測,建立SVM 模型,求得相關(guān)參數(shù),最終得到預(yù)測結(jié)果Nt。
SVM 模型在解決非線性、小樣本、高維數(shù)的模式識別方面具有良好的泛化能力,其得到的最優(yōu)解具有全局性,解決了其它算法中無法避免的局部最優(yōu)問題。 但其預(yù)測效果對核函數(shù)的選擇較為敏感,學(xué)習(xí)能力由核函數(shù)的類型和參數(shù)決定,對于大樣本數(shù)據(jù)較難得到理想的訓(xùn)練效果, 需要提升其泛化能力和訓(xùn)練效率。
售電公司下用戶的用電量受到眾多因素的影響, 由于其為月度統(tǒng)計, 因此以年為單位會呈現(xiàn)一定的周期性規(guī)律,ARMA 作為1 種時間序列方法,可以較好地對用電量的線性相關(guān)性做出預(yù)測。 同時,用戶的用電量還受到用電負荷、溫度、計劃用電量等因素的影響, 且這些因素之間也有著錯綜復(fù)雜的關(guān)系,將這些因素作為變量輸入SVM 模型進行非線性回歸,可以較好的完成對用電量非線性部分的預(yù)測。
本文針對售電公司用戶用電量的預(yù)測問題, 基于ARMA和SVM 模型采用1 種組合的預(yù)測方法, 把用電量時間序列看成由線性自相關(guān)結(jié)構(gòu)和非線性結(jié)構(gòu)兩部分構(gòu)成, 分別發(fā)揮ARMA 模型和SVM 模型對線性模型和非線性模型處理的優(yōu)勢,將二者組合進行用電量的預(yù)測。 通過組合模型進行預(yù)測的具體步驟如下:
(1)獲取歷史用電量實際數(shù)據(jù);
(2)構(gòu)建ARMA 模型得到t 時刻的線性部分的預(yù)測結(jié)果Lt;
(3)重復(fù)步驟(2),對最后n 個樣本進行預(yù)測,得到預(yù)測結(jié)果序列L;
(4)將上一步得到的預(yù)測結(jié)果序列L 與歷史用電量數(shù)據(jù)相減,得到殘差序列N;
(5)獲取負荷、計劃用電量、溫度的歷史數(shù)據(jù);
(6)將步驟(5)獲取的數(shù)據(jù)與步驟(4)得到的殘差序列N進行歸一化處理:

式中:yi為歸一化結(jié)果;xi為原始數(shù)據(jù);max (x) 為最大值;min(x)為最小值。
(7)得到歸一化后的數(shù)據(jù)集,作為SVM 模型的樣本集;
(8)選擇核函數(shù),確定SVM 參數(shù),生成預(yù)測結(jié)果Nt;
(9)將線性部分預(yù)測結(jié)果Lt和非線性部分預(yù)測結(jié)果Nt組合,得到最終預(yù)測結(jié)果Yt=Lt+Nt。
通過組合模型進行用電量預(yù)測的流程圖如圖1 所示。
本文采用的實驗數(shù)據(jù)來自某售電公司的用戶用電數(shù)據(jù),將5 家用戶企業(yè)的歷史用電量數(shù)據(jù)以及用電負荷、溫度、計劃用電量等相關(guān)數(shù)據(jù)作為樣本數(shù)據(jù)輸入, 根據(jù)第2 節(jié)所述步驟建立預(yù)測模型,并利用模型預(yù)測用戶企業(yè)的每月用電量數(shù)據(jù)。依次采用ARMA 模型、SVM 模型和ARMA-SVM 組合模型對5家用戶企業(yè)的用電量分別進行預(yù)測, 并對比分析這3 種模型的預(yù)測效果。
為考察用電量的預(yù)測效果, 本文選取平均絕對百分誤差(Mean Absolute Percentage Error,MAPE)作為定量反映模型預(yù)測精度的指標,其計算公式如下:


圖1 組合模型預(yù)測過程
式中:yi為實際用電量,為預(yù)測用電量,n 為實驗樣本的總數(shù)量,MAPE 值越小,說明預(yù)測值與實際值的差異越小,預(yù)測精度越高。
以用戶企業(yè)A 為例,分別用ARMA、SVM 和組合模型對其連續(xù)24 個月的用電量進行預(yù)測,將預(yù)測結(jié)果與其實際用電量進行對比。
用戶企業(yè)A 從2016 年1 月至2018 年12 月各月份的實際用電量數(shù)據(jù)如表1 所示。

表1 用戶企業(yè)A 實際用電量數(shù)據(jù) 單位:MWh
分別利用ARMA、SVM 和組合模型的預(yù)測結(jié)果與實際用電量的對比如圖2~圖4 所示。
A、B、C、D、E 5 家用戶企業(yè)分別用ARMA、SVM 和組合模型預(yù)測的結(jié)果與相應(yīng)的實際用電量計算出的MAPE 值對比情況如表2 所示。

表2 預(yù)測結(jié)果的MAPE 值情況

圖2 ARMA 模型預(yù)測結(jié)果與實際用電量對比

圖3 SVM 模型預(yù)測結(jié)果與實際用電量對比

圖4 組合模型預(yù)測結(jié)果與實際用電量對比
通過對比結(jié)果可以看出,SVM 模型的預(yù)測結(jié)果普遍優(yōu)于ARMA 模型, 這說明了非線性因素的作用對用電量的預(yù)測有關(guān)鍵的影響,特別是在數(shù)據(jù)波動較大時(如春節(jié)期間用戶用電量下降趨勢明顯),SVM 模型的預(yù)測更加精準,而ARMA 模型更適用于較為平穩(wěn)的訓(xùn)練數(shù)據(jù)。而綜合了ARMA 和SVM 的組合模型預(yù)測精度普遍優(yōu)于單一的ARMA 和SVM 模型,有較好的穩(wěn)定性,說明其充分利用了原始數(shù)據(jù)中的信息,避免了單一模型的局限性, 驗證了綜合考慮線性和非線性作用的組合模型的合理性與必要性。
售電公司作為電力市場的新興主體, 其對用戶用電量預(yù)測的準確性是關(guān)乎其減少偏差考核風(fēng)險和提高競爭力的關(guān)鍵。針對用電量預(yù)測的線性和非線性特征,本文利用ARMA 模型捕捉其線性趨勢,利用SVM 模型預(yù)測其非線性規(guī)律,據(jù)此建立ARMA 和SVM 的組合模型, 對用戶企業(yè)的用電量進行預(yù)測。 實驗結(jié)果表明,組合模型既兼顧了單一預(yù)測模型各自的優(yōu)勢,又彌補了彼此的不足,相較于單一的ARMA 和SVM 模型,其預(yù)測結(jié)果具有有效性和更高的精確性, 可以為售電公司的預(yù)測用電量工作提供很好的技術(shù)支持。