劉 丹,陳 軍,高 政,鄭桂博,張 亮
(國家能源集團電力營銷中心有限公司,北京 100010)
發電量預測作為電力行業中一個熱點問題一直深受關注,特別是近些年異常氣候增多,可再生能源發電存在較大的不確定性,電力保供難度加大,發電量中長期預測成為越來越重要的研究領域。精確、科學的預測是正確決策的前提和保證,發電量預測本質上是對電力市場供應的預測,在商業化的體制下,做好發電量預測尤其是中長期預測工作將直接關系到電力市場發電企業運行所需的成本與經濟效益。
當前國內外的電力負荷預測方法研究相對成熟,預測發電量的方法多種多樣,其中主要包括傳統回歸模型預測方法、時間序列預測方法以及人工神經網絡預測方法。
回歸模型預測技術是根據歷史負荷數據資料,依靠線性回歸數學模型對未來的負荷進行預測,研究各自變量和因變量之間的關系,形成回歸方程[1]。隨著日前交易市場和短期現貨交易市場在美國和歐洲進行試點改革,各類技術進一步發展,時間序列模型組件成為發電量預測的重要方法。發電量序列屬于典型的時間序列,而時間序列模型中的ARMA和指數平滑法應用最為廣泛[2-3]。時間序列模型由于精度高、所需數據簡單而被市場分析者和電網公司所青睞。時間序列模型將負荷數據看成是一個周期性變化的時間序列,然后根據給定的模型對未來的負荷進行預測。近些年來,越來越多的學者形成一種共識,即預測精度的提高必須要考慮其他因素對發電量預測的影響,很多智能預測算法如神經網絡、支持向量機、專家系統、粒子群算法、遺傳算法等開始大量地運用于發電量預測中,其中神經網絡預測方法的應用最為廣泛。BP神經網絡是最基礎且最為經典的預測方法,諸多神經網絡預測文獻表明,神經網絡預測方法在精度方面通常優于傳統的線性回歸模型和時間序列預測方法。
國內學者在預測過程中,早期多借鑒專家經驗和各類預測模型,用于優化單一預測模型存在的缺點,通過將多種預測方法進行組合,按照協方差最小原則確定權數,形成最終的預測模型,從而在一定程度上提高預測精度。此外,由于中國特色社會主義經濟制度的特點,電力供給更多承擔著社會服務和民生保障的功能,因此當政策等宏觀因素變動時,尤其是在保供時間的影響下,電力供需形勢未必會按照市場規律進行調節,政策變化和保供要求將會為發電量預測帶來較大的挑戰。因此國內學者在進行發電量預測的過程中,十分注重宏觀因素包括GDP、人口以及政策等的影響[4]。
文中分別選用改進的多元線性回歸和BP神經網絡預測對2000~2021年全國發電量數據進行分析,并且對未來10年全國發電量數據進行組合預測。
多元線性回歸是建立多個自變量與因變量之間的定量關系,通過回歸系數反映因變量對自變量的影響程度。在建立預測模型的過程中,假設問題的因變量為y,自變量即對因變量y產生影響作用的變量有n個,這n個變量分別是x1,x2,…,xn[5]。假設因變量y與其影響因素之間存在一定的定量線性關系,可寫出如下的線性關系式:
y=β0+β1x1+β2x2+…+βnxn+a
(1)
式中:y為因變量;xi為自變量(i=1,2,3,…,n);β0為回歸常數項;βi為回歸系數(i=1,2,3,…,n);a為隨機誤差項[6]。
為了方便在建立模型的過程中進行估計,假設參數a服從正態分布,即參數a滿足以下條件:
E(a)=0,D(a)=σ2<∞
(2)
式中:E(a)為隨機誤差的均值,D(a)為隨機誤差的方差,σ為隨機誤差項的標準差。
由此可以得到一個n元線性回歸模型,即
(3)
根據中國2010~2020年的用電量、GDP和人口數,首先初步建立線性回歸模型, 在SPSS中對自變量和因變量進行線性回歸分析,得到估計參數和顯著性檢驗值,見表1。根據表1中的數據可以得到初步的線性表達式:

表1 初次線性回歸估計參數
y=-236 527+0.039 8x1+1.944 0x2
(4)
回歸方程(4)的顯著性檢驗結果見表2。根據表2中顯示的數據,回歸方程的R2為0.995 9,這說明回歸方程從整體上是顯著的,但不代表回歸方程中的每一項都是顯著的。按照表1中的數據,由于在進行線性回歸時設置的置信區間為95%,所以在顯著性水平0.05以下,2個自變量均是顯著的。

表2 回歸方程整體的顯著性檢驗結果
該模型中存在2個自變量,自變量之間可能存在一定的線性關系。如果各個變量之間存在嚴重的共線性關系,這時使用最小二乘法所得的方程有可能會無效,從而基于該方程進行分析可能會出錯,甚至會引入歧途。這種情況被稱為多重共線性問題,所以在分析的時候必須要作多重共線性診斷,才能得到較為合理的結果。
診斷所用的方法是看方差膨脹因子VIF的值落在哪個區間。方差膨脹因子VIF是指解釋變量之間存在多重共線性關系時的方差與不存在多重共線性關系時的方差之比,是容忍度的倒數[7]。VIF越大,顯示共線性程度越嚴重。通過方差膨脹因子可以考慮單個自變量與其他自變量的多元線性回歸,從而計算自變量之間新模型的判定系數,記為r2,r2為以xi與其他自變量的復測定系數,方差膨脹因子VIF的計算式為
α=1/(1-r2)
(5)
α反映自變量之間線性關系的具體規則為:當α<5時,表示自變量之間共線性的程度不存在或很弱;若5≤α ≤10,表示自變量之間共線性程度為中等程度;若α>10,表示自變量之間存在嚴重的共線性程度[8]。
該問題中各個自變量之間方差膨脹因子計算結果見表3。

表3 方差膨脹因子α
通過比較診斷原則和表1~3中的數據可知,2個自變量GDP和人口數之間存在嚴重的共線性關系。
根據計算方差膨脹因子,發現人口數與GDP之間存在嚴重的多重共線性,因此考慮將人口數變量或GDP變量剔除掉再次進行回歸分析,重新建立線性回歸模型,即再次使用SPSS進行線性回歸,再次求取方程各項參數。
1.3.1 剔除人口數后的線性回歸
將人口數剔除后,重新建立發電量與GDP之間的線性回歸模型,各項參數見表4。

表4 剔除人口數后線性回歸參數
根據表4中的數據,可寫出改進后的線性回歸方程如下:
y=11 830.899+0.067x1
(6)
改進后線性回歸方程的整體顯著性檢驗結果見表5。

表5 剔除人口數回歸方程的顯著性檢驗結果
根據表4中數據,在置信水平為0.05的情況下,目前自變量GDP通過了系數檢驗,而根據表5可知,線性回歸方程的整體相關性為0.987。
1.3.2 剔除GDP后的線性回歸
將GDP剔除后,重新建立發電量與人口數之間的線性回歸模型,各項參數見表6。

表6 剔除GDP后線性回歸參數
根據表6中的數據,可寫出改進后的線性回歸方程如下:
y=-582 870+4.663x2
(7)
改進后線性回歸方程的整體顯著性檢驗結果見表7。

表7 剔除GDP回歸方程的顯著性檢驗結果
根據表6中數據,在置信水平為0.05的情況下,目前自變量人口數通過了系數檢驗,而根據表7可知,線性回歸方程的整體相關性為0.978。
由此可見, GDP與發電量之間的線性回歸模型擬合效果更好,故選取自變量GDP來預測未來10年的發電量情況,得到最終的線性回歸方程為
y=11 830.899+0.067x1
(8)
式中:x1為GDP。
根據聯合國經濟和社會事務部2023年7月發布的《世界人口展望2022》預測,中國人口在2022年預計較2021年有所下降。根據國家信息中心預測,中國2022年GDP增速約為3.5%,2023年GDP增速約為5%。2020年9月,在中國宏觀經濟論壇舉行的CMF宏觀經濟熱點問題研討會上,瑞銀亞洲經濟研究主管、首席中國經濟學家汪濤在會上預測,未來10年,中國實際年均GDP增速將下降到4.5%。由此預測未來10年中國的人口數與GDP預測值見表8。
將2021~2030年的GDP數據帶入式(6)中,得到2021~2030年的全國發電量數據見表9。
BP神經網絡是一種正向前饋神經網絡[9],利用最速梯度下降法的誤差逆傳播對網絡權值和閾值進行不斷修正[10],一直到終止條件滿足為止。BP神經網絡能學習和存貯大量的輸入-輸出模式映射關系,無需使用者具有描述這種映射關系的數學方程的相關知識,根據Kolmogorov的相關定理,可以由一個包括輸入層(input)、隱含層(hidden layer)和輸出層(output layer)的3層BP神經網絡對非線性映射進行任意精度的逼近。從數學意義上講,若輸入層的節點數為n,輸出層節點數為l,BPNN是從Rn到Rl的一個高度非線性映射,在所選網絡的拓撲結構下,通過學習算法調整各神經元的閾值和連接權值使誤差信號取值最小。圖1所示的是一個典型的3層BP神經網絡的網絡拓撲結構[11]。從圖1可以看出,BP神經網絡的存儲信息的結構可以分為2個部分:1)網絡的體系結構,即網絡輸入層、隱含層和輸出層神經元個數;2)相鄰節點之間的連接權值。

圖1 3層BP網絡拓撲結構示意圖
以BP網絡模型中的最后一層為例,通過計算各節點希望輸出值與實際輸出值之差的平方和Ep:
(9)
式中:P為BP網絡模型中的最后一層;tpj為最后一層節點j的希望輸出值;Opj為最后一層節點j的實際輸出值;M為節點總數。
然后通過誤差反向傳播進行梯度鏈式求導的方式訓練連接權重,從而得到最優的訓練網絡:

(j=1,2,…,m)
(10)
式中:Ipk為最后一層節點k的凈輸入;θj為節點的閾值;wik為節點j到k之間聯系的權重。
利用Matlab中BP神經網絡工具包,設置訓練參數,其中隱藏神經元個數設置為15個,迭代次數為100次,訓練目標為10-3,學習率為0.01,得到預測模型,利用驗證集數據對預測模型進行驗證,得到其預測結果如圖2所示,且決定系數為0.990 7,可見其擬合效果良好。

圖2 驗證集預測值與實際值對比結果
結合BP神經網絡,以2000~2021年全國發電量數據為基礎,對歷年及未來10年電力負荷進行預測,以檢驗該模型的精度,使對發電量的預測更有說服力,最終預測結果見表10。

表10 2022~2031年全國發電量BP神經網絡預測結果
通過上述方法的預測以及相關的參數檢驗,得到2種方法的預測結果見表11。在此基礎上,由于BPNN具有較好的非線性預測能力,而多元線性回歸具有較好的線性擬合解釋能力,因此取平均值對2種方法進行組合預測,最終得到表11。

表11 不同預測方法下2022~2031年全國發電量預測值
2001~2022年全國發電量最終的組合預測值與實際值的對比如圖3所示。

圖3 實際值與預測值的對比
利用決定系數(r2)、平均絕對誤差(MAE)和均方誤差(RMSE)確定不同模型的擬合效果。將多元回歸預測模型、BP神經網絡預測模型以及組合預測模型的預測精度進行對比,見表12。

表12 不同模型的決定系數對比
由表12可見,組合預測模型的決定系數最大,平均絕對誤差和均方誤差最小,其預測效果最好。
結合經典的多元線性回歸模型和BP神經網絡模型對中國年度用電量進行了組合預測。在利用多元線性回歸模型時,對于存在的共線性現象進行了檢測和糾正,最終的組合預測能夠吸收并結合2種模型的優點。線性回歸模型的局限性是模型的線性方法決定其無法描述復雜的非線性因素對發電量的影響情況,而神經網絡技術則較好地考慮非線性因素的影響情況,較好地彌補這一缺點,同時將歷史負荷的發展規律和較高的預測精度相結合,提高了預測的準確性和精確度。