徐久益,李自明,姚劍峰,楊曉雷,屠一艷,李 杰
(1.國網浙江桐鄉市供電有限公司,浙江 桐鄉 314500;2.國網嘉興供電公司,浙江 嘉興 314000)
電力系統規劃設計和運行管理依賴用電量數據。同時,用電量又是經濟變化的“風向標”。因此,月度用電量的準確預測既是實現電網安全、經濟運行的基礎,也對把握宏觀經濟發展趨勢起到至關重要的作用[1-2]。
月度用電量預測是電力需求側管理重要的市場預測技術手段,精確的用電量預測對于平衡區域電力電量、精準的電網投資、電力現貨市場交易、有效實施電力需求側管理和節能降耗戰略等[2]都有著十分重要的意義。
傳統的電量預測方法如回歸分析法、時間序列預測法、灰色預測、神經網絡等預測方法[3-6],其預測精度已經不能滿足當前電網發展需求。目前,電量預測技術和理論不斷涌現,一些學者對月度用電量的預測方法進行研究,在傳統預測方法上面不斷改進,也取得新的成果。文獻[7]在傳統時間序列預測模型基礎上,提出了考慮經濟因素時滯效應的月度電量預測方法。文獻[8]從影響月度用電量的因素出發,利用計量經濟學中的協整檢驗以及格蘭杰因果檢驗來分析經濟因素與用電量的關系,提出一種基于協整-格蘭杰因果檢驗和季節分解的月電量預測方法。近年來,中國的經濟發展進入轉型期,各地區月度用電量的變化也呈現差異性和多樣性,因此,這些預測方法的運用也存在一定的局限性。基于此,通過對區域歷史數據的研究分析,挖掘其發展的規律和特點,并結合兩種算法優勢建立電量預測模型,創新性地提出了一種計及經濟因素的混合模型電量預測新方法,為地區月度用電量預測提供了一種新選擇。
電量預測的核心是根據區域用電量的歷史數據以及對用電量產生影響的經濟、氣候等因素的歷史數據,建立數學模型來表述用電量發展變化規律。因此,在建立數學模型之前,首先需要對歷史數據進行分析和處理,研究和挖掘出歷史數據發展的內在規律性[9]。
所用數據來源于中國中西部某區域電網公司,如表1和表2所示。
通過分析半年度電量與半年度經濟總量的關系可以發現,電量以及相關4類經濟數據具有較強的時序特征,但2015年和2016年上半年的電量與經濟總量的增長率存在明顯的不一致性,其余年份對應的電量與經濟總量增長率基本保持一致。
針對以上非一致性問題,將對原始數據進行預處理,主要是數據清洗,即對原始數據中的明顯錯誤值、缺失值、異常值、可疑數據,選擇合適的方法進行“清理”,使“臟”數據變為“干凈”數據,也包括對重復記錄進行刪除。這里通過比較多種方法進行數據預處理,鑒于篇幅,僅介紹最終選擇的箱形圖檢測方法,箱形圖原理如圖1所示,即對于一組數據,計算中位數、上下四分位數和上下限,若數值超過上下限則為異常值。下、中、上四分位數的位置計算方法為
f(Qi)=i(n+1)/4
(1)

圖1 箱形圖檢測法的基本原理
式中,n=12,表示數據個數。經電量數據檢測發現,存在異常的月份有2014年7月,2015年2月、8月,2016年2月、8月和12月,共6個月份。
檢測出異常值后,需要通過分箱法對異常值進行平滑處理,具體實現方法:若存在縱向兩個數據則取縱向兩個數據的均值a,再取橫向兩個數據的均值b,再取a、b的均值作為異常點的替代值。最終將上述存在異常的6個月用電量數據依次替換為 5082、5021、5821、5518、6194、5822 GWh。

表1 中西部某區域電網公司近年各月電量情況 單位:GWh

表2 中西部某區域相關經濟數據
建立合適的電量預測模型,是電量預測核心,針對本項目原始數據分析,2014—2018年電量曲線波動不大、趨勢平穩,且原始樣本數據量小。而現代預測方法如神經網絡、時間序列[10]等需要大量數據進行訓練才能得到比較準確的模型,對于本項目數據量較小的情況下,預測效果不好。
研究采用傳統的回歸分析法和指數平滑法[11]相結合來建立電量值的預測模型,優點是這兩種預測方法比較成熟,模型參數設置較少,幾乎不需要人為調參,且在數據量較小的情況下仍能得到比較準確的結果。本項目所提模型和算法的整體流程如圖2所示。

圖2 月用電量預測模型流程
1)區域用電量曲線具有一定的周期性、時序性,一般以年為單位,每年電量曲線變化趨勢相同。選取同樣次數的多項式分別擬合2014—2017年的用電量曲線,多項式的系數采用最小二乘法[12]原則確定,即誤差平方和最小,得到用電量與時間的關系式。多項式次數的選擇采用自動尋優,選擇效果最好的值。自動尋優找出最優擬合次數9次。
2)指數平滑法是一種數據預測方法,利用預測數據的變化在短期內保持歷史數據的慣性特征,當前的數據與歷史數據有關,且離現在時刻越近,對當前數據影響越大。本模型采用線性指數平滑模型:
Ft+m=at+btm
(2)
式中:
(3)
將步驟1中得到的2014—2017年的多項式函數的系數運用指數平滑法外推,得到2018年用電量與月份的關系:
f(x)=0.000 081 38x9-0.004 741 82x8+
0.116 814 56x7-1.584 389 12x6+
12.920 345 13x5- 65.031 307 13x4+
199.920 938 01x3-358.480 374 09x2+
337.644 679 21x-62.318 446 43
(4)
然后便可計算出2018年1—12月電量預測值,這是一個初始預測值,后續需要做修正。
3)采用多元線性回歸法[13],將用電量與其影響因素(即4類經濟因素)進行擬合。用多元線性表達式來擬合半年電量和與這些經濟數據的關系,表達式為
h(x1,x2,x3,x4)=ax1+bx2+cx3+dx4
(5)
式中:h(x1,x2,x3,x4)為半年電量和;x1、x2、x3、x4分別為規模以上工業增加值、固定資產投資、社會消費品零售總額和出口總值。2018年上下半年的經濟數據與用電總量關系擬合表達式為
f(x)= 0.043 239 8x1+ 0.014 314 24x2+
0.072 597 81x3-0.326 030 59x4-46.704 427 381
(6)
4)作為一個多輸入系統而言,考慮越多輸入量對系統的輸出預測越準確,但是為了簡化電量預測模型,需要找到影響程度較大的因素,這就需要進行相關性分析。
相關性分析是指對兩個或多個具備相關性的變量元素進行分析,從而衡量兩個變量因素的相關密切程度。相關性的元素之間需要存在一定的聯系或者概率才可以進行相關性分析[14]。分析不同元素的相關性需要計算它們之間的相關系數,其定義為
(7)
式中:r為樣本相關系數;n為樣本總數;x、y為樣本觀測值,在本項目中x為電量,y為經濟性因素。
需要計算各經濟指標因素與電網電量的相關系數,找出對電網電量的影響大且影響較為穩定的因素,相關性結果如表3所示。

表3 4類經濟因素與電量的相關性
從表3可以看出,4類經濟數據與電網電量的相關度均較高,相關系數均大于0.95,其中社會消費品零售總額相關度最高,因此,將4類經濟數據作為電量預測建模研究的關鍵因素。
5)用半年電量和修正初始預測值,如果經濟數據得到的2018年上半年電量和與步驟2中得到的初始預測數據的2018年上半年電量和相比,更接近實際數據,那么經濟數據得到的2018年下半年電量和也會更接近,故用經濟數據得到的電量和對步驟2得到的初始預測數據做修正。如果經濟數據得到的2018年上半年電量和更不接近于實際數據,則不對初始電量預測數據進行修正。
修正的具體方法為整體倍數法:
β=(S1+S2)/2
(8)
式中:S1為經濟數據得到的2018年下半年電量和;S2為步驟2中得到的2018年下半年電量和,對于2018年8—12月的初始預測數據都乘以β,得到本模型最終的預測結果。
為了驗證所提方法的實際運用效果,對給定的中國中西部某區域電網公司2018年1—7月的月用電量進行了預測,與目前使用最廣泛的BPNN預測、灰色預測進行比對,并計算平均絕對百分誤差(mean absolute percentage error,MAPE)。三者預測結果見表4。

表4 不同預測方法預測結果對比
由表4可以看出,所提方法預測平均絕對百分誤差最小,為0.83%,由此可見,所提方法預測精度得到了有效提高,且具有更高的穩定性。
所建模型對未知的2018年8—12月的電量進行預測,并用經濟數據對預測結果進行修正,結果如表5所示。

表5 2018年8—12月的電量預測結果修正 單位:GWh
3.2.1 力助電力部門輔助決策
在已知浙江嘉興地區月用電量數據與4類經濟數據的前提下,將所建模型運用于與中西部區域電量波動、氣候條件以及經濟結構完全不同的嘉興地區,對預測精度及通用性進行驗證。表6為浙江嘉興地區2018年8—12月份月用電量預測值。

表6 嘉興2018年8—12月月用電量預測值 單位:GWh
經計算,所建模型預測的MAPE為2.31%,證明其具有較高的預測精度且通用性強,可適用于不同地區的電量預測。
通過月用電量預測,進一步勾勒出嘉興地區電量預測曲線,如圖3所示,可更加精準地對地區用電量特性進行分析,為電網公司或電力部門提供輔助決策[15],包括:為發展策劃部門提供規劃、決策、投資的依據;為財務部門提供電力現貨交易市場的清晰判斷;為營銷部門提供增供擴銷形勢的判斷。

圖3 嘉興地區月用電量預測曲線
3.2.2 提升主動服務能力
所建模型運用于某水泥廠大用戶月用電量預測,可以了解用戶電力消耗發展趨勢,預測曲線如圖4所示。

圖4 大用戶月用電量預測曲線
通過大用戶電量預測曲線分析,供電公司可以為企業客戶提升主動服務能力[16],包括提前感知客戶的容量變化需求、有的放矢地為客戶提供增容等業務支持、輔助企業確定節能方法、為用戶提供有競爭力的差異化服務等用途。
將回歸分析法和指數平滑法這兩種預測方法相結合,建立電量預測模型,模型中所有參數都采用算法自動尋優,減少了人工干預帶來的誤差。通過對中西部區域實際歷史數據精細和深入的挖掘,先用歷史電量數據初步預測未來幾個月電量,再用與電量相關性很高的經濟因素修正電量初步預測值,新方法實際預測精度得到了有效提高。
算例分析的結果表明,預測MAPE為0.83%,而模型在客觀條件完全不同的嘉興地區進行預測,MAPE也僅為2.31%,證明模型具有通用性。所提預測方法為地區電量預測工作提供了一種可供選擇的新思路,同時,也為供電公司加強電力需求預測和供電負荷管理等工作提供了有益的方法支撐和必要的決策手段。