陳云浩,周 冬
(1.湖南天羽能源科技股份有限公司,湖南 長沙 410205;2.四川省社會科學院,四川 成都 610072)
根據中共中央國務院《關于進一步深化電力體制改革的若干意見》(中發[2015]9號)及配套文件精神,在國家發改委、國家能源局的指導下,近年來各地加快推進電力市場化改革,提升市場主體競爭意識,釋放改革紅利,降低用電成本[1]。電力市場化改革給電力行業實施需求側管理(DSM)帶來了新的挑戰,原有垂直壟斷體制下實施DSM給電力公司帶來的效益被分散,一些傳統的DSM措施如負荷管理與能效提升的實施基礎也發生了變化[2]。
因此,在電力市場化改革和電力需求側管理的雙輪驅動下,在國家節能減排重大戰略實施的指引下,對大型工業企業、大型工商業用戶的用電量預測逐步受到各個利益相關方的重視。沒有準確的用電量預測,售電公司無法進行準確的銷售報價或制定最優的批發購電價格策略,電網公司在開展需求側管理、推廣需求側響應時,也無法制訂有的放矢的方案和機制。特別是在電力現貨交易的發展趨勢下[3],用電量預測已經從傳統的宏觀預測(地區、城市量級)和中長期預測(按年、按月)要轉變為微觀預測(按企業、按建筑)和短期甚至準實時預測(按日、按小時),對用電量預測方法和模型提出了非常高的準確度要求。
本文以中山市某工業企業逐日用電量數據為樣本,用兩種不同的模型分別進行預測,并驗證模型的有效性,分析比較各自的特點。
關于電量預測,較早前的研究大多數是國家電網、南方電網等電網公司以宏觀用電量預測或者電力負荷預測為主,近年來也陸續有高校、設計院和節能公司針對大型公共建筑等用能單位開展用電量預測研究,但針對企業的用電量預測研究較少。
從分析對象的角度看,既有文獻主要針對電力系統、辦公建筑、商業建筑、地鐵站等用能單位進行過用電量預測研究分析。例如江自強等提出了針對現代化建筑用電量的智能預測方法[4],陳利芳提出了面向大數據的電力預測系統應用研究建議[5],李龍、金樑等開展了短期電力負荷預測研究[6-7],繆靈均等開展了生活能源消耗預測研究[8],歐陽前武、劉曉婷等開展了大型公建能耗預測研究[9-10],黃榮庚等開展了地鐵站環控系統的能耗預測研究[11]。總體而言,既有研究工作還是以建筑類能耗的預測分析為主,對于工業企業的能耗預測分析較少。
從預測模型和方法的角度看,大多數文獻提出了時間序列模型、多元回歸模型、ARMA模型、指數平滑模型、神經網絡模型、SVM模型等各種可用的預測模型。例如江自強等選擇RBF神經網絡的現代化建筑用電量智能預測方法、BP神經網絡的現代化建筑用電量智能預測方法在相同條件進行對比測試[4]。孫靖等為解決冰蓄冷控制問題,提出了利用季節性時間序列模型進行建模預測的理論和方法[12]。繆靈均等分別采用布朗(Brown)單一參數線性指數平滑法和Holt雙參數線性指數平滑模型對2013—2016年煤油和天然氣的消耗量進行預測,結果表明指數平滑模型較為有效[8]。歐陽前武等利用ARMA模型(Auto Regressive Moving Average model,自回歸滑動平均模型)對廣州市區的商業建筑逐月總能耗進行預測,模型預測結果與實際值比較吻合,ARMA模型在短期建筑能耗預測中是一種精度較高的方法[9]。黃榮庚等也是利用ARMA模型對于地鐵站環控系統進行能耗,發現預測具有較高的擬合精度[11]。李龍等開展了基于人工神經網絡的負荷模型預測研究,對日最大、最小負荷時刻進行負荷模型預測[6]。通過上述分析可知,ARMA模型在能耗預測領域的適用性較強,指數平滑模型也具有較強的可操作性。
但是現有研究成果普遍存在兩個問題:一方面,面向企業的用電量預測研究較少,而當前電力市場化背景下,大型企業才是電力需求側管理和電力市場化交易的主體,因此企業用電量的預測研究亟待加強;另一方面,輸入參數較少的預測模型的組合應用不夠,預測準確度有待提高,而人工神經網絡的預測雖然能提高準確度,但是輸入參數過多,需要考慮日最大負荷值、日最小負荷值、負荷平均值、最高最低溫度、日平均風速、日期類型等多種影響因子,操作難度大,普適性不夠,無法大面積推廣應用。
本文以工業企業的用電數據作為分析和預測的對象,特別適合于電網公司需求側管理、售電公司電力市場化交易、綜合能源公司能效管理服務的市場化應用需求,具有非常突出的實踐指導意義。本文所建立的模型簡單實用,輸入參數少,可操作性強,適用性廣,實現了電網公司營銷數據和企業能耗監測數據的有機結合和深度利用,既有大量可用的數據基礎,也有巨大的市場需求,實用價值非常高。
本文首先采集中山市某企業2019年1月1日—10月31日的逐日用電量為樣本進行分析,建立時間序列Y,其時序圖如圖1所示。

圖1 2019年1月1日—10月31日逐日用電量曲線圖
企業用電量與企業的產量和經濟周期相關度較高。對于非季節性生產企業而言,企業的用電量相對而言較為平穩,春節、黃金周和周末等節假日的用電量通常與常規工作日有所不同。
通過圖1可知,該企業的用電量數據屬于較為典型時間序列,整體上沒有明顯增長或減少趨勢,除個別節假日以外,數值在10 000~30 000之間隨機波動,同時波動范圍有界(0≤用電量≤企業變壓器的最大容量),因此初步判定企業用電量數據序列屬于平穩時間序列。
針對平穩時間序列的預測,較為成熟的模型為線性回歸模型、ARMA模型和指數平滑模型,其中線性回歸模型通常跟ARMA一起組合應用。這類模型不需要建立因果關系模型,僅需要其變量本身的數據就可以建模,特別適合于企業用電量的預測。而神經網絡模型、SVM等模型雖然更先進,但是輸入參數過多,各類參數無法自動采集或參數本身就是預測值(例如氣象參數),因此可操作性不強。以下將基于ARMA模型和基于Holt?Winters指數平滑模型兩個方面進行建模、預測和對比分析,所用分析軟件為EViews 8.0。
ARMA模型即自回歸滑動平均模型,是由自回歸模型(簡稱AR模型)與移動平均模型(簡稱MA模型)為基礎“混合”構成。ARMA模型和應用的構建通常分為五個步驟:平穩性檢驗、模型識別、確定滯后階數、模型擬合、模型檢驗。
第一步,采用ADF單位根檢驗法檢驗時間序列的平穩性。單位根檢驗是指檢驗序列中是否存在單位根,因為存在單位根就是非平穩時間序列了。將數據集通過EViews軟件進行ADF檢驗,結果見表1。

表1 原始序列ADF根檢驗結果
由檢驗結果可知,原始序列ADF=-5.66878<-3.98894<-3.42488<-3.13552,且P值=0<1%<5%<10%,因此序列Y為平穩時間序列,可進行下一步建模。
第二步,模型識別主要通過檢查自相關函數(AC)和偏自相關函數(PAC)。根據序列Y的相關性檢驗結果,Q統計量的P值均<0.05,拒絕序列純隨機的假設。同時,AC拖尾和PAC二階截尾,初步判斷可能適合的模型類型為ARMA(2,0)模型。根據序列Y的一階差分序列相關性檢驗結果,AC拖尾和PAC均3階截尾,可能適合的模型類型為ARMA(3,3)模型。
第三步,確定滯后階數。主要通過AIC、SC和HQ信息準則來判斷,取綜合最小值確定滯后階數。由于最復雜可能為ARMA(3,3)模型,因此選取9種排列組合進行比較。即選取ARMA(1,1)、ARMA(1,2)直至ARMA(3,3)這9個模型用最小二乘法進行擬合。擬合后的AIC、SC和HQ信息準則函數值匯總表如表2所示。

表2 AIC、SC和HQ信息準則擬合結果匯總
通過上表的擬合結果可以判斷出,模型ARMA(2,3)下AIC和HQ兩個信息準則數值都最小,因此ARMA(2,3)為最優時間序列模型。
第四步,模型擬合。通過多元線性回歸與ARMA模型相結合的方式進行模型擬合,這主要是考慮到企業用電量與工作日、節假日、黃金周等工作周期有關,因此需要引入工作日相關的啞變量時間序列。
利用最小二乘法對模型進行擬合后,其參數估計的結果如表3所示。各項參數的P值較為顯著,可決系數為0.8018,擬合度較高。
第五步,模型檢驗。主要通過三種方式進行檢驗,即通過D?W(Durbin?Watson,德賓?沃森)檢驗和通過模型殘差序列的白噪聲檢驗。
首先,通過D?W統計量進行檢驗。D?W檢驗即杜賓?瓦特森檢驗,是統計分析中常用的一種檢驗序列一階自相關最常用的方法。D?W統計量的取值范圍為區間0~4,當D?W統計量趨近于0或4時,序列顯著相關;當D?W統計量趨近于2時,序列不存在自相關性。根據表3中擬合結果可以看出,D?W統計量約為1.89,因此可判定該序列不存在自相關性。

表3 ARMA(2,3)模型與多元線性回歸組合擬合結果
其次,對殘差序列進行白噪聲檢驗。通過殘差序列的自相關性和偏相關性分析可以看出,自相關系數和偏自相關系數在0階之后,均呈現出截尾的性質,因此可認為殘差序列不存在自相關性,為白噪聲序列,模型信息提取比較充分,通過模型的適應性檢驗和顯著性檢驗。
指數平滑法是生產預測中常用的一種方法,也適用于中短期經濟發展趨勢預測。所有預測方法中,指數平滑是用得最多的一種。簡單的全期平均法是對時間數列的過去數據一個不漏地全部加以同等利用,移動平均法則不考慮較遠期的數據,并在加權移動平均法中給予近期資料更大的權重,而指數平滑法則兼容了全期平均和移動平均所長,不舍棄過去的數據,但是僅給予逐漸減弱的影響程度。
本文采用EViews 8.0,利用Holt?Winters指數平滑模型(非季節性)對企業用電量即時間序列Y進行預測。
如表4所示,通過實驗選取不同的平滑指數進行結果分析,發現平滑指數α=1和β=0時,殘差平方和最小,誤差均方根最小,因此選取該參數建立Holt?Winters指數平滑模型。

表4 不同平滑系數實驗結果比較
4.1.1 分析下一個月逐日用電量預測效果
將前述中山市某企業用電量即時間序列Y對已建立的ARMA(1,3)模型進行擬合度分析,通過比較實際用電量與預測用電量之間的差異,分析預測數據的準確度。以下用2019年1月1日—10月31日數據預測11月1日—11月30日數據,如表5所示。

表5 某企業2019年11月1—11月30逐日用電量數據ARMA模型預測
通過上述預測結果可以看出,大部分準確率為98%以上。即便由于少量異常數據的出現,平均預測準確率也達到95.97%,總體預測準確度較高。
4.1.2 分析樣本數量對預測準確度的影響
考慮到不同企業可獲取的用電量數據時間長短不同,以下針對不同的樣本數量進行下個月逐日用電量預測,分析樣本數量對預測準確度影響。
本次研究從6個月的數據開始往后遞推,即以6個月數據為樣本預測第7個月,以7個月數據為樣本預測第8個月,直到以10個月數據為樣本預測第11個月。
如表6所示,樣本數量對于預測準確度具有明顯貢獻,樣本數量越大,平均預測準確度越高。10個月以上的樣本數量能夠達到95%以上的平均預測準確度。從另一個角度說,針對不同的樣本數量,ARMA(n,m)模型中n和m的取值也需要動態調整,實現同等樣本數量情況下更高的平均預測準確度。

表6 不同樣本數量ARMA模型預測結果分析
4.1.3 分析累計日數據作為月數據預測的效果
在當前實際工作中,逐月用電量數據的預測更加具有指導意義,但直接將每月用電量數據作為樣本進行預測,樣本數較少,準確度欠佳。為此,需要分析累計短期高頻數據預測來實現中長期低頻數據預測的效果,即分析累計每日用電量的預測數據作為月用電量數據預測的效果。
將上述下月逐日用電量預測的下月30個逐日數據進行累加,形成下月的月用電量預測數據,與下月的實際月用電量數據進行對比,分析預測準確度。
如表7所示,累計高頻數據預測中長期數據的準確度較高,預測效果隨著樣本數量的增加而逐步顯著,在9個月以上的逐日用電量數據集進行下一個月用電量數據預測時,準確度已高達97%~98%,已具有較高的現實意義。

表7 以ARMA模型累計高頻數據預測中長期數據效果分析
4.2.1 預測下一個月逐日用電量的效果
將前述中山市某企業用電量即時間序列Y基于Holt?Winters指數平滑模型進行擬合度分析,平滑指數α=1和β=0,通過比較實際用電量與預測用電量之間的差異,分析預測數據的準確度。以下為該模型預測2019年11月1日—11月30日數據,如表8所示。

表8 2019年11月1—11月30逐日用電量數據指數平滑模型預測
通過上述預測結果可以看出,大部分準確率為98%~99%以上。即便由于少量異常數據的出現,平均預測準確率也達到96.55%,總體預測準確度較高。
4.2.2 樣本數量對預測準確度的影響
針對不同的樣本數量基于Holt?Winters指數平滑模型進行下一個月的逐日用電量預測。
如表9所示,樣本數量對于預測準確度有貢獻,超過7個月的樣本數量后準確度明顯提高,但同時也有一定波動,預測準確度與樣本數量不成線性關系。

表9 不同樣本數量指數平滑模型預測結果分析
4.2.3 累計日數據作為月數據預測的效果
與前述ARMA模型中的對應分析一樣,將所有逐日數據進行累加,形成下月預測數據,與下月實際數據進行對比,分析預測準確度。
如表10所示,累計高頻數據預測中長期數據的準確度較高,超過7個月的樣本數量后準確度顯著提高,4個月的預測中有3個月都達到99%以上,最高達99.84%,具有非常高的現實指導意義。

表10 以指數平滑模型累計高頻數據預測中長期數據效果分析
通過將表7和表10聯立比較,可以得出表11和表12。

表11 兩種模型逐日預測準確度對比分析

表12 兩種模型月累計預測準確度對比分析
由表11和表12可以看出,ARMA模型在預測下個月的每日用電量數據方面具有更高的準確度,而且隨著樣本數量的增加準確度也繼續增加;Holt?Winters指數平滑模型預測下個月的每月用電量數據方面具有更高的準確度。
綜上所述,ARMA模型在高頻數據預測方面比Holt?Winters指數平滑模型更有優勢,分析其原因主要在于ARMA模型將數據序列看作一個隨機序列,這組隨機變量所具有的依存關系體現著原始數據在時間上的延續性,而且具有一定的自身變動規律,可以通過回歸分析得到較為準確的預測值。這個特點與企業用電量數據的特點非常相似,所以短期高頻數據的預測準確度較高。而Holt?Winters指數平滑模型兼容了全期平均和移動平均所長,不舍棄過去的數據,但是僅給予逐漸減弱的影響程度,即隨著數據的遠離,賦予逐漸收斂為零的權數。這個特點使得該模型通過預測高頻數據并累加后預測中長期數據的準確度更高。因此在實際工作過程中,兩種模型可以組合使用,效果更佳,實用性更強。
對于工業企業用電量數據預測,基于ARMA模型和基于Holt?Winters指數平滑模型預測都較為實用,準確度較高,具有較高的實用價值。基于ARMA模型預測日用電量數據更為準確,基于Holt?Winters指數平滑模型預測月用電量數據更為準確,采集樣本的數量對于預測的準確度有較大影響。二者組合應用具有較高的可行性和推廣價值。