應張馳,陳淑萍,盧旭航
(國網浙江義烏市供電公司,浙江 義烏 322000)
電力負荷預測是電力系統規劃決策的重要依據之一。 負荷數據記錄了用戶對電能的消耗情況,反映了用戶生產生活規律。在新的發展形勢下,提出更為精確的負荷預測方法對電力系統安全生產和優質服務有著非常重要的意義。
目前流行的負荷預測方法主要有經典時間序列法、指數平滑法、人工神經網絡法、模糊預測法、支持向量機、專家系統、灰色模型等[1-7]。這些預測方法都具有各自的優缺點,比如傳統算法運算量較小,但擬合能力不足;ARIMA(自回歸移動平均)方法建模能力非常優秀,但由于其只考慮歷史數據的變化而不直接考慮其他因素對時間序列的影響,預測精度存在提升空間;支持向量機具有計算速度快、全局最優和泛化能力強的優點,但對模糊現象的處理能力較為缺乏[8];人工神經網絡對多源信息具有較強的學習和自適應功能,但也存在著網格結構難以確定、收斂緩慢等缺陷[9]。
用戶對電能的消耗除了受自身生活規律影響以外,也受周邊環境、事件等因素影響。隨著智能電網的發展,更多智能化設備的引入為電力系統狀態監控和預測提供了更多借鑒信息。考慮到ARIMA 對時間序列的良好建模能力,以及人工神經網絡對多源信息的強大利用效率,本文將兩者相結合,提出一種基于ARIMA 和人工神經網絡的混合預測模型,首先利用ARIMA 模型得到時間序列預測值,再將預測值及其他多源信息送入神經網絡模型中進行訓練,以期取得更好的預測效果。
ARIMA 模型是由Box 和Jenkins 提出的一種時間序列建模方法,分為AR(自回歸過程模型)與MA(移動平均過程模型)兩大類。兩者都是預測未來數據的方法,但前者以原序列滯后變量為依據,后者以過去的誤差項為依據,2 種方法同時使用,就轉化為ARIMA(自回歸移動平均模型)。由于構建ARIMA 模型要求時間序列平穩,對于非平穩時間序列,一般經過若干次差分計算后轉化為平穩時間序列后再進行建模[10]。理論上,對于序列yt的ARIMA 建模數學描述為:

式中:Δdyt為yt經d 次差分轉換后得到的平穩時間序列,將其表達為由若干歷史數據和誤差值組成的相關函數;εt為t 時刻的隨機誤差,具體為相互獨立的白噪聲序列;?i和θj為模型參數;p和q 為模型階數。模型整體簡記為ARIMA(p,d,q)[12]。
ARIMA 模型建模步驟可以分為以下步驟:
(1)序列平穩化。通過若干次差分運算,將非平穩時間序列轉換為平穩時間序列。
(2)模型階數識別。通過樣本自相關系數和偏相關系數,確定模型階數p 和q,一般來說,相關系數衰減幅度大時從p=1 和q=1 開始逐步擬合,當衰減幅度小時,從較大的p,q 取值開始擬合。
(3)參數估計和模型檢驗。按照模型評價指標對模型進行評價,并對殘差序列圖進行隨機性檢驗。
(4)模型預測。按照選取的參數模型對未來趨勢進行預測[13]。
人工神經網絡是目前人工智能領域的研究熱點,在負荷預測領域被廣泛使用。神經網絡由大量神經元相互連接構成,每個節點代表一次函數運算。通過節點間的相互作用,神經網絡可以完成對時間序列或函數的擬合逼近工作。
本文使用主流的BP(反向傳播)人工神經網絡來構造預測模型。多層BP 神經網絡結構如圖1所示,它是一種單向傳播的多層學習網絡,其中第1 層稱為輸入層,最后一層(第L 層)被稱為輸出層,其它各層均被稱為隱含層。其主要特點是信號向前傳遞,誤差向后傳播,從而不斷調節神經元的權重值,最終使誤差函數減小到某個閾值,得到最優擬合結果。神經網絡具有較強的學習能力和非線性映射能力[14]。

圖1 BP 神經網絡示意
BP 神經網絡算法基于梯度下降法提出[15]。設網絡共L 層,第l 層神經元個數為nl,l-1 層第i個神經元和l 層第i 個神經元的連接權值為,l-1 層第j 個神經元輸出為,f 為激活函數,則l 層輸出為:

任意設置網絡的初值和權值,對輸入樣本p,網絡輸出opi和期望輸出dpi的誤差E 為:

進而得到權值修正公式為:

式中:η 為學習速度,用于加快網絡收斂速度;δjp為第l 層j 節點的模式誤差項。神經網絡根據上述公式進行迭代計算,直至誤差滿足要求。
本文以某企業2018 年1 月1 日—2018 年7月30 日的日平均負荷作為預測樣本。按照建模步驟,首先對歷史負荷數據進行預處理,再對負荷數據時間序列及其差分序列進行ADF(單位根)檢驗,選擇顯著性水平為1%,檢驗結果如表1所示。由表1 可知,某企業歷史負荷數據原始序列非平穩,一階和二階差分序列平穩。由于差分階數增加會導致預測誤差增大,故選取一階差分序列進行后續預測。

表1 時間序列各階ADF 檢驗結果
對時間序列相關系數進行分析,其衰減速度較快,所以從較小的p,q 值開始擬合。使用遍歷方法構造ARIMA 模型,選取綜合評價指標最高的模型,對2018 年8 月1—20 日的負荷數據進行預測。 研究中發現,模型準確率為94.60%,ARIMA 構造方法準確擬合了該企業負荷趨勢,但在精確度上仍稍顯不足。進而使用BP 神經網絡對其進行混合預測分析。
3.2.1 變量輸入
神經網絡搭建過程中,首先需要確定輸入變量。根據資料和工作經驗,列舉可能影響負荷數據的因素,歸納為以下3 個維度[16]。
(1)用戶基礎信息。此類信息直接反映用戶的基本屬性,包括使用年限、電壓等級、受電容量等。
(2)氣象信息。氣象信息一定程度上關系到用戶用電強度情況,如企業季節性訂單等。從電力氣候學角度,選擇最高溫度、最低溫度、風力、濕度、天氣信息作為輸入變量。
(3)用戶歷史數據。本文以天為預測單位,包括過去14 天的負荷平均值,以及預測日工作日信息等。
輸入變量如表2 所示。

表2 輸入變量清單
3.2.2 數據預處理
數據收集完成后,需要對數據進行預處理。主要包括以下方式:
(1)對不一致、異常波動的數據進行替換。異常波動定義為t 時刻點的數據值超出t-1 與t+1數據值100%以上或低于30%。用t-1 和t+1 時刻的數據平均值進行填補。
(2)數據編碼。觀察表2 數據集,其中電壓等級、受電容量、用電類別、天氣類別4 項特征為因子型變量,其他特征為數值型變量。部分數據編碼如表3 所示。

表3 部分天氣數據編碼情況
按照表3 所示,本文將天氣數據分為晴、多云、陰、雨4 類,使用同種思路對其他3 項特征進行編碼,其中電壓等級分為220 V,380 V,10 kV 3 類;用電類別分為大工業電價、一般工商業電價、居民電價、農業生產用電4 類;受電容量按10 kW 以下,10~50 kW,50~400 kW,400 kW以上分為4 類,共15 個因子型輸入。數值型變量包括使用年限、最高溫度、最低溫度、平均濕度、風力等級、14 天歷史負荷、上月同期負荷、工作日標簽、預測日ARIMA 預測值共22 條。綜上所述,輸入神經元數量總數為37 個。
(3)數據歸一化。數值型變量的量綱與量級不一致,因此使用0-1 標準化的方式進行歸一化處理。
本文選擇使用38×64×1 的全連接3 層BP 神經網絡模型進行訓練,訓練函數采用trainlm 函數,隱含層神經元函數采用tansig 函數,輸出層神經元函數采用purelin 函數。通過不斷調整迭代次數、學習率參數和收斂誤差參數,最終建立的混合預測模型準確率為96.13%。各負荷預測模型結果如圖2 所示。

圖2 負荷預測模型擬合結果
由圖2 可知,混合預測模型更接近實際負荷;ARIMA 對時間序列趨勢描述較好,但精度較低,這主要是由于該模型無法引入外部信息,進而無法量化外部擾動產生的誤差;神經網絡在負荷均值附近表現良好,但在低谷處表現不佳,這主要是受限于網絡訓練樣本不足,考慮在避免過擬合的情況下,適當增加每日負荷取點數量。
3 種方法的日負荷預測結果相對誤差,如表4 所示,進一步顯示了混合預測的優勢。可以看出,在大部分日期,混合預測的相對誤差較小,平均比ARIMA 預測誤差率減少1.53%,比神經網絡預測誤差率減少2.85%。

表4 某企業日負荷預測結果相對誤差對比
基于負荷混合預測模型成果,在某市隨機選擇100 戶受電容量大于315 kVA 的工業用戶,按照10 天、20 天、30 天的時間跨度對其2018 年8月負荷數據進行預測,并與單獨使用ARIMA 和神經網絡方法進行比較。3 種預測方法的整體結果如表5 所示,可以看出,使用混合預測模型的誤差明顯低于單獨使用ARIMA 和神經網絡方法的預測誤差。可以認為,采用此方法進行負荷預測是可行的。同時發現,當預測時長在30 天以上時,預測誤差將迅速超過10%,開展中期負荷預測需要對特征值進行重新選擇。

表5 不同模型平均預測誤差比較
本文提出了一種基于ARIMA 和神經網絡的日負荷預測方法。首先利用ARIMA 優秀的時間序列建模能力擬合時間序列整體趨勢,再利用神經網絡的非線性擬合能力提升細節精度,取長補短,將盡可能多的用戶信息組合到預測模型當中,提升了預測穩定性和準確度。實驗結果表明,利用該混合預測模型進行預測時,20 天整體預測準確率達到96.20%,效果良好。通過本算法思路可以拓展得到全網、各市縣(區域)、各行業乃至居民用戶的未來負荷數據,有助于更加準確地把握各區域(行業、用戶)發展情況,輔助供電企業進行決策。
本文研究對象主要為工業用戶。工業用戶一般都具有較為明顯的周期性特征,在ARIMA 建模方面有天然優勢。 隨著新能源技術的日益完善,光伏用戶數量不斷增多。光伏用戶不受工作日影響,而受氣象因素影響更大,與普通工業用戶屬性有較多不同。在以后的研究中,可以采用聚類算法[18]對不同屬性用戶分別建立預測模型,以期獲得更好的預測效果。