楊本臣 于坤鵬 張 軍
(遼寧工程技術大學電氣與控制工程學院 遼寧 葫蘆島 125105)
隨著2015年《關于進一步深化電力體制改革的若干意見》出臺,我國電力體制改革進入到了一個新階段。未來電力市場的售電側結構和運行方式也將隨著電力市場的開放而變得更加復雜和精細化,最終形成多個買方、多個賣方間相互競爭、相互合作的局面。這種情形下,用戶的用電行為、負荷曲線、響應規律與力度相比于傳統電力市場都會發生很大的變化,實時電價波動將會成為影響用戶用電方式的決定性因素[1-8]。在開放售電環境下科學、精準地分析用戶負荷響應以及響應力度與規律,是提高電網的可靠性、合理安排運行調度的基礎,也是市場售電主體合理制定電價、電力調度的前提[9]。
文獻[10]利用自回歸模型、人工神經網絡和遞歸神經網絡等方法對用戶負荷的電價響應進行了預測,將電價新的輸入變量加入到傳統預測模型中,預測誤差稍有改善;文獻[11]利用小波變換-神經網絡方法,對負荷數據、電價數據進行標準化處理和預分解,預測效果比較顯著;文獻[12]按照用戶代理與售電商做出的響應合約計劃,將用戶主動響應計劃作為輸入變量來降低負荷預測的誤差,但其預測精確度受制于建立用戶響應模型的精確度;文獻[13]指出需求側的主動響應計劃增加了負荷預測的復雜性,并認為分析電價與響應負荷之間的關系可以轉化為分析電價與預測誤差之間的關系,為研究短期負荷預測提供了新方向;文獻[14]建立了電價-彈性系數矩陣,將電價與傳統的負荷影響因素(天氣、溫度等)分開考慮,但是彈性矩陣的建立過程過于理想化,導致預測結果不夠精確。
以上文獻或考慮了實時電價的影響,將電價作為一種影響因素加入到傳統的預測模型中去,但沒有考慮用戶歷史用電行為;或考慮了用戶的歷史用電行為以及電價因素,但是預測采用預測模型較為粗糙,導致預測效果不夠理想。
本文針對以上問題提出了一種基于K-means聚類的I-OS-ELM的新型負荷預測模型。預測過程主要分為兩個部分:聚類和預測。聚類部分:利用K-means聚類算法尋找用戶負荷曲線變化趨勢之間的相似性,即用戶用電行為之間相似性。預測部分:本文提出了一種能夠自動尋找最優隱含層節點數和在線更新輸出權值的神經網絡:I-OS-ELM。通過算例部分的數據測試,證明本模型預測效果較為理想。
用戶的用電負荷與其用電行為之間具有密不可分的聯系,而用戶的用電負荷曲線又代表了用戶用電行為的主要信息[15-23]。本文將用戶的典型的工作日曲線與節假日曲線首尾相連,構成一個48小時的典型負荷曲線,用這條曲線來代表該用戶的歷史用電行為。本文的預測思路分為:
Step1采用歸一化后的負荷曲線聚類,即認為用戶負荷曲線變化趨勢一致為一類,與具體的負荷數據的大小和量綱無關。歸一化過程采用min-max標準化。
Step2將歸一化后的負荷數據進行K-means聚類,把每一類中負荷曲線的平均值作為該類中每個用戶的負荷曲線。
Step3利用I-OS-ELM學習機對完成分類的每類用戶進行負荷預測,對預測數據進行逆歸一化求和得到實際負荷數據。預測流程如圖1所示。

圖1 用戶負荷預測模型
本文將用戶用電行為序列中的負荷曲線作為用戶用電行為序列聚類的代表。利用用戶歷史負荷數據繪制用戶用電的負荷曲線時采用循環平均法。
Step1求取每個樣本用戶在歷史日內負荷數據的總和及其平均值。
Step2剔除偏離平均值較遠的數據,重新計算樣本用戶的歷史負荷數據平均值。
Step3重復以上兩步,直至所有負荷數據都在平均值周圍分布,得到典型用戶的負荷曲線。
2.2.1K-means聚類
K-means算法是很典型的基于距離的聚類算法,采用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度就越大。該算法認為簇是由距離靠近的對象組成的,因此把得到緊湊且獨立的簇作為最終目標。
對于初始輸入的m個用戶的負荷影響因素序列首先確定k個聚類中心μ1,μ2,…,μk,然后計算每個用電序列到初始聚類中心的距離(本文使用相量二范數度量距離):
di=‖xi-μj‖2
(1)
每個用電序列被歸到距離最近的類中,對于每一類重新計算其中心:
(2)
式中:di表示第i個用電序列到第j類中心的距離;xi表示第i個用戶用電行為序列;μj表示第j類的聚類中心;ci代表樣例i與j個類中距離最近的那個類;ci的值是1到k中的一個。
每個用電序列根據新的聚類中心重新分類。重復上述步驟,直到聚類中心的位置不再發生變化。
2.2.2I-OS-ELM學習機
傳統的ELM算法是一種單隱層前饋神經網絡,相比于傳統的神經網絡(BP神經網絡),具有不需要人為設置大量參數以及學習能力強等優點,但也存在兩個不足之處:(1) 需要人為指定隱含層節點數,而隱層節點個數的又直接影響著訓練結果。隱層節點個數太少,則不能達到良好的擬合效果;隱層節點個數太多,則會出現過擬合,泛化能力較差,若逐一嘗試隱層節點數,則會浪費大量時間。(2) 無在線學習過程,當有新的訓練數據被接收時,無法實時更新輸出權重。I-ELM可以解決第一個問題,但是無法在線學習;OS-ELM可以在線學習,但是必須提前設置隱層節點數。因此本文提出了一種I-ELM和OS-ELM結合的新型學習算法:I-OS-ELM,可以兼顧I-ELM和OS-ELM 的優點。
I-OS-ELM的學習過程大體上可以分為兩個步驟:
Step1利用I-ELM尋找最優隱層節點數Nfit。
Step1.1選擇激活函數g(x)設置最大隱層節點數Nmax和期望學習誤差ε,N=0,殘差E=[e1,e2,…,eN]T。
Step1.2當N
Step1.3對每一個新增的隱層節點的權重ωN和偏置bN進行隨機賦值,并計算相應的輸出權重β(N)。
(3)
Step1.4計算新加入節點后的殘差。
E=E-β(N)·HN
(4)
Step1.5重復Step1.2-Step1.4,直到N>Nmax或‖E‖<ε時,學習結束。
Step2利用OS-ELM在線學習輸出權重β(i)。
Step2.1設置隱含層的節點數為I-ELM學習過程結束時的隱層節點數Nfit,隨機賦值輸入權值ω和神經元偏置b,通過少量樣本計算輸出權重β。
Step2.2設訓練樣本的個數為Ni,Ni可以為一個或多個,計算隱含層的輸出矩陣Hi和輸出權重β(i)。

(5)
當Ni=n,n≠1時,有:
(6)
其流程圖如圖2所示。

圖2 I-OS-ELM學習機流程圖
本文根據收集到的加拿大某地區居民200名用戶7月到10月的負荷和實時電價數據,取7月到9月的負荷數據作為I-OS-ELM學習機的訓練數據集,取9月到10月的負荷數據作為測試數據集(本文選取9月12日為展示樣本)。
I-ELM和OS-ELM的相關參數設置如表1、表2所示。

表1 參數設置表

表2 輸入數據表
經過實驗,K-means聚類在k=3時,聚類效果最為理想,用戶負荷曲線結果如圖3-圖5所示。

圖3 第一類用戶負荷曲線

圖4 第二類用戶負荷曲線

圖5 第三類用戶負荷曲線
圖6給出了一天之中的電價變化趨勢,用戶的實時電價在圖6曲線上加入一個隨市場波動的隨機變量來表示不同日的實時電價。圖7給出了使用I-ELM、OS-ELM、I-OS-ELM三種學習算法的預測結果與實際負荷對比圖。圖8為三種學習算法的預測誤差和對比圖。

圖6 實時響應電價

圖7 9月12日實際負荷與不同方法負荷預測結果對比圖

圖8 不同方法的誤差對比圖
從圖7和圖8的預測結果可以看出,使用I-OS-ELM預測算法的效果明顯優于單獨使用I-ELM算法或OS-ELM算法。由表3可知,單獨使用I-ELM算法時,預測的結果較為粗糙,最大誤差為13.90%,平均誤差為7.88%。這是因為I-ELM學習機不具備在線學習功能,不能隨著訓練數據集的加入,不斷更新輸出權重。單獨使用OS-ELM算法時預測效果也不理想(隱層節點個數為15),最大預測誤差為7.33%,平均預測誤差3.07%。這是因為OS-ELM的預測效果直接與人為設置的隱層節點個數相關,隱層節點過多或過少都會使預測效果不夠理想,并且在隱層節點個數的嘗試過程會浪費大量時間。使用I-OS-ELM算法時,先用I-ELM算法尋找最優節點數,再利用OS-ELM算法在線學習功能可達到滿意結果,最大誤差3.54%,平均誤差1.86%,且所用時間較短。

表3 2016年9月12日實際負荷與不同方法負荷預測結果對比
本文在綜合考慮電價、用戶用電行為以及預測模型的基礎上,提出了一種新的用戶短期負荷預測方法。用戶的用電慣性包含在其歷史用電行為之中,利用K-means對用戶歷史用電行為聚類能夠使預測更加精確、科學。I-OS-ELM學習機兼顧I-ELM和OS-ELM的優點,能夠在較短時間內迅速找到最優隱層節點數,并且能夠隨著訓練數據塊的加入,自我更新輸出權重,不斷優化。實例的預測結果也證明了本文所建模型可達到較為理想的預測結果,可作為供電公司制定供電方案時的參考依據。