鄭建柏
(國網福建省電力公司廈門供電公司,福建 廈門 361000)
基于樸素貝葉斯和支持向量機的短期負荷預測
鄭建柏
(國網福建省電力公司廈門供電公司,福建 廈門 361000)
樸素貝葉斯是一種簡單而高效的分類算法,可與支持向量機結合組成一種新的組合模型,以便供電企業在電力供應不足時對重點大用戶的負荷進行預測。結果表明:組合模型的有序用電短期負荷預測結果準確率較高。
樸素貝葉斯;支持向量機;有序用電;負荷預測
在迎峰度夏期間,供電企業經常面臨局部地區電力供應不足,短期內用戶的負荷情況是制定有序用電方案的重要依據。為了讓有序用電方案科學合理,在供電緊張時盡可能減少對用戶正常用電影響,需要盡可能準確地取得用戶負荷預測數據。
用戶負荷預測就是在充分考慮用戶的生產情況、自然條件與社會條件的情況下,研究或利用一套系統的處理過去和未來負荷的數據方法,在滿足一定精度的要求下,確定未來特定時刻的負荷值。負荷預測經歷了從依賴調度員的經驗到自動化、智能化轉變的過程;近年來人工智能技術被引入負荷預測領域,與傳統負荷預測方法相比,雖然提高了預測準確率,但由于負荷預測的復雜性,預測結果往往無法滿足實際生產需要。
貝葉斯分類是一種基于統計方法的分類模型,對于解決復雜系統不確定因素引起的故障分類問題具有很大優勢,被認為是目前不確定知識表達和推理領域最有效的理論模型之一,其中樸素貝葉斯分類器以簡單的結構和良好的性能受到人們的關注。基于概率統計的貝葉斯分類方法對樣本數量要求較高,而在實際應用中常常難以獲得大量樣本,因此會嚴重影響其分類性能,較難滿足實際分類需要。
支持向量機(簡稱SVM)是一種以統計學理論為基礎,針對有限樣本的一種通用學習方法,能有效解決小樣本、高維數、非線性等問題,并克服人工神經網絡存在局部最優等缺點,大大提高了學習方法的泛函能力。鑒于SVM能在訓練樣本很少的情況下很好地達到分類推廣的目的,國內外學者已開始在負荷預測領域進行SVM方法的應用研究。
根據有序用電工作對負荷預測的需要,提出用支持向量機來改進貝葉斯分類器的算法,建立一種基于樸素貝葉斯和支持向量機的變壓器故障診斷模型,并用廈門供電公司重點用戶的負荷數據進行驗證分析,結果表明新模型取得了令人滿意的效果。
貝葉斯分類是一種典型的基于統計方法的分類模型,它通過對訓練集的學習而歸納出分類器,并以此對沒有分類的數據進行分類。
樸素貝葉斯分類器是基于貝葉斯公式的分類器,當訓練集D的所有實例都完整時,通過對實例出現頻率的統計,求出給定類變量C條件下各個屬性變量Xi的條件概率。理論上,條件變量滿足條件獨立下它是最優的。
由貝葉斯公式可知:

通過訓練集D獲得P(C),P(X1|C),…,P(Xn|C)的值,對給定的屬性值X1,…,Xn,使最大)的C值便是X1,…,Xn所屬的類。
類變量取第k個值Ck的先驗概率為:

其中:NCk為類變量取Ck的樣本數;N為樣本總數。
用似然概率作為各屬性節點的條件概率估計值,其計算公式為:


支持向量機是Vapnik等根據統計學習理論中的結構風險最小化原則提出的,最初是用來解決模式識別問題。支持向量機用于模式識別的基本思想是構造一個超平面作為決策平面,使2類模式之間的間距最大。對于線性可分的訓練樣本:(xi,yi),xi∈Rn,yi∈{+1,-1},i=1,…,n,可構造最優分類超平面使得這2類樣本完全分開(見圖1)。
最優分類方程為:x·w+b=0。
為此需求解下列二次規劃問題:

使分類間隔最大就是對推廣能力的控制,這是SVM的核心思想之一。求解最優分類面問題實際上就是利用Lagrange優化方法將其轉化為對偶問題,即:


圖1 SVM線最優分類面
最終得到決策函數是:

對非線性可分的情況,還可采用核函數的方法,即通過核函數映射使之轉化為在高維特征空間中構造線性分類超平面的問題。輸入空間的樣本做非線性變換,不同的支持向量代入支持向量機的決策函數,最終支持向量機的非線性分類決策函數表示為:

樸素貝葉斯分類器結構簡單,實現多分類的性能較好,在多個領域得到廣泛的應用。但在有序用電的負荷預測時,難以大量獲取同類樣本,樣本的缺乏給樸素貝葉斯分類造成了很大的影響。支持向量機已被證明在小樣本情況下表現突出,并成功應用于多個分類領域。因此考慮引進支持向量機來改進樸素貝葉斯模型,解決某些類別因樣本較少而誤判的可能。建立一種基于樸素貝葉斯和支持向量機的組合模型,該模型可應用于有序用電時的負荷預測中。
樸素貝葉斯(NB)和支持向量機(SVM)相結合的基本原理是:若類別ci,cj的樣本較少,就將這2類合并成1類cij,作為樸素貝葉斯分類器的1個輸出類,這樣對于小樣本情況下樸素貝葉斯分類器分類效果比較差的問題能夠有效解決。若某條信息通過樸素貝葉斯分類器計算的分類結果為cij,就將該信息輸入支持向量機,并將類別ci,cj對應的樣本作為支持向量機的訓練樣本,最后可以得到該信息的確切分類,實驗原理如圖2所示。

圖2 基于樸素貝葉斯和支持向量機組合模型
在有序用電中,大用戶的負荷情況對整體負荷影響最大,因此需重點關注大用戶的負荷走勢,尤其是每天負荷高峰期(11:00和14:00)的負荷極值是否超過允許最大負荷。
選取廈門供電公司用重點大用戶電負荷最高的前50戶,對其在2012—2014年3年間夏季負荷最高月每天96點負荷數據和氣象數據進行整理,保留有效數據共1 280條,將這些數據作為訓練樣本。在組合模型中經參數優化,得到參數修正后的組合預測模型。
在2015年的有序用電期間,將廈門供電公司負荷最高的50戶用電數據、氣象數據輸入組合預測模型,重點預測明日負荷與今日負荷的對比情況,分為“高、低、平”3類進行分類預測。預測準確率達到98 %,而且預測速度在10 s以內。實驗結果表明:利用樸素貝葉斯和支持向量機的組合模型進行有序用電短期負荷預測,這種方法是可行的、實用的。
本文針對有序用電工作中對短期負荷預測的需求,在對常用的樸素貝葉斯分類算法進行研究之后,提出用支持向量機分類器進行改進,解決了其在小樣本情況下分類效果不好的問題。通過運用組合模型對用戶用電負荷進行診斷,收到了令人滿意的診斷效果,表明了該方法的有效性和實用性。
1 朱永利,吳立增,李雪玉.貝葉斯分類器與粗糙集相結合的變壓器綜合故障診斷[J].電機工程學報,2005,25(10):159-165.
2 王 多,王維洲,靳 丹,等.基于貝葉斯網絡的連鎖故障概率模型[J].電力安全技術,2011,13(7):36-38.
2016-07-14。
鄭建柏(1981-),男,計量管理高級師,主要從事電力營銷計量管理工作,email:wellzheng@126.com。