董 亮,闞新生,鄧國如,徐 杰,袁 慧
(1.國網湖北省電力有限公司信息通信公司,湖北 武漢 430077;2.中國聯合網絡通信有限公司武漢市分公司,湖北 武漢 430000)
短期電力負荷預測對于短期電力負荷預測水平的提高,可以幫助電力局提高電力管理水平,降低發電成本,可以為電力的管理和規劃提供重要的管理依據[1]。而數據深度挖掘對于提取隱藏的數據信息和潛在有用的知識,并廣泛用于各個企業,且取得了良好的經濟效益[2]。因此,國內外眾多研究者,都在短期電力負荷預測這一領域中,應用數據挖掘技術,并做了大量工作。尤其是近年來,國內外已經將人工智能技術,應用在對電力負荷預測中的數據挖掘技術中,如粗糙集、神經網絡、Petri網等[3]。數據挖掘技術始于20世紀80年代末,且對于數據挖掘技術并未得到相應的重視,卻在此后的時間里,快速發展數據挖掘技術,并將數據挖掘技術,與人工智能、數據庫、機器學習等領域緊密結合[4]。隨著對數據挖掘技術的開發,除國內外的研究學者外,各企業也開始加入數據挖掘研究的領域,并將數據挖掘技術進行細致的劃分,如數據模型、數據類型、數據應用等[5]。文獻[6]提出基于劃分法的數據挖掘模型,預測短期電力負荷;文獻[7]則提出基于層次法的數據挖掘模型,預測短期電力負荷。但是在上述的研究中,數據挖掘技術在預測短期電力負荷時,短期電力負荷預測存在數據時間序列紊亂現象,導致預測短期電力負荷精確度低,為此研究用于短期電力負荷預測的時間序列數據深度挖掘模型。
采用時間序列數據深度挖掘技術,建立時間序列數據深度挖掘模型,預測短期電力負荷,需要促使此次建立的模型,具有數據預處理能力,可以在大量的電力數據信息中,提取預測短期電力負荷的數據,并對提取出的數據進行預處理,從而減輕時間序列數據深度挖掘模型,在預測短期電力負荷時的計算量。因此構建數據倉庫體系,對電力數據進行預處理,其電力數據倉庫體系結構如圖1所示。

圖1 數據預處理電力數據倉庫體系結構
從圖1中可以看出,此次對電力數據預處理而設計的電力數據倉庫體系,分為數據源的數據獲取層,數據抽取、轉化和裝載的數據處理層,操作型數據存儲、中心數據倉庫、數據集市、多維數據集等組成的數據存儲層和用戶訪問分析的數據訪問層。
在數據獲取層,針對源數據的獲取,在此次設計電力數據倉庫體系,為降低數據處理步驟,根據數據來源,劃分為相關數據、電力數據、歷史數據和外部數據4個方面,根據不同的來源,對獲取的電力數據,根據數據倉庫的要求進行提取;清洗其中存在的錯誤數據或者填補其中缺少的數據,確保數據的完整性后;將數據轉換成統一數據類型,保證數據格式的統一;此時,數據中會存在許多細節數據,需要對數據進行集成處理;經過上述的提取、清洗、轉換、集成處理后,自動加載處理好的電力數據,完成合格數據入庫過程[8]。
此時數據倉庫中,所含有的數據信息包含電力體系的所有數據信息,并完成數據存儲循環,促使電力數據存儲層中的數據,與電力公司數據具有一致性,可以實時通過數據訪問層,對數據信息進行訪問,直接統計數據,挖掘數據中存在的相關性。
由圖1電力數據倉庫體系處理后得到的數據,進行數據時間序列劃分,從而根據歷史數據對短期電力負荷進行預測。因此,將通過數據訪問層,提取數據存儲層中的數據信息,將其中的數據數量設為n,其具有的時間序列為T,且T=〈t1,t2,…,ti,…,tn〉,其中i表示第i個數據,根據時間序列T設定的數據先后關系,將其時間序列的分界點數量設為K,當時間序列T具有K+1個分界點,設時間序列T的分界點為b,即當〈tb1,tb2,…,tbi,…,tbk+1〉(1=b1 在如圖2所示的時間數據序列3種模式圖中,設2個數據之間的相鄰距離為l,則其相鄰采樣點為ti-l、ti和ti+l,其距離閾值為d,且d>0。此時,針對圖中跳躍、漸變和尖峰3個模式,進行數學定義。跳躍模式時,2個數據之間的距離閾值為|ti+l-ti|≥d,其中ti-l 圖2 時間數據序列3種模式 (1) 式中,Nt表示子序列Si中包含的數據個數。此時即完成數據時間序列的劃分,但是在分割的過程中存在數據分割界限模糊問題,為了進一步提高數據劃分質量,設子序列Si中的數據信息為標準數據信息。則可以將子序列Si中所有數據點的特征Fi定義為: Fi=(bi,Ni,Li,Ui) (2) 此時,根據式(1)和式(2),令子序列Sj中所有數據點的特征Fj=(bj,Nj,Lj,Uj),其中j表示第j個數據,將子序列Si和子序列Sj所有數據點特征合并為Sm,則Sm數據點的特征Fm為: Fm=(bm,Nm,Lm,Um) (3) 此時,式(3)的Fm等于Fi加Fj之和。因此,子序列Si和子序列Sj所有數據點特征合并序列Sm的第1個數據為bm=min(bi,bj),即是Si和Sj中的最小起點數據;個數和為Nm=Ni+Nj;則其數據點的線性和、有數據點的平方和為: (4) 綜合式(1)、式(3)和式(4),即完成數據時間序列的劃分。根據劃分好的時間序列,綜合電力數據倉庫體系,即可構建實踐序列數據深度挖掘模型,預測短期電力負荷。 綜合1.1和1.2設計的數據處理電力數據倉庫體系以及劃分的數據時間序列,設計時間序列數據深度挖掘模型,預測短期電力負荷,其時間序列數據深度挖掘模型建模過程,如圖3所示。 圖3 時間序列數據深度挖掘模型建模過程 基于1.2設置的原始數據時間序列T=〈t1,t2,…,ti,…,tn〉,建立如圖3所示的數據累加,則有: (5) 式中,T(1)為累加后的數據。此時的T(1)(k)為數據累加值[13]。 建立微分方程,則有: T(k)+az(1)(k)=c (6) 式中,a為發展系數;c為方程作用量;z為累加值參數[14]。 此時,根據式(6),計算微分方程的背景值,則有: (k=1,2,…,n-1) (7) 此時,建立數據時間序列的影子方程,則有: (8) 式中,d為方程的微分子,不可約分[15]。此時求解微分方程,則有: (9) 式中,T(1)v為原始數據累加后T(1)的映射值。此時,將式(9)代入,則T(1)的數據時間序列模型為: (10) 式中,e為無理數,此時,將(10)中累加的數據時間序列進行刪除,則需要做一階累減,形成原始數據序列的預測數據序列,則T(1)數據時間序列模型的還原值為: (11) (12) 為檢測此次設計的時間序列數據深度挖掘模型,設計模型性能實驗。此次實驗數據選取某區域的電力局電力數據,采集該電力局近3年用戶負荷功率數據和輔助輸入數據作為此次的實驗數據。短期電力負荷預測網絡遷移變化如圖4所示。 圖4 短期電力負荷預測網絡遷移變化 從圖4中可以看出,該電力局共有36條支線路連接該區域的電力負荷,且電力用戶多集中在這片區域中。因此,此次短期電力負荷采集時間間隔為15 min,負荷數據變換的時間序列為96維度。由于此次設計的時間序列數據挖掘模型,主要用來預測短期電力負荷變化情況,因此在此次實驗中,驗證時間序列數據深度挖掘模型性能,采用0~1標準化消除數據存在的幅值大小差異,提高數據采集使用效果。此時,針對得到的電網數據信息,需要進行聚類分析,得到電特性子集,獲得數據聚類結果,對輸入數據的時間序列進行分割,從而得到最終輸入的該電力局電力數據。 上述數據為用戶負荷功率數據,除用戶負荷功率數據外,還需要輔助輸入數據。即收集用戶負荷功率數據時的日期、天氣、溫度等輔助輸入數據信息,并對這些輔助輸入數據信息進行量化處理,量化標準見表1。 表1 輔助輸入數據量化標準 基于表1,對收集的輔助輸入數據進行量化處理。此時,即可將采集到的用戶負荷功率數據和輔助輸入數據合并,即為此次實驗需要的電力數據。基于上述流程收集到的電力信息,將此次實驗設計的時間序列數據深度挖掘模型,放置在R730機架式服務器上運行。服務器的處理器為E5-2630 V3,運行頻率為2.4 GHz,內存為32 GB。 基于此次實驗設置的實驗參數,將此次研究的時間序列數據深度挖掘模型作為A模型,將引言里提到的2種時間序列數據深度挖掘模型作為B模型和C模型。基于此次設計的時間序列數據深度挖掘模型,主要用于短期電力負荷預測,采用3種模型分別預測該電力局的短期電力負荷情況,從預測短期電力負荷功率和模型預測短期電力負荷的精確度2方面,分析3種時間序列數據深度挖掘模型,檢測3種時間序列數據深度挖掘模型,預測短期電力負荷功率,與實際短期電力負荷功率是否一致;統計短期電力負荷功率預測結果,對比3組模型對短期電力負荷預測的精確度。為了保證此次實驗模型對短期電力負荷預測的可靠性和真實性進行50次實驗,并將所得短期電力負荷功率和模型預測短期電力負荷的精確度對比結果,按實驗次序繪成圖表,比較不同時間序列數據深度挖掘模型存在的差異。 基于上述設置的實驗參數,分別采用3組模型對此次采集到的電力數據,進行短期電力負荷預測,并將預測結果與短期電力實際負荷進行對比。實驗結果如圖5所示。 圖5 短期電力負荷對比結果 從圖5中可以看出,經過50次預測結果,B模型對短期電力負荷預測與實際短期電力負荷值走勢不一致,呈現平穩趨勢,相較實際值,所預測的短期電力負荷功率值較低,未出現明顯峰值;C模型對短期電力負荷預測,出現峰值較多,而在實際值中,僅在預測的第28次和36次存在峰值;而A模型與實際值的走勢、峰值等較為接近,得到的負荷功率值也極為接近。由此可見,此次研究的時間序列數據深度挖掘模型,可以準確預測短期電力負荷。 預測效果如圖6所示。 圖6 預測效果 由圖6可知,擬合電力負荷曲線上表現優異,預測數據在接近分割線部分預測較為準確,遠離分割虛線處開始出現衰退。這是因為此處的輸入預測數據為前一時間點的預測數據,通過計算得出下一時間點的預測數據,預測的誤差開始疊加,導致精度下降,而接近分割線的部分由于是真實數據預測出的預測數據,故而較為準確。 在第1組實驗的基礎上,進行第2組實驗。基于此次實驗采集的電力數據,所采集到的181個樣本數據,驗證模型預測短期電力負荷精確度,收集第1組實驗預測過程中,模型產生的規則數目變化、準確預測樣本數、樣本搜索的準確率、負荷的平均預測準確率等5個方面,對比模型在預測短期電力負荷過程中3組模型的精確度。 多變量的預測方式為每一日的同一時刻作為一個時間序列數據,同時預測 24 個時間序列的負荷值,多變量預測結果如圖7所示。 圖7 多變量數據預測效果 由圖7可以看出,多變量預測時存在個別時間點預測誤差較大,整體預測負荷與真實負荷擬合程度較好。其模型預測短期電力負荷精確度對比結果見表2。 表2 模型預測短期電力負荷精確度對比 從表2中可以看出,在驗證同樣的樣本數目下,A模型對此次采集到的樣本數據準確預測的樣本高于B模型和C模型,對模型中的規則使用更是遠遠高于B模型和C模型,樣本搜索準確率也高達90%以上,對短期電力負荷預測準確率更是達到了98%。由此可見,此次研究的時間序列數據深度挖掘模型對短期電力負荷預測精確度更高,對模型自身的規則設定的準確率更高。 綜合上述2組實驗可知,此次研究的時間序列數據深度挖掘模型,可以準確預測短期電力負荷功率,對模型設定的規則使用率高。 綜上所述,通過此次研究的時間序列數據深度挖掘模型,可以得到數據時間序列的變化情況,從而預測短期電力負荷。但是,此次研究的時間序列數據深度挖掘模型未曾考慮負荷電價的敏感程度,對模型預測電力負荷產生的影響。因此,在今后的研究中,需要深入研究負荷電價變化,進一步提高電力負荷預測的準確率。


1.3 預測短期電力負荷




2 實驗研究


2.1 第1組實驗測試結果


2.2 第2組實驗測試結果


3 結語