高巖 史新玉 楊晉彪
【摘 ?要】隨著我國科學技術的不斷發展,電力系統中也出現了許多新的技術,如:數據挖掘技術、聯機分析處理、數據倉庫技術等,這些技術的不斷發展與運用,為新的電力營銷決策支持系統的運用提供了技術支撐。但是,由于數據挖掘技術對一些潛在的問題預測能力較強,特別是對電力營銷系統中較大規模的非線性問題,具有較強的處理能力,在未來的發展中會成為營銷領域中重要的應用工具。因此,本文對數據挖掘技術在電力營銷系統中的應用進行了分析。
【關鍵詞】數據;挖掘技術;電力營銷系統
1電力營銷系統數據來源、特點及數據挖掘技術概述
電力營銷系統當中的數據涵蓋管理信息系統、SCADA系統、地理信息系統、電網運行過程中的負荷管理系統、配變檢測系統、電能量計費系統以及計量檢定等實時信息系統中的所用數據,并且這些數據伴隨著電力企業的發展逐漸積累,數據含量非常龐大。之外,電力營銷系統數據在種類上還比較混雜,而且采集到的數據通常都會摻雜著一些噪聲或是存在數據缺失、錯誤等情況,數據質量難以保證。作為一門新興的學科,自從集統計學和人工智能以及模式識別、數據庫、高性能并行計算與機器學習等多種技術于一體的數據挖掘技術出現之后,人們對于數據的應用不再只停留在簡單的數據查詢階段,而是進入到更高層次的應用——從數據中挖掘有價值的知識和信息,給管理者的決策提供支持。當前常用的數據挖掘技術有關聯規則、分類和時間序列挖掘與序列挖掘以及聚類、Web挖掘、空間挖掘等。
2數據倉庫的系統結構
2.1相對穩固
數據的關鍵是為企業提供分析決策支持,它關聯的操作是數據查詢,通常不對數據進行修改。數據倉庫中的數據是由不一樣的時間數據組成的,而不是事務型的數據。
2.2時間特征
數據倉庫的數據有著時間的特點。數據倉庫伴隨著時間的不斷變化,內容也在不斷的增加,同時需要刪除陳舊且沒有作用的內容。因為數據倉庫通常是作為趨勢的分析預測,通常保留5~10年的歷史數據。數據倉庫里的數據包括著時間的元素,是鍵碼的一個部分。
2.3面向主題
數據倉庫的主題為在一個比較高的層面把數據進行集合的標準,各個主題都是對應一個宏觀的處理領域,充分滿足此領域的決策分析需求。數據在進到數據倉庫前通過集合和加工,把原始的數據構造做到從面向運用到面向主題的改變。
2.4集成性
數據倉庫中的數據主要用作決策分析,要進行整合與歸納。要處理源數據里格式不同的情況,要求把它們統一到數據倉庫的模式中。數據倉庫體系是對進到數據倉庫的原始數據進行清洗、轉換、抽取等處理,最后將其進到數據倉庫里,把對數據倉庫里儲存的數據進行管理、更新、運用的有關工具與軟件進行整合,用于支撐數據倉庫管理與使用的決策。它常常是由分析工具、管理與數據倉庫構成,其具體的關系如圖1所示。
3數據挖掘技術在電力營銷系統中的應用
3.1關聯規則的應用
這種應用可以有效地幫助決策人員進行當前有關數據以及歷史數據的規律分析,最后預測出未來情況。把關聯規則成功引入電力營銷分析,通過FP-Growth算法對電力營銷的有關數據進行關聯規則分析,從中得出各種電量銷售的影響因素以及外部因素、手電水平等的關聯信息,以便更好地為電力的市場營銷策略提供參謀和決策。
3.2分類的應用
在對電力營銷系統進行中長期預測時常用的方法有序列預測、模糊理論和專家系統以及建立在競爭分類基礎上的神經網絡法和模式分類法等,其中神經網絡法和模式分類法在電力負荷預測上都有著令人滿意的精確度。同時還有可應用于日調度計劃編制當中的一種短期負荷預測算法,此種預測方法將決策樹技術和外推算法做了有效結合,有著較高的預測精度;在對SCADA系統中不良數據進行狀態估計時可以通過分類樹建立子數據庫,進而縮減SCADA數據庫規模,將計算速度提升上來。
3.3時間序列與序列挖掘的應用
在所有短期負荷預測方法中,時間序列挖掘是被認為最經典的一種方法,比較系統,同時神經網絡則是短期負荷預測中研究最多、應用最為廣泛的,因此在電力營銷系統的實際應用當中往往會把二者結合在一起對電力營銷數據進行分析。在神經網絡法當中,相較于BP神經網絡,小波神經元網絡在收斂速度上有著更好的表現,而且其中采用了基于隸屬度改進的聚類方法,有利于負荷大波動日預測精度的改善。
3.4聚類應用
聚類在電力營銷系統當中主要應用在以下方面:電力用戶分類、信用評價和負荷預測、分類以及變壓器故障診斷、不良數據的修正等。比如,在對客戶各個方面不同屬性進行劃分的基礎上通過聚類分析法把客戶劃分成不同組別,此時負責決策分析的人員就可以此聚類結構為依據對存在于各個組別相互之間的差異性分析出來,然后對類群特征展開研究,這樣就可以根據實際情況實行不同的營銷策略,保證企業經濟效益的提升。又比如,鑒于電力客戶信用分類的特性,可以在模糊聚類分析的基礎上針對客戶信用建立一個評價算法,通過此種算法就可以獲得基于不同客戶群的聚類中心以及針對每個客戶的隸屬度矩陣,這樣就給針對客戶群的特征分析提供了量化的參考依據。在不良數據的校正上,可以在原有聚類算法——CURE算法當中融入信息熵原則來對聚類過程中出現的基本參數進行選擇,然后在相關負荷特征曲線的提取上使用Kohonen網絡。
4結語
大部分電力管理系統只停留在業務處理層,這一模式不能為電力企業提供更加便利、智能的決策。一直以來,我國電力企業已經在行業信息化建設中積累了大量歷史數據,將數據挖掘技術引入到電力行業中來,進行電力分析決策,為電力企業提供更加科學的管理決策,對防范、控制和化解電力企業生產風險具有現實的意義。但是,由于數據挖掘技術對一些潛在的問題預測能力較強,特別是對電力營銷系統中較大規模的非線性問題,具有較強的處理能力,在未來的發展中會成為營銷領域中重要的應用工具。
參考文獻:
[1]吳冬梅.數據挖掘技術在電力營銷系統線損計算中的應用研究[J].城市建設理論研究:電子版,2014,(17).
[2]郝曉弘,朱潔,王維洲等.數據挖掘技術在電力營銷系統的應用現狀[J].工礦自動化,2011,37(1).
[3]袁哲,王彥文.數據挖掘在電力系統負荷預測中的應用[J].電子制作.2015(11).
(作者單位:1、國網新疆電力有限公司伊犁供電公司;2、新疆宏晟源電力工程建設有限公司)