蔡榮彥
摘要:本文通過介紹神經網絡技術與算法,提出了利用神經網絡進行電力營銷基礎數據準確性校驗的框架模式,經實驗數據驗證,有效提高了營銷基礎數據校驗的自動化程度?!按髷祿睍r代的今天,數據挖掘技術層出不窮,為海量電力營銷基礎數據的自動分析和校驗提供了一條解決之路。本文選擇神經網絡算法,通過SPSS軟件對電力營銷基礎數據進行建模、分類、自動得出校驗規則,實現偏差數據的篩選,為基礎數據的更正提供校驗依據和異常清單。
關鍵詞:神經網絡 電力營銷 SPSS
中圖分類號:TP183 文獻標識碼:A 文章編號:1007-9416(2014)12-0084-01
1 引言
隨著堅強智能電網的迅速發展,電力營銷業務數據以日劇增。電力營銷基礎數據質量的高低直接影響電力營銷工作各項指標的優劣。如何校驗電力營銷基礎數據的準確性是提高電力數據質量的關鍵問題。傳統校驗規則的生成,需要大量各業務領域專家分析探討,費時費力,且自適應能力差。
2 神經網絡簡介
2.1 概述
人工神經網絡(Artificial Neural Networks,簡寫為ANNs),簡稱為神經網絡(NNs),它是一種模仿動物神經網絡行為特征,進行分布式并行信息處理的算法數學模型。
2.2 神經網絡算法
一個神經網絡分為輸入層、輸出層和隱含層。輸入節點對應預測變量。輸出層的節點對應目標變量。在輸入層和輸出層之間的隱含層決定了神經網絡的復雜度。節點間的每個連接對應一個權重,節點的值通過它所有輸入節點的值與對應連接權重乘積的和作為函數的輸入而得。
2.3 神經網絡分類
神經網絡模型主要考慮網絡連接的拓撲結構、神經元的特征、學習規則等。典型的神經網絡模型主要分3大類:以感知機、BP反向傳播模型、函數型網絡為代表的,用于分類、預測和模式識別的前饋式神經網絡模型;以Hopfield的離散模型和連續模型為代表的,分別用于聯想記憶和優化計算的反饋式神經網絡模型;以ART模型、Koholon模型為代表的,用于聚類的自組織映射方法。
2.4 神經網絡應用
神經網絡通常用于兩類問題:分類和回歸。由于其良好的魯棒性、自組織自適應性、并行處理、分布存儲和高度容錯等優點,在很多復雜度很高的領域,都取得良好效果。
3 SPSS簡介
SPSS(Statistical Product and Service Solutions),是IBM公司推出的一系列用于統計學分析運算、數據挖掘、預測分析和決策支持任務的軟件產品及相關服務的總稱。
SPSS的神經網絡模塊,包括多層感知器(MLP)和徑向基函數(RBF)兩種方法。這兩種方法都是有監督的學習技術,且都采用前饋結構。為提高效率,本文選擇速度較快的徑向基函數方法進行數據分析。
4 實驗分析
本實驗使用SPSS神經網絡模塊作為數據分析工具,以標準電力營銷基礎數據為數據模型,對神經網絡進行訓練建模。為方便說明,簡化標準數據集,截取訓練數據片段如下:
在徑向基函數方法中,“因子”選擇“用戶分類”做為神經網絡輸入層,“因變量”選擇“電壓等級”做為神經網絡輸出層。訓練后的神經網絡參數結果如表1:
通過以上參數估計結果,根據鍵結值>0的網絡節點關系可見:
(1)輸入層“用戶分類=低壓居民”時,通過隱藏層H(1),至輸出層的分類為“[電壓等級=交流220V”;
(2)輸20V入層“用戶分類=高壓”時,通過隱藏層H(2),至輸出層的分類為“[電壓等級=交流10kV”。
分類結果符合客觀實際和電力營業規范,可見該神經網絡模型的正確性和有效性。至此,無需專家參與,即可得出以下校驗規則:
(1)用戶分類為低壓居民的,電壓等級不應為交流10kV;
(2)用戶分類為高壓的,電壓等級不應為交流220V。
將實際營銷客戶基礎數據代入該模型進行校驗,分類不符合以上規則的則可判定為偏差數據,進一步由電力營銷業務人員進行核查、清理、整改,修正用戶分類和電壓等級的業務邏輯關系。以此類推,對用戶檔案信息、計量資產、電價電費、臺區、線路等信息均可通過神經網絡分類進行邏輯關系梳理,生成校驗規則,為基礎信息普查整改提供依據,有效提高基礎數據準確性和實用性。
5 總結與展望
本文提出了一種基于神經網絡的電力營銷基礎數據自適應的校驗方法,并使用SPSS工具進行仿真實驗。實驗證明,該方法準確有效、自適應結果良好,有效提高了校驗效率。下一步將對比其他數據挖掘方法,完善和修正實驗模型,整合企業數據庫,搭建高效易行的電力營銷基礎數據校驗平臺。
參考文獻
[1]邵峰晶,于忠清.數據挖掘—原理與算法.中國水利水電出版社,2003.
[2]劉軍,呂俊峰.大數據時代 數據挖掘在電力企業的應用前景.