黃鑫磊, 李盼盼, 王鶴森
(國網新疆電力有限公司營銷服務中心(資金集約中心、 計量中心), 新疆, 烏魯木齊 830000)
新時代電力行業在生產生活中發揮著日益重要的作用,面對電力營銷的海量數據,電力營銷信息化建設不斷被研究,但還存在著建設缺乏合理規劃、信息化的效率不高等問題。
為了解決電力營銷信息化管理中存在的問題,文獻[1]提出了一種基于GIS數據信息的電力營銷信息化系統,該系統以GIS數據信息系統為核心,構建了電力營銷系統的移動平臺,實現了電力營銷數據的信息化管理,但該系統在電力營銷數據存儲中存在系統卡頓現象。文獻[2]提出了一種基于Internet的電力營銷信息化系統,該系統采用VPN技術進行搭建橋梁,實現了對偏遠地區電力營銷的業務辦理,但該系統在整體信息管理上存在效率低的問題。
基于上述文獻中存在的問題,本文研究了電力營商環境的關鍵技術。硬件部分以IBM主機為核心,建立了電力營銷信息化系統,IBM主機接收遠程工作站與營銷系統工作站的數據,并作出相應的處理,實現電力營銷數據的信息化;軟件部分利用三層架構的方式,實現電力用戶的界面交互,以及電力營銷數據的信息管理。最后利用聚類分析法實現對電力營銷數據潛在信息的挖掘[3]。
電力營銷系統有著海量的數據,若不對數據進行挖掘管理,將會造成電力企業混亂的現象,本文對電力營銷信息化進行研究,設計了電力營銷信息化系統,該系統主要包括營銷核心業務系統、營銷大數據平臺、數據存儲域和營銷基礎數據平臺4個模塊[4]。電力營銷信息化系統總體架構圖如圖1所示。

圖1 電力營銷信息化系統總體架構圖
在系統架構中,通過營銷業務核心系統將電力營銷數據整合、選取和轉化成業務系統存儲或結構化非結構化存儲的形式,將數據保存至數據存儲域,再對數據進行處理和實時計算,完成對業務模型驅動域和大數據應用域的建設,進而實現營銷大數據平臺的數據管理[5]。電力營銷使用了數據信息化手段,實現了多元信息融合,將營銷業務、用電信息采集、計量生產、GIS地圖等數據融合在一起,進而實現各電力營銷數據的統一化。
電力營銷信息化系統的硬件部分包括IBM主機、SNA服務器、營銷系統工作站、遠程撥號服務器和遠程工作站5個部分。電力營銷信息化系統的硬件結構圖如圖2所示。
根據圖2可知,遠程工作站的電力營銷數據通過遠程撥號服務器進行傳輸[6],將遠程工作站和營銷系統工作站的電力營銷數據經過SNA服務器傳輸到IBM主機,IBM主機對電力營銷數據作出相應的處理,最終實現電力營銷信息化。本文系統利用IBM大型主機作為電力營銷數據轉換整理中心與電力營銷應用平臺,其內部利用SNA協議,并經過網關完成與TCP/IP之間的協議轉換。電力營銷的各個營銷系統工作站可通過城域網訪問主機,遠程工作站通過遠程撥號服務器訪問主機,在進行遠程訪問時,采用了調制解調器(Modem)。該調制解調器有4種調制方式,分別為頻移鍵控調制、差分相移鍵控調制、調相調幅相結合的調制和高速調制。本文選用的是差分相移鍵控調制[7-8],它可以將音頻信號轉換成較高頻率的信號進行傳輸,具有傳輸速率快、抗干擾性強的特點。
電力營銷信息化系統的軟件設計采用了三層架構的方式,使用組件模式將界面、界面發布、業務邏輯及數據存儲分為多個層次獨立實現,利用中間層對核心模塊進行封裝,為保證系統的可靠性和可行性,采取了多主機并行的方式[9-10]。電力營銷信息化系統的軟件結構圖如圖3所示。

圖3 軟件結構圖
本文系統軟件包括客戶機、Web服務、應用服務和數據庫服務4個主要的模塊??蛻魴C為用電客戶提供瀏覽器,客戶可以通過瀏覽器對用電進行查詢。只需在客戶機上安裝Web瀏覽器并與網絡連接即可,利用客戶端對用戶平臺開發應用程序,通過TCP/IP協議對中間層應用服務進行訪問,實現電力營銷系統的數據管理和關鍵業務管理。Web服務模塊通過HTTP請求及應答的方式與客戶機模塊之間相互通信,在該模塊利用JSP服務器頁面、Servlet服務連接器和Javabean可重用組件實現對用戶接口的處理,方便用戶通過人機界面對電力營銷數據進行瀏覽與查詢,還通過調用中間件,實現與應用服務之間建立通信關系。
應用服務模塊即中間件服務,通過使用EJB應用程序組件,實現對電力營銷業務邏輯、流程控制以及數據分析的管理,并與客戶機之間通過消息服務進行信息交流;通過JDBC/JMS的方式獲取數據庫服務中的電力營銷數據信息,實現電力營銷數據存取、Web服務、安全防護及通信處理等功能。本文系統的中間件服務采用的是跨平臺與架構無關的中間件進行搭建的,能夠很好地提高系統的靈活性,進而實現大規模分布式系統的構建。在營銷業務流程服務中,通過消息服務實現業務流程驅動和消息驅動,進行電力營銷業務流程的流轉、流程調度等流程控制工作,實現電力營銷流程服務的自動化。
本文對電力營銷數據挖掘進行研究,利用聚類分析算法對電力營銷數據進行篩選,利用篩選出的數據計算數據類型相異度,最終實現電力營銷數據的挖掘。聚類分析算法的流程圖如圖4所示。

圖4 聚類分析算法流程圖
設聚類空間中的數據通過低密度區域進行分割,其中低密度對象區域表達式為
nd=(v-b1)nr
(1)
式(1)中,v為聚類空間中數值所屬空間的數目,b為低密度對象子區域數目,nr為當前節點屬性的值域。聚類空間中的數據類經過低密度區域進行分割后,高密度區域將會顯露,高密度對象區域的表達式為
ng=(v-a1)nr
(2)
式(2)中,a1為高密度對象區域的數目。根據式(1)、式(2)可選取出電力營銷聚類分析數據:
ni=z(nd+ng)×i
(3)
式(3)中,z為分割的子區域數目,i為屬性值的樣本密度。進而求得電力營銷聚類分析數據篩選值,出現頻率越高屬性值樣本密度越高。利用數據結構和相異度矩陣進行數據對象間距離的計算和聚類操作,其中數據矩陣屬性結構為
(4)
式(4)中,利用n×p矩陣表示聚類分析數據的相異度,n為數據矩陣對象,p為屬性,i和f為對象之間的差異。其中,f和i的取值為非負數時,若i和f的取值接近0,p的數值就會越大,此時f和i不相似;f和i的取值為負數時,若i和f的取值小于0,p的數值就會越小,說明f和i的相似程度高。
將初始的度量值轉變成沒有單位的常數,利用式(4)進行標準化處理得到:
(5)
式(5)中,sf為絕對偏差值,mf為f的絕對平均值。對度量值進行標準化處理之后,計算數據類型相異度,
(6)
式(6)中,d(i,j)為數據對象之間的距離。如果d(i,j)的值小于等于0,表示聚類數值為一個整數或0;如果d(i,j)的值等于0,表示數據對象與自身的距離為0。對聚類分析數據類型進行相異性計算得到:
W=d(i,j)×kl
(7)
式(7)中,kl為通過掃描得到的聚類分析數據量。完成數據類型相異度的計算后,根據計算結果,挖掘出距離最接近的數據中蘊含的潛在信息。數據庫中具體的樣本向量為(v1,v2,…,vi,c),其中vi為字段值,c為類別。完成電力營銷數據分類后,對數據進行預測其準確度,從數據中獲取知識,將數據輸入,對數據依次測試記錄輸入數據的屬性值,直到找到記錄所在的類,并挖掘出數據蘊含的潛在信息。
為驗證本文研究的電力營銷信息化系統的可行性與聚類分析法數據挖掘的有效性,利用Visual Studio OpenCV 3.0搭建實驗平臺(見圖5)。實驗環境參數如表1所示。

表1 實驗環境參數

圖5 實驗架構示意圖
本實驗采用的用電數據是某電力有限公司每月用電量匯總分析數據,實驗數據如表2所示。

表2 實驗數據
基于上述的實驗基礎,對本文研究的系統進行實驗測試。首先對電力營銷數據挖掘的精準度進行測試,并將實驗結果與文獻[1]、文獻[2]進行比較。實驗結果比較圖如圖6所示。

圖6 實驗結果對比圖
由圖6可知,本文系統的精準度明顯高于文獻[1]和文獻[2]的精準度,并且精準度隨著數據挖掘的數量緩慢上升,在數據挖掘數量達到700個時,精準度達到了97%;文獻[1]在數據挖掘數量為700個時,精準度為72%,精準度從43%到72%緩慢增加;文獻[2]在數據挖掘數量為700個時,精準度為61%,精準度從34%到61%緩慢增加。由此可見,本文系統的挖掘精確度高,具有很高的實用性。
接著對電力營銷信息化系統的時效性進行研究,實驗結果比較圖如圖7所示。

圖7 實驗結果對比圖
由圖7可知,本文系統在信息處理所用的時間隨著信息處理組數的增加而緩慢的上升,在信息處理數據為700組時,信息處理所用的時間為20 s;文獻[1]在信息處理所用的時間也隨著信息處理的數量增長,在信息處理數據為700組時,信息處理所用的時間為60 s;文獻[2]在信息處理所用的時間增長的最快,在信息處理數據為700組時,信息處理所用的時間為70 s。由此可見,本文系統在對信息處理時花費時間最少,具有很好的時效性。
為完善傳統電力營銷中存在的問題,本文設計了電力營銷信息化系統。硬件部分采用IBM主機為核心,將遠程工作站、營銷系統工作站的數據傳送給IBM主機進行處理,實現了電力營銷數據的信息化;軟件部分利用了三層架構的方式,采用多主機并行,實現了對電力營銷數據進行精細化、自動化的資源管理。最后利用聚類分析算法對電力營銷數據進行篩選,利用篩選出的數據計算數據類型相異度,實現了對電力營銷數據的精準挖掘。本文研究的系統還存在著一定的不足,在信息化的電力營銷環境下,信息共享性很低,還需進一步對信息共享進行研究,提高電力營銷信息的共享性。