張艷麗,孫志杰,牛任愷,張鑫磊,郭偉
(國網冀北電力有限公司計量中心,北京 100045)
隨著電網行業逐漸融入新媒體信息技術,電力行業在實際運行過程中會產生大量電力信息數據,對電力營銷數據的處理成為當前急需妥善處理的重要問題[1]。經濟社會的發展帶來技術革命的變化,可以有效提高電力信息數據處理能力,完善用戶數據緩存服務[2]。是電力公司和電力用戶之間達成的一種重要合作形式,企業根據用戶需求,提供符合用戶需要且能夠保證其安全性、可靠性的電力商品,為后續的服務提供保障[3-4]。
電力營銷環節是電力企業中非常重要的一環,解決好該環節的開發與服務,將會極大地提高電網企業的運營效率,服務水平也將會有效提升。數據集成技術能夠對不同種類分散的數據來源進行統一處理,根據不同的處理需求實現分類處理,打破數據之間的邏輯差異,傳統的數據集成技術包括多數據庫系統[5]和物聯網技術的數據庫系統[6],隨著技術的發展,數據集成技術也隨之精進,在電網企業中,這項先進技術得到了較為廣泛的應用。
綜上所述,利用數據集成技術設計了電力營銷數據分析系統,通過優化硬件設計提高系統操作效果,利用軟件強化系統可編程功能,確保系統的經濟實用性和安全性。
為了實現系統架構的設計,滿足兼容要求,系統硬件設計了多個模塊,如圖1 所示。

圖1 電力營銷數據分析系統硬件結構
數據采集模塊主要是采集和挖掘各個部分的數據資源,用于實現數據維護、選擇特定數據集、查看數據屬性等功能。為了選擇特定的目標數據,工作人員對該部分的數據擁有管理和維護權限,而對于數據分析模塊的要求則更加嚴格,只能讓部分具有管理分析權限的工作人員擁有這一權限。在硬件系統中,數據預處理非常必要,其可以使數據具有不同屬性和更分散的數據[7]。
數據采集模塊結構如圖2 所示。

圖2 數據采集模塊結構
在數據采集模塊中,微控制單元能夠區分來源復雜的數據,遇到重復數據、不正常數據以及有可能危害系統安全的入侵數據要立即篩選,將符合要求的數據放入數據庫中,確保數據采集的準確性,這樣才能在挖掘和結果分析模塊中更清晰地輸入不同類型的數據[8]。數據采集模塊內部的異步收發傳輸器對采集的數據進行檢索、查詢、輸出,使工作人員能夠對數據實現多類查詢和輸出,確保整個過程更加流暢、方便。
在整個硬件系統設計中,數據挖掘模塊是一個重要組成部分[9]。數據挖掘模塊是數據采集模塊完成后對用戶數據資源進行二次處理的重要步驟,在整個硬件系統處理過程中起到承上啟下的銜接作用。
數據挖掘模塊能夠按照不同類別的用戶作進一步劃分,根據以往統計數據進行分析,預測電費欠費高風險用戶。在數據采集的基礎上進行二次分析與處理,是整個模塊的重點。在數據挖掘中,將數據分析和管理兩個部分連接起來,通過聚類分析技術對用戶進行細分[10-12]。數據挖掘模塊內部的數據庫能夠提供相應的端口,供其他子程序訪問和讀取數據,確保這些端口具有足夠的硬件接口。數據挖掘模塊電路圖如圖3 所示。

圖3 數據挖掘模塊電路圖
在數據提取、數據校驗、數據融合、對比分析等方面,數據結果分析模塊具有多方面的需求。數據結果分析模塊主要對系統數據集進行采集評估、生成報表及對比處理,對硬件系統中不同情況所產生的數據進行高標準的數據分析,將在不同條件下獲得的數據進行輸出和整理,并將完整的信息呈現給用戶[13]。數據結果分析模塊結構如圖4 所示。

圖4 數據結果分析模塊結構
當用戶輸入相應的關鍵字和數據時,系統可以根據用戶的需要整合數據,以一種更加直觀的方式對數據進行分析,實現統計信息的輸出,并向用戶展示。在目前的系統實驗過程中,輸入相應的名稱和關鍵詞后,系統可以生成相應的數據分布圖,然后啟動具體的數據分析模型,通過瀏覽器向用戶展示分析結果,并且可以通過柱狀圖、條形圖等多種形式,對數據進行對比分析,并且將結果呈現給用戶[14-15]。
在設計系統軟件時,數據庫將現代網絡與信息安全、C 語言編程等軟件程序相結合,實現整個軟件系統運行的高效率和低成本性,在該系統中,開發工具采用了Power-Builer 6.5/8.0,語音查詢和觸摸查詢采用Delphi 6.0、VB 6.0 等開發工具,利用Mapinfo 5.1與PowerBuilder 6.5/8.0 相結合的方法來進行信息數據分析[16]。電力營銷數據分析系統軟件流程如圖5所示。

圖5 電力營銷數據分析系統軟件流程
在數據庫的基礎上,由于使用了先進的設備,能夠實現不同數據的高度共享;在軟件設計中,能夠保證從上至下多個層級單位的數據檢測。軟件設計平臺將以計算機語言為核心技術,保證整個算法分析可以應用于各種平臺,提高自適應能力。
在對電費進行核算時,把整個計算流程放到大型數據庫中進行計算,采用k-means 算法進行挖掘分析能夠大大提高供電公司的用電管理水平,提高整體的經濟運行收益。
電力營銷數據挖掘步驟如下:
步驟一:在電力營銷管理數據庫中確定一個k值,計算得出電力營銷管理數據k的集合;
步驟二:從這些集合中隨機選擇幾個營銷數據點作為中心,和其他參數進行比較;
步驟三:對于集合中的每一個數據類型,利用歐式距離計算出與質心點最相近的點,將電力營銷管理數據集合劃分至所屬的集合類型中;
步驟四:整理好所有的集合數據類型,重新計算電力營銷系統每個管理數據集合類型的質心;
步驟五:重新計算電力營銷管理的距離比,若數值較小,則滿足計算需求,算法結束。
使用聯機分析算法處理技術對電力營銷數據作進一步的處理分析。這一方法可以使電力營銷人員、分析人員、技術人員從不同角度分析思考宏觀數據,從整體上把握數據間的關系,從而更深刻地掌握數據。
在聯機分析算法中,主要是對算法進行多角度分析、應用和檢索。這些不同數據類型維度指標可以用來判斷數據產生的時間等信息,多維的數據管理分析結果可以構建不同的信息類型,以便進行剖析,對電力進行分析,使用戶能夠從不同的側面直接地觀察電力營銷的信息數據,獲得更加深刻直觀的認識。
分析結果顯示,該算法具有較高的安全性和穩定性。經過整體系統運行,用戶將賬號和密碼輸入后,能夠進入到系統主界面,用戶可以選擇查看并根據屬性進行維護,實踐表明,該系統設計具有較好的運行能力。
為了驗證該文設計的基于數據集成技術的電力營銷數據分析系統的實際使用效果,將傳統系統與該文系統進行對比實驗。實驗的操作系統為Microsoft Windows 2010,主頻為6.4 GHz,內存為16 GB,采用硬件系統中的存儲器來存儲采集的電力營銷數據,在Matlab 背景下,采用數據集成技術對電力營銷數據分析系統的相關性能進行仿真分析。
首先將該文系統與文獻[5]系統、文獻[6]系統的電力營銷數據分析能力進行對比實驗。在實驗中,利用硬件系統中的采集模塊采集電網中的電力營銷數據,電力營銷數據中包含電能表電量數據以及電力營銷管理數據,記錄采集的電力營銷數據的種類數量,利用該文系統與文獻[5]系統、文獻[6]系統對各類電力營銷數據進行分析,分析過程中,將電網調制信號經調制解調器由240 V 解調至120 V,把采集的電力營銷數據與電網調制信號一并傳輸到15 kV 的母線上,以方便母線中的分析模塊對電力營銷數據進行二次分析,統計兩次分析實驗情況,包括不同系統分析的電力營銷數據的母線電壓變化以及權重指數變化情況。其中母線電壓越低,分析的電力營銷數據種類越多,證明系統的數據分析能力越強,分析實驗統計的母線電壓變化情況實驗結果如圖6所示。

圖6 母線電壓變化情況實驗結果
在該文設計的分析系統中,隨著電力營銷數據種類的增加,達到300種時母線電壓由原來的15 kV降低至10 kV。而在文獻[5]系統和文獻[6]系統中,隨著電力營銷數據的增加,母線的電壓逐漸升高,最高分別達到了20 kV 和17 kV。由此可見,該文系統得到的電力營銷數據種類明顯高于其他系統的數據種類,進而可證明該文系統的數據分析能力優于其他系統。
針對該文系統與文獻[5]系統、文獻[6]系統的數據挖掘效率進行實驗,挖掘速度的評估指標為權重指數,權重指數為分析電力營銷數據的參數,參數越大,系統挖掘電力營銷數據的效率越低,提取采集模塊采集的電力營銷數據中的10 組數據,分別利用該文系統與文獻[5]系統、文獻[6]系統對數據進行挖掘和分析,挖掘過程中需要采用數據集成技術將多個電力營銷數據源集成在一起,根據集成后的電力營銷數據源篩選出10 組數據中不一致的數據,統計篩選后的電力營銷數據,將其作為權重指數,10 組電力營銷數據的權重指數變化如圖7 所示。

圖7 電力營銷數據的權重指數變化
由圖7 實驗結果可知,在該文設計的電力營銷數據分析系統中,權重指數呈現逐漸降低趨勢,最后趨于穩定,說明該文系統挖掘電力營銷數據的效率較高,且系統較為穩定,而在文獻[5]系統和文獻[6]系統中,權重指數呈現波動升高趨勢,且權重大小波動范圍較大。由此可證明該文系統挖掘電力營銷數據的效率高于文獻[5]系統和文獻[6]系統。
綜上所述,通過實驗驗證了該文設計的基于數據集成技術的電力營銷數據分析系統優于傳統系統,該系統的數據分析能力更強,數據挖掘效率更高。
通過該文的研究發現,基于數據集成技術的電力營銷數據分析系統設計在時代發展背景下顯得十分重要,其作用愈加凸顯,結合以上實驗結果,基于數據采集、挖掘、結果分析構成的硬件部分,與基于k-means 的電力數據挖掘模型和聯機分析算法的軟件部分,共同構成了該文所設計系統,研究表明,該文系統能夠滿足當前實踐和現實發展需要,數據分析能力較高,數據挖掘效率較高,為創建營銷系統提供相應的參考與借鑒。