楊峰, 劉勝強, 吳麗賢
(廣東電網有限責任公司佛山供電局, 廣東, 佛山 528000)
由于電力營銷數據來源種類很多,多是通過實時采集和調度中心收集而來,所以數據是以非線性方式描述的,在描述過程中會涉及數以千計的狀態變量,如何處理電力營銷數據已經成為了亟待解決的問題[1-2]。信息融合是將多種來源的資訊或資料組合、整合以形成統一結構的技術。最初,信息融合在軍事領域得到了廣泛的應用,分析并整合諸如傳感器、信號、信息以及人工產生的各種信息,以獲取隱藏的軍事情報[3]。今天,人們對信息融合的理解不僅僅來自傳感器,還來自因特網、數據庫、軟件等。隨著人們認知領域的擴大,信息融合的概念也不斷擴大,通過計算機和軟件的支持,實現了多數據源的融合,擴大了人們的認知范圍,提高了人們的分析和決策能力,提高了問題解決效率。相關學者進行了研究,取得了一定的進展。陸慧等[4]提出基于數據挖掘的電力營銷數據分析系統,通過挖掘電力營銷數據,分析電力企業營銷對象情況,同時優化電力營銷數據分析系統的架構,此方法能夠有效提升數據分析準確性,但是數據分析時間過長、分析效率不佳。王奇等[5]提出基于數據融合的電網運行全景可視化分析系統,通過算術平均值去除電網數據誤差,并通過一致性檢驗分析電網數據的數據序列,構建關聯性模型實現電網運行全景可視化分析,能夠全方位地實現電網運行分析,但是此方法分析過程比較復雜,分析用時較長。陳泗貞等[6]提出基于COMTRADE模型的電力系統多源故障數據融合分析方法,構建于COMTRADE模型,采用集對分析方法有效整合可靠數據信息,利用BF算法進行電力數據融合,此方法有效提升了數據分析時間,但是分析的準確性不佳。王萍等[7]提出基于云計算的電力大數據分析系統,通過云計算方法分析電力企業業務能力,給出對應的電力營銷管理策略,有效解決電力,實現數據融合,但是此方法的營銷分析結果準確性低。
針對以上問題,本文基于信息融合技術,應用多元回歸分析理念,針對電力營銷數據設計一種新的多元回歸分析系統,將不同條件下的數據融合到一起,通過多元回歸分析實現數據的整合處理。
本文設計的基于信息融合的電力營銷數據多元回歸分析系統整體架構包括平臺層、核心功能層、系統邏輯層和應用層構成。系統整體架構結構如圖1所示。

圖1 電力營銷數據多元回歸分析系統整體架構圖
該平臺以 MongoDB數據庫為主庫,支持本體模型的持久化存儲;以關系型數據庫為補充,實現了從原始科學研究信息到科學研究本體的過渡存儲。MongoDB用于與系統上層模塊交換數據,負責與關系數據庫的數據交換工作,支持將源數據轉化為融合數據的過程。基于云的架構在平臺層上,使系統的可擴展性更強[8-10]。
核心功能層包括系統所需的核心算法,如信息提取、聚類、分類、實體識別、重復名稱消除、網絡特征值計算等。在數據預處理過程中,主要采用信息提取和實體識別算法對數據進行有用信息提取[11-12]。聚類分類算法和重復名稱消除歧義算法是數據融合的一部分,主要用于消除歧義。在信息挖掘過程中主要應用了網絡特征值的計算[13]。
從系統整體上看,其操作流程為數據采集、數據預處理、本體構建、信息融合、數據分析、可視化。
在完成電力營銷數據多元回歸分析系統整體架構設計后,設計系統硬件。系統硬件有信息管理模塊、數據管理模塊、報警模塊和電力營銷數據管理模塊。系統硬件結構如圖2所示。
在系統硬件結構中,信息管理模塊是公共模塊,能夠管理數據信息,實現用戶管理,增強繼電保護裝置的自主保護性能,取得較高的電路安全性。信息管理模塊通過調節電力系統內部的安全信息,將數據信息全部錄入轉化空間中并構建電路數據傳輸通道,配置數據監管裝置,時刻掌控此時的數據狀態,并獲取精準程度較高的初始繼電保護裝置數據,提高操作的成功率,提升其電路安全性。

圖2 系統硬件結構圖
信息管理模塊主要負責管理電力營銷數據用戶信息、角色信息、片區管理、數據配置等。
數據管理模塊實現了對電力營銷數據的管理,主要內容:合同管理、租約管理、電費管理、基站管理、電表管理。
預警模塊主要負責預警各類信息,所有的預警信息在生成后都會以短信的形式傳給負責人,達到及時提醒的目的。
電力營銷數據管理模塊是系統的核心模塊,負責預估、監控、分析、統計電量。
電量估算:根據各機房設備的實際情況,從理論上估算能耗。針對電力頻繁變化或受氣候影響的設備,采用靈活的電力估算公式及相關系數,保證電力估算的智能化。
功率監測:在動態環境監測系統中,通過對裝有功率采集模塊的設備進行實時的功率采集來實現功率監測。
用電分析:分析用電消耗、實際用電量和理論用電量,以檢查設備老化、用戶偷電和其他情況,并為今后節能和減排提供決策依據。分析用電量以實現節能減排,通過科學合理地分析用電量,可以調查業主偷電行為和設備故障導致用電量過大的原因,從而實現節能減排。
用電統計:對收集到的電量進行統計,包括日用電統計、月用電統計、年用電統計、隨時用電統計等。
對電力營銷數據進行信息融合,通過引入回歸分析方法對系統進行優化。首先,分析電力營銷信息融合過程,具體融合過程如圖3所示。

圖3 電力營銷信息融合過程
分析圖3可知,采集電力營銷信息,通過數據關聯對原始電力營銷信息進行分析,并根據電力營銷信息的不同類別進行融合,獲得新的電力營銷數據。在此基礎給出電力營銷數據功能模型如圖4所示。
根據圖4可知,通過傳感器對電力營銷數據進行校準,提取相關數據并對電力營銷數據狀態進行估計,通過模式識別獲得電力營銷數據中更加細致的信息。通過信息融合的功能模型,引入回歸分析方法對系統進行優化。工作流程如圖5所示。

圖4 信息融合的電力營銷數據分析系統功能模型

圖5 電力營銷數據多元回歸分析流程
利用挖掘算法篩選數據,篩選過程如下:
(1) 通過低密度區域分割電力營銷數據。分割計算過程如下:
nd=(v-b1)nr
(1)
其中,v表示研究的電力營銷數據所屬空間的數目,b1表示在低密度下電力營銷數據的對象子區域空間,nr表示電力營銷數據所處節點的值域。
(2) 電力營銷數據的分割是在低密度下分割的,在完成分割后,從高密度中顯示出來。高密度的屬性值與低密度不同,低密度的屬性值為φ,高密度的屬性值為δ,在高密度對象區域,電力營銷數據的表現式為
(2)
其中,a1表示在高密度下電力營銷數據的對象子區域空間。
(3) 在綜合分析低密度和高密度電力營銷數據的表達式后,對電力營銷數據進行聚類,得到聚類公式為
ni=p(nd+ng)i
(3)
其中,i表示所處理的電力營銷數據,由此實現電力營銷聚類數據篩選值后,在樣本數據中選擇屬性最高的數據,總結成數據集,如果數據集滿足特殊條件執行下一步。
在篩選系統營銷數據后進行多元回歸處理。回歸過程如下:
(1) 根據數據結構構建矩陣,矩陣表示為A:
(4)
矩陣A是t×p形式的相異度矩陣,t泛指矩陣的電力營銷數據對象,p代表該對象所對應的屬性。
(2) 根據度量值和絕對平均值進行標準化處理,進而得到絕對偏差值為
(5)
其中,mf表示絕對平均值,sf表示絕對偏差值,f表示數據對象之間的差異。與其他數值相比,絕對偏差值的魯棒性更好,這樣可以更好地避免異常數據而帶來的降低效果。
(3) 在實現上述標準化處理后,確定不同電力營銷數據類型之間的相似程度,尋找不同對象之間的距離。回歸分析距離公式為
(6)
式中,d(i,j)表示分析的不同電力營銷數據多元回歸分析對象之間的距離:如果d(i,j)的數值是0,則2個對象之間是具有對稱性的;如果d(i,j)的數值不為0,則2個對象之間不具備對稱性,對象具備相異性,計算式為
W=d(i,j)×ki
(7)
其中,ki表示需要進行回歸分析的數據量,W表示多元回歸分析結果。
為驗證基于信息融合的電力營銷數據多元回歸分析系統的可行性和操作效果,設定實驗,選取電力營銷數據分析網站(https:// yq. aliyun. com/zt/437092)得到電力營銷數據回歸分析測試所需實驗,在確定重要參數即權重系數和聚類數目之后,探討本文研究的多元回歸分析系統的分析效果:如果分析結果顯示聚類數目小于聚類樣本的總數量,則表明數據分析是無意義的;若聚類的數量等于1,表示該數據多元回歸很有意義。權值指標是數據多元回歸分析的重要參數,參量過大,分析效果不好,因此,必須保證權值指標一直在合理范圍之內。選擇的電力營銷數據數值如表1所示:
對表1中的電力營銷數據進行多元回歸分析,回歸分析過程如圖6所示。
根據圖6可知,實驗過程如下:
(1) 對電力營銷數據內部的空缺值進行填充,通過填充處理糾正內部數據,防止電力營銷數據存在不一致。
(2) 將所有的電力營銷數據源統一結合到一起,在一個相同的數據倉庫中。
(3) 將數據倉庫中的樣本數據轉換,并統一存放在數據庫中。
(4) 在進行多元回歸分析之前,需要壓縮數據,從而提高數據多元回歸的速度。

表1 電力營銷數據數值

圖6 回歸分析過程
(5) 通過多元回歸消除電力營銷數據內部無關數據。
(6) 在決策樹下將數據轉換。
選擇本文研究的基于信息融合的電力營銷數據多元回歸分析系統和傳統的基于數據融合的電力營銷數據分析系統、基于COMTRADE模型的電力營銷數據分析系統進行對比實驗,得到的回歸分析用時結果如圖7所示。

圖7 回歸分析用時結果
分析圖7可知,不同方法下電力營銷數據分析速度不同。當實驗次數為700次時,基于COMTRADE模型系統的回歸分析用時為1.8 s,基于數據融合系統的回歸分析用時為1.65 s,所設計系統的回歸分析用時為0.8 s。所設計系統的回歸分析用時始終在1.0 s內,分析速度較快。由此可以證明,本文提出的信息融合電力營銷數據的回歸分析能力更強。在此基礎上測試系統的分析精準度,精準度計算式為
(8)
其中,m表示多元回歸分析的電力營銷數據數量,w表示實際的分析數量,w′表示預測的分析數量,Z表示分析結果精準度。得到的實驗結果如圖8所示。

圖8 分析結果精準度
分析圖8可知,不同方法的分析精準度不同。當電力營銷數據量為300 bit時,COMTRADE模型分析系統的精準度為58%,數據融合系統的精準度為35%,所設計系統的精準度為65%。所設計系統始終具有較高分析精度。這是由于本文在研究的過程中不斷提高分析數據的位置跟蹤力度,按照故障數據流動曲線查找相應的位置信息,利用相關程度較高的信息數據轉化不同的數據系統,并整合具體的診斷信息,最終獲取較高的分析結果精準度。
目前研究的電力營銷數據信息多元回歸分析系統分析精準度低,耗時過長,本文利用信息融合技術研究了一種新的電力營銷數據多元回歸分析系統。根據實驗結果可以得出以下結論:
(1) 所設計系統的回歸分析用時短,當實驗次數為700次時,所設計系統的回歸分析用時僅為0.8 s。
(2) 所設計系統的分析精準確較高,當電力營銷數據量為300 bit時,所設計系統的精準度為65%。