竇健,劉宣,盧繼哲,吳迪,王學偉
(1. 中國電力科學研究院,北京 100085; 2. 北京化工大學 信息科學與技術學院,北京 100029)
電力工業是國民經濟的基礎性產業,保證電網企業及時收回電費是確保電力發展的必要條件。但是由于各種原因,目前竊電現象還普遍存在,部分地區甚至還很猖獗,給供電企業也造成巨大損失[1-2]。據不完全統計,我國每年竊電損失達200億元[3]。
常見的竊電方法可分為與計量裝置有關的竊電和與計量裝置無關的竊電兩大類。其中與計量裝置有關的竊電主要包括欠壓竊電法、欠流竊電法、移相竊電法、擴差竊電法等[4];而與計量裝置無關的竊電包括繞越計量裝置竊電、私自增加用電設備容量竊電等[5]。近年來,大數據技術在各個行業逐漸得到廣泛的應用,大數據是指無法在可容忍的時間內用傳統的IT技術、軟硬件工具和數學分析方法,對其進行感知、獲取、管理、處理和分析的數據集合[6-7]。智能電網被看作是大數據應用的重要技術領域之一,用電信息采集系統是國家電網公司信息化建設的重要基礎,是提升服務能力、延伸電力市場、創新交易平臺的重要依托[8]。目前國家電網公司的用電信息采集已經基本實現“全采集、全覆蓋”,能夠及時、完整、準確掌控廣大電力用戶的用電數據和信息[9]。然而,如何應用用電信息采集系統多年來運行采集與沉淀的大量數據,研究防竊電的策略、分析數據處理方法、構建防竊電模型等,是該領域面臨的具有挑戰性的問題。
根據用電信息采集系統的數據,建立各種數據與各類異常事件與竊電行為之間的關聯關系,據此,建立基于大數據的防竊電結構化模型,進而解決大數據條件下的竊電行為監控問題。
針對形式多種多樣的竊電手法,通過用電信息采集系統采集的數據,實時監測用戶的用電狀態參量。隨著大數據技術的發展,選取電壓、電流、功率、電量等作為竊電判據中的電氣參考量,通過當前數據與歷史數據相結合分析用電行為,發現竊電可疑用戶,實現利用大數據技術進行反竊電。采用大數據技術辨識竊電方法的關鍵是分析不同竊電方法的竊電特征,進而給出監測的相關特征電氣參量。
根據功率測量與電能計量的基本原理,用戶負荷功率、電流、電壓、以及電流和電壓間的相位關系這三個參量相關,用戶負荷消耗電能與負荷運行功率和時間相關,通過用電信息采集系統監測電流、電壓、功率因數、電量、線損等電氣特征參量和各種事件的狀態特征參量,建立該特征參量與用戶用電行為的關聯關系,表1為建立大數據防竊電的結構化模型奠定基礎。

表1 常見竊電方法與主要特征參量
盡管竊電手法多種多樣,然而這些竊電行為都會在竊電用戶用電量統計數據上反映出來,特定時期內用戶用電統計數據與用戶的用電習慣與特征相關聯,通過對海量的用電統計數據分析,提取出對決策者決策有價值的信息,可發現其背后隱藏的客觀規律,進而實現防竊電目的。基于用電信息采集系統大數據的防竊電方法如圖1所示。該方法分為四部分:(1)用電信息采集系統的數據采集;(2)分布式數據存儲;(3)結構化的防竊電模型;(4)竊電嫌疑預測。以下將分別進行分析。

圖1 基于用電信息采集大數據的防竊電方法
用電信息采集系統表示為三層簡化物理結構[10],如圖2所示。頂層系統主站負責整個系統的用電信息采集、數據管理與應用,以及與其他系統的數據交換等功能,是用電信息采集系統的核心計算機網絡系統;第二層是數據采集層,其主體為電能信息采集終端與集中器,主要負責對各采集點電參量信息的采集和監控;第三層是采集點監控設備層,包括智能電能表等,是電參量信息采集源和監控對象。通過用電信息采集系統可以實現對電力用戶的“全采集、全覆蓋”,及時、完整、準確掌控電力用戶的當前數據和歷史數據等用電信息,為分析竊電行為提供穩固的數據基礎。
用電信息采集系統的主站,根據監測用戶的電參量數據和用電異常監測模型,對相同的計量點通過不同方式采集的電參量數據進行比對,或者對同一計量點的實時數據與歷史電參量數據進行比對,依據對比曲線數值差距和趨勢差異,判斷用戶用電是否正常,如果發現異常,啟動異常處理流程,對此用戶其他的參數進行持續監測,并根據竊電嫌疑預測模型,將監測的數據進行綜合分析判斷給出“竊電概率系數”。

圖2 用電信息采集系統三層結構
用電信息采集系統監測的數據按照時間屬性可分為l類數據(實時和當前數據)、2類數據(歷史日數據和歷史月數據)和3類數據(事件數據)[11]。按照數據的物理屬性可分為:(1)電能數據 (總電能量、各費率電能量、最大需量等);(2)交流模擬量(電壓、電流、有功功率、無功功率、功率因數等);(3)工況數據(開關狀態、終端及計量設備工況信息);(4)電能質量越限統計數據(電壓、功率因數、諧波等越限統計數據);(5)事件記錄數據 (終端和電能表的事件記錄數據);(6)其他數據(預付費信息等)。
1類數據主要反映電力用戶當前的實時用電信息;2類數據具有時間序列屬性。此類數據可提供曲線數據,并給出曲線時間周期,1、2類數據是分析竊電現象的基礎數據。3類數據為事件數據,記錄事件的詳細狀態信息。其中電流回路異常、電壓回路異常、相序異常、有功總電能量差動越限事件記錄、電壓越限記錄、電流越限記錄、電能表示度下降、電能量超差等事件詳細信息可為分析竊電提供綜合判斷依據。
目前,用電信息采集系統主機架構采用基于傳統的IOE 架構,采用IBM 系列主機及配套存儲與Oracle關系數據庫。但這種結構越來越不適合于海量數據的存儲,因此為了適應海量采集數據的存儲,可采用關系型數據庫 (Oracle) 和No SQL數據庫 ( HBase)相結合的存儲方式[12],使用Oracle 存儲全部參量關系數據,而采用具有高可靠性、可伸縮性的海量數據分布式存儲系統HBase,保存系統的海量監測數據,經過數據處理后轉存到Oracle。采用HBase技術可搭建起大規模、結構化的存儲集群,同時采用Hadoop的MapReduce技術,可對HBase分布式存儲系統中的海量數據進行高效的計算和分析。通過上述方法解決使用Oracle數據庫進行海量數據分析的性能問題。HDSF(Hadoop Distributed Filesystem)是一個分布式文件系統,以流式數據訪問模式來存儲超大文件,從而實現一次寫入、多次讀寫的最高效訪問模式;并在普通的商用硬件上運行。
基于用電信息采集大數據防竊電的結構化模型如圖3所示,主要包括以下三部分:數據預處理,用電異常檢測模型與竊電嫌疑預測模型。

圖3 大數據防竊電的結構化模型
在用電信息采集系統的數據采集中,數據缺失是一個不可避免與必須面對的問題。尤其是電量和功率等數據的缺失會直接影響用電異常信息的挖掘和竊電嫌疑預測等準確性。因此,對缺失數據的處理變得非常重要。文中把缺失屬性作為因變量,其他屬性作為自變量,利用n次多項式逼近法進行缺失值插補,插補的步驟(以模擬有功功率參量的缺失屬性為例)如下:
第一步,選擇取3階(或5階)擬合方程。設有功功率參量x與屬性量時間t之間的函數擬合方程為:
x(ti)=a0+a1ti+a2ti2+a3ti3+……+a5ti5
(1)

第三步,依據最小二乘法原則,使插補[xn,tn]值的均方差達到最小,求解出系數a0,a1,a2,a3值,即使下述均方差方程:
(2)
對系數a0,a1,a2,a3求導數最小值,建立矩陣:
(3)

第四步,將式(1)函數結構優化,輸入缺失屬性參量值tn,求出有功功率缺失屬性數據[xn,tn];
x(tn)=a3tn3+a2tn2+a1tn+a0=
[(a3tn+a2)tn+a1tn]tn+a0
(4)
用電異常檢測模型如圖4~圖7所示,分別為:線損異常模型;交流電壓異常模型;功率因數異常模型;交流電流異常模型。

圖4 線損異常模型

圖5 交流電壓異常模型
(1)線損異常模型:根據國家電網電能損耗管理規定,城網線損率低于5%,農網線損率低于7%。以此兩個閾值作為判定條件;


圖6 功率因數異常模型
(3)功率因數異常模型:根據《功率因數調整電費辦法》,工業用戶功率因數應大于0.80,為了同時適用于100 kV·A及以上農業用戶,功率因數異常的閾值設定為0.6;
(4)交流電流異常模型:根據電流失流異常、電流不平衡以及線損、電量等約束條件來判定。
線損異常模型適合表1中3~6的竊電情況。交流電壓異常模型適合表1中1、3、4、8的竊電情況;功率因數異常模型適合表1中7的竊電情況;交流電流異常模型適合表1中2~6的竊電情況。

圖7 交流電流異常模型
當某用戶存在竊電行為時,該用戶必然會出現用電異常狀態,而且大多數情況下用電異常狀態具有多面性與持續性,即幾種用電異常狀態同時持續發生。據此特性,通過綜合計算用戶不同類別用電異常狀態出現的次數,設計一種竊電嫌疑預測模型,來判斷該用戶的“竊電嫌疑系數T”。
(14)
式中Ti表示在一天連續監測中,用戶每種類別的用電異常模型中出現異常次數;εi表示每種用電異常模型對應的不同權值。
通過設定Ts1、Ts2、Ts33個竊電系數判別閾值,且Ts1>Ts2>Ts3,將判別輸出結果分為四種竊電嫌疑等級:無竊電,竊電等級A,竊電等級B,竊電等級C,如圖8所示。竊電等級從A~C的嫌疑程度減少,為稽查處理竊電提供依據。

圖8 竊電嫌疑預測模型
通過采用國內某電力公司用電信息采集系統中多個用戶發生竊電行為時的用電數據,驗證了該方法的正確性。
文中分析了常見的竊電方法及其特征,給出了相關特征參量;其次,設計了基于大數據的防竊電結構化模型,其中用電異常檢測模型建立了竊電行為與用電信息采集系統中各種數據和各類異常事件之間的關聯關系,竊電嫌疑預測模型給出了用戶四種竊電嫌疑等級;最后,通過“竊電嫌疑系數”估計,鎖定竊電稽查的對象。為用電信息采集系統大數據防竊電方法提供了技術基礎。