夏澤舉 金 耀 王海鴻 常 樂 鮑懷志
(1.國網安徽省電力有限公司,安徽合肥230061;2.國網安徽省電力有限公司營銷服務中心,安徽合肥230088;3.國網信通產業集團北京中電普華信息技術有限公司,北京100085)
隨著科技的不斷進步,當前竊電現象也發生了新的變化,出現了諸多科技含量較高、隱蔽性較好的竊電方式,甚至產生了智能化竊電、職業化竊電的趨勢,這無疑給反竊電工作制造了更多難題。為了提升反竊電工作的成效,電力企業應應用先進的科學技術,改進與優化反竊電手段。
數據挖掘技術是指在海量數據信息中挖掘出未知的、隱含的、對決策有價值或有潛在價值的數據模式、關系與趨勢,并高效利用這些數據信息,構建用于決策支持的模型,提供用于預測性決策支持的工具、方法與過程。數據挖掘技術突破了數據分析技術在處理海量數據方面的局限性,為海量數據的分析處理提供了良好的手段,為從海量數據之中提取有價值的信息提供了強有力的工具。
目前數據挖掘技術中比較常見的運算模式包括人工神經網絡、模糊神經網絡兩種類型。其中,人工神經網絡指的是在認識、理解人腦組織結構、人腦運行機智的前提下,對人腦神經元網絡進行模擬的一種系統,其主要缺點是不能對模糊信息進行描述、有效處理,對樣本有著較高要求。模糊神經網絡結合了神經網路、模糊系統的優勢,不僅精度較高,可以描述及有效處理模糊信息,對樣本沒有太高要求,且具備自適應學習能力,在處理模糊性問題、非線性問題方面有著明顯優勢。模糊神經網絡是以輸入信號為模糊量或有模糊權系數的神經網絡,集模糊信息處理、聯想、識別以及自適應等多重功能于一體,可借助神經網絡,對模糊邏輯推理系統的推理規則、隸屬度函數進行調整,在對神經網絡結構進行構造的過程中采取模糊推理規則。經過神經系統的學習,模糊規則可采取“權值”的方式體現,從而將規則的生成、修改轉變成權值的確定、修改,在模糊問題處理中(如竊電評價等)有著顯著優勢。
現階段的反竊電工作中,主要是通過應用用戶信息采集系統開展反竊電管理。用電信息采集系統可將某一用戶的用電負荷、某一臺區或者是某一線路的實時線損情況展示出來,但無法深層次挖掘這些信息,也無法高效利用這些信息,仍需要相關工作人員憑借經驗,對異常臺區、異常線路進行判斷,并結合現場排查方法,對竊電用戶進行定位。隨著科學技術的發展,近年來高技術含量的竊電手段不斷涌現,如高頻干擾、強磁干擾等,這些新竊電手段具有遠程化、機動化以及隱蔽化的特點,難以在現場排查時準確識別出竊電用戶。同時,傳統反竊電管理方法過于依賴經驗,存在較大的隨意性和偏低的準確度,需要投入大量人力、物力。
近年來,關于數據挖掘技術在電力行業中的研究與應用實踐不斷增多,但大多集中于電網規劃、負荷預測等方面,其在反竊電工作中的應用研究與實踐較少。基于此,本研究在明確數據挖掘技術優勢及傳統反竊電工作方法不足的基礎上,提出了依托數據挖掘技術,構建反竊電管理系統的思路,旨在及時、準確地發現竊電行為,提高反竊電工作水平。
以數據挖掘技術為基礎的反竊電管理系統,在對各業務系統中的數據進行處理時所使用的工具為ETL,即數據倉庫技術,其可以將數據從來源端抽取、轉換、清洗、加載至目的端。第一,在數據抽取環節,主要是在數據接口讀取各業務系統中的各類數據,并在臨時中間庫中將數據存儲起來,備用。數據可能是異構、分散、無序的。第二,在數據轉換環節,主要是按預先設計的規則,將格式不同的各種數據轉換為格式統一的數據。如,時間數據的形式可能是“2018年5月1日”,也可能是“2018-05-01”;電量數據的形式可能是“度”“千瓦時”,也可能是“kWh”。對這些形式不同的數據,采用一致性檢查以及相應的約束條件進行轉化,確保數據格式的統一性。第三,在數據清洗環節,根據切比雪夫原理,設計一個判別區間,對數據的“噪聲”進行評估,“噪聲”值超出范圍的時候將其清除,填補清除區間的值時采用歷史平均數據。第四,在數據加載環節,將所有處理完的數據導入數據庫,為數據挖掘模型的構建提供支持。引入基于工作流的ETL模型體系結構,來進行數據加載。
反竊電模型的作用是對多種來源的模糊、隨機、有噪聲、不完整的海量數據信息進行提取,挖掘、呈現數據間的內在規律,將數據轉換成知識。反竊電模型主要包括以下幾種:
(1)實時線損計算分析模型。該模型可以根據臺區、線路歸屬,將對應電表的實時電量提取出來,對臺區、線路的實際線損(ΔP%)進行統計,并將周期線損曲線繪制出來。而臺區、線路的理論線損,是以典型負荷日為根據,如最小或最大負荷日的負荷情況,并考慮一般負荷日的負荷情況、線路參數、變壓器等因素,來對典型復合日的理論線損值進行計算,包括最小線損值(ΔP%min)、最大線損值(ΔP%max)、平均線損值(ΔP%av)。然后對比分析理論線損值、實際線損值的差異,若比值不在定義范圍之內,則該臺區、線路存在異常。針對某一臺區或某一線路,可采取遞歸分析法,對其歷史線損平均水平進行挖掘,并將其當作線損標準值(ΔP%b),然后對線損偏移度(RΔP%)進行計算,計算公式為若計算得出線損偏移度>1,則可判定該臺區、線路存在異常用戶。
(2)用戶用電異常對比分析模型。竊電用戶的電量屬性,必然與其歷史特征值,即歷史同期用電情況存在明顯差異。定義實際電量(Ws)與歷史特征值(Wb)之間的比值為電量差異度(Rw)。電量差異度較大的用戶,便是竊電嫌疑用戶。與此同時,針對三相用戶,可應用三相電壓不平衡度(Ru)、三相電流不平衡度(Ri)來對電壓、電流異常變化情況進行表征。Ru=對應Rw、Ru、Ri,可定義標準Rwb、Rub、Rib,與定義標準進行比較,明確異常用戶的特征屬性。
(3)用戶負荷曲線實時顯示模型。隨著智能電表在我國的推廣與普及,用電信息采集系統的數據采集任務可以“分鐘”實現,可在此基礎上對用戶負荷曲線進行繪制,并與在歷史數據基礎上繪制的標準負荷曲線進行比較,從而直觀判斷用戶的用電情況是否處于合理區間,并以此判定竊電嫌疑用戶。
上述3個模型,還應結合大量其他數據作為分析技術,以已有歷史數據為根據,對有關用電量、線損、三相電壓、三相電流的數據進行統計,并加載至模型中,為相關分析提供良好基礎。
構建反竊電模型之后,可借助數據挖掘技術的數據聚類、數據分類功能,來篩選用戶的用電行為。
針對大量復雜數據,可采取聚類方法,根據數據特性,實現數據的自動聚類,并對用戶的電量差異度(Rw)、三相電壓不平衡度(Ru)、三相電流不平衡度(Ri)進行計算,明確用戶正常、非正常用電的特征屬性。在此基礎上,還可采取分類方法,將用戶正常、非正常用電的特征屬性轉化為欠流法竊電、欠壓法竊電、其他方法竊電等明確的竊電類型。
反竊電模型流程如圖1所示。SOM為自組織特征映射網絡,用電負荷集{X1,X2,…,Xn},其中X1為來源于各業務系統針對某一臺區、某一線路、某一用戶的有關聯的數據。聚類:第一次聚類以臺區或線路為單位,開展線損判斷,區分正常、非正常線損的臺區或線路;第二次聚類以用戶為單位,從電量、電流、電壓等角度開展用電信息分析,區分正常、非正常用戶的用電特征。分類:以聚類結果為根據,設定分類規則,明確竊電類型,鎖定竊電行為。
綜上所述,本文在深入分析數據挖掘技術優勢及傳統反竊電工作存在的不足的基礎上,借助數據挖掘技術,構建反竊電管理系統。
該系統可以在提取各業務系統海量信息的基礎上,計算線損偏移度、電量差異度、三相電壓不平衡度、三相電流不平衡度等,并與標準數據進行對比,以判斷竊電范圍、鎖定竊電目標。
反竊電管理系統的構建有利于提高反竊電工作效率與質量,從而維護電力企業的經濟效益。

圖1 反竊電模型流程