程慧 王鏡芳 胡程平 吳方舟 劉愛禹 錢啟宇



關鍵詞:線路損耗;數據挖掘;層次分析;加權LOF算法;異常值檢測
低壓臺區作為配電網的末端,通常是指以380V或220V低壓變壓器供電的區域,其可為廣大居民用戶和小微企業用戶供電。低壓臺區變壓器端采集的電力數據量龐大、用電信息維度高導致分析困難,并且原始數據很難為電力用戶用電研究提供數據依據。線路損耗會影響到配電網的輸出效果,進而對變壓器性能造成直接影響。線路損耗按結構可分為統計線損、技術線損和管理線損。它不僅是指以熱能形式存在的能量損耗,而且還是指竊電行為引起的管理線路損耗。
針對低壓臺區內竊電行為引起的線損研究,文獻提出了一種基于局部離群點檢測的低壓臺區用戶竊電識別方法。搭建了一套包含低壓臺區電網異常分析、用戶竊電預警以及采集缺陷判斷等數據診斷功能的云平臺。利用卷積神經網絡Le Net5模型對日用電量數據進行建模分析,為精確捕獲竊電奠定了基礎。電力系統線損計算和系統的精準管理,對降低節能降耗、促進線損管理具有重要的指導意義。
為了降低低壓臺區內線損問題,結合數據挖掘中的離群點分析方法,對異常用電行為進行了研究。此外,針對傳統異常功率檢測方法的局限性,提出了一種基于層次分析法(AHP)的加權LOF算法的電力線異常功率檢測方法。
1基于數據挖掘的異常電量檢測
數據挖掘作為一種新興的數據處理方法,能夠有效地處理海量且復雜情況的數據分析。因此,為了有效地應對低壓臺區內大規模用戶功耗數據中檢測異常用戶數據的問題,引入了數據挖掘技術,基于數據挖掘的異常用電量檢測模型主要分為三個部分:用戶用電數據采集與處理、異常用電模型的構建、檢測用戶結果分析與驗證。基于數據挖掘的異常用電量檢測模型,如圖1所示。
2基于用電特征分析的異常檢測原理
2.1電能利用特征提取
竊電線損行為引起的異常用電數據信息提取往往不是孤立的,并且一個竊電場景可能引發多個異常現象。如果測試是基于單個指標,則很可能會出現遺漏或誤判。因此,必須從各種異常用電現象中以及在由各種異常用電行為引起的可量化特征量中提取綜合特征來進行有效的防竊電工作。
以單相用戶為例,整合現有文獻對功耗評估指標如下:日平均電壓、日平均功率因數、日平均電流不平衡率、前7天平均日凍結功率、功率不平衡率。
2.2基于離群點檢測的竊電線損判定原理
離群點檢測又稱異常檢測,其目的是發現樣本組中具有不同行為特征的目標。常用的檢測方法主要分為五類:基于分布的檢測、基于深度的檢測、基于距離的檢測、基于密度的檢測和基于偏移量的檢測。
考慮到電力用戶環境,基于密度的檢測算法能夠更好地適應內部結構復雜的電力數據集。因此,選擇了密度檢測算法中最具代表性的LOF算法,并將其應用到異常功率檢測中。為了更好帥理解算法,引入以下概念,
由公式(4)可以看出,數據目標的密度越小,k距離鄰域中目標的密度越大,LOF值越大,則異常程度越大。根據離散點檢測原理,利用LOF算法得到用戶異常度,并且表達用戶竊電導致的線損嫌疑程度,進而根據嫌疑程度完成低壓臺區內異常用戶檢測。
3加權LOF算法及其在竊電線損檢測中的應用
由于低壓臺區內用戶較多,且不同用戶的用電特性差異較大,這使得電力數據集內部呈現出復雜的分布特性。LOF算法能有效地避免數據分布不均勻對檢測結果的影響,并且對密度不平衡的電力數據集具有良好的檢測效果。由于不同的電能指標具有不同的含義,如果用傳統的LOF算法直接得到異常值來表示用戶竊電線損嫌疑程度,當多個電能指標對可疑的竊電線損具有不同的重要性時,導致判斷結果并不合理。如果不同指標數據具有相同程度的異常值,并不意味著兩個用戶具有相同的竊電線損嫌疑。
考慮到選定的電能指標對涉嫌竊電用戶具有不同的重要性,因此,有必要分析可以代表竊電線損可能性的每個電能指標數據異常程度。本文使用層次分析法(AHP)對每個檢測指標分配合理權重,并結合加權LOF算法對用戶的竊電線損嫌疑進行綜合量化,利用得到的綜合異常值來表征用戶對竊電線損的嫌疑程度,提高了對用戶竊電線損的檢測效率。最后,通過實驗驗證了該檢測方法的有效性。
3.1指標權重的確定
傳統的LOF算法無法區分不同指標數據的含義,且傳統的LOF算法得到的異常值只能代表用戶用電特性的異常程度,不能解釋用戶對竊電線損行為的嫌疑程度。因此,有必要對傳統LOF算法的不同維度數據分配相應的權重。電能指標異常程度越大代表竊電線損行為的概率越大,在整個涉嫌竊電線損行為分析中應發揮的作用越大,則權重越大,反之亦然。因此,引入AHP作為權重量化的數學工具。
AHP的基本思想是根據優勢關系分解復雜問題,并形成層次結構。同時,根據一定的比例尺度,通過兩兩比較對判斷過程進行量化,計算相對判斷矩陣,進而確定層次結構要素的相對重要性。具體步驟如下:
(1)構建竊電線損行為評價指標體系:以用戶竊電線損嫌疑程度為評價目標,并使用由竊電線損現象引起的各種可量化的電能特性參數作為評估指標集,從而構建了竊電線損嫌疑評價體系,如圖2所示。
(2)電能參數:根據與涉嫌竊電線損相關的重要程度,形成判斷矩陣P。指標的相對權重使用9/9到9/1的比例進行比較。具體比例尺度,如表1所示。
參照專家經驗,根據電能指標數據異常能夠代表竊電線損的概率所建立指標判斷矩陣P:
綜合分析了用戶異常用電量中各電能參數的特點,得出當前涉嫌竊電線損的重要性高于其他指標的結論。測量電壓、功率因數和功率不平衡率對試驗結果影響很大。然而,由于功率因數不僅取決于電網,還取決于用戶的負載性質,因此,低壓臺區變壓器存在一些正常的波動。功率不平衡率受通信系統中的通信容量和電流采集頻率的限制,所得到的數據不可避免地會隨著實際功耗而呈現較小的波動。因此,功率因數和功率不平衡率對試驗結果影響略低于測量電壓對試驗結果影響。
(3)判斷矩陣P
得到了對應于矩陣最大特征值的特征向量,歸一化特征向量。為異常功耗指標的權重。同時,對判斷矩陣進行一致性檢驗。根據以上步驟,涉嫌竊電線損的評價指標權重如表2所示。
3.2基于加權LOF算法的低壓臺區竊電線損分析
簡要討論距離度量對結果的影響。目前,使用較多的距離度量是歐氏距離,因此是用n個數值屬性描述的兩個目標。目標i和目標J之間的歐氏距離定義為:
在對涉嫌竊電線損的分析中,由于電能指標的含義不同,并且不同指標對涉嫌竊電線損的影響有所不同。因此,在異常檢測中,針對不同的電能指標設置相應的權重。改進的歐氏距離表達式為:
在計算綜合異常值時,利用加權歐氏距離對任意用戶之間的綜合距離進行加權,從而得到能夠表示每個用戶對竊電線損行為涉嫌程度的綜合異常值。異常值越大,竊電線損的可能性越大。基于加權LOF算法的低壓臺區竊電線損檢測系統的總體結構,如圖3所示。
4實驗結果與分析
比較分析了傳統LOF算法和所提的基于AHP的加權LOF算法對低壓臺區竊電線損檢測的效果,所使用的數據集來自浙江省海寧市某低壓臺區的反竊電檢查裝置,該低壓臺區變壓器端采集的數據集覆蓋1143戶家庭。
4.1結果評價標準
采用多種分類器評價工具對算法的檢測效果進行度量,根據真實類別和分類模型兩個準則,將數據集中的記錄以混淆矩陣的形式進行匯總。如下表3所示,表中的每一列表示一個預測類別,每一行表示數據的真實屬性類別。基于混淆矩陣可以得到多個評價標準:
在實際應用中,低壓臺區內的正常用戶和異常用戶在類別分布上存在不平衡。為了更直觀地表達最終的檢測結果,引入了受試者工作特征(R()C)曲線和ROC曲線下與坐標軸圍成的面積(AUC)的概念。其中,ROC曲線描述了混淆矩陣中FPR和TPR增長率之間的相對關系;ROC曲線下的面積AUC表示分類器的性能,AUC越大,性能越好。
4.2算法檢測結果
兩種檢測算法的召回率隨檢測率的變化,如圖4所示。從圖4可以看出,整個低壓臺區竊電線損檢測大致可以分為兩部分:當檢測率較低時,曲線增長較快。當檢測率超過20%時,上升趨勢減慢并最終趨于穩定,即通過20%的檢測率就可以發現約80%的潛在竊電用戶。為了節省成本,異常功耗檢測可以將重點放在用戶具有較大懷疑系數的檢測算法輸出上,從而提高了異常功耗檢測的效率。
兩種檢測算法的ROC曲線,如圖5所示。根據電能參數的含義,綜合量化了不同電能指標對配電網電能分析的重要性。改進的加權LOF算法的檢測結果更合理地解釋了用戶對竊電線損的懷疑,因此改進的加權LOF算法的ROC曲線下的面積AUC明顯高于傳統LOF算法,這說明了竊電用戶的整體檢測效果優于傳統LOF算法。
5結論
通過對低壓臺區電壓器端用電信息采集系統獲取的用戶用電量數據進行深入分析,可以有效揭示數據背后隱藏的用電行為信息,完成對各種異常用電行為的有效檢測。基于數據離群點分析理論,提出了一種基于AHP的加權LOF算法異常值分析方法,該方法綜合了多個電能指標來評價用戶的全面性能。該方法通過監測電壓臺區內用戶竊電線損行為引起的多個可量化電能參數,完成對多種線損檢測。同時,只需要對輸出可疑系數高的用戶進行異常值分析,即可完成對臺區內大部分竊電用戶所導致的線損檢測。