文小琿,孫煦,張敏,邵美陽,劉志勇
(1.陜西省地方電力(集團)有限公司,陜西 西安 710054;2.威勝信息技術股份有限公司,湖南長沙 410221;3.國網西安供電公司,陜西西安 710054)
電表能夠將電力公司和用戶聯系起來,用戶電力使用量能夠通過電表記錄下來,然后電力公司根據電表數據向用戶收取電費[1],而電力計量的準確性是保證電費工作順利開展的前提。然而,在利益的驅動下,部分人采用不正當手段來竊取電能,這種行為嚴重損害了電力公司的利益。為此,反竊電一直是電力公司急需解決的難題。
針對上述問題,很多專家和學者提出了自己的意見和建議。例如,文獻[2]針對配電臺區的竊電行為進行研究,提出了一種反竊電預警方法,采集用戶的電表數據,并對其進行插值處理。利用竊電分析算法分析電力數據,將數據與時間進行關聯分析,對是否存在竊電行為進行判斷。結合判斷結果以及關聯分析方法提取嫌疑用戶特征,以此實現竊電定位、竊電量估計以及反竊電預警。文獻[3]以愛爾蘭智能電表數據集為基礎,利用AdaBoost 算法構建分類器,通過分類器來識別數據中是否存在異常,以達到竊電監測的目的。文獻[4]根據各種復雜的竊電行為構建不同的竊電模型,并結合MIC 與CFSFDP 搭建一種竊電檢測模型,從而定位竊電用戶,實現竊電行為判斷[4]。
根據前人研究經驗,該文設計了一種基于數據驅動模型的反竊電行為精準取證系統。
反竊電行為精準取證系統邏輯架構分為三層[5],具體如圖1 所示。

圖1 系統邏輯架構
頂層是主站層。該層主要負責從采集的數據、圖像中獲取竊電行為發生的證據,并將其整理與存儲到數據庫當中,以便為后續有效追責提供參考[6]。
中間是通信層。該層主要負責下層和頂層之間的通信傳輸。
底層是采集層。該層主要負責采集現場圖像以及電表數據,為竊電取證提供基礎數據。
反竊電稽查儀是數據采集最重要的硬件,主要放置在集中器的表箱內,通過USB 接口與集中器連接,獲取電能表中的各種數據[7]。文中使用的反竊電稽查儀型號為252-100A,具有數據采集記錄功能、數據挖掘功能、無線通信功能。
紅外攝像頭與反竊電稽查儀類似,同樣布置在現場,主要是對出現在電表箱周圍的可疑人員進行監控,拍攝視頻圖像,并將其作為現場證據,結合用電信息,完成竊電行為取證[8]。之所以選擇紅外攝像頭作為監控設備,是因為紅外攝像頭不受昏暗環境的影響,能夠清晰地拍攝下視頻圖像。文中使用的紅外攝像頭型號為L100S4。該設備采用200 萬變焦鏡頭,支持高清畫面輸出。
文中的集中器[9]與反竊電稽查儀、紅外攝像頭相連,采集到的用電數據和圖像保存在集中器中,集中器再定時把這些數據傳給主站。文中使用的集中器型號為ES4100,其接線圖如圖2 所示。

圖2 集中器接線圖
集中器的優勢如下:
1)內置的無線通信模塊,通過RS-485 實現信息的實時傳送,保證遠距離、跨地區的通信;
2)能耗低,電池容量大,滿電的情況下能維持至少一個星期不間斷工作;
3)存儲容量大,最大達到256 GB,可滿足大容量的數據存儲需求。
為實現稽查人員隨時取證,將可移動的工業電腦作為數據處理終端,判斷是否存在竊電行為[10]。文中使用的工業電腦TQ10S200 尺寸為19 英寸,質量為4.48 kg,便于攜帶,其具體參數如表1所示。

表1 工業電腦TQ10S200具體參數
數據驅動是指在采集大量數據的基礎上,對數據進行整合和提煉,以此為依據進行決策和行動,具有包括數據采集、數據處理、數據分析、數據反饋四個步驟[11]。根據數據驅動模型設計系統運行程序,具體包括數據采集處理模塊和數據分析取證模塊。
數據采集處理模塊主要是控制反竊電稽查儀和紅外攝像頭采集基礎數據,并對采集到的數據進行預處理,具體過程如下:
步驟1:采集設備接入系統;
步驟2:采集參數設置;
步驟3:反竊電稽查儀采集用電相關數據,紅外攝像頭啟動并錄制現場視頻圖像;
步驟4:判斷是否結束,若結束,則數據存入集中器;否則就繼續采集;
步驟5:載波傳輸。
步驟6:用電相關數據缺失填補、降維、標準化;
步驟7:圖像灰度化、去噪、增強處理[12]。
數據分析取證模塊是系統最重要的部分之一,在模塊選擇不同的數據驅動算法設計四個子程序。下面進行具體分析。
1)數據驅動程序1:反竊電異常數據取證。
步驟1:輸入用電相關數據,組成樣本集;
步驟2:提取數據特征;
步驟3:設置基學習器類型;
步驟4:構建弱分類器f(x),如下:
式中,An代表分類誤差率;Bn(x) 代表基學習器;n代表迭代次數。
步驟5:構建分類器線性組合,結果如下:
步驟6:利用式(2)挖掘反竊電數據,確定是否存在竊電行為,將其作為竊電證據。
2)數據驅動程序2:嫌疑用戶定位取證。
步驟1:輸入預處理好的用戶用電相關數據;
步驟2:計算用電特征相關參量;
步驟3:計算用戶竊電嫌疑系數,計算公式如下:
式中,wi代表權值系數;xi代表用戶的第i個特征量;m代表特征量數量,這里取值4。
步驟4:對用戶竊電嫌疑系數進行排序處理,將排序靠前的用戶作為嫌疑用戶,以此確定取證目標[13]。
3)數據驅動程序3:竊電時間取證。
步驟1:輸入預處理好的用戶用電相關數據;
步驟2:提取用電特征相關參量,包括電流不平衡率、電壓不平衡率、功率因數以及線損;
步驟3:構造分離窗,得到時刻t對應時間窗的數據矩陣;
步驟4:計算特征值圓環,并計算和記錄當前圓環點密度。
步驟5:繪制圓環點密度隨時間的變化趨勢圖。
步驟6:根據曲線突變區間的起始時間點定位竊電時間區段[14]。
4)數據驅動程序4:視頻取證。
步驟1:導入預處理后的視頻圖像;
步驟2:根據竊電時間區段,調取該時間段內的視頻圖像;
步驟3:對該時間段內出現在視頻中的人臉進行排查,并提取人臉特征;
步驟4:根據人臉特征,借助置信網絡算法識別用戶身份;
步驟5:當用戶在嫌疑用戶范圍內,確定該用戶為竊電用戶,將異常數據以及視頻作為最為直接的證據,完成精準取證[15-16]。
取證完畢,對證據進行整理,對目標人物進行目標性和針對性的追責,完成整個取證系統流程。
系統測試樣本分為兩類,一類是用電相關數據,另一類是視頻圖像。前者選自愛爾蘭能源監管委員會的智能電表項目中采集到的數據集,后者選自中國CAS-PEAL人臉數據庫。測試樣本分布如表2所示。

表2 系統測試樣本
根據表2給出的數據,系統測試流程如圖3所示。

圖3 系統測試流程
以F1 指數作為系統功能測試的評價指標,其計算公式如下:
其中,
式中,TP 代表真陽性;FP 代表假陽性;FN 代表假陰性。F1 指數取值0~10,越靠近10,表示系統的檢測與識別結果越準確。
利用所設計系統對所有樣本進行取證,得出取證結果,最后根據這些結果統計其F1 指數,結果如圖4 所示。

圖4 系統取證功能測試結果
從圖4 中可以看出,利用所設計系統對竊電用戶進行檢測與識別后,所得出的F1 值均大于9,比較接近10,說明系統做到了精準取證。
該文設計了一種基于數據驅動模型的反竊電行為精準取證系統。通過采集用戶的用電數據以及監控視頻來確定竊電嫌疑人,從而進行目標性的取證,以節省取證時間,提高取證效率。最終通過系統測試,證明了系統在取證方面的檢測與識別性能均較優。然而,該次測試為仿真測試,缺乏實際應用的檢驗,因此有待進一步完善。