999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于計算智能的竊電檢測模型研究

2023-08-02 02:43:36林華城葉泳泰陳錦迅賴佛強陸建巧
自動化儀表 2023年7期
關鍵詞:分類特征用戶

林華城,葉泳泰,陳錦迅,賴佛強,陸建巧

(廣東電網有限責任公司惠州供電局,廣東 惠州 516000)

0 引言

隨著網絡、大數據、物聯網、通信技術[1-2]的不斷發展,電力系統每時每刻都在不停地接收新信息。同時,電力公司可通過高級量測體系(advanced metering infrastructure,AMI)[3]監控細粒度時間間隔內的電力消耗,從而更有效地監控電力系統中的異常情況。

一般情況下,電力系統中存在2種類型的損耗[4],分別是技術損耗和非技術損耗。技術損耗由線路、變壓器和其他設備中的電阻元件加熱引起。非技術損耗主要由竊電、電表故障或計費錯誤引起。為此,可通過采集到的大數據分析用戶的用電行為,建立異常用電行為檢測模型。這樣不僅可以減少竊電行為,還可為電能表故障檢測提供新的解決思路。

目前,AMI計量數據在竊電檢測中的應用方案主要有兩種,分別是基于數據統計[5-6]的方法和基于機器學習[7-8]的方法。基于數據統計的方法實施相對簡單,但只能判斷低壓站發生了竊電,無法準確定位非法用戶。如果要確定可疑用戶,則需要手動逐個檢查區域內的所有用戶。這樣做效率較低,且對檢測過程中檢測人員的素質提出了更高要求。文獻[9]提出了1種基于差分進化支持向量機(support vector machine,SVM)的識別方法。文獻[10]提出了1種基于貝葉斯優化和改進XGBoost模型的竊電檢測方法。然而,機器學習方法也存在一定缺陷,如訓練超參數確定困難、算法易陷入局部最優等。隨著深度學習技術的發展,部分學者將深度學習方法引入竊電檢測,從而獲得更高的準確度。然而,深度學習方法訓練復雜,且非常依賴樣本數據。同時,如果無法有效處理AMI不平衡樣本集問題,將會嚴重影響訓練效果。

為改善上述問題,本文提出了1種將無監督學習和有監督學習相結合的竊電檢測模型。本文首先基于Wasserstein距離、相似性約束和真實約束,訓練生成對抗網絡(generative adversarial network,GAN),以生成符合竊電特征的高精度測量數據;然后,為了提高相似性度量的有效性,在相似性度量過程中綜合考慮了數值特征和形態特征,并采用動態時間扭曲(dynamic time warping,DTW)來度量形態特征的相似性;最后,使用SVM-K近鄰(K-nearest neighbor,KNN)進行竊電檢測。

1 基于計算智能的竊電檢測模型

基于計算智能的竊電檢測模型結構如圖1所示。

圖1 基于計算智能的竊電檢測模型結構圖

典型的低壓配電網由多個相互連接的單元組成。電力通過高壓線從發電廠輸送到變電站,并從變電站輸送到工業、商業和住宅區。在此過程中,通過AMI可測量、收集、存儲、分析和使用客戶數據。收集的數據包括各種大、中、小型典型變壓器用戶以及380 V、220 V低壓居民用戶的數據。收集的信息包括數據項,如電能數據、事件記錄和其他數據。通過對收集的數據及信息進行分析,可以獲取用戶的電力消費信息和消費行為信息。在低壓變電站中,能量損失是基于能量平衡失配產生的。假設所有電表讀數正常,而低壓站被視為1個節點,則根據基爾霍夫定律,子電表讀數與網損之和等于總電表讀數。因此,當網損過大時,可認為竊電的可能性非常高。

基于計算智能的竊電檢測模型執行過程包含3個關鍵過程。

①確定可疑站點。竊電檢測模型基于改進的模糊C均值(improved fuzzy C-means,IFCM)聚類算法對用戶的歷史數據進行聚類,從而獲取用戶的用電特性曲線。

②基于相似性約束和真實性約束,使用GAN生成符合竊電特征的高精度測量數據。

③竊電用戶定位。綜合考慮待測曲線的數字特征、形態特征以及特征曲線,將平衡數據集代入改進的SVM-KNN模型進行訓練,從而準確識別非法竊電用戶。

2 可疑站點檢測和客戶特征分析

2.1 站點檢測方法

本文假定AMI系統獲得的竊電數據涉及時間n內的m個用戶,其數據形式可由矩陣描述。同時,本文令同一用戶在不同時期的數據為xj。不同用戶在時間n的數據向量X可描述如下。

(1)

式中:xnm為第n個用戶在第m個測量期間由智能儀表測量的值。

為消除數據多尺度影響,本文基于最大-最小歸一化函數對數據進行處理,并將數據映射為[0,1]。歸一化函數如式(2)所示。

(2)

式中:x為實際測量數據;xmax為樣本數據的最大值;xmin為樣本數據的最小值;x*為歸一化后的用電量數據。

2.2 特征選取

用戶的用電行為多種多樣。對于不同的用戶,通常選擇不同的特征集來分析用戶的用電行為具有不同的分析結果。然而,特征空間中包含的冗余信息導致分析結果效果不佳。因此,有必要去除重疊和冗余信息,從而提高分析性能。

本文選取的基本用戶用電行為特征包括統計特征、時間序列特征和關系特征。其中:統計特征包括日用電量數據、年用電量數據、季節用電量數據、日最大和最小負荷、平均負荷率等;時間序列特征包括高峰小時耗電率、谷功率系數等;關系特征包括房屋面積和家庭成員人數等。為去除冗余特征,本文提出了IFCM特征選擇算法。該算法具體過程如下。

①選擇特征數為1,確定特征個數為1時的最高聚類評價標準。

②選擇特征數為2,根據所選特征選擇新特征,確定具有最高聚類評估標準的特征。

③選擇特征數為i,根據所選特征選擇(i+1)個特征。其中,(i+1)特征為具有最高的聚類評價標準的特征。

④重復上述步驟,直到選擇(n+1)個特征,且具有最高聚類評估標準的特征為所選特征。

3 基于GAN的數據增強

本文使用GAN[11]生成竊電數據。由于測量數據是一維時間序列,因此本文設計了基于一維卷積層的GAN結構。同時,本文基于Wasserstein距離、相似性約束和真實約束,生成符合竊電特征的高精度測量數據。所生成的樣本與現有樣本相結合,可以獲得大量樣本。基于GAN的數據增強結構總體框架如圖2所示。

模型首先選擇現有的少量竊電數據作為訓練集。本文令竊電數據為pd(X),數據中存在的1組隨機變量z滿足高斯分布pz(z)。GAN可從已知分布中采樣,生成滿足原始數據分布的新數據。訓練過程中,生成器G負責學習樣本分布的規律并生成新樣本。G由神經網絡組成。其輸入為先驗分布pz(對應z),輸出為G(z)。需注意,生成數據的目標是生成盡可能真實的數據,即生成數據的分布規律pg(z)與樣本數據pd(X)擬合。如生成器損失函數為Ez~pz{-D[G(z)]},則目標函數fD定義如下。

fD=minEz~pz{-D[G(z)]}

(3)

式中:D為鑒別器,負責確定輸入數據是否真實。

D是1個神經網絡,但其輸入是實際數據或生成器生成的數據。鑒別器的主要任務是區分2種數據,因此其輸出是1個介于0和1之間的標量,即屬于實際數據或生成數據的概率。D的損失函數可以定義為Ex~pd[-D(x)]+Ez~pz{-D[G(z)]}。D的目標函數fE定義為:

fE=maxEx-pd[-D(x)]+Ez~pz{-D[G(z)]}

(4)

因此,整個對抗過程的目標函數定義為:

Ez~pz{log{1-D[G(z)]}}

(5)

本文選取最小Wasserstein距離為目標訓練GAN,從而有效提高GAN訓練的穩定性。Wasserstein距離定義如下。

(6)

式中:∏(pd,pg)為聯合分布γ的集合,pd和pg分別為鑒別器和生成器中數據的邊際分布;W(pd,pg)為γ(x,y)期望的下確界,即pg到pd的擬合需要x到y的距離。

由于很難直接計算任意分布之間的Wasserstein距離,因此本文采用對偶形式:

(7)

經過訓練后,生成器可以生成大量樣本,且滿足分布要求。為了確保生成的測量數據的真實性,必須同時滿足真實性和相似性約束。真實性約束用于確保生成的數據能夠接近真實情況。真實性損失Lr為:

Lr=W[G(z;θ(G));θ(D)]

(8)

式中:G(z;θ)為生成器的生成數據;W(~;θ(D))為生成數據與實際樣本之間的Wasserstein距離。

同理,生成的數據應盡可能與實際數據相似。

因此,相似性損失Ls為:

(9)

(10)

(11)

4 竊電用戶定位

本文提出的竊電用戶定位包括2個關鍵環節,分別為基于相似性度量確定可疑用戶,以及基于改進SVM初步檢測可疑用戶并輸出非法用戶。竊電用戶定位執行流程如圖3所示。

圖3 竊電用戶定位執行流程圖

圖3中,D1和D2為設置的閾值,且D1D2時,用戶大概率為可疑用戶,應手動驗證。當DW

4.1 相似性度量

時間序列的相似性包括值和形態2個方面。為了獲得特征曲線的值和形態,本文分別使用歐幾里德距離、DTW度量值和形態特征相似性。為了簡單而準確地描述曲線的形態特征,例如不同時期的上升、下降和穩定性,本文使用直線斜率表示該時期的形態特征。因此,長度為n的時間序列可縮減為形態序列(n-1)。

本文令2個獨立的時間序列分別為X=(x1,x2,…,xn-1)和Y=(y1,y2,…,ym-1)。因此,X和Y的值相似性可由距離矩陣度量。其中,矩陣中的每個元素由歐幾里德距離表示。

(12)

式中:i=1,2,…,n;j=1,2,…,m。

同理,X和Y的形態相似性可由DTW度量。然而,DTW不是隨機選擇,其需要滿足邊界條件、連續性和單調性約束。在滿足這3個約束后,可得到許多路徑。本文需要選擇1條使最終獲得的總距離最小化的路徑。為此,本文基于動態規劃方法構造累積距離γ。累積距離γ(i,j)表示當前網格點的距離D(i,j)與可到達該點的最小相鄰元素的累積距離之和。

γ(i,j)=D(q,c)+min[γ(i-1,j-1)

γ(i-1,j)γ(i,j-1)]

(13)

4.2 改進的SVM-KNN模型

SVM-KNN模型執行流程如圖4所示。

圖4 SVM-KNN模型執行流程圖

SVM是1種典型的有監督學習方法,主要用于分析給定數據并識別輸入值相對于輸出的模式或趨勢。傳統SVM為1個層次化的分類模型,其最大的問題是錯誤積累。這影響了分類的準確性。如果使用有偏二叉樹進行分類,則需要構造一個誤差積累小、分類精度高的決策樹。為了減少誤差累積的影響,本文采用投影向量方法來度量類間的分離度,并在此基礎上構造了1個有偏二項決策樹。同時,由于數據遠離超平面,SVM能夠準確地進行分類。但當距離接近超平面時,分類效果較低,在超平面附近容易發生誤分類。為提高竊電用戶分類精度,本文提出了1種改進的SVM-KNN模型。SVM-KNN模型利用界面附近樣本提供的信息來提高分類精度。

對識別樣本進行分類時,需計算樣本與分類超平面之間的距離。如果距離大于給定的閾值,則直接應用SVM分類;否則,應用KNN分類。在KNN分類中,每一類的支持向量用來計算識別樣本與每個SVM之間的距離。

5 仿真與分析

5.1 數據集

仿真試驗數據使用某電力公司提供的2019年至2020年約5 000個家庭用戶和企業用戶的半小時用電報告。數據經用戶同意,主要從用戶家或辦公室中安裝的智能電表中獲取。每個用戶數據,至少都有1個包含350天的半小時用電報告信息。為了不失一般性,本文假設所有樣本都屬于誠實用戶。根據竊電的實際情況,本文建立了6種類別的竊電情況。第一類竊電是所有樣本乘以相同的隨機選擇系數。第二類竊電是1種典型的“開-關”攻擊,即在某些時間間隔內,耗電量報告為零。第三類竊電是將耗電量乘以隨時間變化的隨機系數。第四類竊電是第二類和第三類的結合。第五類竊電是在高峰時段乘以相同的隨機選擇系數。第六類竊電是1種隨機周期的“開-關”攻擊,但持續時間短且不連續,因此減少了總用電量。與第二類竊電相比,由于時間段的隨機性,第六類竊電檢測顯得更加困難。

5.2 站點檢測性能對比分析

5.2.1 特征選取

本節對用戶用電行為的常用特征選取策略進行對比。表1所示為特征數量和準確率變化統計結果。由表1可知:隨著特征數量的增加,聚類的準確率增加;當特征數量超過4時,聚類的準確率降低。因此,研究最終確定代表電力消費行為的特征數量為4。特征指標為負荷率、谷系數、高峰小時用電率和正常時段的用電量百分比。

表1 特征數量和準確率變化統計結果

5.2.2 站點檢測

圖5所示為IFCM和傳統模糊C均值(fuzzy C-means,FCM)聚類目標函數對比結果。

圖5 IFCM和傳統FCM聚類目標函數對比結果

由圖5可知,IFCM迭代次數較少,且每個點到聚類中心的代數和較少。因此與FCM相比,IFCM可以有效提高算法的分類效果和迭代時間。

5.3 數據生成對比分析

考慮到正常用戶和非正常用戶之間數據的不平衡,本節基于一維卷積層的GAN生成竊電數據。為了驗證所提SVM-KNN模型的性能,本節比較了合成少數類過采樣技術(synthetic minonity over-sampling technique,SMOTE)和分界線-SMOTE(borderline-SMOTE,B-SMOTE)數據增強算法的分類性能。不同數據增強算法分類性能對比結果如表2所示。

由表2可知,無論有無噪聲,SVM-KNN生成的樣本都能有效提高分類器的分類精度。

5.4 竊電檢測性能對比分析

本節將SVM-KNN與傳統SVM、決策樹-SVM(decision tree-SVM,DT-SVM)、KNN、卷積神經網絡(convolutional neural network,CNN)等模型在不同噪聲數據中進行綜合對比。表3所示為不同方法綜合性能對比結果。對比指標包括識別準確率、召回率和F分數。

表3 不同方法綜合性能對比結果

由表3可知,各模型在無噪聲數據集中的指標均優于有噪聲數據集;隨著數據集中的噪聲數據增加,各指標均有不同程度下降。綜合對比后可知,所提模型具有較高的魯棒性,在驗證干擾數據集中表現較為優異。對比結果進一步驗證了所提模型對電力行業竊電行為檢測具有較高的準確性和穩定的識別率。

6 結論

本文對電力行業竊電檢測進行了研究與分析,建立了1種基于計算智能的竊電檢測模型。首先,本文基于IFCM對用戶的歷史數據進行聚類,從而獲取用戶的用電特性曲線。其次,本文基于相似性約束和真實性約束,使用GAN生成符合竊電特征的高精度測量數據。最后,本文綜合考慮待測曲線的數字特征、形態特征以及特征曲線,將平衡數據集代入改進的SVM-KNN模型進行訓練,從而準確識別非法竊電用戶。該模型為電力部門分析用戶用電行為以及竊電檢測提供了借鑒。

猜你喜歡
分類特征用戶
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 国产在线视频二区| 91欧洲国产日韩在线人成| 永久免费无码日韩视频| 日本不卡在线播放| 黄色片中文字幕| 香蕉eeww99国产精选播放| 日韩毛片在线视频| 美女视频黄又黄又免费高清| 欧美日韩福利| 少妇人妻无码首页| 无码AV日韩一二三区| 美女视频黄频a免费高清不卡| 99一级毛片| 国产精品蜜臀| 一级爆乳无码av| 国产办公室秘书无码精品| 亚洲国产精品国自产拍A| 国产精品网拍在线| 国产成人欧美| a免费毛片在线播放| 国产黄色免费看| 亚洲精品无码久久毛片波多野吉| 欧美激情第一区| 久久国产香蕉| 精品国产aⅴ一区二区三区| 欧美成人精品在线| 亚洲天堂高清| 久久精品国产电影| 国产真实乱了在线播放| 亚洲成av人无码综合在线观看| 国产成人精品视频一区二区电影| 成人自拍视频在线观看| 亚洲国产综合自在线另类| 天天色天天操综合网| 亚洲精品成人片在线播放| 亚洲综合色婷婷| 久久黄色影院| 天堂av综合网| 久久福利网| 亚洲伊人天堂| 综合色天天| 久久久久免费看成人影片| 国产亚洲精品无码专| 国产精品亚洲一区二区三区在线观看| 亚洲香蕉伊综合在人在线| a毛片免费在线观看| 亚洲国产系列| 亚洲欧美日韩成人高清在线一区| 新SSS无码手机在线观看| 日韩激情成人| 久久成人免费| 色综合日本| 欧美午夜视频在线| 亚洲最新网址| 亚洲AV无码一区二区三区牲色| 乱人伦99久久| 国产精品永久不卡免费视频| 欧美性色综合网| 亚洲精品爱草草视频在线| 2021无码专区人妻系列日韩| 日韩福利在线观看| 国产黑人在线| 日本一区高清| 日本道综合一本久久久88| 免费A∨中文乱码专区| 九九热视频精品在线| 蜜桃视频一区二区三区| 成人av专区精品无码国产| A级全黄试看30分钟小视频| 99视频精品全国免费品| 91高清在线视频| 日韩精品亚洲精品第一页| 亚洲大尺度在线| 国产精品xxx| 日韩精品亚洲精品第一页| 亚洲精品国产成人7777| 亚洲欧美人成电影在线观看| 精品国产电影久久九九| 亚洲精品国产成人7777| 国产网站免费观看| 蜜芽国产尤物av尤物在线看| 欧美三级日韩三级|