劉安磊,馬 迅,賈旭超,王 勇,趙 檀
(國網(wǎng)河北省電力有限公司營銷服務(wù)中心,河北 石家莊 050000)
竊電是電力公司無法徹底解決的難題,既影響電力公司經(jīng)濟(jì)效益,又?jǐn)_亂用電秩序[1],同時(shí)還會提升電力設(shè)備損耗程度,導(dǎo)致嚴(yán)重的用電事故發(fā)生[2]。電力公司一直在提升竊電打擊力度,完善反竊電技術(shù),但目前反竊電技術(shù)具有一定的局限性,同時(shí)竊電手段的隱蔽性與多樣性逐漸提升,直接加劇了反竊電難度[3-4]。熊霞等研究竊電監(jiān)測方法,利用用電信息采集系統(tǒng)獲取用戶基本負(fù)荷數(shù)據(jù),在負(fù)荷數(shù)據(jù)中獲取疑似竊電異常關(guān)聯(lián)因素,通過改進(jìn)層次分析法,構(gòu)造竊電監(jiān)測模型,按照置信度求解用戶竊電嫌疑值,完成用戶竊電智能監(jiān)測,該方法可精準(zhǔn)確定疑似竊電用戶,且竊電監(jiān)測速度較快,為反竊電工作提供技術(shù)支撐[5]。張宇帆等研究竊電監(jiān)測方法,通過深度卷積生成對抗網(wǎng)絡(luò)獲取負(fù)荷數(shù)據(jù)特征,利用邊緣數(shù)據(jù)中心訓(xùn)練支持向量機(jī),在完成訓(xùn)練的支持向量機(jī)內(nèi)輸入負(fù)荷數(shù)據(jù)特征,輸出竊電監(jiān)測結(jié)果,該方法可有效監(jiān)測竊電情況,計(jì)算復(fù)雜度較低[6]。用戶異常用電數(shù)據(jù)包含各種情況下的異常數(shù)據(jù),涵蓋范圍較廣,以上2種方法僅考慮負(fù)荷數(shù)據(jù),考慮的因素不夠全面,影響反竊電在線監(jiān)測效果。為此,研究基于用電異常數(shù)據(jù)的反竊電在線監(jiān)測方法,利用K-means聚類算法在一定周期內(nèi)用電數(shù)據(jù)中,確定用電異常數(shù)據(jù),根據(jù)用電異常數(shù)據(jù)構(gòu)建疑似竊電數(shù)據(jù)特征數(shù)據(jù)庫,確定異常用電數(shù)據(jù)特征,通過主成分分析法降低建立用電異常數(shù)據(jù)特征維度,依據(jù)模糊神經(jīng)網(wǎng)絡(luò)建立在線反竊電模型,實(shí)現(xiàn)反竊電在線監(jiān)測。
利用K-means聚類算法在一定周期內(nèi)用電數(shù)據(jù)中,確定用電異常數(shù)據(jù),該算法是按照用電數(shù)據(jù)樣本間的相似度,將用電數(shù)據(jù)樣本自動劃分成數(shù)個(gè)聚類[7],令聚類內(nèi)部間用電數(shù)據(jù)樣本相似度較大,聚類間用電數(shù)據(jù)樣本間相似度較小。
利用歐幾里德距離描繪用電數(shù)據(jù)樣本間的相似度[8]
式中:x i、x j為用電 數(shù)據(jù)樣本;x ik和x jk為用電數(shù)據(jù)x i、x j在第k個(gè)聚類內(nèi)做差所得的數(shù)值;N為用電數(shù)據(jù)屬性數(shù)量,n∈N;d(x i,x j)為歐幾里德距離,如果用電數(shù)據(jù)樣本x i與x j間的d(x i,x j)越小,說明x i與x j間的相似程度越大[9],如果用電數(shù)據(jù)樣本x i與x j間的d(x i,x j)越大,說明x i與x j間的相似程度越小。
利用K-means聚類算法確定用電異常數(shù)據(jù)的原理如下:
1)確定用電數(shù)據(jù)聚類數(shù)量k,在M個(gè)用電數(shù)據(jù)樣本中選取k個(gè)用電數(shù)據(jù)樣本x k當(dāng)成初始聚類中心;
2)按照x k的聚類均值,獲取中心對象B,求解各類別和B的距離,按照最小距離再次分割x k;
3)求解存在變動x k的聚類均值,獲取B,重復(fù)2),以各用電數(shù)據(jù)聚類不再改變?yōu)橹?輸出用電數(shù)據(jù)聚類結(jié)果[10],得到用電異常數(shù)據(jù)。
聚類數(shù)量k與用電數(shù)據(jù)聚類效果息息相關(guān),為此選擇有效指數(shù)度量方法確定k,在k超過1的情況下,便能夠獲取最佳的用電數(shù)據(jù)聚類結(jié)果,公式如下
式中:V(k)為用電數(shù)據(jù)聚類k的有效指數(shù);M為用電數(shù)據(jù)樣本數(shù)量,i,j∈M;Ci和C j分別為用戶i和j的用電數(shù)據(jù)聚類;B i為C i的中心;B j為C j的中心;x為用電數(shù)據(jù)的聚類結(jié)果;為相同用電數(shù)據(jù)聚類中的內(nèi)聚性為各用電數(shù)據(jù)聚類集間的離散性。
令用電數(shù)據(jù)聚類中用電數(shù)據(jù)樣本和的B i距離最小,便可令相同用電數(shù)據(jù)聚類中用電數(shù)據(jù)相似度最大[11]。用電數(shù)據(jù)樣本和B i的距離確定了相同用電數(shù)據(jù)聚類中用電數(shù)據(jù)樣本的內(nèi)聚性。為此,V(k)與用電數(shù)據(jù)聚類數(shù)量k的用電數(shù)據(jù)聚類效果呈反比,與最小V(k)相應(yīng)的k值便為最佳用電數(shù)據(jù)聚類數(shù)量。
通過K-means聚類算法聚類用電數(shù)據(jù)時(shí),聚類結(jié)果共包含2類數(shù)據(jù),分別是正常用電數(shù)據(jù)與異常用電數(shù)據(jù),其中,異常用電數(shù)據(jù)包含缺失與錯(cuò)誤兩方面用電數(shù)據(jù),根據(jù)1.1節(jié)設(shè)計(jì)具體的數(shù)據(jù)確定步驟如下。
步驟1:輸入t時(shí)刻用電數(shù)據(jù)中的用電量P(t),確定用電數(shù)據(jù)中的缺失用電數(shù)據(jù),如果當(dāng)天t時(shí)刻用電量與當(dāng)天t-1時(shí)刻用電量一致,說明該用電數(shù)據(jù)中存在缺失用電數(shù)據(jù)。
步驟2:初次確定用電數(shù)據(jù)中的錯(cuò)誤用電數(shù)據(jù),一天用電數(shù)據(jù)中用電量為累加的,即其變化過程為遞增的,如果當(dāng)天t時(shí)刻用電量小于等于當(dāng)天t-1時(shí)刻用電量,那么確定t時(shí)刻用電數(shù)據(jù)是錯(cuò)誤用電數(shù)據(jù),存儲至錯(cuò)誤用電數(shù)據(jù)集。
步驟3:按照鄰近時(shí)刻用電量差值ΔP,確定該用戶外出情景;該用戶存在外出情景情況下,僅有持續(xù)運(yùn)行設(shè)備運(yùn)行,鄰近時(shí)刻ΔP為規(guī)律的。按照該用戶一定時(shí)間段中每日各鄰近時(shí)刻ΔP,可獲取外出規(guī)律用電量差值,同時(shí)可按照用電量差值,確定該用戶是否處于外出情景,在用電量較大時(shí)刻出現(xiàn)偏差,則將該用電數(shù)據(jù)確定為偏小用電異常數(shù)據(jù)。
步驟4:確定用戶外出情景后,利用K-means聚類算法確定用電數(shù)據(jù)中的用電異常數(shù)據(jù),通過有效值指數(shù)度量方法確定K-means聚類算法的最佳聚類數(shù)量k,輸出用電數(shù)據(jù)聚類結(jié)果,確定用電異常數(shù)據(jù)。
在第1節(jié)確定的用電異常數(shù)據(jù)中,選擇用電異常數(shù)據(jù)特征,利用主成分分析法降維用電異常數(shù)據(jù)特征。
將第1節(jié)中確定的用電異常數(shù)據(jù)中的電流三相不平衡、電壓三相不平衡、線損與負(fù)荷,作為用電異常數(shù)據(jù)特征指標(biāo),并在這4個(gè)方面對用電異常數(shù)據(jù)展開特征提取。
電流三相不平衡描繪三相電流間的差異[1213],電流三相不平衡指標(biāo)的計(jì)算公式如下
式中:Ia、Ib、Ic為三相電流;z為 三 相 電流均值,z
電流三相不平衡描繪三相電壓間的差異[14],電壓三相不平衡指標(biāo)的計(jì)算公式如下
式中:Ua、Ub、Uc為三相電壓。
線損率在0~6%為正常狀態(tài),在6%~26%為嫌疑狀態(tài)。設(shè)置統(tǒng)計(jì)天數(shù)為H天,那么日線損率移動均值為當(dāng)天與前H-1 天的日線損率均值。
負(fù)荷特征指標(biāo)包含用電異常數(shù)據(jù)內(nèi)各時(shí)間段的負(fù)荷率與負(fù)載率,負(fù)荷率代表用戶每日用電量變化情況,負(fù)載率代表各時(shí)段負(fù)荷變化情況[15]。日負(fù)荷率是日負(fù)荷均值與日負(fù)荷最大值間的比值;負(fù)載率是各時(shí)刻負(fù)荷均值與日負(fù)荷均值間的比值。
利用主成分分析法降維各用電異常特征數(shù)據(jù)集,令各類用電異常特征數(shù)據(jù)集內(nèi)均包含G個(gè)電力用戶,各用戶的用電異常特征數(shù)據(jù)集包含4項(xiàng)指標(biāo),原始用電異常特征數(shù)據(jù)集的矩陣是
式中:g為當(dāng)前用戶,g∈G;y1,y2,y3,y4為每項(xiàng)用電異常數(shù)據(jù)特征指標(biāo)相應(yīng)值。
線性組合Y的4項(xiàng)用電異常特征數(shù)據(jù)指標(biāo)內(nèi)數(shù)據(jù),可獲取:
式中:F1、F2、F3、F4分別為電流三相不平衡、電壓三相不平衡、線損與負(fù)荷指標(biāo)函數(shù);a pn為特征數(shù)據(jù)指標(biāo)分量系數(shù),同時(shí)符合ap21+ap22+ap23+=1,p=1,2,3,4;λ為 修 正 系 數(shù)。
利用主成分分析法降維各用電異常特征數(shù)據(jù)集的具體步驟如下。
步驟1:標(biāo)準(zhǔn)化處理Y,利用行變換把矩陣變成行最簡形,再使用列變換將每一非零行的除了首非零元素外的其余元素化為零。適當(dāng)?shù)慕粨Q各列的位置使其左上角稱為一個(gè)單位矩陣,即可完成矩陣的標(biāo)準(zhǔn)化,獲取用電異常特征數(shù)據(jù)集標(biāo)準(zhǔn)化矩陣Y'。
步驟2:求解Y'內(nèi)用電異常特征數(shù)據(jù)均值[16],公式如下
式中:M′為用電異常特征數(shù)據(jù)量;y′i為第i個(gè)用電異常特征數(shù)據(jù)對應(yīng)值。
步驟3:求解Y'內(nèi)用電異常特征數(shù)據(jù)的協(xié)方差矩陣
步驟4:求解S的特征向量與特征值。
步驟5:確定各類用電異常特征數(shù)據(jù)的主成分,完成用電異常特征數(shù)據(jù)降維。
通常情況下,在特征值超過1、累積貢獻(xiàn)率超過90%情況下,相應(yīng)的前m個(gè)特征數(shù)據(jù)便是主成分。
利用分類預(yù)測模型完成反竊電在線監(jiān)測,在反竊電在線監(jiān)測過程中,包含各種因素彼此作用的繁瑣狀況,模糊神經(jīng)網(wǎng)絡(luò)可較好地處理這種狀況。為此,利用模糊神經(jīng)網(wǎng)絡(luò)建立反竊電在線監(jiān)測模型,在該模型內(nèi)輸入降維后的用電異常特征數(shù)據(jù)y′i,輸出反竊電在線監(jiān)測結(jié)果。該模型共包含5層,分別是輸入層、模糊化層、模糊推理層、去模糊化層、輸出層。鄰近兩層間均包含一個(gè)連接權(quán)值。
第1層中共包含r個(gè)節(jié)點(diǎn),各節(jié)點(diǎn)和y′i直接相連,并傳輸y′i至第2層,因用電異常數(shù)據(jù)特征指標(biāo)有4個(gè),所以該層節(jié)點(diǎn)數(shù)量是4,即r=4。
第2層負(fù)責(zé)求解用電異常特征數(shù)據(jù)的隸屬度函數(shù),如果各y′i內(nèi)都包含l個(gè)模糊集合,那么第2層中共包含r×l個(gè)節(jié)點(diǎn),即將用電異常特征數(shù)據(jù)分成r組,各組用電異常特征數(shù)據(jù)中共有l(wèi)個(gè)節(jié)點(diǎn),第β組的l個(gè)節(jié)點(diǎn)輸入的用電異常特征數(shù)據(jù)為y′β;該模型內(nèi)r=4,將各用電異常特征數(shù)據(jù)分割成l個(gè)模糊度,為此共分割成4l個(gè)模糊度,各節(jié)點(diǎn)的激活函數(shù)均為異常特征數(shù)據(jù)各模糊度的隸屬度函數(shù)η(y′β),那么該層輸出為η(y′β),η∈[0,1]。
激活函數(shù)選擇高斯函數(shù),計(jì)算公式如下
式中:θ為η(y′β)的中心;τ為η(y′β)的寬度;e為高斯函數(shù)符號表達(dá)參數(shù)。
第3層中各節(jié)點(diǎn)僅和上一層內(nèi)各節(jié)點(diǎn)單獨(dú)連接,節(jié)點(diǎn)數(shù)量是l r,各節(jié)點(diǎn)均與一條模糊規(guī)則相對應(yīng),用于匹配模糊規(guī)則的輸入與狀態(tài),求解各條規(guī)則適應(yīng)度f,因?yàn)樵撃P蛢?nèi)r=4,所以節(jié)點(diǎn)數(shù)量是l4,即共包含l4條模糊規(guī)則,f的計(jì)算公式如下
式中:j′為當(dāng)前節(jié)點(diǎn)標(biāo)號,j′∈l4。
第4層節(jié)點(diǎn)數(shù)量是輸出反竊電在線監(jiān)測結(jié)果模糊度分割數(shù)量,該模型輸出的反竊電在線監(jiān)測結(jié)果為竊電與非竊電,即節(jié)點(diǎn)數(shù)量是2,第4層負(fù)責(zé)歸一化f,歸一化公式如下
式中:λ為修正系數(shù);i′為當(dāng)前節(jié)點(diǎn)數(shù)。
第5層負(fù)責(zé)變更上一層內(nèi)每個(gè)節(jié)點(diǎn)的輸出,獲取精準(zhǔn)值,第5層節(jié)點(diǎn)數(shù)量是1,輸出的精準(zhǔn)值是竊電嫌疑系數(shù),該值與1越接近,說明竊電嫌疑越大,該值與0越接近,說明竊電嫌疑越小。通過加權(quán)平均法求解竊電嫌疑系數(shù),公式如下
式中:w j′為連接權(quán)值。
以某市供電局為實(shí)驗(yàn)對象,該供電局中共涉及18座110 k V 變電站,包含100 多萬個(gè)用戶,299條線路,總長2 964 km。在該供電局內(nèi)隨機(jī)選擇部分電力用戶的用電數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),這些用戶中包含竊電用戶,利用本文方法在線監(jiān)測這些用戶的竊電情況,驗(yàn)證本文方法的有效性。
采用第1.2節(jié)步驟,利用K-means聚類算法確定用電異常數(shù)據(jù);
采用第2.2 節(jié)步驟,在確定的用電異常數(shù)據(jù)中,選擇用電異常數(shù)據(jù)特征,利用主成分分析法降維用電異常數(shù)據(jù)特征。
采用第3節(jié)計(jì)算方法,利用分類預(yù)測模型完成反竊電在線監(jiān)測,在反竊電在線監(jiān)測過程中,包含各種因素彼此作用的繁瑣狀況,模糊神經(jīng)網(wǎng)絡(luò)可較好地處理這種狀況,為此利用模糊神經(jīng)網(wǎng)絡(luò)建立反竊電在線監(jiān)測模型。
利用本文方法確定實(shí)驗(yàn)數(shù)據(jù)中的用電異常數(shù)據(jù),結(jié)果如圖1所示(以用電數(shù)據(jù)中存在偏小與偏大用電異常數(shù)據(jù)的2個(gè)用戶為例)。

圖1 用電異常數(shù)據(jù)確定結(jié)果
由圖1可知,圖1(a)的歷史時(shí)刻用電數(shù)據(jù)遠(yuǎn)遠(yuǎn)高于當(dāng)前時(shí)刻用電數(shù)據(jù),說明當(dāng)前時(shí)刻用電數(shù)據(jù)為用電異常數(shù)據(jù),即屬于偏小用電異常數(shù)據(jù);圖1(b)的歷史時(shí)刻用電數(shù)據(jù)遠(yuǎn)遠(yuǎn)低于當(dāng)前時(shí)刻用電數(shù)據(jù),說明當(dāng)前時(shí)刻用電數(shù)據(jù)為用電異常數(shù)據(jù),即屬于偏大用電異常數(shù)據(jù)。實(shí)驗(yàn)證明:本文方法可有效確定偏小與偏大用電異常數(shù)據(jù),與實(shí)際情況相符,確定用電異常數(shù)據(jù)的精度較高。
利用本文方法在用電異常數(shù)據(jù)中選擇用電異常特征數(shù)據(jù),以三相電流不平衡指標(biāo)的用電異常特征數(shù)據(jù)為例,隨機(jī)選取某個(gè)用戶的用電異常特征數(shù)據(jù)如圖2所示。

圖2 用電異常特征數(shù)據(jù)
由圖2可知,A 相電流、B相電流與C 相電流間的差距很大,說明該用電異常特征數(shù)據(jù)為三相電流不平衡特征。實(shí)驗(yàn)證明本文方法可有效在用電異常數(shù)據(jù)中選擇用電異常特征數(shù)據(jù),再次驗(yàn)證其確定用電異常數(shù)據(jù)的精準(zhǔn)性。
利用本文方法降維用電異常特征數(shù)據(jù),4個(gè)用電異常特征指標(biāo)數(shù)據(jù)的降維結(jié)果如表1所示。

表1 用電異常特征數(shù)據(jù)降維結(jié)果
由表1可知,三相電流不平衡特征指標(biāo)數(shù)據(jù)中前5個(gè)主成分的特征值超過1,累積貢獻(xiàn)率超過90%,為此,該特征指標(biāo)數(shù)據(jù)選擇前5個(gè)主成分作為指標(biāo)數(shù)據(jù)集。三相電壓不平衡特征指標(biāo)數(shù)據(jù)中前8個(gè)主成分的特征值超過1,累積貢獻(xiàn)率超過90%,為此,該特征指標(biāo)數(shù)據(jù)選擇前8個(gè)主成分作為指標(biāo)數(shù)據(jù)集。線損特征指標(biāo)數(shù)據(jù)中前9個(gè)主成分的特征值超過1,累積貢獻(xiàn)率超過90%,為此,該特征指標(biāo)數(shù)據(jù)選擇前9個(gè)主成分作為指標(biāo)數(shù)據(jù)集。負(fù)荷特征指標(biāo)數(shù)據(jù)中前4個(gè)主成分的特征值超過1,累積貢獻(xiàn)率超過90%,為此,該特征指標(biāo)數(shù)據(jù)選擇前4個(gè)主成分作為指標(biāo)數(shù)據(jù)集。實(shí)驗(yàn)證明本文方法可有效降維用電異常特征數(shù)據(jù)。
依據(jù)降維后用電異常特征數(shù)據(jù),利用本文方法在線監(jiān)測反竊電情況,隨機(jī)選擇10 個(gè)電力用戶,這10個(gè)電力用戶的反竊電在線監(jiān)測結(jié)果如表2所示。

表2 反竊電在線監(jiān)測結(jié)果
由表2可知,本文方法可有效在線監(jiān)測用戶的反竊電情況,獲取用戶的竊電嫌疑系數(shù),本文方法獲取的竊電嫌疑系數(shù)與實(shí)際值間差距很小,最大誤差僅有3.5%(用戶ID9912),這10個(gè)用戶均為竊電用戶。實(shí)驗(yàn)證明本文方法可精準(zhǔn)在線監(jiān)測反竊電情況。
研究基于用電異常數(shù)據(jù)的反竊電在線監(jiān)測方法,基于電流三相不平衡、電壓三相不平衡、線損和負(fù)荷為特征指標(biāo),得到異常用電數(shù)據(jù)中選取異常用電特征數(shù)據(jù);對異常用電特征數(shù)據(jù)進(jìn)行降維,采用K-means聚類算法確定用電異常數(shù)據(jù),基于有效指數(shù)度量方法確定用電數(shù)據(jù)的聚類個(gè)數(shù),增加異常數(shù)據(jù)判斷的準(zhǔn)確性;利用模糊神經(jīng)網(wǎng)絡(luò)建立反竊電在線監(jiān)測模型,輸入降維異常用電特征數(shù)據(jù),輸出竊電可疑系數(shù)。實(shí)驗(yàn)結(jié)果表明本文方法所得竊電可疑系數(shù)與實(shí)際值差距較小,最大誤差僅有3.5%,可實(shí)現(xiàn)反竊電在線監(jiān)測。
由于越來越多的電力設(shè)備將與互聯(lián)網(wǎng)相連,從而面臨著更高的竊電風(fēng)險(xiǎn)。反竊電行為監(jiān)測作為一種信息安全技術(shù),在未來的發(fā)展中,將逐漸適用于物聯(lián)網(wǎng)設(shè)備,需要更加注重技術(shù)的可靠性和穩(wěn)定性。通過質(zhì)量控制和數(shù)據(jù)分析等手段提升技術(shù)的可靠性,并確保在各種情況下都能正常工作。除此之外,需更加注重標(biāo)準(zhǔn)化和規(guī)范化,制定相應(yīng)的技術(shù)規(guī)范和標(biāo)準(zhǔn),以保證技術(shù)的安全性和統(tǒng)一性。