999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

機器學(xué)習(xí)算法在反竊電分析中的應(yīng)用

2020-04-15 09:39:16浩馬迅劉安磊賈旭超紀書軍駱云娟徐冬冬
河北電力技術(shù) 2020年1期
關(guān)鍵詞:特征用戶模型

王 浩馬 迅劉安磊賈旭超紀書軍駱云娟徐冬冬

(國網(wǎng)河北省電力有限公司電力科學(xué)研究院,石家莊 050021)

隨著科學(xué)技術(shù)的不斷發(fā)展,利用高科技進行竊電的手段越來越普遍[1],比如強磁竊電、無線干擾竊電、更改電能表編程器竊電等。這些技術(shù)手段不但隱蔽性強,而且不容易控制,用戶的竊電量大,查處難度非常大。

針對高科技竊電現(xiàn)象,有學(xué)者提出采用時域和頻域的曲線相似性分析方法,通過判斷用戶負荷曲線與異常饋線線損曲線之間的相似性來識別竊電行為;有學(xué)者提出根據(jù)“在一個數(shù)據(jù)集中,會出現(xiàn)偏離集群中其他數(shù)據(jù)的數(shù)據(jù)點,若數(shù)據(jù)點的偏離程度較大,則懷疑形成這種偏離的原因不屬于集群內(nèi)部因素導(dǎo)致,而是外界干擾因素導(dǎo)致的這種不正常的現(xiàn)象”建立基于距離的離群點檢測方法檢測電壓、電流異常,進而判斷用戶是否存在竊電行為;有的學(xué)者提出通過獲取智能電表數(shù)據(jù)和配電變壓器的數(shù)據(jù),構(gòu)建數(shù)據(jù)模型,進而判斷用戶是否竊電[2]。上述判斷方法,主要根據(jù)用戶用電數(shù)據(jù)進行異常判斷,判斷方式單調(diào),構(gòu)建的數(shù)據(jù)特征較少,導(dǎo)致數(shù)據(jù)挖掘的效率不高,數(shù)據(jù)價值沒有得到充分利用,所以分析效果并不理想。而基于機器學(xué)習(xí)算法構(gòu)建反竊電模型,從用戶用電數(shù)據(jù)、計量異常事件以及線損3個角度切入,多方位偵測用戶竊電行為,能夠有效地提高竊電檢測率,對構(gòu)建基于大數(shù)據(jù)的反竊電稽查監(jiān)控系統(tǒng)具有重要的社會和經(jīng)濟意義。

1 模型簡介

模型選用隨機森林算法是利用多棵樹對樣本進行訓(xùn)練并預(yù)測的一種分類器。其反復(fù)二分數(shù)據(jù)進行分類或回歸,計算量大大降低。在變量(列)的使用和數(shù)據(jù)(行)的使用上進行隨機化,生成很多分類樹,再匯總分類樹的結(jié)果。目前反竊電的特征中多數(shù)的特征無共同性,因竊電的形式可能多種,竊電用戶的數(shù)據(jù)不具備一定的共同性,隨機森林算法可以根據(jù)這些竊電用戶的特征以及非竊電用戶的特征,在子樹中對每一個分裂過程選擇部分特征,從所有特征中隨機選取一定的特征,之后再在隨機選取的特征中選取特征,每棵樹重復(fù)上述過程,最后投票選擇出最正確的分類。此模型可提升反竊電稽查監(jiān)控系統(tǒng)的多樣性,從而提升數(shù)據(jù)的可利用性和結(jié)果預(yù)測的正確性,同時防止過擬合。隨機森林算法可以在運算量沒有顯著提高的前提下提高了預(yù)測精度,其原理如圖1所示。

圖1 隨機森林算法的原理

隨機森林算法是機器學(xué)習(xí)中的重要算法,在許多領(lǐng)域應(yīng)用[4]。隨機森林模型[5]是一個包含多個決策樹的分類器,并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。在機器學(xué)習(xí)中,決策樹是一個預(yù)測模型,他代表的是對象屬性與對象值之間的一種映射關(guān)系。

在決策樹中每個節(jié)點表示某個對象,而每個分叉路徑則代表某個可能的屬性值,每個葉結(jié)點則對應(yīng)從根節(jié)點到該葉節(jié)點所經(jīng)歷的路徑所表示對象的值。隨機森林由多個決策樹構(gòu)成,每個決策樹都表述了一種樹型結(jié)構(gòu),由它的分支來對該類型的對象依靠屬性進行分類。每個決策樹可以依靠對源數(shù)據(jù)庫的分割進行數(shù)據(jù)測試,這個過程可以遞歸式的對樹進行修剪。當不能再進行分割或一個單獨的類可以被應(yīng)用于某一分支時,遞歸過程完成。隨機森林分類器將許多決策樹結(jié)合起來可以提升分類的正確率[6]。具體的決策樹與隨機森林的算法介紹見參考文獻[7]。

2 模型框架

2.1 設(shè)計理念

隨機森林算法的基本思路是基于歷史的用電信息數(shù)據(jù),構(gòu)建特征向量用來表征竊電行為和正常用電行為的差異性,進而訓(xùn)練二分類機器學(xué)習(xí)模型,基于過去一段時間的用電信息,自動判斷用戶在該時間段內(nèi)是否發(fā)生了竊電,如圖2所示。

2.2 特征選擇

圖2 隨機森林模型算法設(shè)計框架

特征所使用的基礎(chǔ)表如圖3所示。其中歷史用電信息,是指用戶在一段時間區(qū)間內(nèi)(1個月/季度/年)所產(chǎn)生用電行為信息和用戶基本屬性信息。具體而言,可以分為三類:時間序列類型信息、事件類信息、靜態(tài)類信息。其中時序類信息包含了用戶每天用電量的時序數(shù)據(jù)和臺區(qū)每天線損量的時序數(shù)據(jù);事件類信息,主要記錄了不同異常類型用電事件的發(fā)生時刻信息;靜態(tài)類信息,指用戶的基本信息,例如地址、職業(yè)、愛好、性別等。

圖3 隨機森林模型算法特征

2.2.1 基礎(chǔ)表說明

a.日用電量:日凍結(jié)有功電能示值、測量點日凍結(jié)電能量。

b.日臺區(qū)線損:臺區(qū)線損率明細。

c.用電異常事件:電能表的潮流反向、電流不平衡、電壓逆相序、電源異常、斷相、輔助電源掉電、負荷開關(guān)誤動拒動、過流、恒定磁場干擾、開表蓋、開端鈕蓋、欠壓、全失壓、失流、失壓、校時、電能事件清零、飛走、倒走等事件。

d.用戶基本信息表:用戶檔案。

2.2.2 主要特征數(shù)據(jù)提取

根據(jù)上述基礎(chǔ)表,以竊電手段判別,根據(jù)短接偷電、電能表停轉(zhuǎn)、電能表反轉(zhuǎn)、欠電壓法竊電,欠電流法竊電、移相法竊電,擴差法竊電、無表法竊電等,可得出異常事件行為記錄表記錄的信息將是本模型數(shù)據(jù)權(quán)重較大部分,根據(jù)此表判斷竊電用戶的行為,取異常事件發(fā)生時間點,以此用戶、發(fā)生時間,關(guān)聯(lián)出其對應(yīng)時間的用電量、臺區(qū)線損,觀察其突變度,并取突變度最大值,主要特征如下:

a.異常事件發(fā)生次數(shù)(對取出的所有異常事件進行計數(shù));

b.異常事件時刻用電突變度(異常事件發(fā)生的時間節(jié)點所對應(yīng)的用電量的突變度);

c.異常事件時刻線損突變度(異常事件發(fā)生的時間節(jié)點所對應(yīng)的臺區(qū)線損的突變度);

d.用戶用電突變點個數(shù)(所有時間下的用電量突變點的計數(shù));

e.用電突變時刻線損突變度(所有時間下的用電量突變點的時間所對應(yīng)的線損突變度)。

2.2.3 其他特征

根據(jù)用戶日用電量的均值、方差、異常值、突變點、工作日、休息日用電量等,統(tǒng)計如下信息:時間序列的空值占比、時間序列0值占比、時間序列異常電占比、時間序列中位數(shù)、時間序列方差、時間序列標準化中位數(shù)(<=>中位數(shù)/時間序列最大值)、時間序列標準化方差(<=>方差/時間序列最大值)、突變點個數(shù)、突變點躍遷最大值、工作日平均用電量、休息日平均用電量、工作日平均用電比例、休息日平均用電比例、星期用電比例的信息熵。此部分特征為預(yù)想可能存在影響該樣本是否為竊電用戶,因而選用部分。

3 模型訓(xùn)練

模型輸入數(shù)據(jù)部分選擇了360天的數(shù)據(jù)(包含竊電以及非竊電用戶),從基礎(chǔ)表提取出主要的5個特征,訓(xùn)練數(shù)據(jù)2W正樣本+5W普通竊電用戶,交叉驗證準確率為80%,隨機抽取模型中1個樹的過程,如圖4所示。

圖4 隨機森林模型樹的預(yù)測過程

由100多棵樹隨機抽取特征,根據(jù)訓(xùn)練數(shù)據(jù)擬合模型后,將新樣本輸入,執(zhí)行上述過程,得到結(jié)果。

訓(xùn)練模型:第一步將要提取特征,但在進入特征提取前,需要抽取一定比列的訓(xùn)練樣本(竊電用戶和未發(fā)現(xiàn)竊電的用戶),此部分需手動設(shè)置,提取完訓(xùn)練樣本后,數(shù)據(jù)將交給feature_extract抽取數(shù)據(jù),后續(xù)將會調(diào)用feature_util中的方法對數(shù)據(jù)進行轉(zhuǎn)換,于feature_combine中整合成用來訓(xùn)練的數(shù)據(jù)(特征),于model_train_script中訓(xùn)練模型,訓(xùn)練完成后將導(dǎo)出一份訓(xùn)練完后的文件,內(nèi)含訓(xùn)練完畢的模型,后續(xù)預(yù)測時將直接調(diào)用該文件。

4 模型應(yīng)用

4.1 模型預(yù)測

模型預(yù)測嫌疑用戶流程如下:

a.提取預(yù)測數(shù)據(jù);

b.執(zhí)行preprocess腳本創(chuàng)建臨時表;

c.臨時表中提取預(yù)測數(shù)據(jù),通過feature_extract抽取數(shù)據(jù)(調(diào)用feature_util中的方法對數(shù)據(jù)進行轉(zhuǎn)換);

d.在feature_combine中整合成預(yù)測的數(shù)據(jù);

e.通過model_predict_util打開訓(xùn)練完成的模型文件;

f.將數(shù)據(jù)導(dǎo)入模型進行預(yù)測,并輸出結(jié)果;

g.調(diào)用output_database導(dǎo)出txt文件;

h.使用hadoop命令將文件導(dǎo)入hive的臨時表;

i.住址姓名通過表內(nèi)ID信息關(guān)聯(lián),導(dǎo)入Oracle完成。

4.2 模型結(jié)果

模型選取滄州某縣進行驗證測試工作,對部分嫌疑用戶的部分特征進行分析,根據(jù)輸出結(jié)果進行嫌疑度排名,選取其中嫌疑度較高的嫌疑用戶,將其用電采集數(shù)據(jù)繪制成圖,見圖5、圖6,其中虛線部分代表用戶日用電量,實線部分代表臺區(qū)日線損。

圖5 隨機森林模型嫌疑用戶1臺區(qū)線損與日用電量相關(guān)性

圖6 隨機森林模型嫌疑用戶2臺區(qū)線損與日用電量相關(guān)性

2019年5月,選取圖5、圖6對應(yīng)的嫌疑用戶,在滄州某縣城進行現(xiàn)場稽查工作。最終,確定2戶均為竊電用戶,其中一戶嫌疑用戶存在繞越計量竊電,表內(nèi)計量電流為0 A,實際流入電流為4.97 A,屬竊電行為;另外一戶嫌疑用戶存在動表竊電,使計量不準確,達到竊電目的。

2019年4月起至8月,根據(jù)文本模型得出的嫌疑用戶,于石家莊、保定、滄州3個地市開展試點工作,共51戶派發(fā)進行現(xiàn)場核查,查實用戶10戶,準確率19.6%。

5 結(jié)束語

由此可見,隨機森林算法可以有效快速地實現(xiàn)竊電嫌疑用戶的追蹤。隨機森林采用了集成算法,本身精度比大多數(shù)單個算法要好。在測試集上表現(xiàn)良好,由于2個隨機性的引入,使得隨機森林不容易陷入過擬合(樣本隨機,特征隨機),訓(xùn)練速度快,可以運用在大規(guī)模數(shù)據(jù)集上。利用機器學(xué)習(xí)算法對竊電嫌疑用戶的追蹤,實現(xiàn)了快速有效的反竊電目標,為國家以及社會反竊電領(lǐng)域創(chuàng)造了應(yīng)用價值。

猜你喜歡
特征用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 亚洲婷婷六月| 欧美人与牲动交a欧美精品| 99re在线视频观看| 91色爱欧美精品www| 亚洲综合九九| 九九香蕉视频| 精品福利网| 国产极品美女在线观看| 亚洲中文久久精品无玛| 极品私人尤物在线精品首页 | 亚洲色欲色欲www在线观看| 色天天综合久久久久综合片| 国产内射一区亚洲| 一本大道香蕉高清久久| 国产经典免费播放视频| 亚洲一区无码在线| 成人精品亚洲| 亚洲欧美国产视频| 亚洲人在线| 九九线精品视频在线观看| 成人在线视频一区| 大乳丰满人妻中文字幕日本| 久久99热这里只有精品免费看| 91久久夜色精品| 国产视频a| AV天堂资源福利在线观看| 久久国产V一级毛多内射| 在线观看欧美国产| 69av免费视频| 91麻豆精品视频| 色综合天天视频在线观看| 亚洲综合片| 久久人午夜亚洲精品无码区| 亚洲无码日韩一区| 国产丰满大乳无码免费播放| 青青国产视频| 欧美性色综合网| 一级毛片中文字幕| 美女被操91视频| 亚洲精品久综合蜜| 欧美精品v日韩精品v国产精品| 婷婷亚洲天堂| 亚洲天堂日韩在线| 无码免费的亚洲视频| 天堂岛国av无码免费无禁网站| 男女男免费视频网站国产| 国产香蕉97碰碰视频VA碰碰看| 亚洲无码视频图片| 亚洲第一福利视频导航| 97se亚洲综合在线天天| 国产无码精品在线播放| 成人毛片在线播放| 国产对白刺激真实精品91| 中文字幕乱码二三区免费| 欧美中出一区二区| 成人福利在线观看| 婷婷色婷婷| 亚洲无码在线午夜电影| 亚洲妓女综合网995久久| 国产97视频在线观看| 国产一在线观看| 午夜精品久久久久久久无码软件| 精品视频第一页| 这里只有精品在线播放| 欧美日韩动态图| lhav亚洲精品| 黄色a一级视频| 久久天天躁狠狠躁夜夜2020一| 亚洲国产91人成在线| 日韩福利视频导航| 91国内在线视频| 亚洲日本一本dvd高清| 综合色亚洲| 超清无码一区二区三区| 国产精品亚洲日韩AⅤ在线观看| 91在线丝袜| 美女一级免费毛片| 亚洲自拍另类| 欧美啪啪精品| 国产一区二区三区精品久久呦| 亚洲第一色视频| 日韩av在线直播|