999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于kNN算法的智能電網5G海量接入數據異常檢測

2024-04-29 00:00:00林舒嫄林曉敏歐亞闞雙星莫裕全
粘接 2024年2期
關鍵詞:智能檢測

doi:10.3969/j.issn.1001-5922.2024.02.041

摘 要:為了更好適應智能電網高維數據異常識別,提出了一種加權kNN數據異常值檢測識別方法,該方法使用Z階曲線來識別kNN。利用Z階曲線,提出了一種加權kNN異常數據檢測方法。用信息熵衡量所有屬性的重要性,用Z階曲線對高維數據進行編碼并映射為Z值。實驗結果表明,智能電網集群計算節點的數量越多,算法的運行速度就越短。發電數據異常檢測準確率達到最高99.2%,較隨機森林算法提高8.165%。且kNN算法的運行時間均優于隨機森林算法運行時間,最小算法運行時間為4 s,進一步表明kNN算法可有效檢測智能電網5G海量接入數據。

關鍵詞:kNN算法;智能電網;5G;數據異常;檢測

中圖分類號:TP18" " " "文獻標志碼:A" " " "文章編號:1001-5922(2024)02-0155-04

Abnormality detection of 5G massive access data of smart grid based on kNN algorithm

LIN Shuyuan1,LIN Xiaomin1,OU Ya2,KAN Shuangxing3,MO Yuquan3

(1.Fujian Power Trading Center Co.,Ltd.,Fuzhou,350001,China;

2.Fujian Power Supply Service Co.,Ltd.,Fuzhou,350001,China;

3.Shanghai Hill Management Consulting Co.,Ltd.,Shanghai,201210,China)

Abstract:In order to better adapt to the identification of high-dimensional data anomalies in smart grids,a weighted kNN data anomaly detection and recognition method was proposed,which used Z-order curves to identify kNN.A weighted kNN anomaly data detection method was proposed using Z-order curves.The importance of all attributes was measured with information entropy,and high-dimensional data was encoded and mapped to Z-values with Z-order curves.The experimental results showed that the more computing nodes there were in the smart grid cluster,the shorter the running speed of the algorithm.The accuracy of anomaly detection in power generation data reached a maximum of 99.2%,which was 8.165% higher than the random forest algorithm.Moreover,the running time of the kNN algorithm was better than that of the random forest algorithm,with a minimum algorithm running time of 4 seconds,further indicating that the kNN algorithm can effectively detect massive 5G access data in the smart grid.

Key words:KNN algorithm;smart grid;5G;data anomalies;detection

隨著智能電網快速的發展,5G海量接入數據量呈爆發性增長。在5G海量數據中,部分異常數據會誘發智能電網異常行為或模式,包括硬件故障或惡意數據侵入[1-2]。從數據中識別異常值對于智能電網安全運行至關重要。

k最近鄰(kNN)是一種最簡便的機器學習方法[3],是一種可以在多維空間中查詢與識別最近 k個對象的方法,廣泛用于數據庫異常值檢測[4]。研究表明kNN算法難以適應多維數據集,無法從多維數據集識別數據異常值[5]。提出了一種非參數自適應檢測算法,該算法通過k最近鄰估計異常數據[6]。然而,k最近鄰(kNN)在全空間中計算仍在高維數據中存在無法識別異常值等情況[7]。而在實際應用中,每個屬性的重要性是不同的[8]。忽略屬性的重要性將嚴重影響kNN算法的智能電網5G海量接入數據異常檢測?;诖?,研究利用Z階曲線,提出了一種加權kNN異常數據檢測方法。用信息熵衡量所有屬性的重要性,用Z階曲線對高維數據進行編碼并映射為Z值。每個對象的加權kNN算法根據Z值進行數據識別,可以進一步提高kNN算法在高維空間中的異常數據檢測效率。并利用實驗結果驗證加權kNN算法在智能電網5G海量接入數據異常檢測的有效性。

1"kNN分類算法概述

在采用加權 k近鄰算法求出各物體的 k近鄰時,要充分考慮各物體的屬性重要性(權重)\[9\]。在5G智能電網中,由于缺少對智能電網5G海量接入數據的理解,因此,屬性的重要程度不能被直觀地反映出來。因此可以用信息熵的平均值來表示各個離散信息的不確定性,從而更好地解決了各個指標權重的不確定性問題。

1.1"k 最近鄰 (kNN)異常值識別算法

kNN算法是模式識別領域的一種非參數分類或回歸算法\[10\]。假設有一些訓練數據具有多個屬性和一個標簽。kNN分類算法的目的是獲取測試數據的標簽。具體流程如下。

(1)準備訓練數據和測試數據。有m組訓練數據,每組有n個屬性{σi1,σi1,…σin},同時包含一個標簽ti,其中i∈[1,m]。假設測試數據為{q1,q2,…,qn,}。

(2)計算每個訓練數據和測試數據之間的歐幾里德距離di。即

di=(q1i12+…+(qnin2,i∈[1,m](1)

(3)所有的距離di和它相應的標簽ti生成一個有序的集合,即

C={(d1,t1),(d2,t2),…(dm,tm)}(2)

(4)根據距離di和標簽ti的有序集合C進行排序。

(5)從排序的集合C中選擇第一個標簽K。

(6)計算標簽K的頻率,將頻率最高的標簽設為測試數據的最終結果。

1.2"信息熵

信息熵是指一個不連續的隨機事件出現的平均概率\[11\]。平均信息用于反映數據源的每個離散信息的不確定性,可以有效地表征數據信息定量測量問題,并被應用于屬性權重的測量。數據源的信息熵是描述源的平均不確定性,即源的平均信息可以用所有單個符號信息的平均值來衡量,即可以用式(3)表示:

1.3"5G海量數據異常值檢測原理

在確定數據集中的所有樣本點位后,應繪制智能電網5G海量接入數據決策圖[12]。從決策圖中找出5G海量接入數據點,該點被作為數據集的聚類中心。從離群點檢測的角度來看,在決策圖中也可以直觀地看到接入數據點,這些點被確定為離群點。

考慮到智能電網電力數據的特點,可以假設離群值應滿足以下條件:(1)局部密度小于局部密度的閾值,即pilt;pf;(2)相對距離小于相對距離的閾值,即δilt;δf。局部密度的閾值pf可以通過以下方式計算:

相對距離的閾值δf可以通過以下方式計算:

式中:N表示權重數據集中的樣本總數,δi和εδ表示經驗參數。

1.4"加權kNN算法

加權kNN算法的數據識別方法有LSH、Voronoi圖和Z階曲線等。其中Z階曲線是一條空間填充曲線,它在高維空間中每個離散的網格都會經過并只經過一次。原來的高維空間查詢被轉化為線性空間范圍查詢[13]。因此,Z階曲線可以很好地保護高維數據之間的接近性,并且可以應用于不同密度的數據集。

因此提出基于Z階曲線加權kNN的方法,該方法可以有效地解決多個問題。將每一數據目標與Z階的一條直線上的某一點相對應,此點被稱作 Z值,可以將加權kNN算法的樣本辨識問題轉換成一維的Z值檢測值\[14-16\]。當一個數據目標的全部性質被賦權并且被映射成一個 Z階曲線時,對象的加權kNN數據識別就轉化為與識別對象Z值最接近的k個對象的查詢。

2"試驗結果與討論

2.1"kNN算法可擴展性

使用電網數據集S1、S2和S3,對kNN算法的可擴展性進行研究分析,其S1、S2和S3數據集分別包含200 000、550 000和800 000個對象。

圖1 (a)為5G大規模訪問數據處理節點數量對于智能電網5G網絡中異常信息辨識的有效性。隨著節點數量的減少,算法所需的計算時間也隨之增加。而 kNN算法中各數據目標的離群系數的運算是平行的,與節點數量無關。因此,kNN算法的運行時間與數據對象的數量呈線性關系。

圖1(b)為數據節點數量變化時,智能電網數據集的運算速度變化趨勢。由圖1(b)可知,智能電網5G海量數據節點的數量越多,運算速度越快。且當智能電網5G數據量較小時,智能電網HDFS文件系統中的數據塊數量將減少,這將導致kNN算法的運算速度減少。同時,隨著智能電網5G海量接入數據節點增加,所需時間也相應縮短。從理論上講,該算法的運算速率應與計算節點數目成正比,然而,在實際應用中,由于計算節點數目的增多,會導致網絡的傳輸速率增大。因此,并行性的影響將會越來越小。

2.2"異常數據識別準確性

利用智能電網5G海量接入數據集,測試kNN算法和唐賡[17]學者提出的隨機森林算法的異常數據識別精度。假設m、n、t、q分別為數據記錄的數量、屬性、訓練數據記錄和查詢數據。查詢數據從數據集中隨機選擇。因此,每個智能電網查詢數據都有自己的標簽,可以判斷kNN算法的分類結果是真是假。智能電網數據集參數設置如表1所示。

由表1可知,共使用了3個不同的數據集。第2個數據集為電網施工現場異常數據集,共有1 728個數據記錄和4個不同的標簽,包括施工現場電線短路、電線電壓超載、電流超載和電網設備故障,且每個數據記錄都有6個屬性。將前1 400條記錄設置為訓練數據,將其他328條記錄設為測試數據。第3個數據集是系統異常數據集,共有830個數據記錄,具有5個屬性和2個不同的標簽,包括系統硬件故障和系統軟件故障。在該數據集中,前600個數據記錄為訓練數據,而其他230個數據記錄則為測試數據。第三個數據集為發電異常數據集,該數據集在智能電網中具有重要的應用,包括發電耗電量、發電電壓異常數據等??偣灿?0 000個數據記錄,11個屬性和2個不同的標簽。在該數據集中,前8 000個數據記錄為訓練數據,后2 000個數據記錄為測試數據。

kNN和隨機森林算法性能對比如表2所示。

由表2可知,發電數據異常準確率達到最高為99.2%,較隨機森林算法提高8.165%。而電網現場異常數據與系統異常數據最大準確率為98.5%,最小準確率為87.5%。kNN算法可以有效識別電網現場異常數據及系統與發電異常數據。且所提出的kNN算法可以有效識別智能電網5G海量接入數據異常,從而保證智能電網正常運行。kNN算法和隨機森林算法對異常數據的識別精度均大于95.1%,其中電網現場異常數據精度達到最高99.1%,同時kNN算法的運行時間優于隨機森林算法運行時間,最小算法運行時間為4 s。

3"結語

研究提出了基于kNN算法的智能電網5G海量接入數據異常檢測。利用加權kNN算法,以適應智能電網高維數據異常識別。所提出的kNN算法準確率、精度、算法時間均優于隨機森林算法,且kNN算法的運行時間與數據對象的數量呈線性關系,kNN算法可以有效識別電網現場異常數據及系統與發電異常數據。且所提出的kNN算法可以有效識別智能電網5G海量接入數據異常,從而保證智能電網正常運行,結果表明kNN算法可有效識別智能電網5G海量數據異常值檢測。

【參考文獻】

[1]齊波,冀茂,鄭玉平,等.電力物聯網技術在輸變電設備狀態評估中的應用現狀與發展展望[J].高電壓技術,2022,48(8):3012-3031.

[2]王定發.基于線纜狀態數據的特征集成及異常信息自動檢測技術[J].粘接,2023,50(5):188-192.

[3]王九思,王日南.5G與能源互聯網深度融合在智能電網中的應用[J].電站系統工程,2021,37(5):76-78.

[4]錢浩,羅少杰,郭強,等.基于5G通信的有源配電網多方向故障恢復策略[J].供用電,2022,39(12):1-10.

[5]劉震宇.基于支持向量機的電力系統調度數據異常檢測方法[J].自動化技術與應用,2023,42(6):24-27.

[6]張云峰,魏星,諸駿豪,等.基于電力通信動靜態資源的光纜數據監測系統設計[J].粘接,2022,49(2):92-96.

[7]李春生,田夢晴,張可佳.基于Bi-LSTM網絡的管道異常數據檢測方法[J].計算機技術與發展,2023,33(6):215-220.

[8]張仁斌,左藝聰,周澤林,等.基于多模態生成對抗網絡的多元時序數據異常檢測[J].計算機科學,2023,50(5):355-362.

[9]徐飛陽,薛安成,常乃超,等.電力系統同步相量異常數據檢測與修復研究現狀與展望[J].中國電機工程學報,2021,41(20):6869-6886.

[10]黃文杰,秦芳麗,鄧舒遲,等.基于負載均衡聚合技術的配電網數據信息智能化提升研究[J].粘接,2023,50(5):193-196.

[11]王鋒,高欣,賈欣,等.一種基于對數區間隔離森林的電力調度數據異常檢測集成算法[J].電網技術,2021,45(12):4818-4827.

[12]金鵬,夏曉峰,喬焰,等.基于深度信念網絡的高維傳感器數據異常檢測算法[J].傳感技術學報,2019,32(6):892-901.

[13]黃欣,趙敏彤,郇嘉嘉,等.基于BWO-DBSCAN和CSA-OCRKELM的變電站數據流異常檢測方法[J].廣東電力,2023,36(5):39-48.

[14]拓廣忠,葛樹峰,李榮讓,等.基于熵值法和DEA的電力監測異常數據自動識別算法研究[J].微型電腦應用,2023,39(4):160-163.

[15]王建元,劉柯辰.基于經驗模態分解與多視角聚類的異常用電模式檢測[J].電器與能效管理技術,2023(3):73-80.

[16]李強,張立梅,白牧可.基于多元數據特征和改進隨機森林的智能配電網異常數據辨識[J].科學技術與工程,2023,23(5):2007-2015.

[17]唐賡.電網同期線損檢測系統的設計與實現路徑[J].粘接,2022,49(5):170-173.

收稿日期:2023-09-05;修回日期:2023-12-02

作者簡介:林舒嫄(1988-),女,碩士,高級經濟師,研究方向:智能電網等;E-mail:linshuyqnn801@126.com。

引文格式:林舒嫄,林曉敏,歐"亞,等.基于kNN算法的智能電網5G海量接入數據異常檢測[J].粘接,2024,51(2):155-158.

猜你喜歡
智能檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
智能制造 反思與期望
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
主站蜘蛛池模板: 久久99国产乱子伦精品免| 精品欧美一区二区三区在线| 人妻中文久热无码丝袜| 一本视频精品中文字幕| 无码精品福利一区二区三区| 99视频在线精品免费观看6| 亚洲激情99| 国产一级小视频| 激情综合婷婷丁香五月尤物| 国产美女精品在线| 国产成人调教在线视频| 亚洲一区免费看| 欧美成在线视频| 午夜天堂视频| 99国产精品免费观看视频| 在线永久免费观看的毛片| 91免费国产高清观看| 欧美亚洲国产日韩电影在线| 日韩精品成人网页视频在线| 亚洲日韩AV无码精品| 最新日韩AV网址在线观看| 国产欧美精品一区二区| 中文字幕 91| 中文字幕第1页在线播| 成人午夜网址| 国产原创自拍不卡第一页| 国产精品亚洲а∨天堂免下载| 国产精品女同一区三区五区| 久久中文字幕2021精品| 亚洲精品老司机| 99热线精品大全在线观看| 日韩不卡免费视频| 一级毛片免费观看不卡视频| 欧美另类精品一区二区三区| 欧美综合成人| 亚洲精品日产精品乱码不卡| 无码中字出轨中文人妻中文中| 国产精品尤物铁牛tv| 亚洲视屏在线观看| 九九线精品视频在线观看| 毛片在线看网站| 久久人妻xunleige无码| 欧美精品成人| 国产成人1024精品下载| 广东一级毛片| 欧美区在线播放| 天堂成人av| 日韩在线2020专区| 欧美在线视频不卡第一页| 亚洲第一极品精品无码| 91福利国产成人精品导航| 综合亚洲色图| 国产一级毛片高清完整视频版| 国产成人精品无码一区二| 国产偷倩视频| 91精品国产情侣高潮露脸| 亚洲视频二| 国产精品视频导航| 伊人久久精品无码麻豆精品| 国产精品欧美日本韩免费一区二区三区不卡 | a在线亚洲男人的天堂试看| 伊人激情综合| 97在线碰| 538精品在线观看| 久久天天躁狠狠躁夜夜2020一| 免费av一区二区三区在线| 97视频在线观看免费视频| 99视频在线免费观看| 黄色一及毛片| 国产簧片免费在线播放| 国产欧美成人不卡视频| 欧美亚洲国产一区| 免费一级α片在线观看| 影音先锋丝袜制服| 欧美亚洲一区二区三区导航 | 欧美伦理一区| 无码有码中文字幕| 呦女亚洲一区精品| 在线精品亚洲国产| www.精品国产| 亚洲人成在线免费观看| 免费毛片视频|