999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于kNN算法的智能電網5G海量接入數據異常檢測

2024-04-29 00:00:00林舒嫄林曉敏歐亞闞雙星莫裕全
粘接 2024年2期
關鍵詞:智能檢測

doi:10.3969/j.issn.1001-5922.2024.02.041

摘 要:為了更好適應智能電網高維數據異常識別,提出了一種加權kNN數據異常值檢測識別方法,該方法使用Z階曲線來識別kNN。利用Z階曲線,提出了一種加權kNN異常數據檢測方法。用信息熵衡量所有屬性的重要性,用Z階曲線對高維數據進行編碼并映射為Z值。實驗結果表明,智能電網集群計算節點的數量越多,算法的運行速度就越短。發電數據異常檢測準確率達到最高99.2%,較隨機森林算法提高8.165%。且kNN算法的運行時間均優于隨機森林算法運行時間,最小算法運行時間為4 s,進一步表明kNN算法可有效檢測智能電網5G海量接入數據。

關鍵詞:kNN算法;智能電網;5G;數據異常;檢測

中圖分類號:TP18" " " "文獻標志碼:A" " " "文章編號:1001-5922(2024)02-0155-04

Abnormality detection of 5G massive access data of smart grid based on kNN algorithm

LIN Shuyuan1,LIN Xiaomin1,OU Ya2,KAN Shuangxing3,MO Yuquan3

(1.Fujian Power Trading Center Co.,Ltd.,Fuzhou,350001,China;

2.Fujian Power Supply Service Co.,Ltd.,Fuzhou,350001,China;

3.Shanghai Hill Management Consulting Co.,Ltd.,Shanghai,201210,China)

Abstract:In order to better adapt to the identification of high-dimensional data anomalies in smart grids,a weighted kNN data anomaly detection and recognition method was proposed,which used Z-order curves to identify kNN.A weighted kNN anomaly data detection method was proposed using Z-order curves.The importance of all attributes was measured with information entropy,and high-dimensional data was encoded and mapped to Z-values with Z-order curves.The experimental results showed that the more computing nodes there were in the smart grid cluster,the shorter the running speed of the algorithm.The accuracy of anomaly detection in power generation data reached a maximum of 99.2%,which was 8.165% higher than the random forest algorithm.Moreover,the running time of the kNN algorithm was better than that of the random forest algorithm,with a minimum algorithm running time of 4 seconds,further indicating that the kNN algorithm can effectively detect massive 5G access data in the smart grid.

Key words:KNN algorithm;smart grid;5G;data anomalies;detection

隨著智能電網快速的發展,5G海量接入數據量呈爆發性增長。在5G海量數據中,部分異常數據會誘發智能電網異常行為或模式,包括硬件故障或惡意數據侵入[1-2]。從數據中識別異常值對于智能電網安全運行至關重要。

k最近鄰(kNN)是一種最簡便的機器學習方法[3],是一種可以在多維空間中查詢與識別最近 k個對象的方法,廣泛用于數據庫異常值檢測[4]。研究表明kNN算法難以適應多維數據集,無法從多維數據集識別數據異常值[5]。提出了一種非參數自適應檢測算法,該算法通過k最近鄰估計異常數據[6]。然而,k最近鄰(kNN)在全空間中計算仍在高維數據中存在無法識別異常值等情況[7]。而在實際應用中,每個屬性的重要性是不同的[8]。忽略屬性的重要性將嚴重影響kNN算法的智能電網5G海量接入數據異常檢測?;诖?,研究利用Z階曲線,提出了一種加權kNN異常數據檢測方法。用信息熵衡量所有屬性的重要性,用Z階曲線對高維數據進行編碼并映射為Z值。每個對象的加權kNN算法根據Z值進行數據識別,可以進一步提高kNN算法在高維空間中的異常數據檢測效率。并利用實驗結果驗證加權kNN算法在智能電網5G海量接入數據異常檢測的有效性。

1"kNN分類算法概述

在采用加權 k近鄰算法求出各物體的 k近鄰時,要充分考慮各物體的屬性重要性(權重)\[9\]。在5G智能電網中,由于缺少對智能電網5G海量接入數據的理解,因此,屬性的重要程度不能被直觀地反映出來。因此可以用信息熵的平均值來表示各個離散信息的不確定性,從而更好地解決了各個指標權重的不確定性問題。

1.1"k 最近鄰 (kNN)異常值識別算法

kNN算法是模式識別領域的一種非參數分類或回歸算法\[10\]。假設有一些訓練數據具有多個屬性和一個標簽。kNN分類算法的目的是獲取測試數據的標簽。具體流程如下。

(1)準備訓練數據和測試數據。有m組訓練數據,每組有n個屬性{σi1,σi1,…σin},同時包含一個標簽ti,其中i∈[1,m]。假設測試數據為{q1,q2,…,qn,}。

(2)計算每個訓練數據和測試數據之間的歐幾里德距離di。即

di=(q1i12+…+(qnin2,i∈[1,m](1)

(3)所有的距離di和它相應的標簽ti生成一個有序的集合,即

C={(d1,t1),(d2,t2),…(dm,tm)}(2)

(4)根據距離di和標簽ti的有序集合C進行排序。

(5)從排序的集合C中選擇第一個標簽K。

(6)計算標簽K的頻率,將頻率最高的標簽設為測試數據的最終結果。

1.2"信息熵

信息熵是指一個不連續的隨機事件出現的平均概率\[11\]。平均信息用于反映數據源的每個離散信息的不確定性,可以有效地表征數據信息定量測量問題,并被應用于屬性權重的測量。數據源的信息熵是描述源的平均不確定性,即源的平均信息可以用所有單個符號信息的平均值來衡量,即可以用式(3)表示:

1.3"5G海量數據異常值檢測原理

在確定數據集中的所有樣本點位后,應繪制智能電網5G海量接入數據決策圖[12]。從決策圖中找出5G海量接入數據點,該點被作為數據集的聚類中心。從離群點檢測的角度來看,在決策圖中也可以直觀地看到接入數據點,這些點被確定為離群點。

考慮到智能電網電力數據的特點,可以假設離群值應滿足以下條件:(1)局部密度小于局部密度的閾值,即pilt;pf;(2)相對距離小于相對距離的閾值,即δilt;δf。局部密度的閾值pf可以通過以下方式計算:

相對距離的閾值δf可以通過以下方式計算:

式中:N表示權重數據集中的樣本總數,δi和εδ表示經驗參數。

1.4"加權kNN算法

加權kNN算法的數據識別方法有LSH、Voronoi圖和Z階曲線等。其中Z階曲線是一條空間填充曲線,它在高維空間中每個離散的網格都會經過并只經過一次。原來的高維空間查詢被轉化為線性空間范圍查詢[13]。因此,Z階曲線可以很好地保護高維數據之間的接近性,并且可以應用于不同密度的數據集。

因此提出基于Z階曲線加權kNN的方法,該方法可以有效地解決多個問題。將每一數據目標與Z階的一條直線上的某一點相對應,此點被稱作 Z值,可以將加權kNN算法的樣本辨識問題轉換成一維的Z值檢測值\[14-16\]。當一個數據目標的全部性質被賦權并且被映射成一個 Z階曲線時,對象的加權kNN數據識別就轉化為與識別對象Z值最接近的k個對象的查詢。

2"試驗結果與討論

2.1"kNN算法可擴展性

使用電網數據集S1、S2和S3,對kNN算法的可擴展性進行研究分析,其S1、S2和S3數據集分別包含200 000、550 000和800 000個對象。

圖1 (a)為5G大規模訪問數據處理節點數量對于智能電網5G網絡中異常信息辨識的有效性。隨著節點數量的減少,算法所需的計算時間也隨之增加。而 kNN算法中各數據目標的離群系數的運算是平行的,與節點數量無關。因此,kNN算法的運行時間與數據對象的數量呈線性關系。

圖1(b)為數據節點數量變化時,智能電網數據集的運算速度變化趨勢。由圖1(b)可知,智能電網5G海量數據節點的數量越多,運算速度越快。且當智能電網5G數據量較小時,智能電網HDFS文件系統中的數據塊數量將減少,這將導致kNN算法的運算速度減少。同時,隨著智能電網5G海量接入數據節點增加,所需時間也相應縮短。從理論上講,該算法的運算速率應與計算節點數目成正比,然而,在實際應用中,由于計算節點數目的增多,會導致網絡的傳輸速率增大。因此,并行性的影響將會越來越小。

2.2"異常數據識別準確性

利用智能電網5G海量接入數據集,測試kNN算法和唐賡[17]學者提出的隨機森林算法的異常數據識別精度。假設m、n、t、q分別為數據記錄的數量、屬性、訓練數據記錄和查詢數據。查詢數據從數據集中隨機選擇。因此,每個智能電網查詢數據都有自己的標簽,可以判斷kNN算法的分類結果是真是假。智能電網數據集參數設置如表1所示。

由表1可知,共使用了3個不同的數據集。第2個數據集為電網施工現場異常數據集,共有1 728個數據記錄和4個不同的標簽,包括施工現場電線短路、電線電壓超載、電流超載和電網設備故障,且每個數據記錄都有6個屬性。將前1 400條記錄設置為訓練數據,將其他328條記錄設為測試數據。第3個數據集是系統異常數據集,共有830個數據記錄,具有5個屬性和2個不同的標簽,包括系統硬件故障和系統軟件故障。在該數據集中,前600個數據記錄為訓練數據,而其他230個數據記錄則為測試數據。第三個數據集為發電異常數據集,該數據集在智能電網中具有重要的應用,包括發電耗電量、發電電壓異常數據等??偣灿?0 000個數據記錄,11個屬性和2個不同的標簽。在該數據集中,前8 000個數據記錄為訓練數據,后2 000個數據記錄為測試數據。

kNN和隨機森林算法性能對比如表2所示。

由表2可知,發電數據異常準確率達到最高為99.2%,較隨機森林算法提高8.165%。而電網現場異常數據與系統異常數據最大準確率為98.5%,最小準確率為87.5%。kNN算法可以有效識別電網現場異常數據及系統與發電異常數據。且所提出的kNN算法可以有效識別智能電網5G海量接入數據異常,從而保證智能電網正常運行。kNN算法和隨機森林算法對異常數據的識別精度均大于95.1%,其中電網現場異常數據精度達到最高99.1%,同時kNN算法的運行時間優于隨機森林算法運行時間,最小算法運行時間為4 s。

3"結語

研究提出了基于kNN算法的智能電網5G海量接入數據異常檢測。利用加權kNN算法,以適應智能電網高維數據異常識別。所提出的kNN算法準確率、精度、算法時間均優于隨機森林算法,且kNN算法的運行時間與數據對象的數量呈線性關系,kNN算法可以有效識別電網現場異常數據及系統與發電異常數據。且所提出的kNN算法可以有效識別智能電網5G海量接入數據異常,從而保證智能電網正常運行,結果表明kNN算法可有效識別智能電網5G海量數據異常值檢測。

【參考文獻】

[1]齊波,冀茂,鄭玉平,等.電力物聯網技術在輸變電設備狀態評估中的應用現狀與發展展望[J].高電壓技術,2022,48(8):3012-3031.

[2]王定發.基于線纜狀態數據的特征集成及異常信息自動檢測技術[J].粘接,2023,50(5):188-192.

[3]王九思,王日南.5G與能源互聯網深度融合在智能電網中的應用[J].電站系統工程,2021,37(5):76-78.

[4]錢浩,羅少杰,郭強,等.基于5G通信的有源配電網多方向故障恢復策略[J].供用電,2022,39(12):1-10.

[5]劉震宇.基于支持向量機的電力系統調度數據異常檢測方法[J].自動化技術與應用,2023,42(6):24-27.

[6]張云峰,魏星,諸駿豪,等.基于電力通信動靜態資源的光纜數據監測系統設計[J].粘接,2022,49(2):92-96.

[7]李春生,田夢晴,張可佳.基于Bi-LSTM網絡的管道異常數據檢測方法[J].計算機技術與發展,2023,33(6):215-220.

[8]張仁斌,左藝聰,周澤林,等.基于多模態生成對抗網絡的多元時序數據異常檢測[J].計算機科學,2023,50(5):355-362.

[9]徐飛陽,薛安成,常乃超,等.電力系統同步相量異常數據檢測與修復研究現狀與展望[J].中國電機工程學報,2021,41(20):6869-6886.

[10]黃文杰,秦芳麗,鄧舒遲,等.基于負載均衡聚合技術的配電網數據信息智能化提升研究[J].粘接,2023,50(5):193-196.

[11]王鋒,高欣,賈欣,等.一種基于對數區間隔離森林的電力調度數據異常檢測集成算法[J].電網技術,2021,45(12):4818-4827.

[12]金鵬,夏曉峰,喬焰,等.基于深度信念網絡的高維傳感器數據異常檢測算法[J].傳感技術學報,2019,32(6):892-901.

[13]黃欣,趙敏彤,郇嘉嘉,等.基于BWO-DBSCAN和CSA-OCRKELM的變電站數據流異常檢測方法[J].廣東電力,2023,36(5):39-48.

[14]拓廣忠,葛樹峰,李榮讓,等.基于熵值法和DEA的電力監測異常數據自動識別算法研究[J].微型電腦應用,2023,39(4):160-163.

[15]王建元,劉柯辰.基于經驗模態分解與多視角聚類的異常用電模式檢測[J].電器與能效管理技術,2023(3):73-80.

[16]李強,張立梅,白牧可.基于多元數據特征和改進隨機森林的智能配電網異常數據辨識[J].科學技術與工程,2023,23(5):2007-2015.

[17]唐賡.電網同期線損檢測系統的設計與實現路徑[J].粘接,2022,49(5):170-173.

收稿日期:2023-09-05;修回日期:2023-12-02

作者簡介:林舒嫄(1988-),女,碩士,高級經濟師,研究方向:智能電網等;E-mail:linshuyqnn801@126.com。

引文格式:林舒嫄,林曉敏,歐"亞,等.基于kNN算法的智能電網5G海量接入數據異常檢測[J].粘接,2024,51(2):155-158.

猜你喜歡
智能檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
智能制造 反思與期望
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
主站蜘蛛池模板: 亚洲国产精品一区二区第一页免 | 日韩无码视频网站| hezyo加勒比一区二区三区| 国模极品一区二区三区| 久无码久无码av无码| 亚洲精品欧美重口| 在线观看91香蕉国产免费| 国产精品色婷婷在线观看| 久久香蕉国产线看观| 国产精品自在在线午夜区app| 欧美性天天| 久久久久国产精品熟女影院| 人妻无码中文字幕一区二区三区| 日韩中文精品亚洲第三区| 亚洲精品制服丝袜二区| 亚洲男人的天堂久久香蕉网| 欧美色香蕉| 中文字幕亚洲乱码熟女1区2区| 亚洲精品桃花岛av在线| 在线看国产精品| 中文字幕人成乱码熟女免费| 在线视频一区二区三区不卡| 麻豆国产原创视频在线播放| 欧美第二区| 国产永久在线观看| AV片亚洲国产男人的天堂| 久久久久青草大香线综合精品| 国产激情第一页| www.91中文字幕| 黄色成年视频| 在线观看欧美精品二区| 亚洲欧美日韩成人在线| 白丝美女办公室高潮喷水视频| 91日本在线观看亚洲精品| 18禁黄无遮挡免费动漫网站| 91九色国产在线| 亚洲无码91视频| 亚洲天堂日韩在线| 国产精品美女自慰喷水| Jizz国产色系免费| 欧美日韩国产综合视频在线观看 | 久久不卡国产精品无码| 国产精品吹潮在线观看中文| 欧美性精品不卡在线观看| 国产成人精品亚洲日本对白优播| 色欲色欲久久综合网| 亚洲综合激情另类专区| 大陆精大陆国产国语精品1024 | 九色在线观看视频| 99国产精品一区二区| 色婷婷亚洲十月十月色天| 亚洲综合精品香蕉久久网| 精品亚洲麻豆1区2区3区| 国产成人永久免费视频| 日韩人妻精品一区| 欧美日韩在线第一页| 久久精品人人做人人爽| 成人免费网站在线观看| 另类欧美日韩| 毛片免费在线| 99青青青精品视频在线| 国产亚洲精久久久久久久91| 91久久夜色精品国产网站| 免费一级α片在线观看| 特级欧美视频aaaaaa| 国产乱人激情H在线观看| 国产免费网址| 久久黄色毛片| 国产精品无码久久久久AV| 老司机久久99久久精品播放| 午夜国产精品视频| 天堂成人av| 国产成人做受免费视频| 在线观看免费人成视频色快速| 波多野结衣二区| 天天综合网站| 久久男人资源站| 国产主播在线观看| 久久亚洲欧美综合| 无码AV高清毛片中国一级毛片| 国内毛片视频| 香蕉99国内自产自拍视频|