999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于譜聚類的離群檢測

2023-07-10 15:12:29馮超羅杰
計算機應用文摘 2023年11期

馮超 羅杰

關鍵詞:譜聚類;候選離群因子;離群點檢測;kNN

中圖法分類號:TP311 文獻標識碼:A

1引言

目前,數據挖掘技術大多集中于挖掘數據集中數據對象的常規數據模式,然而并不是所有的數據對象都符合這種常規模式。數據集中一些新穎、不符合常規的少部分異常模式通常被視為噪聲或異常而被拋棄,然而在很多應用中,這些小眾的數據模式可能蘊涵重要的隱藏信息,如入侵行為、欺詐行為、醫學上疾病前期的征兆等。這些稀有的異常模式通常被稱為離群點,目前關于離群點并沒有一個廣泛認可的定義,按照Hawkins的觀點:“離群點是偏離其他觀察點非常大的觀察點,以至于懷疑它是由不同的機制所產生的”。離群點挖掘的目的是在大量復雜的數據集中發現這些小部分的異常模式。

近年來,基于數據挖掘概念的離群點檢測技術已經取得一定的研究成果,大致可分為基于分布的離群點檢測方法、基于密度的離群點檢測方法、基于距離的離群點檢測方法和基于深度的離群點檢測方法。譜聚類是近年來新出現的一種極具競爭力的聚類算法,它建立在譜圖理論基礎上,實質是將原始數據點映射到它的譜特征空間上,然后用K-means,C -means等方法對譜特征空間聚類實現原始數據集的聚類。與傳統的K-means,EM聚類算法相比,譜聚類的優勢在于聚類可以在任何形狀的樣本空間上進行并且能夠收斂于全局最優解,因此逐漸受到廣大數據挖掘研究者的重視。由于譜聚類算法只與數據的點數有關,而與維數無關,因此可以避免由高維特征向量造成的奇異性問題。另外,譜聚類可用于大規模數據集。離群點代表的是一種不同于主體結構特征的結構,鑒于譜聚類算法的諸多優勢,將譜聚類方法引入離群數據挖掘中顯得尤為重要,這將有利于從結構特征分析數據對象,并發現離群點與主體結構特征的相異之處,最終實現離群數據的挖掘。

本文在研究了離群數據挖掘和譜聚類相關理論的基礎上,提出一種新型的基于譜聚類算法的離群點檢測方法。仿真驗證了該方法不僅在低維數據上有很好的效果,并且對高維及高維空間上的離群點檢測具有更好的效果,這為目前基于距離和密度的離群點檢測方法在高維數據空間上存在維數災難等問題提供了重要的參考價值。

3仿真結果

以人工合成數據集為例,數據總數為140,其中索引號為0,80,81,82,106,116,124的數據點為離群點,索引號為0,106,116的數據點為局部離群點,索引號為80,81,82的點組成了離群簇,索引號為124的點為全局離群點。我們對所有數據點的kNN譜聚類求出的特征值和特征向量進行了分析,圖1表示所有點譜聚類后第二小特征值與該點的kNN譜聚類后第二小特征值組的平均值的偏離程度。

圖1中橫線表示偏離閾值的分割線,橫線以上部分是偏離值大于0.05的數據點,總數為24,橫線以下部分是偏離值小于0.05的數據點,總數為116。之所以選擇閾值為0.05,從統計學角度考慮,離群點一般是在數據集中出現概率小于某一閾值的數據點,在整個數據集中只占一小部分,為了得到包含所有離群點的最小候選離群點集,一般將偏離值選擇為大于該值的數據點個數占整個數據集規模的15%~20%。從圖1中可以看到,偏離程度大于0.05的數據點中包含所有的離群點。因此,我們受到啟發:對于數據集中每個數據點的k個鄰近點組成的數據集通過譜聚類算法求出的第二小特征值,以及該點每個k鄰近點的kNN組經過譜聚類后得到的第二小特征值組的平均值,這2個值的差值越大的那些點意味著離群。

4結束語

通過譜聚類算法求解的特征值和特征向量,包含關于離群點和正常數據點譜的豐富信息。為了彌補傳統方法的不足和充分利用特征空間的信息,本文提出了一種基于譜聚類的離群點檢測的新思路。該算法的優點在于對大規模和高維數據集上的離群點檢測具有很高的參考價值。

作者簡介:

馮超(1986—),本科,工程師,研究方向:網絡安全、個人信息保護。

羅杰(1985—),碩士,工程師,研究方向:網絡安全、數據安全。

主站蜘蛛池模板: 99久久精品久久久久久婷婷| 国产成人三级在线观看视频| 久久网欧美| 1级黄色毛片| 刘亦菲一区二区在线观看| 国内丰满少妇猛烈精品播| 日韩人妻少妇一区二区| 热热久久狠狠偷偷色男同| 久久99蜜桃精品久久久久小说| 亚洲无码高清视频在线观看| 亚洲性一区| 欧美日韩一区二区三| 91午夜福利在线观看| 韩国v欧美v亚洲v日本v| 婷婷亚洲视频| 直接黄91麻豆网站| 久久久久人妻一区精品| 日本中文字幕久久网站| 91色国产在线| 伊人久久综在合线亚洲2019| 一本大道在线一本久道| 福利在线不卡一区| 岛国精品一区免费视频在线观看| 日韩精品一区二区三区中文无码| 亚洲swag精品自拍一区| 亚洲欧美一区二区三区蜜芽| 58av国产精品| 精品无码国产一区二区三区AV| 国产成人免费| 国产精品午夜福利麻豆| 野花国产精品入口| 九色视频在线免费观看| 成人字幕网视频在线观看| aⅴ免费在线观看| 精品夜恋影院亚洲欧洲| 色噜噜在线观看| 任我操在线视频| 免费国产小视频在线观看| 国产18在线播放| 九色免费视频| 九月婷婷亚洲综合在线| 国产精品欧美激情| 亚洲三级a| 欧美日韩综合网| 国产成人av一区二区三区| 国产a在视频线精品视频下载| 色网站在线视频| 国产精品毛片一区| 黄色网在线| 久久综合国产乱子免费| 午夜福利无码一区二区| 国产成人1024精品| 一本大道视频精品人妻| 在线一级毛片| 日韩欧美视频第一区在线观看| 国产综合亚洲欧洲区精品无码| 成人av手机在线观看| 一本综合久久| 欧美综合激情| 中美日韩在线网免费毛片视频 | 中文字幕久久亚洲一区| 亚洲欧洲日韩综合| 在线免费亚洲无码视频| 欧美特黄一免在线观看| 亚洲国产精品一区二区高清无码久久| 精品亚洲麻豆1区2区3区| 久久精品国产精品青草app| 婷婷亚洲视频| 欧美亚洲欧美| 91精品国产丝袜| 日韩福利在线视频| 97精品国产高清久久久久蜜芽| 精品欧美一区二区三区久久久| 欧美影院久久| 美女被躁出白浆视频播放| 久久视精品| 国内熟女少妇一线天| 精品视频一区二区三区在线播| 亚洲日韩第九十九页| 亚洲乱伦视频| 青青草国产一区二区三区| 国产凹凸视频在线观看|