999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于AE-OCSVM模型的電力大數據異常值檢測方法

2024-12-14 00:00:00劉陽
今日自動化 2024年11期
關鍵詞:大數據模型

[關鍵詞]AE-OCSVM 模型;電力;大數據;異常值檢測方法

[中圖分類號]TP311.13 [文獻標志碼]A [文章編號]2095–6487(2024)11–0124–03

在過去的幾十年中,異常值檢測技術已從簡單的統計測試發展到復雜的機器學習方法。簡單統計方法主要有3sigma 準則、四分位算法、Z-score 等。復雜的機器學習方法主要為K-Means 聚類、孤立森林、隨機森林、DBSCAN 等。文獻[1] 基于改進的K-Means和DNN(深度神經網路)對數據進行檢測,對大數據的異常情況進行檢測與修正;文獻[2] 融合異常檢測與區域分割的高效K-Means 聚類算法提高算法執行效率;文獻[3] 對K-Means 聚類進行了相應的改進,提高了異常值檢測效率;文獻[4] 結合SVM 和孤立森林算法進行檢測,可快速有效地識別出異常值;文獻[5] 結合孤立森林算法和改進X-Means 保障了數據的穩定性;文獻[6] 使用DBSCAN 算法進行檢測,提高了準確率、適用性和魯棒性。然而目前異常值檢測依然面臨著一系列挑戰,因此,文章提出一種AEOCSVM(深度自動編碼一類支持向量機)組合算法對異常值進行檢測,以適應高維大數據的情況。該方法首先用深度自動編碼對輸入空間降維和特征表示,然后基于支持向量和余量的OC-SVM 進行異常預測。對9 種不同的算法進行分析對比,結果顯示,能夠有效提高預測準確性和精確度。

1"AE-OCSVM

2.2評價指標分析

準確度指總樣本中準確預測的百分比。雖然準確率可判斷整體準確率,但在樣本不平衡的情況下,其并不是衡量結果的好指標。例如,在樣本集中,有90個正樣本和10 個負樣本,樣本嚴重失衡。在這種情況下,只需要將所有樣本預測為正樣本,就可以獲得90% 的準確率,但這完全沒有意義。對于新數據,根本沒有準確性。因此,在樣本不平衡的情況下,所獲得的高精度沒有任何意義,并且精確度將無效。因此,需要找到新的指標評估該模型的優缺點。

精確度指預測結果,即在所有預測為正的樣本中,樣本實際為正的概率。精確度和準確度看起來很相似,但概念完全不同。精確度表示正樣本結果中預測的準確性,準確度表示整個預測的準確性,包括正樣本和負樣本。

召回率是針對原始樣本的,這意味著在實際為正的樣本中被預測為正樣本的概率。

Precision 和Recall 可用P-R 圖表示。為確定P-R曲線上最佳閾值點,希望準確率和召回率高,但事實上這兩個指標相互矛盾,無法達到雙高。因此,選擇正確的閾值點需要根據實際問題的要求,例如,如果想要高精度,必須犧牲一些召回率;為了獲得高的召回率,必須犧牲一些精確度。但通常,可根據他們之間的平衡來定義一個新的指標,即F1 指數。F1 指數平衡了準確度和召回率,同時考慮了準確度和召回率。

2.3結果對比分析

在準確性方面,Isolation Forest 和OC-SVM 的準確性低于80%,Isolation Forest 算法模型測量的數據最低準確性為0.6184,比平均值0.7975 低近10個百分點。剩余算法模型的最高精度為PCA+GMM(TN=0),為0.8508,并且PCA+ KMeans、DBSCAN、DAGMM、LOF、AE-OCSVM、VAEGMM 在(0.8000,0.8500)的區間內增加。在精度方面,OC-SVM 和DBSCAN 算法的精度特別突出,比其余算法模型高出約5 個百分點。DAGMM、VAEGMM 和AE-OCSVM與其余算法模型相比具有約1~2 個百分點的優勢。召回數據的狀態和準確性相似,Isolation Forest 和OC-SVM 遠未達到平均水平,PCA GMM(TN=0)尤為突出,其值為0.9444。F1 指數是精度和召回率平衡的結果,Isolation Forest 和OC-SVM 的指數比其他算法低,其余算法的F1 指數在90% 左右略有波動。

基于以上分析,Isolation Forest 的4 個指標相對較低,數據處理能力最差。OC-SVM 和DBSCAN 只具有更高的精度,而準確度、召回率和F1 指數都低于平均值,但DBSCAN 的評估指標值高于OC-SVM,并且都適合于只注重準確度的試驗數據處理。除準確度一般外,PCA+GMM(TN=0)的準確度、召回率和F1 指數在所有模型中最高,數據處理能力最好。PCA+K-Means 的值都是平均值,其余數據模型的數據處理能力相對較強且相似。具體的選擇取決于試驗對象。9種不同算法分析見表1。

3結束語

針對電力數據維數較高,數量龐大,以及數據的多源異構特點,文章引入深度自編碼模型(AE),提出了AE-OCSVM(深度自動編碼一類支持向量機)組合算法對異常值進行檢測。試驗結果表明,該方法取得了良好的檢測效果,準確率,精確率,召回率和F1指數4個指標在9個模型對比分析中具有突出優勢,能夠處理電力高維大數據的異常值檢測情況。

猜你喜歡
大數據模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
一個相似模型的應用
主站蜘蛛池模板: 亚洲免费毛片| 欧美一区精品| 亚洲男人的天堂网| 亚洲福利一区二区三区| 日韩精品亚洲一区中文字幕| 国产成人AV大片大片在线播放 | 亚洲精品午夜无码电影网| 全部无卡免费的毛片在线看| 欧美一级夜夜爽| 国产视频欧美| 免费在线视频a| 自拍偷拍一区| 综合色在线| 伊人成人在线视频| 内射人妻无码色AV天堂| 亚洲熟妇AV日韩熟妇在线| 国内老司机精品视频在线播出| 最新精品久久精品| 国产电话自拍伊人| 国产91色在线| 久久综合伊人 六十路| 永久成人无码激情视频免费| 欧美日韩中文国产va另类| 亚洲国产成熟视频在线多多| 99爱在线| 91福利国产成人精品导航| 精品久久高清| 欧美一道本| 国产一在线| 国产三级a| 久久久久久国产精品mv| 欧美日韩精品一区二区在线线 | 精品国产福利在线| 亚洲水蜜桃久久综合网站| 极品国产一区二区三区| 福利视频99| 蜜桃视频一区| 青青青国产精品国产精品美女| 日本午夜影院| 免费在线视频a| 国产精品成人啪精品视频| 欧美亚洲一区二区三区在线| 午夜国产大片免费观看| 日韩国产黄色网站| 青青操视频在线| 国产精品网址在线观看你懂的| 亚洲区视频在线观看| 亚洲精品色AV无码看| 免费A∨中文乱码专区| 免费一级α片在线观看| 国产真实二区一区在线亚洲| 国产91精选在线观看| 国产白浆视频| 亚洲男人在线| 成人va亚洲va欧美天堂| 人妻无码一区二区视频| 久久久久中文字幕精品视频| 亚洲美女高潮久久久久久久| 国产在线观看人成激情视频| 亚洲性一区| 九色在线观看视频| 精品人妻AV区| 成人综合网址| 国产国产人在线成免费视频狼人色| 免费国产福利| 欧洲极品无码一区二区三区| 欧美亚洲欧美| 精品亚洲麻豆1区2区3区| 干中文字幕| 亚洲欧洲日韩久久狠狠爱| 伊人色天堂| 亚洲最大情网站在线观看| 97在线碰| 国产亚洲欧美日韩在线一区| 欧美国产日韩在线观看| 国产精品三区四区| 亚洲swag精品自拍一区| 日韩av高清无码一区二区三区| 九九这里只有精品视频| 9999在线视频| 高清无码手机在线观看| 日韩欧美一区在线观看|