魏斐斐



摘要:為改善孤立森林算法建立二叉樹時隨機選擇屬性進行數據分割,構建孤立森林時可能出現一些性能較差的冗余二叉樹,導致模型精度不高的問題,應用一種區間套搜索算法對初始構建的孤立森林搜索森林劃分閾值,去除性能較差的孤立二叉樹,構建性能更優的孤立森林,提出一種自適應閾值的改進孤立森林算法(Adaptive-iForest) 。選取UCI經典數據集中Breastw、Ionosphere、Satellite、Shuttle、Pendigits 5個數據集進行實證分析,對比iForest、LOF兩個算法,AdaptiveiForest算法的精度與AUC值均有不同程度提升。
關鍵詞:異常數據檢測;改進孤立森林算法;區間套搜索算法;自適應閾值;UCI數據集
中圖分類號:TP301.6 文獻標識碼:A
文章編號:1009-3044(2024)10-0020-03