999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于粗糙集的動態特征選擇算法研究

2022-04-29 18:46:35董雪
計算機應用文摘 2022年21期

董雪

關鍵詞:粗糙集;動態;特征選擇;信息量;可分辨矩陣;正域

1 引言

所謂特征選擇,顧名思義是從原始特征空間中篩選與任務相關的特征,剔除無關、冗余及噪聲特征等[1]。 在大數據時代下,由于信息量急速增加,數據集的構成具有動態變化和不確定性的特征,傳統特征選擇方法普遍面臨不能適應的問題[2]。 粗糙集理論作為一種數據分析理論,是一種處理不精確、不確定與不完全數據的數學方法,被廣泛應用于知識發現、模式識別、生物學及數據挖掘等領域,使得應用粗糙集理論解決數據特征選擇面臨的上述不確定性問題成為可能。 本文主要對粗糙集理論下的動態特征選擇方法進行研究和分析,總結現有的動態特征選擇方法,并對動態特性選擇發展趨勢進行預測。

2 相關概念

2.1 粗糙集

信息系統 S = (U,A,V,f),其中 U = { x1 ,x2 ,…,xn }是對象集,X?U,U | A 是 U 的一個劃分,X 的上下近似分別定義為

2.2 基于粗糙集的動態特征選擇框架

與靜態數據不同,動態數據常常在變化,且動態特征選擇的算法實現難度更高。 基于粗糙集的動態特征選擇是指對動態變化的數據進行特征選擇。 目前,相關研究大都是基于增量方法來處理動態數據的變化,即充分利用歷史信息,提高特征選擇效率。 動態特征選擇框架如圖 1 所示,相關學者研究的算法屬于框架中的搜索策略步驟。

3 粗糙集背景下動態特征選擇算法

基于動態特征的選擇,若仍使用經典的非增量特征選擇來處理,則會導致運行速度較慢,因此,學者設計了許多增量特征選擇算法去解決動態變化數據特征選擇的問題,歸納總結出動態特征選擇算法分為三類,即基于可分辨矩陣的動態特征選擇[4]、基于信息表示的動態特征選擇[5] 和基于正區域的動態特征選擇[6]

3.1 。 基于可分辨矩陣的動態特征選擇方法

3.1.1 基本思路

主要思路是“以不變應萬變”,即針對數據每次的變化,不須重新計算可分辨矩陣,只須在原來的可分辨矩陣上增加或刪除列,并對新矩陣進行核特征的修正,可以大大減少計算量。 在實際應用中,將增加的新樣本與原有樣本比較, 可分辨矩陣隨之增加列(行),對其他元素沒有影響。

3.1.2 研究進展

可分辨矩陣可以標識條件屬性與決策屬性之間的關系,自張春英等提出基于粗集理論中的可分辨矩陣的動態特征提取算法后,滕寶等[7]基于 S?粗集和可分辨矩陣提出一種動態特征選擇算法,用來解決單向特征遷移集合的動態變化問題,但由于每添加一個樣本就需要掃描一次可分辨矩陣,使算法的搜索空間大大增加。 基于此,錢文彬等[8]提出一種快速的動態特征選擇矩陣算法,構造了簡化矩陣,有效地縮小了算法的搜索空間;WEI 等[9] 基于可分辨矩陣,提出一種增量式動態屬性特征選擇; FELIX 等[10] 提出基于二進制的差別矩陣,使差別矩陣元素由 0 和 1 組成,把存儲空間縮小至原來的一半;XU 等[11] 更進一步地提出基于 0?1 整數規劃的動態特征選擇算法;在許多情況下,數據集往往通過引入一組數據而不是逐個引入單個對象來擴展,MA 等[12]提出一種壓縮的二進制可分辨矩陣,很好地解決了這個問題;景運革[13] 基于知識粒度提出一種高效動態特征選擇算法,在此基礎上,提出針對刪除式動態變化的特征選擇原理及算法;在大數據時代下,隨著數據的維度不斷增加,計算也隨之復雜,ZHOU 等把多維數據劃分為多個子集,利用現有子集及它們的核進行計算,避免重復計算,降低了時間復雜度。

3.2 基于信息 。 表示的動態特征選擇方法

3.2.1 基本思路

根據知識信息量或者屬性重要度以及信息熵依次剔除無關特征,利用新增的對象對原有的信息量進行修正,利用原有的信息量的結果遞歸計算信息系統變化后的信息量,并有效利用上一次的特征選擇結果很快地求出新的特征選擇。

3.2.2 研究進展

在信息系統不斷變化的情況下,劉山等[14] 利用新增對象對原有信量進行修正,對原有信息量的結果進行遞歸計算,縮減了計算量,提高了效率;對于不確定信息系統,陳亮等[15]定義了一種等價關系,以等價類決定屬性的條件信息量來定義屬性的重要度;針對多個對象被添加到一個決策表,LIANG 等[16] 提出一種基于信息熵的分組增量粗特征選擇算法;王永生等[17]以信息粒度為啟發信息,提出一種使得提取效果有較好傳承性的動態特征提取算法;對于不完備信息系統,大多數學者集中于研究動態增加時的特征選擇。 基于此,董惠玉[18] 提出一種不完備信息系統的減少式特征選擇算法;當只考慮已選特征和類別之間的動態變化信息量時,會使得特征選擇的分類準確率下降,陳永波等[19] 結合已選特征與候選特征的交互相關性來選擇相關特征,與此同時,剔除無關特征和冗余特征,提出一種基于動態相關性的特征選擇算法.

3.3 基于正區域的動態特征選擇方法

3.3.1 基本思路

此類方法不需要建立可分辨矩陣,只對等價類進行劃分,降低了時間和空間復雜度。 首先計算原始數據和動態數據的正域,然后依據兩種重要度及特征選擇搜索策略分別設計相應的特征提取算法,最后基于啟發性動態特征選擇算法,即依據特征重要度來選擇特征子集的元素。 比較動態數據提取特征前后的重要度變化情況,變化越大,說明重要度越高,就將該特征加入特征子集中,反之則不加。

3.3.2 研究進展

最初相關學者僅基于信息系統的不可分辨等價關系來規定正域,隨著粗糙集的逐漸成熟,有學者提出了很多基于粗糙集的動態特征選擇算法,如張春英等[20]針對集合元素的遷入與遷出,提出雙向概率 PS?粗糙集,并在此基礎上提出一種動態三支決策,有效提高提取特征的效率;但粗糙集只能直接處理離散化的數據,連續型數據進行離散化處理時會造成信息損失,SUN 等[21] 根據模糊集只關注知識模糊性這一特點,提出了模糊決策粗糙集模型,為動態特征選擇提供一個可以直接處理連續型數據的模型;在此啟發下,針對大規模直覺模糊信息系統數據量大、特征維數高、動態性強等特點,ZHANG 等[22] 基于直覺模糊粗糙集的相似關系和廣義動態抽樣理論,提出了一種廣義的動態特征選擇算法,同時解決了直覺模糊粗糙集無法處理大數據集的問題。

3.4 三種方法的適用類型及優缺點

基于可分辨矩陣的動態特征選擇方法、基于信息表示的動態特征選擇方法和基于正區域的動態特征選擇方法的適用類型及優缺點對比[23]如表 1 所列。

4 發展趨勢

針對動態數據中樣本對象動態變化、特征維度動態變化及特征值的動態變化三種變化情形,可以設計出多種不同的算法。 基于此,可以考慮如何利用上述三種動態特征選擇方法設計針對性算法,使效率更高。 在大數據環境下,很多信息系統是不完備的,但目前針對不完備的動態信息系統進行特征提取研究較少,這是目前動態特征選擇的一大發展趨勢。 由于模糊集具有只對知識的模糊性感興趣的良好特性,因此,如何更好地利用粗糙集理論與模糊集理論的高效結合也是動態特征選擇的又一研究方向。

5 結束語

隨著學者的不斷探索和研究,動態特征選擇算法越來越多,但由于數據的多樣性及復雜性,使得現有算法性能不佳,動態數據特征選擇方法仍面臨巨大挑戰。

主站蜘蛛池模板: 国产精品毛片一区| 亚洲自拍另类| 亚洲一区免费看| 国产熟睡乱子伦视频网站| 一级毛片无毒不卡直接观看| 噜噜噜久久| 亚洲精品大秀视频| 亚洲黄网在线| 亚洲成人动漫在线| 91人妻在线视频| 曰AV在线无码| 中文成人在线视频| 午夜视频日本| 国产91色| 天天摸天天操免费播放小视频| 九九九久久国产精品| 亚洲色图欧美在线| 久久a级片| 青草91视频免费观看| 久久福利片| 成人自拍视频在线观看| 久久国产亚洲欧美日韩精品| 无码AV动漫| 欧美视频在线播放观看免费福利资源| 好紧太爽了视频免费无码| 小说区 亚洲 自拍 另类| 色AV色 综合网站| 9啪在线视频| 日韩精品久久无码中文字幕色欲| 午夜日本永久乱码免费播放片| 91免费国产高清观看| 日韩精品一区二区三区swag| 91视频日本| 日韩毛片基地| 免费AV在线播放观看18禁强制| 国产精品嫩草影院av| 老司机精品99在线播放| 91国内在线视频| 欧美成人免费午夜全| 在线播放国产一区| 亚洲av无码专区久久蜜芽| 午夜性刺激在线观看免费| 超碰91免费人妻| 国产精品v欧美| 理论片一区| 亚洲二三区| 老司国产精品视频| 国产91成人| av天堂最新版在线| 亚洲天堂网2014| 91麻豆精品国产高清在线| 67194亚洲无码| 国产乱子伦一区二区=| 韩日无码在线不卡| 好久久免费视频高清| 中文字幕天无码久久精品视频免费 | 亚洲福利片无码最新在线播放 | 亚洲欧洲一区二区三区| 国产va在线观看免费| 午夜视频在线观看免费网站| 日韩无码真实干出血视频| 亚洲综合色婷婷| 97青草最新免费精品视频| 国产成人a在线观看视频| 久久这里只有精品66| 天天色天天操综合网| 亚洲男人在线| 成年人国产网站| 久久精品66| 亚洲无限乱码| 国产性爱网站| 91蜜芽尤物福利在线观看| 午夜天堂视频| 手机成人午夜在线视频| 99精品免费欧美成人小视频| 91无码网站| 91精品小视频| 成人精品区| 国产另类视频| 一级片免费网站| 成年人免费国产视频| 国产精女同一区二区三区久|