潘巍 馬培軍 李東
0引言
特征選擇在機器學習和模式識別領域扮演著重要的角色,可以有效降低數據存儲空間和分類學習的計算時間。最近十幾年,特征選擇已經在圖像識別Ⅲ,漢字識別,基因分類等方面得到了廣泛的應用。通常來說,可以將特征選擇方法按照其構造的模式分為兩類:Filter模式和wrap—per模式。在wmpper模式中,特征選擇的方法主要是在特征選擇空間中對所有可能的特征子集進行評估的一種方法,這種方法是比較費時的。Filter模式是根據一定的評估甬數作為搜索策略,并使這個函數最大化或最小化從而選取特征子集;例如基于距離的特征評估算法,互信息方法等方法都屬于后者。