傳統(tǒng)的對病變組織樣本的分類主要依賴醫(yī)學(xué)工作者積累的經(jīng)驗,主觀性較大,并且沒有實質(zhì)的醫(yī)學(xué)和生物依據(jù)。從生物信息學(xué)的角度來講,利用選取樣本的分類特征基因作為病變組織的分類特征來尋找和研究與疾病有關(guān)的基因表達(dá)特征,具有重要的生物學(xué)意義。然而,數(shù)據(jù)集中的每個樣本都記錄了組織樣本中所有可測基因的表達(dá)水平,而實際上只有少數(shù)基因才真正與樣本分類相關(guān)。因此如何選取對樣本分類而言至關(guān)重要的一組特征基因是樣本分類的關(guān)鍵所在。鑒于樣本分類特征基因選取的重要性,研究者們針對該問題作了大量分析研究。