摘要:針對現有的微陣列數據集成分類方法分類精度不高這一問題,提出了一種BaggingPCASVM方法。該方法首先采用Bootstrap技術對訓練樣本集重復取樣,構成大量訓練樣本子集,然后在每個子集上進行特征選擇和主成分分析以消除噪聲基因與冗余基因;最后利用支持向量機作為分類器,采用多數投票的方法預測樣本的類屬。通過三個數據集進行了測試,測試結果表明了該方法的有效性和可行性。
關鍵詞:微陣列數據; 主成分分析; 特征選擇; 支持向量機; 集成分類
中圖分類號:TP391文獻標志碼:A
文章編號:10013695(2010)01010403
doi:10.3969/j.issn.10013695.2010.01.031