王自強 馮博琴
摘要:為了高效地從數據庫中挖掘分類規則,提出了一種基于免疫算法的分類算法.該算法的核心思想為:對規則的前件進行固定長度編碼,適應度函數的計算由分類規則的較小分類錯誤率、簡潔性、一致性和訓練實例的覆蓋性構成,通過把適應度最小的個體作為先驗知識來修改個體的某些分量的方法進行疫苗接種,并通過檢測個體是否出現退化和模擬退火來實現免疫選擇,同時還采用了基于信息增益的規則剪枝策略.在美國加州大學標準數據集中的5個數據集上將該算法與RISE和OCEC算法進行了實驗比較,結果表明該算法不僅具有更快的收斂速度,而且獲得了更高的預測準確率及更小的規則集.
關鍵詞:數據挖掘;分類規則;免疫算法;信息增益
中圖分類號:TP18文獻標識碼:A文章編號:0253—987X(2005)02—0111—04