李 策,王保云,高 浩
(南京郵電大學 自動化學院,江蘇 南京 210003)
基于自適應粒子群算法的特征選擇
李 策,王保云,高 浩
(南京郵電大學 自動化學院,江蘇 南京 210003)
在模式分類問題中,數據往往存在不相關或冗余的特征,從而影響分類的準確性。特征選擇的提出,很好地解決了這一問題。特征選擇的關鍵在于利用最少的特征獲得最佳的分類效果。為了達到這一目的,一種基于自適應粒子群的特征選擇的理論被提出。相比于原始的粒子群算法,在初始過程中引入混沌模型增加其初始粒子的多樣性,在更新機制中引入自適應因子增加其全局搜索能力。同時將特征數目引入到適應度函數中,在迭代前期通過懲罰因子調節分類準確率和特征數目對于適應度函數的影響,在迭代中后期懲罰因子恒定,使特征數目對于適應度函數的影響趨于穩定。自適應粒子群算法具有很好的全局收斂性,能夠避免陷入局部最優,尤其適合高維數據的降維問題。大量的理論分析和仿真實驗的結果表明,與其他粒子群算法(PSO)的特征選擇結果相比,在數據特征數目各異的情況下,該算法具有更好的分類效果,同時表明了所提算法的可行性以及優越性。
特征選擇;粒子群算法;分類;自適應;封裝
特征選擇也叫特征子集選擇。指從已有的特征中選擇N個特征使系統的特定目標最優化,從輸入特征中選擇出一些最有效特征以降低數據集維度的過程[1],是提高學習算法性能的一個重要手段,也是模式識別中關鍵的數據預處理步驟。……