武方方 趙銀亮 蔣澤飛
摘要:為了解決支持向量機的分類僅應用于較小樣本集的問題,提出了一種密度聚類與支持向量機相結合的分類算法。在密度聚類中,當一個樣本點不存在擬密度可達的樣本點,則其顯著特征即表現為該簇的邊緣點,將該點加入約簡集合,直至選出樣本集合中的所有邊緣對象,然后再利用約簡集合尋找支持向量.實驗表明,采用該算法,分類的準確率可從基于無監督聚類的支持向量機算法的86.81%提升至95.43%,核函數計算量由原數量級109下降到106以下,采取限制密度聚類中的核心點卜鄰域內的反例百分比的方法,可以增加約簡樣本的個數,可將分類準確率提高5%~8%左右。
關鍵詞:支持向量機;密度聚類;ε-領域
中圖分類號:TP301.6文獻標識碼:A文章編號:0253—987X(2005)12—1319—04