摘要:提出一種基于矩陣加權關聯(lián)規(guī)則的空間粒度聚類算法。該算法核心思想是根據(jù)文檔特征向量矩陣提取文檔的相似度,再在該關聯(lián)規(guī)則算法上進行聚類來尋找相似關系的頻繁項集。通過引入核函數(shù),樣本點被非線性變換映射到高維特征空間進行聚類,提高聚類性能。通過矩陣加權關聯(lián)規(guī)則算法進行聚類。通過實驗表明,在處理中小型文檔時,該算法的精確度優(yōu)于傳統(tǒng)Apriori算法和K-mean算法;在處理大型文檔時,該算法的時間復雜度小于傳統(tǒng)的K-mean算法。
關鍵詞:關聯(lián)規(guī)則;粒度;聚類算法;頻繁項集
中圖分類號:TP39 文獻標識碼:A