聚類是將數據對象分成類和簇的過程,使同一個簇中的對象之間具有很高的相似度,而不同簇中的對象相似度低。針對聚類分析,日前國內外對聚類挖掘算法的研究眾多,其中基于網格的聚類算法和基于密度的聚類算法成為聚類算法中最重要的兩種方法。基于網格的聚類方法主要采用網格技術對空間進行劃分,以單一的網格對象作為聚類處理目標,忽略其內部的所有數據屬性。這樣處理的一個突出優點就是速度快、聚類效率高。但是利用網格技術存在的最大問題是沒有涉及聚類邊界點的處理,可能造成聚類邊界對象的丟失,導致聚類精度的降低。而基于密度的聚類方法是將簇視為對象空間中被低密度區域分割開的高密度對象區域。此方法主要的優點就是可以發現任意形狀的類簇,但是對主存要求較高,主要由于在密度聚類過程中對每一個對象必須與其他對象求解其距離。因此,合理地設計出質量精確和時問效率高的聚類算法,成為數據挖掘領域迫切需要解決的問題,也是一個難點問題。