目前用于高維數據的聚類算法包括分層聚類法、快速分類法、混合模型法及平方和方法。平方和方法的聚類準則是基于類內及類間散布矩陣的秩最大,是目前發展最快的方法,包括K-均值法和向量量化方法。平方和方法雖然能夠聚類,但研究結果表明,數據組中的分離聚類不一定代表原始數據中數據點的分離聚類。產生這種現象的原因是由于隱性地在給定數據上強加了結構,無法決定數據中存在的聚類數。Agrawal等人似設聚類存在于低維子空間,提出維數約簡方法,該方法在進行真實數據計算時并不準確。Duda等人提出的線性判別分析方法(LDA)可以監督維數約簡,其通過最大化類間距離和類內距離比進行線性變換以獲得最大區別。然而LDA中的分布矩陣可能為奇異矩陣,改進算法無法解決龐大的矩陣帶來的計算復雜性問題。