楊清宇 孫鳳偉 張曌 張迪 莊健
摘要:針對往復式壓縮機故障數據空間分布復雜、常規算法不能有效聚類的問題,提出了一種改進的譜聚類算法,該算法使用新的相似度矩陣計算方式,根據故障數據流形分布的特點引入測地線距離取代歐氏距離作為數據間的關系度量;通過計算各數據點的鄰域密度因子有效地識別和剔除了噪聲點;利用基于密度的局部歐氏距離調整方法對流形間隙過小的區域進行了處理,在幾個人工數據集和往復式壓縮機故障數據集上的測試結果表明,改進譜聚類算法對于具有流形分布、多尺度、有噪聲、流形間隙過小甚至交叉等特點的數據具有很好的聚類能力,聚類準確率比常規的k-均值和MSCA譜聚類算法分別提高了50.86%和8.6%。