王學恩 韓德強 韓崇昭
摘要:針對粗糙模糊C均值聚類的閾值、權重選取問題,提出了一種基于不確定性度量的參數自適應獲取方法。該方法將閾值選取歸結為一個最優劃分尋找問題,給出一種基于方差的劃分優劣評價方法;利用信息熵來度量樣本歸屬的模糊性,基于該模糊性度量和類簇的粗糙度.提出了一種權重參數自適應計算方法。將所提方法應用于粗糙模糊C均值聚類,并將分別基于所提方法與典型參數選取方法的粗糙模糊C均值聚類算法在人工數據集和真實數據集上進行實驗比較。結果表明,基于所提參數確定方法的粗糙模糊C均值聚類能獲得更好的聚類有效性和準確性。