黃繼鵬,陳 志,芮 路,王宇虹
(南京郵電大學 計算機學院,江蘇 南京 210023)
基于模糊聚類決策樹的分布式語者識別算法
黃繼鵬,陳 志,芮 路,王宇虹
(南京郵電大學 計算機學院,江蘇 南京 210023)
為解決大規模語者識別問題中普遍存在的加性噪聲、高計算復雜度等問題,提高大規模語者識別算法的抗噪性和魯棒性,利用模糊聚類決策樹,提出了一種分布式語者識別算法。該算法將訓練數據等分成幾個部分,對這幾個部分分別使用基于模糊聚類的決策樹算法進行訓練;對于輸入的測試樣本,用建好的決策樹進行分類,判斷它屬于哪棵樹的哪個葉節點;在該選定的葉節點上使用梅爾頻率倒譜系數和高斯混合模型識別方法識別該語者身份。對訓練數據進行模糊聚類的過程主要包括四個步驟:根據相應的層提取語音特征;計算特征數據的均值和標準差得到信任間距集合;對集合使用Lloyd算法得到分隔向量;以分隔向量為基礎進行聚類分組得到下一層的節點。實驗結果表明,與傳統的硬聚類算法相比,該算法能夠提高語者識別的準確率和分類效率,對加性噪聲具有良好的抗干擾能力。
語者識別;模糊聚類;決策樹;分布式計算
在語者識別中,給出一個輸入語音,要求從系統提供的所有語者中選擇一個來確定未知語者的身份[1],這個過程通常用到梅爾頻率倒譜系數、高斯混合模型等方法[2-4]。上述方法在低噪聲條件下對小型語者表現非常好,但是在高噪聲條件下會嚴重地降低識別性能,并且當語者數量明顯增時,識別錯誤的可能性將大大增加[5]。……