摘要:針對目前生活中涌現的海量語音數據,人們對語音檢索技術準確度的要求越來越高。主要研究了漢語連續語音檢索任務中,基于轉換音節網格的研究方法。針對語音檢索系統中置信度計算的問題,提出了一種基于音節問互信息的置信度計算方法,并將其用于網格結構的語音檢索系統中。該方法能夠有效地利用上下文之間的互信息量,從而更準確、合理地描述漢語語言模型。實驗結果表明,用提出的方法建立轉換音節網格來進行語音檢索,其檢出率(FOM)比后驗概率法和N-best法有較大幅度的提高。得到的漢語語音檢索系統其FOM最高可以達到83.7%。
關鍵詞:網格;互信息;語音檢索;置信度;語言模型
中圖分類號:TP391 文獻標志碼:A 文章編號:1001-3695(2009)12-4607-03