摘要:提出了一種基于頻域信噪比和復(fù)雜信號(hào)檢測(cè)的語(yǔ)音活動(dòng)檢測(cè)方法(VAD)。首先對(duì)每一幀語(yǔ)音信號(hào)進(jìn)行傅利葉變換。將頻域內(nèi)信號(hào)劃分成幾個(gè)頻帶,求得每一個(gè)頻帶的信噪比,利用估計(jì)得到的噪聲能量產(chǎn)生一個(gè)閾值,并進(jìn)行VAD的預(yù)判,得到一個(gè)判定結(jié)果。其次,利用音樂(lè)信號(hào)的相關(guān)性,將高通后自相關(guān)系數(shù)與閾值進(jìn)行比較,得出另一個(gè)判定結(jié)果。最后,聯(lián)合兩個(gè)判定結(jié)果,得出最終的判定。實(shí)驗(yàn)表明,這種算法可以較好地應(yīng)用于復(fù)雜語(yǔ)音活動(dòng)檢測(cè)。
關(guān)鍵詞:語(yǔ)音活動(dòng)檢測(cè);信噪比;復(fù)雜信號(hào);自相關(guān)系數(shù)
引言
語(yǔ)音活動(dòng)檢測(cè)是語(yǔ)音通信中的一項(xiàng)重要技術(shù)。在噪聲抑制、語(yǔ)音增強(qiáng)中,正確地檢測(cè)語(yǔ)音和噪聲,直接影響到這些算法的性能。在VoIP(voice overIP)中,VAD也擔(dān)當(dāng)著重要的角色,通過(guò)VAD檢測(cè),可以節(jié)省帶寬,在有限帶寬中,提供更好質(zhì)量的語(yǔ)音。
VAD算法一般是利用語(yǔ)音信號(hào)與噪聲信號(hào)的特性不同,提出一些特征值,并與閾值進(jìn)行比較,從而得到判定結(jié)果。現(xiàn)在VAD算法中,有短時(shí)能量檢測(cè)、過(guò)零率檢測(cè)、自適應(yīng)能量檢測(cè)、線性預(yù)測(cè)模型檢測(cè)、基音周期檢測(cè)、概率檢測(cè)等方法。
本文提出的基于頻域和復(fù)雜信號(hào)檢測(cè)相結(jié)合的方法,語(yǔ)音信號(hào)被劃分成不同的頻帶,算出每一個(gè)頻帶的信號(hào)能量和背景噪聲,結(jié)合高通自相關(guān)系數(shù),可較好地完成VAD檢測(cè)。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文