梁李鵬 陸永耕
摘 要 在噪聲環境下的語音識別率將會受到嚴重的影響。語音增強是解決噪聲污染的有效方法。在語音增強技術中,語音識別和說話人識別是很重要的。因此,識別裝置通常工作在環境噪聲下。語音增強不僅與信號處理技術相關,并涉及到人的聽覺感知和語音認知。由于噪聲的來源有很多,在不同的應用場合,其特點也各不相同,因此很難確定一個通用的適用于各種環境噪聲的語音增強算法。根據不同的噪聲,采用不同的語音增強策略。
關鍵詞 語音識別 語音增強 噪聲 算法 信噪比
中圖分類號:TN912 文獻標識碼:A
1語音與噪聲的研究現狀
在言語交際中,人們不可避免地受周圍環境的影響,如傳輸介質噪聲,通信裝置內的電噪聲,和其他說話人的聲音等。由于噪聲干擾的存在,接收到的語音不是原來干凈的語音信號,因為在嘈雜的語音信號中存在著噪聲污染。例如,安裝在車輛上,飛機或船上的電話,街道或在戰場上的公共電話與機場廣播,在強背景噪聲下往往會受到噪音干擾,嚴重影響通信的質量。室內電話會議和語音廣播混合各會場的回聲,影響收聽效果。深海潛水員的演講會因為佩戴著氦氧氣面罩而失真,歷史悠久的老唱片與舊磁帶會產生噪聲,從而引發失真的現象,這些都是語音帶噪音的實際例子。
多年來,各種語音增強算法的寬帶噪聲存在的人。雖然語音增強還沒有建立完整的理論體系,但一些語音增強算法已被證明是有效的。常用的語音增強算法大致分為兩種:基于語音產生模型參數的增強方法和基于非語音產生模型參數的增強方法。基于語音產生模型參數的方法主要有卡爾曼濾波方法和基于隱馬爾可夫模型的方法,他們對語言產生的模型參數和恢復特性做合理的估計。但由于語音生產模型的參數難以被評估,很難得到準確的低信噪比,并且由于迭代和增加算法的復雜度,該算法沒有取得實質性的進展。不基于語音生成模型的語音增強方法主要包括自適應噪聲濾波方法,譜減算法以及短時譜估計增強算法。這種算法相比于基于語音生成模型的語音增強算法,參數設置簡單,信噪比大大提高,在語音增強的實際應用中得到了廣泛的應用。在該算法中,譜減算法作為基本算法,簡單而易于實現,具有良好的性能和廣泛的應用。
在實際的需求下,語音增強技術早就引起了人們的關注,許多工程技術人員與科學家多年來一直鍥而不舍進行這方面的研究。隨著數字信號處理理論的發展,上世紀七十年代,語音增強技術的研究已經達到了一個高潮,得到了一些基本結果,使語音增強技術成為了數字語音信號處理的一個重要分支。之后,隨著大規模集成電路和計算機技術的發展,語音增強算法的仿真技術推動語音增強技術的發展提供了必要的條件,語音增強中的應用研究進入了一個嶄新的階段。
語音增強的目的是提取盡可能多的從帶噪語音信號中原始的純凈語音。然而,由于干擾通常是隨機的,從帶噪語音中提取完全純粹的語音幾乎是不可能的。在這種情況下,語音增強的主要目的有兩個:首先是語音質量的改進,消除了背景噪聲,使人們愿意接受,不感覺疲勞,這是一個主觀的方法,其次是提高信噪比,這是一個客觀的測量。這兩個目標往往是不相同的。目前有一種針對于低信噪比的語音增強方法,雖然可以顯著降低背景噪聲,提高語音信號的信噪比,但它會嚴重降低語音質量。
2語音與噪聲的特性
2.1語音的特性
語音是一段非平穩的隨機過程,但由于聲帶和聲道的形狀在一段相對穩定的時間內是不會產生突變的,因此可以得出結論:語音的特征是不變的,所以語音具有短時譜的相對穩定性。這種平穩的語音可以使用短時譜來進行分析。
清音和濁音是語音的兩大分類。濁音在頻域中存在一個明顯的周期性,在時域中具有共振峰結構,但大部分能量集中在低頻段。清音段沒有明顯的時域和頻域特性,類似于白噪聲。在語音增強技術中,可以使用具備周期性特征的濁音,使用梳狀濾波器來提取語音分量或抑制非語音信號,而清音和寬帶噪聲則難以區分。
通過對語音信號的統計分析,可以用來描述語音的特征。由于語音是不穩定的,是非遍歷隨機過程,所以長時域的語音增強技術的統計特性意義不大。隨時間變化的幅度統計特性具有短期語音頻譜,并且只有當分析幀的長度趨向于無窮大時,才近似可以被認為是具有高斯分布的。在高斯分布模型的基礎上可以獲得中心極限定理。在寬帶噪聲污染的語音增強技術中,這種假設可以被認為是分析的前提。
2.2噪聲的特性
不同的實際應用中會有不同的噪聲特性,并且噪聲能發生很大變化。噪聲可以是加性的,但也可以是非加性的。一些非加性噪聲可以轉換為加性噪聲。例如,同態乘性噪聲通過噪聲卷積變換可以成為加性噪聲。加性噪聲通常分為周期性噪聲,脈沖噪聲,寬帶噪聲和語音的干擾噪聲和其他非加性噪聲,包括混響電路噪聲和傳輸網絡噪聲。
語音增強要利用到噪聲的各種參數,噪聲評估的精確度對后續算法具有顯著直接的影響,因此預先準確地估算噪聲對語音增強的影響是非常重要的。當對噪聲進行估計時,通常假設要估計的噪聲具有零均值。在許多噪聲估計方法中,有檢測無聲語音信號和有聲語音信號的。
參考文獻
[1] 張俊.基于譜減算法語音增強的研究[J]. 信息技術,2009(03).
[2] 范立,侯強,吳題,李娟.變噪聲環境下語音增強算法性能比較[J]. 武漢理工大學學報(信息與管理工程版),2009(02).