王順利 夏長春 付嘉銘

摘 要 語音增強是語音處理的一個重要技術,許多研究人員正通過不懈努力來尋求多種優秀的語音增強算法,其目的是為了提高語音的清晰度和理解度。然而這兩個目標是不相關的,有時甚至是相互矛盾的,因此語音增強系統是根據不同的應用場合來選擇的。
關鍵詞 語音增強 語音信號 噪音污染 抑制干擾
中圖分類號:TN912 文獻標識碼:A
1語音增強技術的研究意義
1.1語音增強技術簡介
語音信號處理是一種在信息高速公路中的應用的關鍵技術,新興的多媒體技術,辦公自動化,現代通信和智能系統技術,它主要包括語音通信,語音合成,識別和語音增強。然而,在接收到語音信號的同時,語音的干擾將不可避免地受到噪聲的影響。一些傳輸媒體,如通訊設備,電子音響和其他揚聲器就會出現這種情況。這些語音干擾不僅會造成噪音污染,還會導致許多語音處理系統性能的急劇惡化。
語音增強作為一種預處理方案是抑制干擾的一種有效途徑,是語音信號的其他應用基礎。通過對語音增強技術的深入研究,人們越來越意識到由于噪聲通常是隨機的,從帶有噪聲的語音信號中提取完全純化的原始語音信號幾乎是不可能的。
語音增強是一個非常復雜的技術,不僅是數字信號處理的問題,還涉及到聽覺感知特性和人類的語音特征。同時,多樣性的噪聲,即噪聲來源眾多,具有不同的應用和不同的特點,增加了語音增強的困難。因此,一勞永逸的設計一種算法是不可能的,噪音是唯一的,處理不同的噪聲就要使用不同的語音增強算法。如圖1所示,是噪聲對消法的原理框圖。
1.2語音增強技術的研究目的
由于受到環境噪聲的影響,語音通信過程中的干擾是不可避免的,從周圍的環境引發的噪聲嚴重影響了電子通信設備的語音信號采集。這些干擾將最終接收到的聲音是不純凈的原始語音信號,而是受噪聲污染的語音信號。例如,安裝在汽車,飛機,船只,機場內的公共電話,干擾往往是由強背景噪聲引起的,嚴重影響通信的質量。
實際語音常常帶有各種噪聲信號,為了從噪聲信號中獲得純凈的語音信號,減少噪音的干擾,就需要使用語音增強技術。因為一般的干擾信號是隨機信號,想完全消除噪聲是不現實的,因此研究語音增強技術的目的主要是為了減少人們的疲勞,提高語音質量,提高語音處理系統的識別能力,提升語音的清晰度,提高手機的識別率和抗干擾能力。
人耳對背景噪聲的抑制作用顯著,理解其機制有助于語音增強技術的發展。人類的聽覺系統可以從非平穩噪聲中提取有用的信息,但有的語音增強采取了語音聽覺系統模擬技術,這是人類未來科技的發展方向。許多環境噪聲是非平穩的,所以很難找到一個共同的語音增強算法適用于各種噪聲環境。因此,非平穩語音的隨機噪聲增強技術的研究具有十分重要的意義,這項工作將會在近幾年進一步擴展。
隨著語音激勵特點的深入分析研究,非線性語音信號的非平穩性越來越受到人們的重視。傳統的線性分析技術也日益暴露出其對非線性信號處理的局限性,很難在理論和技術上有所突破,不同的研究方向開始進展緩慢或停滯。因此,人們開始尋求新的數學方法分析語音信號的處理,各種非線性方法的研究是語音分析領域的一個熱門話題,如模糊理論,混沌分析和數學形態學。
2語音增強技術的研究背景
2.1語音增強技術的一般研究方法
語音增強技術成為語音數字信號處理的重要組成部分。語音增強是對帶噪語音進行處理,以改善語音質量,提高語音清晰度,可懂度和舒適度,使人們易于接受或提高語音處理系統的性能。環境噪聲污染使許多語音處理系統的性能急劇惡化。語音識別技術已經取得了重大的進展,進入了實用階段。但目前的識別系統只能在安靜的環境中正常工作,在噪聲環境下,特別是在強噪聲環境下,語音識別率會受到影響。
由于語音生成模型的編碼參數比特率非常低,當混合背景噪聲干擾嚴重時提取語音信號,重建語音的質量會急劇惡化,甚至完全無法理解。在這種情況下,語音增強作為一種預處理方法,是一種有效的方法,解決了噪聲污染。
2.2語音增強技術的應用背景
語音增強作為預處理,或抑制背景噪聲,提高語音質量,是一種用來解決噪聲污染有效的方法。因此,語音增強應用技術的研究具有重要的實踐價值。目前,語音增強系統在語音通信,多媒體技術,數字家電等領域已被廣泛應用。
語音增強的主要目的是從帶噪語音信號中提取盡可能多的純凈原始語音。然而,由于干擾通常是隨機的,從嘈雜的語音中完全提取純凈的原始語音幾乎是不可能的。在這種情況下,語音增強的目的主要有兩個:一是語音質量的改善,消除背景噪聲,使人們愿意接受,消除人們的聽覺疲勞,這是主觀測量,另外一個就是提高語音的可懂性,這是一個客觀的測量。但這兩個目標不可兼得,因此在實際應用中往往是根據具體情況來確定的。
參考文獻
[1] 黃蘇雨,梁聲灼,黃蘇園.語音增強方法綜述[J]. 計算機與現代化,2007(03).
[2] 孫晉松.語音增強算法的研究及改進[D]. 山東大學,2009.