羅俞坤



摘 要:在傳輸的過程中無線語音信號往往會受到噪聲干擾,所以,在語音通信中降噪一直是大家重點研究的一個課題。本文研究和綜合分析了語音降噪的關鍵技術、三大基本工具與兩大基礎理論,意在提升無線語音傳輸的質量。
關鍵詞:語音通信;降噪;關鍵工具;關鍵技術
引言
語音是信息傳遞最重要的手段之一。在無線通信中,噪聲不可避免地對有用語音產生影響,對帶噪語音信號進行降噪處理是仍是當今語音通信中的一個重大課題。頻譜減法、遺傳算法、自適應濾波算法等,早在上世紀六十年代,就在相關學者對語音靜噪處理的深入研究中提出來。語音降噪的過程如下圖1所示:
1 無線語音噪聲分類
目前還沒有一種降噪處理技術能夠完美處理任何噪聲,因此對噪聲進行分類并選擇適用的降噪算法顯得尤為重要。噪聲是無法徹底消除的,因為噪聲與純凈語音信號都屬于隨機信號。故而,我們只能盡可能地在語音降噪處理過程中提取出有用語音信號[1]。在進行降噪處理時,選擇適用的技術很關鍵,但是必須先根據分析出的待處理語音中噪聲的種類與特性,再作出選擇。噪聲的分類有很多種。一般而言,加性噪聲與乘性噪聲是無線通信系統中存在的兩大類噪聲。
1.1 乘性噪聲
乘性噪聲:卷積失真是乘性噪聲的另一種稱謂,它是指噪聲在頻域上同純凈語音信號存在相乘的關系,它是一種由于聲場或信道特性的隨機變化所引起的噪聲。在實際中,乘性噪聲可轉化為加性噪聲,如利用同態濾波變換,然后以加性濾波方式加以處理,便可處理乘性噪聲。
1.2 加性噪聲
加性噪聲:在時域內,噪聲對純凈通信信號的影響表現為兩種語音信號的疊加。因此,在頻域內有用語音信號和噪聲也是疊加的。加性噪聲,從噪聲的來源來看,又可進一步分為無線通訊系統中的外部、內部噪聲。通信系統各部件和元件是造成內部噪聲的主要原因,而外部噪聲則主要來自于信道。單頻噪聲、脈沖噪聲(源于雷電、電火花感染、電力線感應等)和起伏噪聲是加性噪聲的三種基本分類。本文研究的是加性噪聲。
2 降噪處理工具
本研究使用了目前應用較為廣泛的三種降噪處理工具,分別為:Adobe Audition軟件、VS99語音工作站與DSG—98 計算機語音分析系統。
2.1 Adobe Audition 軟件
Adobe Audition軟件具有強大的編輯、特效、混音等功能,支持128 條音軌、多種音頻格式、多種音頻特效,可有效地對音頻文件進行修改、合并。該軟件所含的降噪工具和聲相修復工具可有效對噪聲和語音進行調整。同時,Adobe Audition軟件還設計有包括噪聲降低器、爆音修復器和自動咔噠聲消除器等一系列專門處理噪聲的濾波器。
2.2 VS-99 語音工作站
VS-99是我國自主研發的一款語音信號處理系統。該系統能實時動態采集分析語音,利用VS-99系統中的降噪器和頻域編輯功能,能夠在語圖觀察的基礎上將語音信號中的噪聲進行降噪處理并把有用的語音信號放大,提高語音質量。
2.3 DSG—98 計算機語音分析系統
DSG—98 計算機語音分析系統是一款有通用微機構成的語音分析系統。該系統以FRFT算法為核心,提高了運算速度,還綜合了語音處理、圖像處理和計算機圖形學等理論和處理技術,為語音分析探索了一條新路。綜合來看,DSG—98 計算機語音分析系統具備低成本、高性能、多功能的優點。
3 語音降噪算法
語音降噪,也稱語音增強。語音降噪的目的在于增強語音質量,其實現手段為將有用的語音信號在帶噪語音中盡可能分離出來。
3.1 基于語音譜特征的諧波增強算法
利用帶噪語音濁音段所具有的周期性的特性,可利用自適應梳狀濾波器將語音分量提取出來,增加語音可懂度。梳狀濾波器的實現形式如下:
在式中,s (n)代表輸出信號,M為常數,Ck為濾波器系數, x (n)為輸入信號,L為基音周期。從上式中可知,s (n)是輸入信號的延時加權平均。周期性分量在這個平均過程中得以增強,但是其他非周期性分量受到抑制或消除[2]。由此可見,使用諧波增強法的關鍵是準確估計基音周期。各種基音估計算法可有效估計基音周期,但如果背景噪聲過強,則難以準確估計基音周期。并且,由于基音發生變化,所以在過渡語音段中,也是難以準確估計基音周期的。
梳狀濾波不僅有增強語音信號的效果,還可對噪聲產生抑制的作用[3]。但如果同時對兩個語音進行處理,準確估計基音周期也很困難,這時使用濾波方法增強語音的效果也差強人意。
3.2譜減法
語音降噪算法多種多樣。譜減法因其原理簡單、容易實現等優點成為語音降噪算法中較為常用的算法。在使用譜減法時,噪聲滿足以下三個假設條件:
1. 噪聲為加性噪聲,且都是高斯噪聲。
2. 語音信號是短時平穩且獨立于噪聲的信號。
3. 因人耳對語音信號相位不敏感,故可用帶噪語音信號的相位代替純凈語音信號的相位。
將x (n)表示為有用語音信號,d (n)表示為加性噪聲,y (n)表示為帶噪信號,則有如下(2)式:
帶噪語音經加窗處理后如式(3):
其中0 ≤ n ≤ N-1,i為第i幀,n為樣點數,N是幀長。相應的頻域表示為:
k 是頻譜的分離值,假設純凈語音信號與噪聲信號不相關,從功率譜的角度出發則有:
若從幅度值的角度考慮,則有:
人耳對語音信號的頻譜相位不敏感,其獲取語音信號主要是通過獲得頻譜分量的幅度來實現的[4]。將原始語音信號的相位加入到降噪后的語音信號中,便可獲得語音信號的估計值。由此,頻譜減法公式一般化后為:
頻譜減法的原理圖如下:
頻譜減法能夠做到有效降噪并且該方法的算法簡單,故獲得廣泛應用,但該方法也有其缺點。它主要包含兩個方面的缺點:(1)傳統頻譜減法是依靠噪聲端點檢測的正確性來估計噪聲的正確性。但是,當噪聲水平高時,噪聲端點檢測算的的正確性并不高,于是降低了頻譜減法的語音降噪效果;(2)在對噪聲進行估計時,頻譜減法求噪聲均值。于是,在降噪的過程中,又會引入音樂噪聲。然而,人耳對音樂噪聲易產生疲勞,因此會降低人耳對語音的敏感度。
4.結束語
綜上所述,Adobe Audition軟件、VS99語音工作站以及DSG—98 計算機語音分析系統都可以有效對語音信號進行降噪。實踐證明,傳統頻譜算法和諧波增強算法是兩種比較高效的語音降噪算法。兩種算法各有其優勢與不足。在進行降噪處理時,要根據實際情況選取相應的算法。
參考文獻:
[1]趙力. 語音信號處理. 北京:機械工業出版社 2003:272-273, 282-283.
[2]甄斌 “語音信號的增強相對譜濾波”,聲學學報,Vol. 26 No. 3 pp252-258.
[3]樊養余 “加性噪聲抵消的對稱相關函數法”,數據采集與處理,Vol. 16 No. 3 pp343-347.
[4] 楊行峻,遲惠生等. 語音信號數字處理. 北京:電子工業出版社, 1995.