中圖分類號:TN912.3 文獻標識碼:A 文章編號:2096-4706(2025)16-0001-08
Abstract: With the wide application of speech technology in the fields ofcommunication,smart home,medical treatment, railwayoperation and soon,theproblem that speech signal is vulnerable to noise interferencein the processof acquisition andtransmision is becoming more and more prominent.This papersystematicallyreviews thecore methods andresearch progressofspeech denoising technology.Basedonthe statisticalcharacteristicsofnoise,thedenoising methodsaredivided into two categories ∵ stationary noise and non-stationary noise.For stationary noise,the principle,process and limitations of spectral subtraction,Wiener filteringand Minimum Mean SquareError methodareanalyzed.For non-stationary noise,the implementationsateiesandapplicablesenariosofKalmanftermetod,daptiveseaeltioneod,signalspace methodandwavelet hresholddenoisingmethodarediscussed indetail.Inadition,theadvantagesofthejointdenoisingmethod aresummarized,anditispointedoutthatitcaneffctivelydealwithomplexnoiseenvironmentbyfusingmultiplelgorhs. Finaly,thekeyperformanceevaluationindexessuchassignal-tooiseratioandRootMeanSquareErorareintroduced,which provide a theoretical basis for the optimization and selection of denoising algorithms.
Keywords: speech denoising; stationary noise; non-stationary noise; signal-to-noise ratio; Root Mean Square Error
0 引言
在當今數字化社會中,語音技術已廣泛融入生活的方方面面。從日常通信到智能家居控制,從車載導航到遠程醫療會診,語音作為最自然、便捷的人機交互方式之一,發揮著不可替代的作用。除了日常生活,在特定行業,例如鐵路、電力等行業的作業中也非常重要。然而,語音信號在采集和傳輸過程中極易受到干擾,影響其質量和可用性。在開放空間中,背景噪聲、回聲、混響以及電磁干擾等因素,都會使語音信號變得模糊不清、難以辨識。這種語音質量的下降在多個場景中會造成顯著的負面影響。例如,在語音通信中,噪聲可能導致信息的誤傳或遺漏,影響溝通效率和準確性;在語音識別應用中,噪聲會干擾識別算法對語音特征的提取,從而降低識別率,影響用戶體驗。
為了減少上述的噪聲影響,語音去噪技術應運而生,旨在從帶噪語音中提取出清晰、純凈的語音信號,提升語音質量。其意義深遠,不僅能顯著改善語音通信的清晰度和舒適度,減少因背景噪聲引起的疲勞和誤解;還能在嘈雜環境中優化語音識別系統的前端輸入,提高識別準確率,增強語音交互設備的智能性和實用性。語音去噪的框架如圖1所示。
首先,純凈語音信號在采集和傳輸過程中會受到周圍環境的影響而引入背景噪聲。這些噪聲可能來自交通工具的引擎聲、電器設備的運行聲、作業的噪聲等。其次,傳輸通道本身也可能引入噪聲,進一步干擾語音信號。為了應對這些噪聲干擾,語音增強處理算法被應用于去噪過程,用以生成去噪語音信號。
根據噪聲的統計特性,可將噪聲分為平穩噪聲和非平穩噪聲,兩者的主要區別在于統計特性上的表現不同。針對這兩種噪聲,去噪算法需要采取不同的策略。經過幾十年的研究和發展,針對平穩噪聲和非平穩噪聲的去噪技術都取得了顯著的進展,為語音去噪的實際應用提供了有力支持。
圖1語音去噪整體流程框架

1針對平穩噪聲的語音去噪方法
平穩噪聲的均值、方差、平均功率等統計特性不隨時間的推移而改變。其自相關函數僅依賴于兩個采樣點間的時間差,與具體的時間起點無關,這使得其頻譜特性相對穩定。常見的白噪聲以及電子系統中的熱噪聲均屬于此類。基于這些特性,譜減法、維納濾波法和最小均方誤差法等成為處理平穩噪聲的有效手段。
1.1 譜減法
譜減法最早由Boll于1979年提出,其假設輸入的語音信號和加性噪聲信號是相互獨立的,于是可以通過對帶噪聲的語音信號進行頻域分析,然后減去估計的噪聲頻譜,進而恢復出純凈的語音頻譜。該方法實現簡單,主要用于處理平穩的加性噪聲,其計算過程如圖2所示。
圖2譜減法整體流程

首先假設噪聲信號數學模型為:
y(n)=s(n)+d(n)
其中, s(n) 為純凈語音, d(n) 為加性噪聲, y(n) 為帶噪信號。接著對帶噪語音進行短時傅里葉變換以及模平方運算,得到每個幀的帶噪信號功率譜以及相位信息:
Y(ω)=S(ω)+D(ω)
Py(ω)=Ps(ω)+Pd(ω)
然后,通過分析語音信號活動段和非語音信號活動段來估計噪聲的功率譜 pd(ω) ,并從帶噪語音的功率譜 py(ω) 中減去噪聲功率譜 pd(ω) ,得到增強后的語音功率譜 ps(ω) 。最后,通過逆傅里葉變換還原 ps(ω) 和帶噪信號相位,將增強后的頻譜轉換回時域,重構干凈的語音信號。
該方法基于傅里葉變換的頻域操作,僅需噪聲段的頻譜估計和簡單的減法運算,無須復雜的計算,易于實時實現。在嵌入式設備或移動終端中,譜減法可快速處理語音信號而不顯著增加硬件負擔。但是,譜減法可能會引入“音樂噪聲”,即直接使用帶噪信號的功率譜減去噪聲信號功率譜,會導致語音段過度抑制或噪聲殘留,使語音信號失真嚴重。同時,譜減法通常保留原始相位,而相位誤差可能放大聽覺感知中的刺耳感,影響語音識別率和聽覺體驗。
為此,后續有學者改進了該方法,在譜減法基礎上引入了多個過減參數[],如:

通過調節參數來減少噪聲殘留,以達到更好地去噪效果。這使得譜減法得到快速發展,進一步增強了其語音去噪的效果。
1.2 維納濾波法
Lim等[3]在80年代首次提出使用維納濾波器來去除語音信號噪聲。維納濾波是一種基于最小均方誤差準則的線性濾波方法,旨在通過估計信號和噪聲的統計特性來設計維納濾波器的傳輸函數表達式,使輸出信號與原始純凈語音信號之間的均方誤差最小。其具體流程如圖3所示。
圖3維納濾波法整體流程

該方法假設帶噪的語音信號為:
y(n)=s(n)+d(n)
其中, s(n) 為純凈語音, d(n) 為加性噪聲, y(n) 為帶噪信號。維納濾波的目的是設計濾波器 h(n) ,使得維納濾波輸出
與 s(n) 的均方誤差最小:

在頻域中,維納濾波器的傳遞函數為:

其中, ζ(ω) 為先驗信噪比(prioriSNR)。通過先驗信噪比計算維納濾波器傳遞函數 H(ω) ,再利用傳遞函數進行頻域濾波,得到去噪信號 

最后通過逆傅里葉變換,將
轉換回時域,得到去噪信號 
在統計意義上,維納濾波器是一種最優線性估計濾波器。其基于最小均方誤差準則,并通過先驗信噪比動態調整增益,適用于平穩噪聲和線性系統。與譜減法相比,維納濾波法更加智能。但是,在非平穩噪聲環境下,噪聲功率譜估計仍會存在估計誤差,導致語音失真或噪聲殘留。
1.3最小均方誤差法
最小均方誤差法[是一種基于語音短時譜幅度(Short-TimeSpectral Amplitude,STSA)的統計優化方法,其核心目標是通過最小化估計信號與純凈語音之間的均方誤差,實現噪聲抑制與語音保真的平衡。其去噪的具體流程如圖4所示。
圖4最小均方誤差法整體流程

該方法的語音短時譜的數學表達式為:


其中, A(k,j) 和 N(k,j) 分別為純凈語音和帶噪語音的幅度譜, X(k,j) 和
分別為代表純凈語音和帶噪語音的頻譜。假設噪聲信號與純凈信號相互獨立,則最小均方誤差的估計表達式為:

其中, a(k) 為
某一幀的幅度譜。如果語音信號滿足高斯分布,噪聲也服從零均值高斯分布,那么估計表達式可化簡為:


其中, ζ(k) 為先驗信噪比, γ(k) 為后驗信噪比,
G(k) 為增益函數。
在頻域中,最小均方誤差估計器可分解為幅度譜估計與相位保留兩部分。首先通過漢明窗分幀,再計算先驗信噪比與后驗信噪比得到純凈語音幅度譜估計,接著直接使用保留的帶噪語音相位合成復數語音頻譜,最后通過逆傅里葉變換與合幀技術得到去噪的語音輸出。
最小均方誤差方法作為語音去噪領域的統計優化算法,在假設噪聲與語音符合高斯分布的條件下,能夠推導出閉式解,實現頻域幅度譜的最優估計。在平穩噪聲下,最小均方誤差方法優于譜減法和維納濾波法。但由于其涉及超幾何函數與指數積分,處理時間相對較長,在高實時性需求的嵌入式設備場景中,還需要考慮時間成本。
2針對非平穩噪聲的語音去噪方法
與平穩噪聲不同,非平穩噪聲的統計特性隨時間變化。其均值和方差可能隨時間發生顯著變化,且自相關函數不僅與時間差有關,還與具體的時間起點相關。這意味著噪聲的頻譜特性也會隨時間而變化,不能用固定的功率譜密度來描述。如腦電波、心電圖等生物醫學信號,工廠機器運轉噪聲等都屬于非平穩噪聲。針對上述特性,卡爾曼濾波法、自適應噪聲抵消法、信號子空間法、小波閾值去噪法等成為處理非平穩噪聲的有效手段。
2.1卡爾曼濾波法
針對非平穩噪聲場景下,維納濾波法去噪性能不佳的問題,Pailwal等在1987年提出基于卡爾曼濾波[5]的語音去噪方法,通過建模語音的動態特性實現去噪。卡爾曼濾波法是一種遞歸的估計算法,它以最小均方誤差為最佳估計準則,采用信號與噪聲的狀態空間模型,利用前一時刻的估計值和當前時刻的觀測值來更新對狀態變量的估計,求出當前時刻的估計值,從而對語音信號進行去噪。其核心原理在于將純凈語音視為自回歸(AR)過程,滿足:
y(n)=s(k)+n(k)

其中, a1(k) 和 b1(k) 為初始參數, p 和 q 為AR模型的階次。接著計算得到卡爾曼濾波系統的各矩陣方程式:

K(k)=P(k∣k-1)?h?[hT?P(k∣k-1)?h]-1

P(k)=?1-K(k)?hT??P(K|K-1)

其中, P(k|k-1) 為預測誤差協方差矩陣, P(k) 為誤差協方差矩陣, K(k) 為卡爾曼增益矩陣, Q 為噪聲系數。結合上述矩陣,卡爾曼濾波可分為預測和更新兩個步驟。預測是根據狀態轉移模型和前一時刻的狀態估計預測當前時刻的狀態,而更新則是根據當前時刻的觀測值對預測狀態進行修正,得到更準確地狀態估計。于是,可得最終的卡爾曼濾波輸出為:

綜上所述,卡爾曼濾波通過將語音建模為自回歸過程,并引入狀態空間模型和遞歸估計機制,解決了維納濾波的靜態假設問題。其采用“預測-更新”遞歸框架,僅依賴當前觀測值與前一步估計值,無須全局統計信息,就能實現逐幀最優估計,在非平穩噪聲干擾場景下表現出優異的去噪性能。
2.2 自適應噪聲抵消法
1975年,Windrow等提出使用自適應濾波器來抵消語音中的噪聲信號。自適應噪聲抵消法(AdaptiveNoiseCancellation,ANC)是一種基于參考噪聲信號的動態濾波技術,其核心思想是利用噪聲的統計特性與語音信號的非相關性,對噪聲信號進行逼近,并與帶噪信號抵消生成去噪信號。其原理如圖5所示。
圖5自適應噪聲抵消法流程圖

其中, s(n) 為純凈語音, d(n) 為加性噪聲, y(n) 為帶噪信號, r(n) 為與主噪聲相關的參考噪聲,而u(n) 則為由自適應濾波器動態調整權重系數 w 而得到的估計噪聲。同時,計算帶噪信號與自適應濾波輸出信號的差值,即誤差信號 e(n) 。計算式為:

其中, N 為濾波器抽頭數, wk 為自適應濾波器的各項系數。接著,ANC算法通過最小化 e(n) 的均方誤差 E[e2(n)] ,并利用噪聲信號與語音信號的非相關性,使自適應濾波器輸出 u(n) 逼近噪聲信號 d(n) ,而最終的 e(n) 將逼近純凈信號 y(n) ,作為去噪信號輸出,具體計算式為:
E[e2(n)]=E[(s(n)+d(n)-ν(n))2]
minE[e2(n)]=minE[(d(n)-ν(n))2]
綜上所述,ANC通過調整自適應濾波器輸出權重 wk ,生成估計噪聲 u(n) ,然后從帶噪信號中減去信號 u(n) 來達到降噪效果。該方法僅依賴噪聲與語音的非相關性,無須先驗語音模型。其通過實時更新濾波器系數以跟蹤噪聲變化,可有效抑制非平穩噪聲,在嵌入式系統上去噪迅速且效果顯著。
2.3 信號子空間法
信號子空間分解的降噪方法早期由Denrinos等[7]提出,隨后由Ephraim等[進行完善。該算法主要源自線性代數理論,其基本原理是在歐式空間中,純凈信號的分布可能局限在帶噪信號的子空間中。因此,如果給定一種方法用于將帶噪信號的向量空間分解到兩個子空間中,其中一個子空間主要包含純凈信號,另一個子空間主要包含噪聲信號,這樣就可通過清除“噪聲子空間”來達到估計純凈信號的目的。而將帶噪信號向量空間分解為“信號子空間”和“噪聲子空間”可以通過線性代數中的正交矩陣分解技術實現,特別是奇異值分解(SingularValueDecomposition,SVD)和特征值分解(EigenValueDecomposition,EVD)。
2.3.1 奇異值分解方法
假設純凈信號與噪聲信號具有低互相關性,且噪聲信號服從高斯分布,其數學模型為:
y(n)=s(n)+d(n)
其中, s(n) 為純凈語音, d(n) 為加性噪聲, y(n) 為帶噪信號。接著,將帶噪信號分幀后,利用延遲嵌入法構造漢克爾矩陣 Y ,該矩陣維度為 (N-M+1)×M 其中 N 為幀長, M 為矩陣維度。然后對 Y 進行奇異值分解:

其中, U 為正交 (N-M+1)×M 矩陣, V 為正交M×M 矩陣, ? 為包含奇異值 φi 的對角 M×M 矩陣,且滿足 φgt;φgt;…gt;φM 。由于SVD方法認為,噪聲信號多存在于奇異值小的子空間中,所以該方法引入了閾值 K ,將 ? 分為信號子空間 Ps (保留前 K 個奇異值)和噪聲子空間 ?d (剩余置零),這基本上去除了信號的噪聲部分。然后通過逆變換得到去噪后的漢克爾矩陣:

其中, ?* 為去除小奇異值后的對角矩陣。最后通過反分幀和平均對角線元素來恢復時域信號
作為去噪信號。
2.3.2 特征值分解方法
EVD方法通過求取協方差矩陣的特征向量,構
造正交投影矩陣,從而將帶噪語音向量投影到兩個正交的子空間中:
y=UsUsTy+UdUdTy=ys+yd
其中, UsUsT 為帶噪信號 y 在信號子空間的投影,UdUdT 為 y 在噪聲子空間的投影。通過忽略噪聲子空間投影可得去噪信號 

具體去噪過程如下,首先計算帶噪語音的協方差矩陣 Ryy=E[yyT] ,接著進行特征值分解 Ryy=UΛUT ,其中 A 為特征值對角矩陣, U 為特征向量矩陣。與SVD方法相同,利用閾值 K 將 U 劃分為信號子空間Us (對應大特征值)和噪聲子空間 Ud (對應小特征值)。再利用信號子空間計算正交投影矩陣 Ps=UsUsT ,最后重構去噪信號
。
基于線性代數理論,使用SVD和EVD的信號子空間方法通過直接去除噪聲子空間,能有效減少語音諧波失真和周期性的殘留噪聲。但該方法具有參數敏感性,需要合理調整閾值 K 以及矩陣維度 M 等方法參數。
2.4小波閾值去噪法
傅里葉變換為
,其基函數是無限長的正弦波,僅能提供全局頻域信息,無法定位瞬態特征。且這種全局積分導致時域分辨率完全喪失,無法區分信號不同時間段的頻域特征。相比之下,小波變換具有有限支撐長度和多尺度特性,能夠通過平移和縮放實現對信號的局部化分析:

其中, a 為尺度參數,用于控制頻域分辨率; b 為平移參數,用于控制時域位置。這種設計使小波變換可同時捕捉信號的時域瞬態特征與頻域能量分布。所以,利用小波變換分析語音信息,并去除其中噪聲信號的方法,受到了廣大學者的關注。其中,小波閾值去噪法[9-10]應用最為廣泛。
該方法的核心理論是小波變換具有多分辨率分析的特點。通過小波變換,能夠將帶噪信號分解到不同尺度和位置的小波基函數上,獲得不同頻率段的小波系數。然后根據小波系數的特性和噪聲的統計規律,采用閾值法對小波系數進行處理,去除或減小噪聲系數的影響,最后通過小波逆變換重構語音信號,實現去噪。其流程框圖如圖6所示。

在上述流程中,小波分解以及小波閾值處理兩個步驟至關重要。其中,有四個主要因素會影響小波去噪的實際效果,分別是小波基函數、小波分解層數、閾值規則以及閾值函數。下面將逐個進行介紹。
2.4.1 小波基函數
小波基函數是小波變換的數學基礎,其特性直接影響信號分解的精度和噪聲分離效果,因此需要根據實際情況來決定采用哪種小波基。基函數的正交性可以去除變換后的冗余信息;基函數的支撐長度影響小波的時域分辨率;基函數的消失矩可以反映多項式信號的奇異值;基函數的緊支性反映小波的局部化特征以及分解效率趨勢。下面是經常用于語音去噪的小波基函數:
1)Haar小波。Haar小波是最早應用的小波,是緊支撐的正交小波基函數。其表達式為:

2)Morlet小波。Morlet小波是一種單頻率的余弦函數,不存在正交性與緊支性,可用于連續小波變換。其定義為:

3)Daubechies小波系(db N 小波)。db N 小波是Haar小波的改進版本,在具備規范正交性的同時自帶N階消失矩,有效支撐長度為2N-1。
4)Symlet小波系( symN 小波)。該小波函數具有近似對稱性質,是對Daubechies小波的算法改良,其通過分解函數 W(z) 構建小波:

2.4.2 小波分解層數
小波分解層數決定了信號在時頻域的分辨率,直接影響噪聲與信號的可分性。根據Mallat分解重構算法[11],分解層數越多,低頻子帶的頻帶越窄,有利于保留基頻等穩態成分。但過度分解會導致信號高頻細節丟失,且分解層數每增加1,計算量約提升2倍,需權衡實時性與降噪效果。
從理論上來說,對于長度為 N 的數據信號,小波變換時能取得的最大尺度 J=?log2N? ,且每分解一次,信號的長度就會減半。以3層分解層數為例,可將帶噪信號 s 分解為 S=A3+D1+D2+D3 ,分解結
構如圖7所示。
圖7小波分解示意圖

其中, Ai 為分解后的低頻小波系數, Di 為分解后的高頻小波系數。低頻小波系數通常對應的是信號中的近似信息,相當于有用信號;而高頻小波系數則代表細節和噪聲部分。在此基礎上,通過設定閾值函數和閾值規則,對高頻小波系數 D1 , D2 和 D3 進行濾波,去除部分噪聲信息,再通過小波重構得到處理后的去噪信號。一般來說,分解層數的具體數值由信號的信噪比與頻帶寬度等因素決定。
2.4.3 閾值規則
在小波分解理論中,噪聲信號主要存在于高頻小波系數 Di 中,且噪聲系數普遍較小。所以需要設置一個閾值λ,將低于該閾值的高頻小波系數置零或者進一步降低,從而達到去噪的效果。而閾值規則設定了閾值的計算方式,從而決定了高頻小波系數中噪聲系數的剔除強度。通常情況下,可由以下4種閾值規則計算閾值:
1)通用閾值(sqtwolog規則):

其中, σ 為噪聲標準方差, N 為信號長度。
2)Stein無偏風險估計閾值(rigrsure規則)。該閾值規則是一種基于統計優化的閾值選擇方法,通過對給定閾值進行極大似然估計運算,再將閾值最小化得到。假設向量 ?W=(w1,w2,w3,???,wn) ,且滿足w12lt;…n ,則有:
f(k)=(sort(|s|))2,(k=0,1,2,…,N-1)
若令閾值
,則產生的風險為:

通過最小化風險得到 kmin ,即可確定閾值
。
3)極大極小閾值(Minimaxi規則)。該閾值規則是在極大值極小值原理上進行估計,數學表達式為:

其中, σ 為噪聲標準差。
4)啟發式閾值(heursure規則)。該閾值規則是通用閾值和Stein無偏風險估計閾值的這種方案。在低信噪比時,采用通用閾值 λ1 ;在高信噪比時,采用通用閾值 λ1 與Stein無偏風險估計閾值 λ2 的最小值。設 n 個小波系數的平方和為 s ,即
,同時令式
,
,則啟發式閾值數學表達式為:

上述四種閾值規則中,Stein無偏風險估計值和極大極小閾值的估計相對保守,閾值相對較小,可有效保留有用信號,但部分噪聲信號也被保留。通用閾值和啟發式閾值的估計的閾值較高,可強力去除噪聲信號,但高頻小波系數中的有用信號系數也可能被去除。因此,在選用閾值時要根據具體情況而定。
2.4.4 閾值函數
在根據閾值規則確定了閾值λ之后,高頻小波系數中低于閾值λ的部分將被收縮,而閾值函數將直接決定系數收縮方式,影響信號保真度與噪聲抑制強度。通常情況下,有多種閾值函數可以選擇,如硬閾值、軟閾值、改進閾值:
1)硬閾值。硬閾值函數將低于閾值的小波系數直接置零,用以去除噪聲系數。其數學表達式為:

其中, ωj,k 為小波系數。可以發現函數在閾值處是不連續的,經小波重構后會導致去噪信號出現振蕩現象。
2)軟閾值。軟閾值函數解決了硬閾值函數不連續的問題,表達式為:

其中,signO為符號函數。雖然軟閾值的連續性較好,但是其產生了恒定偏差,會損失有用信號的小波系數,從而影響去噪的實際效果。
3)改進閾值。許多學者針對上述兩種閾值函數的優缺點,給出了各自的解決方案,以其中一個改進閾值函數[12]為例:

通過數學證明,該函數既保證了硬閾值的連續性問題,又解決了軟閾值的恒定偏差問題,能更加精細地去除噪聲系數。
綜上所述,通過合理調控上述四種核心參數,小波閾值去噪法能夠適應多種噪聲場景,并在信號保真度與噪聲抑制之間取得平衡。因此,在多種去噪領域中,該方法已成為優先選擇的去噪方法之一。
2.5 聯合去噪方法
在語音去噪領域,眾多方法雖能在一定程度上實現去噪效果,但單一方法往往難以應對復雜多變的噪聲環境。為此,學術界和工業界開發出多種聯合去噪方法,將不同算法的優勢融合,以應對復雜噪聲場景。這些聯合方法的優勢在于打破單一算法的性能瓶頸,通過分層或并行處理,同時應對不同頻段、不同統計特性、不同時變規律的噪聲,在復雜場景下的綜合去噪性能優勢更加明顯。例如,卡爾曼-小波去噪結合了卡爾曼濾波的時間序列預測優勢與小波變換的多分辨率分析能力;維納-小波去噪融合了維納濾波的統計特性利用與小波變換的局部化處理;自適應-卡爾曼去噪結合了自適應濾波的動態調整和卡爾曼濾波的最優估計;譜減-維納-卡爾曼去噪則更是集成了三種方法的特點。這些聯合去噪方法在語音通信、語音識別等實際應用中展現出更強的適應性和更優的去噪效果。
3 性能評價指標
要衡量去噪方法對信號去噪的效果優劣,可依據相似性和光滑性這兩個基本原則來確定。具體而言,相似性原則是指兩個信號間的方差應達到最小;光滑性原則則是要求兩個信號的光滑性保持一致。通常,相似性可用標準差來表征,而光滑性則常用能量比來加以量化。常見的信號去噪評價標準包括信噪比與均方根誤差兩個方面。
3.1 信噪比
信噪比是衡量信號與噪聲相對強度的一個重要指標。在信號去噪領域,它表示原始信號中有用的信息部分與噪聲部分的功率比值。較高的信噪比意味著信號的質量較好,噪聲干擾較小;較低的信噪比則表明信號被噪聲淹沒的情況較為嚴重。其數學表達式為:

其中, s(n) 為純凈語音信號,
為去噪后的語音信號, L 為采樣數。信噪比通常用對數形式 (分貝)表示。
3.2 均方根誤差
均方根誤差是衡量去噪信號與原始信號之間差異程度的一種指標,反映了去噪過程中對原始信號的估計精度與失真情況。均方根誤差越小,說明去噪信號與原始信號越接近,去噪算法在保留信號原始特征方面表現越好;反之,均方根誤差較大則可能導致信號失真。其數學表達式為:

其中, s(n) 為純凈語音信號,
為去噪后的語音信號, L 為采樣數。
4結論
本文對語音去噪技術進行全面深入的探討,首先闡述語音去噪的背景和重要意義,接著詳細介紹語音去噪的框架,以及噪聲的兩種主要分類一一平穩噪聲和非平穩噪聲,并分別闡述針對這兩類噪聲的典型去噪方法。文中還介紹了聯合去噪方法,強調了其融合多種算法優勢、打破單一算法性能瓶頸的特點,使其在復雜噪聲場景下表現出色。最后闡述評價語音去噪效果的常見指標一信噪比和均方根誤差。本文從基本概念、典型方法、聯合策略及性能評價等方面呈現語音去噪技術的整體圖景,為相關研究和應用提供參考和借鑒,助力語音去噪技術的進一步發展和優化。
參考文獻:
[1] BOLL S. Suppression of Acoustic Noise in Speech Using
Spectral Subtraction[J].IEEETransactionsonAcoustics,Speech,
andSignal Processing,2003,27(2):113-120.
[2]BEROUTIM,SCHWARTZR,MAKHOULJ.
Enhancement of Speech Corrupted by Acoustic Noise [C]//
ICASSP'79.IEEE International Conference on Acoustics,Speech,and
SignalProcessingIEEE.Washington:IEEE,1979,4:208-211.
[3]LIMJ S,OPPENHEIM AV.Enhancement and
Bandwidth Compression of Noisy Speech [J].Proceedings of the
IEEE,2005,67(12):1586-1604.
[4]EPHRAIMY,MALAHD. Speech Enhancement Using
a Minimum-Mean Square Error Short-Time Spectral Amplitude
Estimator[J].IEEETransactionsonAcoustics,Speech,andSignal
Processing,1984,32(6):1109-1121.
[5]KALMANRE.A NewApproach to LinearFilteringand
Prediction Problems[J].Journal of Basic Engineering,1960,82(1):35-45.
[6]WIDROWB,GLOVERJR,MCCOOLJM,et
al.Adaptive Noise Cancelling:Principles and Applications[J].
Proceedings of theIEEE,1975,63(12):1692-1716.
[7]DENDRINOSM,BAKAMIDISS,CARAYANNIS
G.Speech Enhancement from Noise:A Regenerative Approach [J].
SpeechCommunication,1991,10(1):45-57.
[8]EPHRAIMY,VANTREESHL.ASignalSubspace
Approach for Speech Enhancement[J].IEEE Transactions on
speech and audio processing,1995,3(4):251-266.
[9]DONOHODL,JOHNSTONE IM.Ideal Spatial Adaptation
byWaveletShrinkage[J].Biometrika,1994,81(3):425-455.
[10]DONOHO D L,JOHNSTONE IM. Adapting to
Unknown Smoothness Via Wavelet Shrinkage [J].Journal of the