李思嘉 趙婧 蔡樹陽
摘要:基于小波去噪理論實現了閾值法語音增強算法,傳統的軟閾值法與硬閾值法在去噪處理上均有不足,經過軟閾值法處理的語音信號與原始信號相比存在恒定誤差,經過硬閾值法處理的語音信號不夠光滑,且附加震蕩的存在。在軟硬閾值法的基礎上提出了一種改進的軟硬閾值折衷算法,提出的改進軟硬閾值折衷算法和傳統的閾值算法相比其適應性更優,克服了硬閾值函數不連續的缺點,減小了軟閾值函數中估計小波系數與分解小波系數的恒定偏差,仿真結果說明,根據噪聲信號的不同,通過修改式中系數,可得到比傳統閾值法去噪更優的結果。
關鍵詞:語音去噪;語音增強;閾值函數;小波變化
中圖分類號:TP391文獻標志碼:A文章編號:1008-1739(2022)08-60-4

從帶有噪聲干擾的語音中提取純凈的語音為語音增強的目的,但是就目前的科技水平而言,從帶有噪聲干擾的語音中提取完全純凈的語音的可能性為零。近年來,隨著科技的發展、生活質量的提高,人們對通信質量的要求也越來越高,為此必須增強系統抗噪聲干擾的能力,盡可能地從帶有噪聲干擾的語音中提取純凈的語音,提高系統的處理性能。
語音信號由于受噪聲的影響,且噪聲的來源很復雜,可能與接收環境有關,也可能來自發送端或者設備內部處理信號產生的噪聲等,這些噪聲必然影響語音源信號的質量。如何從攜帶噪聲干擾的語音中提取純凈的語音是語音增強的目的[1]。20世紀70年代中期Windrow B等[2]應用自適應相消法去噪,隨后幾年Limhe等[3]提出維納濾波法,Boll[4]提出譜相減法,80年代初Maulay和Malpass[5]提出軟判決噪聲抑制法,80年代中期Ephraim和Malah[6]提出了基于最小均方誤差(MMSE)短時譜語音增強法,而在80年代末,Paliwal[7]將卡爾曼濾波算法思想應用在語音增強算法中,進入90年代后,Ephraim[8]將信號子空間分解法應用于語音增強算法,而在2004年,Hu Yi和Loizou[9]將基于小波變換閾值函數的多窗口譜用于語音增強。經過多年的發展,語音增強算法已經逐步完善,已經變成整個語音系統中不可或缺的環節。
不同場景會產生不同的噪聲,不同的噪聲又有不同的特性,目前還沒有一種適用于所有噪聲類型的語音增強算法,因此需要結合不同的噪聲提出與之相對應的語音增強算法。
1.1語音信號的特征
發聲系統中不同位置發出的聲源是不同的,因此語音信號是一個非平穩的時變隨機過程,但人體中發聲器官的變化有限,聲帶和聲道處于一種相對穩定的狀態,語音信號的基本特征保持不變,可在語音增強算法中用語音信號的短平穩性對其進行分析。
1.2噪聲的特性
根據具體環境的不同,噪聲的特性差異很大,有些噪聲具有穩定性,有些噪聲是非平穩的,依據環境和語音信號之間的聯系,基本可以分為加性噪聲和非加性噪聲兩大類,本文著重于對加性噪聲的分析。
1.3語音增強算法的評判標準
1.3.1主觀評價法
平均意見(Mean Opinion Score,MOS)得分法和判斷韻字測試(Diagnostic Rhyme Test,DRT)得分法是2種主觀評價的基本方法。
(1)MOS得分法
這種評價方法采用5級評價標準,需要大量測試者的評價數據,并且需要足夠多的評測語音,最后去除所有測試者的平均評級等級即為最終的MOS得分,MOS評價標準如表1所示。

(2)DRT得分法
這種評價方法一般需要對大量測試者進行測試,對測試者播放多對相同韻母的同一韻字中的某音節,測試者根據所聽到的音節選出相應的字,采取全部測試者的正確百分比做為DRT得分,DRT評價標準如表2所示。

1.3.2客觀評價法
當人對語音質量敏感程度達不到算法要求時,主觀評價方法就不再繼續適用,客觀評價法一般有2種:信噪比(SNR)和分段信噪比(SEGSNR)。
(1)SNR

2.1小波基和閾值選取
利用閾值法去噪的依據是語音信號和噪聲信號在小波系數幅值上的不同,利用閾值法去噪,可以保留幅值較大的小波系數,這類系數一般為語音信號的小波系數,可將幅值小的小波系數減為零,這種小波系數一般為噪聲信號的語音系數。



將實驗仿真進行錄音,并將其作為原始語音信號,通過awgn函數對原始語音信號加入高斯白噪聲,將分解層數選為5,通過對軟閾值法、硬閾值法以及改進的軟硬閾值折衷算法的仿真,表明了改進算法的優勢。依據主觀評價法中的MOS得分法來評價閾值法的處理效果,仿真結果對比如圖2所示。


對比圖像可知,改進的軟硬閾值折衷算法對比軟閾值法和硬閾值法更好地還原了原始語音信號,經過硬閾值法處理后的語音信號平滑度不夠,而軟閾值法與原始語音信號有所偏差。并且,通過仿真實驗中播放處理后的語音信號,可以明顯地感受到本文提出的改進折衷算法的處理效果要優于傳統的軟閾值法以及硬閾值法。
通過理論分析,在Matlab中對基于小波變換的軟閾值法以及硬閾值法的語音增強算法予以實現,并提出了一種基于軟硬閾值算法的折衷算法。提出了一種基于軟硬閾值算法的折衷算法即改進軟硬閾值折衷算法,仿真結果表明,和傳統的閾值算法相比其適應性更優,克服了硬閾值函數不連續的缺點,減小了軟閾值函數中估計小波系數與分解小波系數的恒定偏差,可以根據噪聲信號的不同,通過修改式中系數,得到比傳統閾值法去噪更優的結果。
參考文獻
[1]趙力.語音信號處理[M].北京:機械工業出版社,2009.
[2] WIDROW B,GLOVER JR J R,MCCOOL J M,et al. Adaptive Noise Cancelling:Principles and Application[J].Proceedings of the IEEE,1975,63(12):1692-1716.
[3] LIM J S,OPPENHEIM A V.All-pole Modeling of Degraded Speech[J].Acoustics,Speech and Signal Processing,IEEE Transactions on,1978,26(3):197-210.
[4] BOLL S F.Suppression of Acoustic Noise in Speech Using Spectral Subtral[J].IEEE Transactions on ASSP, 1979,27(2):113-120.
[5] MCAULAY R,MALPASS M.Speech Enhancement Using A Soft-decision Noise Suppression Filter[J]. Acoustics, Speech and Signal Processing,IEEE Transaction on,1980,28(2):137-145.
[6] EPHRAIM Y,MALAH D.Speech Enhacement Using A Minimum-mean Square Error Short-time Spectral Amplitude Estimator[J].Acoustics,Speech and Signal Processing,IEEE Transactions on,1984,32(6):1109-1121.
[7] KALMAN R E. A New Approach to Linear Filtering and Prediction Problems[J]. Journal of Basic Engineering,1960,82(1):35-45.
[8] YARIV E, HARRY Van L.A Signal Subspace Approach for Speech Enhancement[J].IEEE Transactions.on Speech and Audio Processing,1995,3(4):251-266.
[9] HU Y,LOIZOU P C.Speech Enhancement Based on Wavelet Thresholding the Multitaper Spectrum[J].IEEE Trans.on Speech and Audio Processing, 2004,12(1):59-67.
[10]高迎東,王宏力,由四海,等.基于小波基函數選取與改進閾值函數的脈沖星信號去噪算法研究[J].電光與控制, 2020,27(4):15-19.
[11]崔公哲,張朝霞,楊玲珍,等.一種改進的小波閾值去噪算法[J].現代電子技術,2019,42(19):50-53.