張娓娓 陳樂瑞
(1.河南工業職業技術學院電氣工程系,河南 南陽 473000;2.鄭州鐵路職業技術學院,河南 鄭州 450001)
基于PSO-BP的語音增強方法研究
張娓娓1陳樂瑞2
(1.河南工業職業技術學院電氣工程系,河南 南陽 473000;2.鄭州鐵路職業技術學院,河南 鄭州 450001)
針對一些常用語音增強方法的特點和不足,本文提出將改進粒子群優化BP網絡算法用于語音增強,仿真結果表明:基于PSO-BP神經網絡的語音增強方法可以較大幅度的提升帶噪語音信號的信噪比,效果明顯。
語音增強;帶噪語音信號;信噪比
語音增強[1]是指當語音信號受到噪聲干擾,從含噪語音中提取盡可能純凈的原始語音的技術。目前,國內外諸多學者對語音增強領域進行了研究,并提出了多種方法,譜減法[2,3]因為其計算量比較小,比較容易實現,應用得也較多。文獻[2]提出了小波分層閾值處理法,其對于低信噪比下的處理結果不太理想,為此本文使用改進的粒子群優化神經網絡的學習算法對低信噪比下的帶噪語音信號進行了進一步處理。
2.1 PSO優化BP網絡算法
2.1.1 基本粒子群算法
在允許范圍內隨機產生粒子的速度和位移,之后根據(1)、(2)式迭代,直到找到滿意的解為止。

2.1.2 粒子群算法的改進

2.1.3 改進粒子群優化BP網絡步驟
第一步:初始化設置。
第二步:先對每個粒子的適應度值進行計算,然后將計算出來的各個粒子的適應度值進行比較,并對各個粒子的適應度值進行線性排列。
第三步:按照(1)和(2)式更新粒子的位移以及其速度,(1)式中w由w(k)代替。
第四步:計算各個個體的選擇概率,之后選擇、交叉,使得新一代種群生成。
第五步:若粒子群優化BP網絡算法的終止條件被滿足,可以求出最優解。如若終止條件沒有得到滿足,需要轉到第二步繼續進行。
第六步:確定網絡參數,使用相應的訓練樣本對網絡進行分幀訓練。
第七步:停止運算。
2.2 仿真結果分析
原始信號的時域波形圖,以及在該原始信號上加噪后的時域波形圖如圖1所示,從圖1中可以明顯看出,噪聲完全淹沒了原始的語音信號。針對這樣的情況,單靠傳統的濾波器沒有辦法將噪聲濾掉,即無法將原始信號從噪聲中提煉出來,而神經網絡卻具備了很好的非線性映射能力,正是利用網絡非線性映射能力這一特點,可以對低信噪比下的帶噪信號進行增強處理。

圖 1 原始語音信號波形圖和帶噪信號的波形圖

圖2 使用BP和PSO-BP網絡對帶噪語音的處理結果
圖2是使用BP網絡和改進粒子群優化BP網絡對同一段帶噪語音的處理結果。在處理效果上,與BP網絡相比,帶噪語音經改進粒子群優化BP網絡處理后,其噪聲成分有了更大衰減。在主觀聽覺上,使用改進粒子群優化BP網絡算法處理后的語音中仍然有較大噪聲存在,但與BP網絡的處理結果相比,原始語音可以聽得更清楚。
3.1 實錄環境
錄音環境為一報告廳,可容納300人,錄音時的噪聲有腳步聲,拿東西和放東西聲,竊竊私語聲,翻動紙張聲等,即報告廳常見噪聲。錄音軟件采用Windows系統自帶的錄音機軟件,量化為16位,采樣頻率為11025。
3.2 仿真結果分析
實錄語音段的內容為:“過程控制系統是實現生產過程自動化的平臺,而過程控制儀表與裝置是過程控制系統不可缺少的重要組成部分。”使用改進PSO-BP網絡對上述帶噪語音段進行增強處理,在未進行增強處理時,語音信號被淹沒在噪聲里,主觀聽覺上,語音段內容幾乎聽不到。經語音方法增強后有所改觀,但是譜減法的語音增強處理結果和小波分層閾值法語音增強處理結果,效果并不是太明顯,平均意見得分也僅在1.5左右。但是經過PSO-BP網絡處理后,語音的內容已經基本上能聽清楚,語音的質量和可懂度也得到了提高,平均意見得分為2.2。
分別使用譜減法、小波分層閾值法、BP網絡、改進PSO-BP方法對同一段信噪比為-9.66dB的帶噪語音信號進行增強處理的性能比較如表1所示。

表 1 不同方法的性能
本文提出了改進粒子群優化BP網絡算法,并分別用譜減法、小波分層閾值法、BP網絡、改進PSO-BP對語音信號進行了仿真處理。仿真結果表明,使用PSO-BP神經網絡對帶噪語音進行增強處理,可以大幅提高信噪比,效果明顯。

圖 3 極端噪聲環境下不同方法的處理結果
[1]張雄偉,陳亮,楊吉斌.現代語音處理技術及應用[M].北京:機械工業出版社,2003.
[2]靳志強,萬紅.小波分層閾值處理在語音增強中的應用[J],煤炭技術,2010:54-56.
[3]李季,孫秀霞,李士波,等.基于遺傳交叉因子的改進粒子群優化算法[J].計算機工程,2008,34(2):181~183.
[4]韓瑞通,王書明,黃理善,等.交叉粒子群算法在大地電磁反演中的應用[J].工程地球物理學報.2009,6(2):223~228.
[5]Adam Borowicz,Alexandr Petrovsky.Signal subspace ap?proach for psy-choacoustically motivated speech enhancement[J]. Speech Communicat-ion.2010(2).
[6]阮兆文.基于聲學模型和小波變換的語音增強方法研究[D].合肥:中國科技大學,2009.
[7]李如瑋,鮑長春,竇慧晶.基于小波變換的語音增強算法綜述[J].數據采集與處理.2009(03).
[8]Stephen So,Kuldip K.Paliwal.Modulationdomain Kal?man filtering for single-channel speech enhan-cement[J]. Speech Communication.2011(6).
TN912
A
1671-0037(2014)04-60-1.7