朱佰澤 卜慶凱
摘 要: 語音作為一種搭載著特定的信息模擬信號,已成為人們社會生活中獲取信息和傳播信息的重要的手段。語音信號處理的目的就是在復雜的語音環境中提取有效的語音信息。環境干擾在語音傳播過程中對信號的影響不容小覷,因此語音信號處理的抗噪聲能力已經成為一個重要的研究方向。Matlab的應用有著廣泛的領域,在信息處理領域其強大的數據處理能力可以將非平穩時變的語音數據轉換為離散的數據,然后可對離散數據進行分析或者做進一步運算處理。它的信號處理工具箱可以迅速、有效地實現語音信號的處理和分析,Matlab是適用于信號處理領域的強大的處理工具。在此運用Matlab對一段包含有環境噪聲的語音進行傅里葉變換、時域和頻域分析、提取部分語音信號及分析信號的處理。
關鍵詞: Matlab; 語音信號; 傅里葉變換; 信號處理
中圖分類號: TN911.74?34; TP311.1 文獻標識碼: A 文章編號: 1004?373X(2016)04?0009?03
Abstract: Speech signal processing is to extract the effective speech information from the complex speech environment. The influence of environmental interference in speech communication process on the speech signal should not be underestimated, so the anti?noise ability of speech signal processing has become an important research direction. Matlab has a powerful data processing capacity in the information processing field and can convert the nonstationary time?varying audio data into discrete data, and then performs discrete data analysis or further processing. Its signal processing toolbox can quickly and effectively achieve the processing and analysis of speech signal. It is a powerful processing tool in the signal processing field. For a piece of speech containing environment noise, Matlab was used to do Fourier transform, time domain and frequency domain analysis, extraction of partial speech signal and analysis of signal characteristic.
Keywords: Matlab; voice signal; Fourier transform; signal processing
0 引 言
語言作為傳播信息的工具,其最主要的表現形式是語音,語音為交際和思維提供了比文字更為便捷的方式。人類的語言起源于語音,由語音開始逐漸演變為文字,而不是先有文字后有語音。語音是由人類聲帶發出具有社會功能的特殊聲音,語音是語言符號的載體,對信息的傳遞起著重要的推動作用。如果沒有了語言,人們也就失去了交換思想和實施社會活動獨特的功能,幾千年的人類文明史將難以創造和繼承。伴隨著科技的發展,人們對信息的傳播速度及質量要求越來越高,通過現代語音信號處理技術的研究和探索,可以讓人們語音信息的產生、傳輸、存儲、檢索更有效率。信號處理的發展讓計算機能聽到聲音,看到圖片,還能說話,其中語音在未來人機交互中更具優勢,也是最具發展潛力的方向[1]。本文對數字信號處理中所用的原理進行了詳細的介紹,運用巴特沃斯型濾波器和切比雪夫濾波器實現了語音信號的提取和去噪濾波。運用Matlab 7.0軟件編寫語音信號處理的程序實現語音信號處理,包括信號的采集、傅里葉變換、倒譜、濾波等。
1 語音信號的處理設計
Matlab可以方便地實現模擬信號轉換為數字信號,快捷地實現傅里葉、倒譜等計算,使設計處理語音的速度更為高效,提取語音的效果更明顯易懂。語音信號處理分為三個步驟來進行:第一步是采集語音信號,對其進行傅里葉變換、倒譜;第二步是將采集到的語音通過設計好的巴特沃斯型濾波器和切比雪夫濾波器濾波。第三步根據經過濾波處理后提取到語音信號的質量對濾波器提取信息的有效性進行分析。
1.1 語音信號的提取
首先需要采集到音頻信號“啊歐,你有新的消息請注意查收”,同時語音中也包含些許背景噪聲,這對信息的提取和傳遞性產生了一定的影響,獲取信號的采樣頻率為22 500 Hz。
采集數據并畫出波形圖,整段音頻的時域波形高低起伏與錄入的聲音信號基本一致,由該語音信號波形圖可以大致分析出振幅主要分布在0~1之間,聲調有高有低,含有高頻和低頻成分,時長3 s,如圖1所示。
1.2 語音信號的倒譜
倒譜分析[2],其可以采集到頻譜包絡信息用來表現音韻的特征參數,也可以采集到細微的結構信息。聲道特性和聲門特征可以通過頻譜分析得到有效的參數,這些參數的獲取可以通過語音來精確地分辨一個人。對語音信號進行頻譜分析,可以提取到聲道和聲門參數,以便通過聲音來區分不同的人。倒譜分析在各類信號分析中經常使用,要獲取倒譜需要先取得信號的頻譜,再對頻譜的對數進行快速傅里葉變換,然后可得信號倒譜。
頻譜圖展示了采集的語音信號在不同頻率上所攜帶的能量的狀況,而倒譜是檢測采樣信號頻譜周期性的工具。倒譜圖中存在多個峰值表示主要頻率成分,通過對語音倒譜的峰值提取得到的共振峰對人的聲音具有較高的辨識度。
1.3 語音信號的濾波
如圖2所示,使用Matlab采集到的語音信號中含有嘈雜的噪聲,這些背景噪聲頻率一般較高。為了進一步提取到有效的語音信息,使用各種濾波器對采集的語音進行濾波,分析利用各個濾波器提取到語音信息的質量。
1.3.1 語音信號的低通濾波
切比雪夫?I型低通濾波器中,設計截止頻率為1 000 Hz,其性能指標是: [ωp=0.075π,ωs=0.125π,][Rp=0.25 dB,As=50 dB。]然后采集到信號的圖,如圖3所示。
1.3.2 語音信號的高通濾波
為了使采集到的語音信號通過切比雪夫?Ⅱ型數字高通濾波器,設計其性能指標為:[ωp=0.6π,][ωs=0.975π,Rp=0.25 dB,As=50 dB。]然后采集到的信號如圖4所示。
1.3.3 語音信號的帶通濾波
讓采集到的語音信號通過巴特沃斯帶通濾波器,帶通濾波性能指標為:N=5;ωc=[0.1,0.3];信號通過此濾波器后仿真圖如圖5所示。
1.3.4 語音信號的帶阻濾波
對采集到的語音信號運用巴特沃斯數字帶阻濾波器[2]進行過濾提取,結果如圖6所示。
在頻譜圖中此次采集到的語音能量分布比較分散,其中語音也包括背景噪聲。由各種數字濾波器提取得到語音信號對比可知,通過低通濾波后,提取到的語音頻率更加集中分布在500~1 000 Hz范圍內。由于低頻分量被低通濾波器保留,高頻分量被衰減,語音聽起來有些發悶、低沉;但由于背景噪聲被濾除,語音中包含的信息仍能被人耳分辨,提取到的語音辨識度較高。通過高通濾波后,人聲頻率無法達到足夠高的頻率,不能通過高通濾波器,所以提取到的語音信號聽不到人的聲音。帶通濾波后,大部分語音被濾除,只有部分語音頻率可被提取到,濾波后聲音有點像兒童發出的聲音,提取到的語音信息人耳辨別困難。帶阻濾波后,在語音中只有部分頻率被濾除,提取到的聲音聽上去比較混濁。
2 結 語
本文構建了一個基本的語音信號處理系統,經過測試運行,完成了對語音信號的采集,通過FFT變換得出了語音信號的頻譜圖和頻譜的分析,并運用濾波、倒譜等數字語音處理技術,最后再對提取到的語音信息進行效果分析和比對。設計主要是從數字濾波器入手來設計濾波器,提取了自定義頻段內的語音信號,同時比較各種濾波器對語音信號的影響,為如何有效除噪提供了良好的方法。
注:本文通訊作者為卜慶凱。
參考文獻
[1] 張雄偉,陳量,吉斌,等.現代語音處理技術及應用[M].北京:機械工業出版社,2003.
[2] 王京輝.語音信號處理技術研究論[D].濟南:山東大學,2008.
[3] 任明溪.基于EMD與特征規整的含噪語音特征提取方法研究[D].哈爾濱:哈爾濱工程大學,2012.
[4] 王彪.基于EMD法的語音信號特征提取方法研究[D].寶雞:寶雞文理學院,2012.
[5] 于俊鳳.語音信號的識別和轉換研究[D].成都:成都理工大學,2004.
[6] 王彪.一種改進的語音信號特征參數提取算法研究[D].寶雞:寶雞文理學院,2011.
[7] 俞翠華.含噪語音信號的基音提取算法的研究[D].南京:南京信息工程大學,2011.
[8] 孫廣.基于優化語音提取的聲紋識別系統[D].西安:西安建筑科技大學,2013 .
[9] 肖宇鋒.基于ISOMAP語音特征提取的研究與DSP實現[D].長沙:湖南大學,2013.
[10] 胡航.語音信號處理[M].哈爾濱:哈爾濱工業大學出版社,2005.