999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種改進的雙麥克智能語音前端算法

2018-03-29 08:20:55方賽鴻
網絡安全與數據管理 2018年2期
關鍵詞:信號

方賽鴻

(福州瑞芯微電子股份有限公司,福建 福州 350003)

0 引言

隨著人工智能的興起與發(fā)展,語音處理的作用也越來越重要。當前比較熱門的語音交互平臺有蘋果的Siri、亞馬遜的Alexa以及科大訊飛的訊飛云,這些軟件可以將說話人的聲音信號轉化為文字信息,進而控制硬件系統(tǒng)。語音識別率決定語音交互系統(tǒng)的性能,語音信號進入語音識別系統(tǒng)之前需要進行預處理。

由于環(huán)境噪聲和墻壁等障礙物的存在,麥克風采集的語音信號通常包含噪聲和混響,它們會降低語音的清晰度和可懂度,導致語音識別系統(tǒng)識別率下降。因此,語音信號進入語音識別系統(tǒng)之前,需要進行噪聲和混響消除。目前,多通道語音增強算法主要分為三類:波束形成[1]、逆濾波[2]以及盲源分離[3]。 HABETS EAP等人提出了一種雙麥克風噪聲和混響消除算法[4],該算法輸出存在一定的失真,本文對其進行改進,并利用仿真數據驗證改進算法的有效性。

1 混響理論

房間混響信號是由聲源信號s(n)和房間聲學沖激響應函數h(n)卷積產生的。h(n)可分為三個部分:直達路徑、前期反射和后期反射,如圖1所示。

圖1 房間沖激響應示意

混響時間為400 ms的某一房間的房間沖激響應如圖2所示。

對于第i路麥克風在某離散時間n時的混響信號可以表示為:

(1)

因此,第i路麥克風接收到的信號可以表示為:

Xi(n)=Zi(n)+Vi(n)

(2)

圖2 混響時間為400 ms的房間沖激響應

其中Vi(n)表示背景噪聲。

對輸入的陣列語音信號加窗分幀(每幀長度在30 ms以內)后,通過短時傅里葉變換[5]由時域變換到頻域,式(2)的頻域表示如下:

Xi(m,k) =Zi(m,k)+Vi(m,k)

=Di(m,k)+Ri(m,k)+Vi(m,k)

(3)

其中m表示幀索引,k表示頻率索引;Di和Ri分別表示第i路麥克風輸入信號中的直達聲(包括直達聲和早期反射,為了簡化統(tǒng)稱直達聲)和后期混響聲。混響消除算法的目的是盡可能地去除Ri(m,k)。

2 Habets雙麥克風算法及其問題分析

2.1 Habets雙麥克風算法

Habets雙麥克風原理圖如圖3所示。整個結構包含四個部分:固定波束形成器、噪聲功率譜估計、后期混響功率譜估計和單通道后置濾波器。固定波束形成器的系數固定為[0.5,0.5],輸出為Q(m,k);噪聲功率譜估計是利用優(yōu)化最小控制遞歸平均[6]算法估計Q(m,k)中噪聲功率譜λv(m,k);后期混響功率譜估計是利用Polack模型[5]估計輸入信號中的后期混響功率譜密度λr;單通道后置濾波器采用的是OM-LSA算法[7],根據前面估計的噪聲和后期混響來計算增益函數GOM-LSA,最終的輸出為:

Y(m,k)=GOM-LSA(m,k)Q(m,k)

(4)

圖3 Habets雙麥克風算法原理圖

2.2 Habets算法存在的問題及其分析

后置OM-LSA算法的譜增益函數如下:

GOM-LSA(m,k)=GLSA(m,k)p(m,k)Gmin(m,k)1-p(m,k)

(5)

其中p(m,k)表示語音存在概率,Gmin表示增益下限,p(m,k)計算表達式如式(6)所示:

p(m,k)=

(6)

q(m,k)=

(7)

公式(6)中ξ(m,k)表示先驗信噪比,v(m,k)的值和ξ(m,k)有關;分析式(7)發(fā)現,q(m,k)的取值與閾值γ1和ζ0有關[6]。實際這兩個閾值是固定的常數,在某些幀q(m,k)可能會出現較大偏差,會導致增益函數異常,使得輸出失真。Habets雙麥克風算法輸出與純凈語音波形對比如圖4所示。觀察圖中橢圓圈標記部分發(fā)現,算法的輸出在某些時刻存在失真,這種失真最終導致識別系統(tǒng)識別率的降低。

圖4 Habets雙麥克風算法輸出與純凈語音波形對比

3 本文提出的基于維納濾波的改進算法

針對Habets算法存在的問題,本文的改進思路是將Habets算法的后置濾波器用維納濾波進行替換。改進算法的原理圖如圖5所示。

圖5 改進算法框圖

對應該系統(tǒng)的維納濾波器的表達式如下:

(8)

式中:

ξ(m,k)=βH(m-1,k)+ξ(m-1,k)+

(1-β)max{γ(m,k)-1,0}

(9)

(10)

式(9)中的β表示權重因子,γ(m,k)表示后驗信噪比。

(11)

其中,Hmin,R和Hmin,N0是常數,用來控制噪聲和混響消除的最大化。

改進算法最終的輸出為:

Y(m,k)=H(m,k)Q(m,k)

(12)

4 實驗結果

4.1 仿真實驗

本次仿真實驗采用間距為10 cm的線性麥克風陣列。純凈聲源取自TIMIT標準語音庫,噪聲源取自Noise92語音庫。利用MATLAB工具箱[8]生成陣列語音信號。仿真時,房間大小設置成4.6 m×4.6 m×3.2 m,聲源到麥克風陣列的距離設置成3種情況:1.5 m、2 m和2.5 m,采樣頻率為16 kHz,墻壁的吸聲系數設置為[0.8,0.8,0.8,0.8,0.7,0.4],聲源混響時間設置為400 ms。

仿真房間沖激響應曲線圖如圖6所示,純凈源語音的波形圖以及語譜圖如圖7所示。

圖6 仿真實驗環(huán)境房間沖激響應

圖7 純凈語音的波形圖和語譜圖

輸入信噪比為10 dB的陣列信號的波形和語譜圖如圖8所示。

圖8 輸入信號波形和語譜

Habets算法和改進算法處理后的結果分別如圖9和圖10所示。

圖9 Habets算法輸出

圖10 改進算法輸出

觀察圖9和圖10可以發(fā)現,Habets雙麥克風算法噪聲消除性能很好,但是輸出存在失真;改進算法噪聲消除性能變弱,但是輸出失真減小。

4.2 實際實驗

為了驗證改進算法輸出識別率是否有所提高,采用科大訊飛四麥克風陣列模塊采集語音信號,將采集到的信號通過Habets算法和改進算法處理后,將算法的輸出送到語義識別端,比較識別結果。語義識別算法采用的是訊飛開放平臺的語音聽寫模塊[9]。

10個不同的人分別站在距離麥克風1.5 m、2 m、2.5 m的地方說“今天天氣很好,福州天氣,劉德華的電影”,總共16個漢字。假設某一組采集數據經過算法處理后通過語義識別算法能識別出的正確字數為N,那么識別率計算如下:

(13)

然后對10組識別率求平均得到最終的識別率結果。

對未處理、Habets算法輸出以及改進算法的輸出通過語義識別端進行識別率結果對比,如表1所示。

表1 不同算法處理結果識別率的比較 (%)

由表1可知,隨著聲源到麥克風距離的增加,三種情況下的識別率都越來越低;未處理的語音信號識別率急劇下降,改進算法識別率情況最好。由此可以說明,改進算法是有效的。

5 結論

本文對Habets雙麥克風噪聲和混響消除算法進行研究,針對其存在的問題,提出了一種改進算法。經過仿真數據和實錄數據的測試發(fā)現,改進算法與Habets

算法相比,噪聲消除性能有所下降,但是改進算法輸出失真更小,最終的識別率也有一定的提升。隨著聲源到麥克風距離的增加,改進算法輸出的識別率也越來越低,有待后續(xù)進一步優(yōu)化。

[1] MCCOWAN I A, MOORE D C, SRIDHARAN S. Near-field adaptive beamformer for robust speech recognition[J]. Digital Signal Processing, 2002, 12(1): 87-106.

[2] Xu Guanghan, Liu Hui, Tong Lang, et al. A least-squares approach to blind channelidentification[J]. IEEE Transactions on Signal Processing, 1996, 43(12): 2982-2993.

[3] ABRARD F, DEVILLE Y. A time frequency blind signal separation method applicable to underdetermined mixtures of dependent sources[J]. Signal Processing, 2005, 85(7): 1389-1403.

[4] HABETS E A P, GANNOT S, COHEN I. Dual-microphone speech dereverberation in a noisy environment[C]//IEEE International Symposium on Signal Processing and Information Technology. IEEE, 2006:651-655.

[5] WOLFE P J,GODSILL S J. Efficient alternatives to the Ephraim and Malah suppression rule for audio signal enhancement[J]. EURASIP Journal on Advances in Signal Processing, 2003, 2003(10):1043-1051.

[6] COHEN I. Noise spectrum estimation in adverseenvironments:improved minima controlled recursive averaging[J]. IEEE Transactions on Speech & Audio Processing,2003,11(5):466-475.

[7] COHEN I,BERDUGO B. Speech enhancement for non-stationary noise environments[J]. Signal Processing,2001,81(11):2403-2418.

[8] LEHMANN E A. Image-source method:Matlab code implementation[EB/OL].(2006-08-01)[2017-03-12]http://www.eric-lehmann.com/

[9] 訊飛開放平臺[EB/OL].(2012-03-22)[2017-02-24]http://www.xfyun.cn/sdk/dispatcher.

猜你喜歡
信號
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
7個信號,警惕寶寶要感冒
媽媽寶寶(2019年10期)2019-10-26 02:45:34
孩子停止長個的信號
《鐵道通信信號》訂閱單
基于FPGA的多功能信號發(fā)生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
基于Arduino的聯鎖信號控制接口研究
《鐵道通信信號》訂閱單
基于LabVIEW的力加載信號采集與PID控制
Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
主站蜘蛛池模板: 国产99欧美精品久久精品久久| 亚洲无码免费黄色网址| 日韩经典精品无码一区二区| 亚洲人成在线精品| 亚洲一区二区三区中文字幕5566| 久久精品电影| 欧美亚洲国产日韩电影在线| 91成人在线免费视频| 国产综合另类小说色区色噜噜 | 国产成人精品一区二区不卡| 日韩久草视频| 丝袜国产一区| 亚洲国产精品成人久久综合影院| 日韩无码视频专区| 国产免费高清无需播放器| 操美女免费网站| 日本一本正道综合久久dvd | 亚洲国产av无码综合原创国产| 国产香蕉一区二区在线网站| 日本久久网站| V一区无码内射国产| 青青草国产一区二区三区| 无码aⅴ精品一区二区三区| 在线精品亚洲国产| 国产精品亚洲专区一区| 中文字幕乱码二三区免费| 日韩a在线观看免费观看| 激情综合网址| 国产成人精品一区二区免费看京| 黑色丝袜高跟国产在线91| 毛片久久久| 欧美成人一级| 先锋资源久久| 成人精品免费视频| 国产在线观看一区精品| 欧美一级在线看| 伊人91在线| 97视频免费在线观看| 99er这里只有精品| 欧美精品综合视频一区二区| 午夜高清国产拍精品| 亚洲第一视频免费在线| 最新国产成人剧情在线播放| 五月丁香伊人啪啪手机免费观看| 永久免费精品视频| 国产丝袜无码精品| 东京热一区二区三区无码视频| 亚洲国产中文综合专区在| 一本色道久久88综合日韩精品| 一级全黄毛片| 日韩午夜福利在线观看| 亚洲精品在线观看91| 夜夜高潮夜夜爽国产伦精品| 一级成人欧美一区在线观看 | 精品超清无码视频在线观看| 午夜福利视频一区| 中文字幕一区二区人妻电影| 国产乱人激情H在线观看| 国产全黄a一级毛片| 国产一级一级毛片永久| 二级特黄绝大片免费视频大片| 亚洲欧美日本国产综合在线| 第九色区aⅴ天堂久久香| 91在线视频福利| 免费不卡视频| 欧美成人一级| 国产午夜福利亚洲第一| 国产系列在线| 无码一区中文字幕| 福利视频一区| 毛片在线区| 亚洲精品国产乱码不卡| 亚洲国产天堂在线观看| 国产va欧美va在线观看| 日本爱爱精品一区二区| 欧美色综合久久| 亚洲啪啪网| 女人18毛片久久| 亚洲v日韩v欧美在线观看| 激情無極限的亚洲一区免费| 日本高清视频在线www色| 国产一级视频久久|