999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種結合直達聲補償策略的混響抑制算法

2017-12-29 06:15:33陳長海
網絡安全與數據管理 2017年24期
關鍵詞:信號策略

陳長海

(福州瑞芯微電子股份有限公司,福建 福州 350003)

一種結合直達聲補償策略的混響抑制算法

陳長海

(福州瑞芯微電子股份有限公司,福建 福州350003)

混響是聲音經過室內墻壁等物體反射、吸收后多徑傳播疊加產生的,是導致語音識別系統性能下降的主要因素之一。基于TF-GSC的混響消除算法在估計混響功率譜時可能會出現過估計的現象,導致輸出語音失真。提出一種直達聲補償策略,并將其應用到混響抑制算法中去。實驗結果表明,直達聲補償策略減小了輸出語音失真,提高了輸出語音質量。

混響;TF-GSC;直達聲補償;混響功率譜估計

0 引言

隨著人工智能技術研究與應用的興起,越來越多的產品可以實現人機交互,人們可以通過語音控制機器執行一些操作。例如智能電視,用戶可以通過語音控制換臺、音量的調整,甚至可以利用智能電視進行一些社交活動[1]。實時語音識別系統是實現人機交互的橋梁[2],隨著人機交互應用場景的復雜化,對語音識別系統性能的要求也越來越高。

室內麥克風采集到的語音信號通常包含噪聲和混響,使得語音信號的保真度和清晰度下降,從而導致實時語音識別系統性能的降低。其中,混響是聲音經過室內墻壁等物體反射、吸收后,由多徑傳播產生的。麥克風接收到的語音信號在時序上可以分為三個部分:直達聲、早期反射聲、后期混響聲。后期混響會掩蓋弱語音部分,影響語音的清晰度[3-4]。為了提高語音識別系統的性能,必須抑制后期混響?,F有的混響處理算法可以分為兩大類:混響消除和混響抑制[5]?;祉懴乃悸肥菍Ψ块g聲學系統求逆,因此需要對房間聲學系統進行估計,計算量較大;混響抑制算法利用譜增強策略來抑制語音中的混響,避免了房間聲學系統估計這一難題。

本文提出了一種直達聲補償策略,并將其應用到基于TF-GSC的混響消除算法中,從而改善算法的性能。

1 混響理論

房間混響信號是由聲源信號s(n)和房間聲學沖激響應函數h(n)卷積產生的。h(n)可分為三個部分:直達路徑、前期反射和后期反射,如圖1所示。

圖1 房間沖激響應示意

混響時間為400 ms的某一房間的房間沖激響應如圖2所示。

圖2 混響時間為400 ms的房間沖激響應

對于第i路麥克風在某離散時間n時的混響信號可以表示為:

(1)

因此,第i路麥克風接收到的信號可以表示為:

xi(n)=zi(n)+vi(n)

(2)

其中vi(n)表示背景噪聲。

對輸入的陣列語音信號加窗分幀(每幀長度在30 ms以內)后,通過短時傅里葉變換[6]由時域變換到頻域,式(2)的頻域表示如下:

Xi(m,k)=Zi(m,k)+Vi(m,k)

=Di(m,k)+Ri(m,k)+Vi(m,k)

(3)

其中m表示幀索引,k表示頻率索引,Di和Ri分別表示第i路麥克風輸入信號中的直達聲(包括直達聲和早期反射,為了簡化統稱直達聲)和后期混響聲。混響消除算法的目的是盡可能地去除Ri(m,k)。

2 基于TF-GSC的混響消除算法

HABETS E[7]等人提出了一種基于TF-GSC的噪聲和混響消除算法,算法的原理圖如圖3所示(以4麥克風為例)。

圖3 基于TF-GSC的混響抑制算法框圖

由圖3可知,算法主要包含四個部分,分別是TF-GSC、噪聲功率譜估計[8]、混響功率譜估計以及后置單通道濾波器。

2.1 基于傳輸函數的廣義旁瓣抵消器

基于傳輸函數的廣義旁瓣抵消器(TF-GSC)是廣義旁瓣抵消器的改進形式,其結構理論上可以處理任何的聲學傳輸函數,適合混響等復雜條件下陣列語音信號的處理[9]。其基本結構如圖3虛線框中部分所示。它主要由非自適應部分和自適應部分組成,非自適應部分主要是一個固定波束形成器,自適應部分由一個阻塞矩陣和一個自適應濾波器組成。

對輸入陣列信號進行時延補償[10],使得各路輸入信號中的期望信號時域同步,加窗分幀后通過短時傅里葉變換由時域轉換到頻域。傳輸函數比(Transfer Function Ratio)矢量如下:

(4)

其中Ai(k)表示聲源到第i路麥克風的傳輸函數的頻域形式。

固定波束形成器的系數矩陣為:

(5)

阻塞矩陣B相當于一個空域濾波器,目的是阻塞期望方向上的信號,留下非期望方向的干擾信號組合;TF-GSC的阻塞矩陣的頻域形式如下:

(6)

其中*表示共軛。

實際環境中的Ai(k)是未知的,因此傳輸函數比也是未知的,需要對其進行估計,通常是利用信號之間互功率譜密度的來進行求解,如式(7)所示。

(7)

其中Φxix1表示第i路麥克風的輸入與第1路麥克風的輸入之間的互功率譜密度,〈 〉表示幀平均。

自適應濾波部分采用的是自適應LMS算法,自適應濾波器的系數矩陣G計算如下:

G(m+1,k)=G(m,k)+μU(m,k)Y*(m,k)

(8)

U(k,m)=B?(k)X(m,k)

(9)

其中μ表示LMS算法的步長,U(k,m)表示阻塞矩陣的輸出,?表示共軛轉置,*表示共軛,XT(m,k)表示輸入:

XT(m,k)=[X1(m,k),X2(m,k),X2(m,k),X4(m,k)]

(10)

最終的輸出:

Y(m,k)=W?(k)X(m,k)-G?(m,k)U(k,m)

(11)

2.2 問題分析

Habets算法估計后期混響采用的是Polack混響統計模型,這種隨機模型對大部分的聲學環境的模擬都是相當精準的。KUTTRUF H[11]認為只有當聲源到麥克風的距離大于臨界距離時,Polack混響統計模型才有效,這里的臨界距離是指此距離上的直達聲能量與前期和后期反射的能量相等。這也就意味著當直達聲的能量小于前期和后期反射信號的能量時,Polack模型才有效。實際處理過程中,某些幀的語音信號可能不滿足臨界條件,導致后期混響功率譜出現過估計,造成輸出信號的譜失真,如圖4所示。

圖4 Habets算法輸入輸出語譜圖對比

3 本文提出的直達聲補償策略

利用Polack混響模型估計后期混響時可能會出現過估計的現象[7]。輸入陣列語音包含直達聲(包含早期反射)、后期混響以及外界噪聲,假設噪聲的估計準確,則剩下的直達聲和后期混響的總功率譜密度是定值,后期混響的過估計會導致直達聲的估計出現偏差,導致系統的輸出結果出現失真現象。本文提出了一種直達聲補償策略,引入動態變量κi(m)利用下面的式子來估計混響聲(包括直達聲和后期混響,即輸入信號去掉噪聲后的剩余部分):

(12)

其中κi(m)表示第i路麥克風的第m幀的直達聲補償系數,這個系數與直達聲和后期混響的能量有關。

(13)

直達聲補償系數κi(m)的更新滿足以下策略:

因此,κi(m)的值的更新可以根據下面的式子進行自動調整:

(14)

其中μk表示步長,且滿足0<μk<1。

利用基于TF-GSC的混響抑制算法去除混響時,利用本文提出的直達聲補償策略估計混響功率譜,可以防止混響功率譜出現過估計。

4 實驗結果

本次仿真實驗采用間距為10 cm的線性麥克風陣列,麥克風數目為4,房間大小為4 m×5 m×3.5 m,聲源到麥克風陣列的距離設置成3種情況:1.5 m、2 m和2.5 m,墻壁的吸聲系數設置為[0.8,0.8,0.8,0.8,0.7,0.4]。純凈聲源取自TIMIT標準語音庫,采樣頻率為16 kHz,長度為3.5 s,語音信號的內容為:She had your dark suit in greasy wash water all year。利用Eric A. Lehmann編寫的Image-source method 工具箱來獲取仿真混響語音信號。

仿真房間沖激響應曲線圖和純凈源語音的波形圖以及語譜圖如圖5和圖6所示。

圖5 仿真實驗環境房間沖激響應

圖6 純凈語音的波形圖和語譜圖

混響程度不同的幾組仿真語音波形圖和語譜圖分別如圖7和圖8所示。

圖7 混響時間分別為0.4 s、0.8 s以及1.2 s的混響語音信號與純凈語音信號波形對比

圖8 混響時間分別為0.4 s、0.8 s以及1.2 s的混響語音信號與純凈語音信號語譜圖對比

由圖7和圖8可以發現,混響會導致語音中聲音的間隔變得模糊,導致語音的質量嚴重下降。

為了驗證本文提出的直達聲補償策略的有效性,分別用沒有結合直達聲補償策略的基于TF-GSC的混響消除算法和結合直達聲補償策略的基于TF-GSC的混響消除算法對混響語音進行處理,混響時間為0.4 s的混響語音經過兩種算法處理后的波形圖和語譜圖如圖9和10所示。

圖9 直達聲補償策略應用前后波形圖對比

圖10 直達聲補償策略應用前后語譜圖對比

觀察圖9和圖10可以發現,基于TF-GSC的混響抑制算法結合直達聲補償策略后,輸出語音失真減小,圖9虛線方框選中部分十分明顯,由此可以證明本文提出的直達聲補償策略是有效的。

5 結論

傳統的基于TF-GSC的混響抑制算法需要估計混響的功率譜,有時會出現過估計的現象。本文提出一種直達聲補償策略,并將其應用到混響抑制算法中去。經實驗驗證,本文提出的直達聲補償策略能夠防止混響功率譜出現過估計,減小算法輸出的失真。該策略適用于語音識別系統的前端處理模塊,能夠很好地對輸入語音進行預處理。

[1] 袁洪,鄧忠平. 智能電視發展趨勢與挑戰[J].網絡新媒體技術,2012,1(1):4-9.

[2] 謝凌云. 實時語音識別系統的快速算法研究[D].北京:中國科學院聲學研究所,2004.

[3] 栗曉麗,徐柏齡. 混響聲場中語音識別方法研究[J]. 南京大學學報(自然科學),2003,39(4):525-531.

[4] OMOLOGO M,SVAIZER P,MATASSONI M. Environmental conditions and acoustic transduction in hands-free speech recognition[J]. Speech Communication,1998,25(1-3):75-95.

[5] MCAULAY R,MALPASS M. Speech enhancement using a soft-decision noise suppression filter[J]. IEEE Transactions on Acoustics Speech & Signal Processing,1980,28(2):137-145.

[7] HABETS E. Single and multi-microphone speech dereverberation using spectral enhancement[D]. Technische Universiteitndhoven,2007.

[6] 朱冰蓮,楊磊. 心音信號的短時傅立葉變換分析[J]. 重慶大學學報(自然科學版),2004,27(8):83-85.

[8] COHEN I. Noise spectrum estimation in adverse environments: improved minima controlled recursive averaging[J]. IEEE Transactions on Speech & Audio Processing,2003,11(5):466-475.

[9] EPHRAIM Y,MALAH D. Speech enhancement using a minimum-mean square error short-time spectral amplitude estimator[J]. IEEE Transactions on Acoustics Speech & Signal Processing,1985,33(2):443-445.

[10] 崔瑋瑋,曹志剛,魏建強.聲源定位中的時延估計技術[J]. 數據采集與處理,2007,22(1):90-99.

[11] KUTTRUFF H. Room acoustics[M]. Spon Press,London,Taylor & Francis,2000.

A speech dereverberation algorithm with the combination of direct path strategy

Chen Changhai

(Fuzhou RockChip Electronics Co.,Ltd.,Fuzhou 350003,China)

The reverberation is generated when the speech signal is reflected and absorbed by wall and other objects,and is superimposed by multipath propagation,which is one of the main reasons that degrade the performance of speech recognition systems. The dereverberation algorithm based on TF-GSC may lead to excessive estimation of reverberation power spectrum,resulting in the distortion of output. In this paper,a direct path compensation strategy is proposed and applied to the dereverberation algorithm. The experimental results show that the direct path compensation strategy reduces the output speech distortion and improves the quality of output speech.

reverberation; TF-GSC; direct path compensation; reverberation power spectrum

TP312

A

10.19358/j.issn.1674-7720.2017.24.010

陳長海.一種結合直達聲補償策略的混響抑制算法J.微型機與應用,2017,36(24):32-36.

2017-06-23)

陳長海(1984-),男,碩士研究生,主要研究方向:智能音頻和智能車載產品。

猜你喜歡
信號策略
基于“選—練—評”一體化的二輪復習策略
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
求初相φ的常見策略
例談未知角三角函數值的求解策略
我說你做講策略
孩子停止長個的信號
高中數學復習的具體策略
數學大世界(2018年1期)2018-04-12 05:39:14
基于LabVIEW的力加載信號采集與PID控制
一種基于極大似然估計的信號盲抽取算法
主站蜘蛛池模板: 亚洲成人网在线播放| 极品私人尤物在线精品首页| 性视频久久| 国产h视频在线观看视频| 亚洲中文字幕无码爆乳| a级毛片免费网站| 91成人试看福利体验区| 国产精品自在线天天看片| 国产69囗曝护士吞精在线视频| 国产正在播放| 久久精品一卡日本电影| 亚洲中文字幕手机在线第一页| 亚洲欧州色色免费AV| 欧美成人精品在线| 丰满少妇αⅴ无码区| 日韩精品一区二区三区中文无码| 亚洲人成成无码网WWW| 中文字幕人妻无码系列第三区| 亚洲一区网站| 欧洲日本亚洲中文字幕| 美女扒开下面流白浆在线试听| 国产激情国语对白普通话| 99草精品视频| 欧美性猛交xxxx乱大交极品| 国产大片喷水在线在线视频| 日本五区在线不卡精品| 国产产在线精品亚洲aavv| 亚洲成年人网| 亚洲男女在线| 高清欧美性猛交XXXX黑人猛交| 噜噜噜久久| 免费国产好深啊好涨好硬视频| www亚洲精品| 色哟哟国产精品一区二区| 亚洲乱码精品久久久久..| a天堂视频| 华人在线亚洲欧美精品| 国产91麻豆免费观看| 亚洲男人天堂久久| 干中文字幕| 国产福利在线免费| 亚洲男人天堂2020| 尤物亚洲最大AV无码网站| 婷婷99视频精品全部在线观看 | 国产精品林美惠子在线观看| 免费人成又黄又爽的视频网站| 人妻中文字幕无码久久一区| 97视频在线观看免费视频| 久久网综合| 国产玖玖视频| 亚洲另类国产欧美一区二区| 国产精品白浆在线播放| 天堂av综合网| 一本大道视频精品人妻| 黑人巨大精品欧美一区二区区| 第九色区aⅴ天堂久久香| 国产成人精品2021欧美日韩| 在线精品自拍| 成人综合在线观看| 国内精品自在自线视频香蕉| 亚洲高清资源| 男女性午夜福利网站| 找国产毛片看| 国产女人在线视频| 91麻豆精品视频| 亚洲国产天堂久久综合226114| 成人午夜天| 国产区在线看| 亚洲AV无码不卡无码| 亚洲精品自产拍在线观看APP| 亚洲三级a| 九色国产在线| 无码'专区第一页| 成人国产精品视频频| 欧美激情视频在线观看一区| 欧美中文字幕在线播放| 天天爽免费视频| 影音先锋亚洲无码| 国产精品女人呻吟在线观看| 亚洲无线国产观看| 国产精品浪潮Av| 午夜精品区|