999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種可跟蹤移動聲源方向的麥克風陣列語音增強算法

2015-05-25 02:26:28江偉華洪青陽
廈門大學學報(自然科學版) 2015年4期
關鍵詞:方向信號

陳 磊,江偉華,童 峰*,洪青陽

(1.廈門大學水聲通信與海洋信息技術教育部重點實驗室,2.廈門大學信息科學與技術學院,福建廈門361005)

一種可跟蹤移動聲源方向的麥克風陣列語音增強算法

陳 磊1,江偉華1,童 峰1*,洪青陽2

(1.廈門大學水聲通信與海洋信息技術教育部重點實驗室,2.廈門大學信息科學與技術學院,福建廈門361005)

麥克風陣列語音增強技術已在語音信號處理中得到廣泛研究.但在智能家居等領域中,當說話人等聲源移動導致聲源方向相對麥克風陣列發生變化時,由此產生的信號泄露將嚴重影響消噪性能.本文提出了一種基于麥克風陣列進行移動聲源方向跟蹤和噪聲消除的聯合算法,該方法利用兩個平行濾波器組構成梯度迭代的移動聲源方向跟蹤器,并將該聲源跟蹤器嵌入廣義旁瓣抵消器結構中從而進行聲源方向梯度迭代跟蹤和麥克風陣列語音增強的聯合實現.在實驗室噪聲背景下移動聲源的語音增強結果表明了該方法的有效性.

語音增強;麥克風陣列;梯度迭代;廣義旁瓣抵消器

由Griffiths和Jim提出的廣義旁瓣抵消器(generalized sidelobe canceller,GSC)[1]是一種常用的麥克風陣列噪聲消除方法[2],在語音信號處理領域得到廣泛的研究和應用[3],如視頻會議[4]、現代助聽器[5]、智能機器人[6]等,使用麥克風陣列處理聲音信號已成為一個熱點[7].Gannot等[]提出了基于傳輸函數GSC的麥克風陣列語音增強結構以處理不同的聲學傳輸函數.李芳蘭等[]提出了采用可調波束形成器(adjustable generalized sidelobe canceller,AGSC)麥克風陣列語音增強算法.針對傳統麥克風陣列孔徑有限的問題,由分布在空間中多個節點組成的分布式麥克風陣列成為當前的研究熱點[].

由于聲源固定時容易獲得較高的聲源方向估計性能,上述麥克風陣列語音增強算法在聲源固定時表現出良好的降噪效果.但在智能家居、視頻會議、移動機器人等場合中當說話人等聲源移動時,聲源方向相對麥克風陣列發生變化,由此導致的聲源方位估計誤差引起的信號泄露將嚴重影響消噪性能.廣義互相關(generalized cross-correlation,GCC)[12-13]被廣泛應用于移動聲源方位估計,但存在對信噪比要求較高、混響環境下定位性能下降等問題;Nadiri等[14]采用球面調和函數(spherical harmonics,SH)提高嚴重混響條件下的聲源定向性能,但該算法需要采用較為復雜、陣元數較多(>32元)的球形麥克風陣列.

同時,傳統上聲源方向估計和語音增強處理由相互獨立的測向算法和增強算法分別完成,因此在方向估計階段無法利用語音增強來改善方向估計精度,而方向估計精度又直接影響語音增強效果.基于此,本文提出了可跟蹤聲源方向的麥克風陣列語音增強算法,該算法采用兩個平行濾波器組作為梯度導引的聲源方向跟蹤器,利用梯度信息進行聲源方向的迭代跟蹤,并將此跟蹤器嵌入GSC結構中,從而實現聲源方向梯度迭代跟蹤和語音增強的聯合實現,改善算法在聲源移動時的語音增強性能.實驗室背景噪聲下移動聲源的語音增強實驗結果證明了本文算法的有效性.

1 GSC

GSC結構如圖1所示,由非自適應支路和自適應支路組成.圖中上方的非自適應支路采用系數固定的濾波器對按照聲源方位時延補齊后的各通道信號X(n)進行濾波處理,得到初步增強的參考信號d(n)·下方自適應支路通過阻塞矩陣B對各通道信號進行自適應濾波,去除其中的目標語音成分,得到噪聲干擾信號U(n)·GSC中輸出的誤差信號即為陣列輸出,即:

圖1 GSC經典算法結構框圖Fig.1 Structure of classical GSC algorithm

其中h為歸一化期望信號導向矢量,hhH=1·U(n)為(M ̄1)×1維矢量,B為(M ̄1)×M(M為麥克風陣列陣元數)維行滿秩阻塞矩陣,滿足

GSC自適應支路系數Wk調節可利用最小均方(least mean square,LMS)或歸一化最小均方(normalized LMS,NLMS)算法實現.

2 本文算法

針對聲源相對麥克風陣列移動時方向變化造成的聲源方位估計誤差,本文提出利用由兩個平行濾波器組成梯度迭代的聲源方向估計器,利用聲源方向的梯度信息調整麥克風陣列各通道時延值實現聲源方向的梯度迭代跟蹤,保證在聲源移動條件下的GSC語音增強性能.

本文提出的內嵌聲源方向跟蹤器GSC算法結構如圖2所示.考慮M(以M為偶數的情況為例)個麥克風組成的陣列孔徑為d的均勻直線陣,設聲場為遠場傳播模型,聲波以平行波方式傳播·記X(n)=[x1(n),x2(n),…,xM(n)]T為陣列接收數據矢量,di(n)、Ui(n)分別為第i個平行濾波器輸出的參考信號及噪聲干擾信號,Wi為每個GSC的維納濾波器系數,εi(n)為GSC輸出的期望信號,其中i=1,2·定義α(n)為聲源方向角估值序列,ns為聲源方向角估值更新周期,則具體的波束指向控制方法如下:

1)初始化α(0)、ns、Δα·令兩個平行濾波器對應的聲源方向角估值分別為α1=α(n) ̄Δα,α2=α(n)+ Δα,分別代表聲源方向角減小及增加的趨勢,以用于梯度計算·

2)通道間時延補償.對兩個平行濾波器的輸入語音序列以各自的聲源方向角估值對應的通道時延值進行各通道間的時延補償:

其中,c為空氣中聲速,fs為采樣頻率,[]表示取整· τi(αi)為第i個平行濾波器對應的時延值,以采樣點數表示;xi,j(αi,n)為第i個平行濾波器對第j個麥克風陣元接收信號進行時延補償后的信號,j=1,2,…,M·

3)根據NLMS算法分別計算兩個平行濾波器的估計誤差,更新各自的濾波器系數:

圖2 本文算法結構框圖Fig.2 Illustration of the proposed algorithm

式中L為濾波器長度.

4)如果n=m×ns(m為整數,m≥1),則利用輸出語音段能量為代價函數計算聲源方向角相對代價函數的梯度delta(n),其中v為聲源方向角梯度導引迭代的步長因子:

則聲源方向角的梯度導引迭代公式為

本文算法為了避免聲源方向角梯度信息中隨機噪聲的影響,每隔ns個采樣點對此采樣點范圍內梯度取均值后進行一次梯度導引迭代.

5)以梯度迭代[15]獲得當前聲源方向角α(n+1)對應的通道時延值對陣列接收信號X(n)進行時延補償,并利用GSC進行自適應噪聲抵消.

6)算法梯度迭代收斂后,可獲得聲源方向角并輸出對應于此聲源方向的語音增強信號y(n);隨著聲源的移動,梯度迭代過程可實現對聲源方向的跟蹤及語音增強.

在本文算法參數中,考慮到麥克風陣列陣元數較小時,陣列波束主瓣較寬,同時說話人移動速度通常有限,因此,根據捕獲、梯度迭代跟蹤聲源方向的不同要求,本文算法對聲源方向左右偏移量Δα采用2種設置,即:在初始化時Δα取較大的值,如本文例中取Δα(大值)=π/6,以在較大范圍內粗略捕獲說話人的初始方位;實現聲源方向捕獲后Δα設置為較小值,如本文例中取Δα(小值)=π/20,以實現對聲源方向的梯度迭代跟蹤·

同時,為了避免噪聲干擾源引起方向跟蹤錯誤,算法在靜音段不進行目標的跟蹤,在通過傳統的基于短時能量和短時過零率的雙門限端點檢測算法[]檢測到語音段后在已獲取目標方位的基礎上重新進行目標信號的捕獲.

3 實 驗

3.1 實驗設置

本文在實驗室中利用實測數據對技術方案進行了測試,并將本文算法與GCC方法[13]及AGSC[9]獲取聲源方向進行語音增強效果進行比較.其中,考慮到算法復雜度,AGSC算法只進行初始聲源方向估計,本文算法與GCC算法則在聲源移動過程中進行聲源方向跟蹤計算.

實驗室大小約為7 m×3.2 m×3 m,房間背景噪聲級為57.4 dB(A).麥克風陣列為由4個麥克風組成的間距d=14 cm的均勻直線陣.

實驗平面示意圖如圖3所示,說話人語音由移動的音箱播放,距麥克風1,2,3,4組成的四元麥克風陣列中心2.0 m;考慮到本文算法針對的是聲源移動的場景,實驗中設置播放說話人語音的音箱從A點勻速移動到B點,A、B兩點間的距離為2.0 m(由于設置的聲源移動路線平行于麥克風陣列,移動過程造成的語音幅度變化不大);固定噪聲源位于C點,由音箱播放,噪聲類型為幅度基本平穩的電吹風噪聲.麥克風陣列和音箱距地面的高度均為1.1 m.

圖3 實驗系統設置平面示意圖Fig.3 Configuration of the experimental system

實驗中采用的麥克風為單指向性的駐極體麥克風,陣列語音采樣頻率為16 k Hz,采樣時間為6 s.實驗算法中相關參數設置如表1所示.文中語音段的端點檢測采用文獻[15]的檢測算法.

表1 算法參數設置Tab.1 Setting of algorithm parameters

3.2 實驗結果及分析

圖4給出了本文算法利用梯度迭代及GCC算法獲得的聲源方向角變化曲線.圖4曲線中聲源方向角保持不變部分對應的是信號的靜音段,在靜音段不進行聲源方向跟蹤.由于NLMS算法收斂需要一定時間,同時由于在靜音段算法停止跟蹤,在說話人移動過程中算法獲取的目標信號入射角變化曲線并不光滑,并且出現了波動,然而從圖4中仍可以看出其變化趨勢與實驗中目標聲源移動的方向變化基本一致;由于存在明顯的背景噪聲影響了相關效果,圖4中GCC算法聲源測向雖總體趨勢正確,但性能低于本文方法.

圖4 本文算法與GCC算法獲取的移動聲源方位角曲線Fig.4 Varying azimuth of the moving speaker obtained with the proposed and the GCC method

圖5 含噪語音及各算法語音增強效果示意圖Fig.5 Noisy speech and the enhanced speech obtained with different algorithms

圖5 給出了帶噪實驗語音及3種算法的輸出結果,其中圖5(a)為帶噪語音信號時域波形,圖5(b)、(c)、(d)分別為帶噪語音信號經過AGSC算法、GCC算法及本文算分估計聲源方向語音增強后的時域波形.

由于AGSC算法僅根據初始聲源方向進行波束對準,因此當說話人發生移動后,聲源方向誤差會造成目標信號泄漏的現象,使算法的語音增強性能急劇下降(如圖5(b)的2和4.5 s處語音);GCC算法由于受背景噪聲對相關性能的影響,在語音信號信噪比較低時聲源方向估計誤差下降,影響了語音增強效果(如圖5(c)中2 s處語音).

本文算法由于考慮了移動說話人的方位變化,其對目標語音方向的跟蹤能力確保了在聲源移動時語音增強性能的穩定性.從圖5(b)~(d)的對比可看出,本文算法在聲源移動狀態下語音增強性能得到改善.

4 結 論

針對聲源移動對麥克風陣列語音增強算法性能的影響,本文提出了內嵌梯度迭代聲源方向跟蹤器的GSC麥克風陣列語音增強算法,它具有聲源方向跟蹤能力.該算法采用兩個嵌入GSC結構的平行濾波器,利用梯度信息進行麥克風陣列波束指向的迭代調整,以實現對聲源方向的跟蹤,并在此基礎上進行噪聲消除.實驗室噪聲背景下移動說話人的麥克風陣列語音增強實驗表明了本文算法的有效性.

本文算法相較于常規GSC語音增強算法及GCC算法的優勢是考慮了目標聲源的方位變化,通過內嵌梯度迭代方向估計器對聲源進行方位跟蹤,從而削弱了因目標信號泄露所造成的GSC語音增強效果下降的影響.同時也需指出,雖然梯度迭代算法具有工作量小、存儲變量少、對初始點要求不高等優點,但收斂較慢,不適于聲源移動較快的應用場景.

[1] Griffths L J.An alternative approach to linear constrained adaptive beamforming[J].IEEE Transactionson Antennas Propagat,1982,1(30):27-34.

[2] 高杰,胡廣書,張輝.基于GSC結構的多麥克風數字助聽器的自適應波束形成算法[J].北京生物醫學工程,2006,25(3):269-273.

[3] Gannot S,Cohen I.Speech enhancement based on the general transfer function GSC and postfiltering[J].IEEETransactions on Speech and Audio Processing,2004,12(6):561-571.

[4] 舒雪嬌,陳景發,敬代波.語音DOA技術在視頻會議系統中的應用[J].電子技術與軟件工程,2014,22:138-139.

[5] 張戌寶,吳毓祥.現代助聽器的方向性麥克風降噪技術和性能(1)[J].聽力學及言語疾病雜志,2015,23(5):1-6.

[6] 吳玉秀,孟慶浩,曾明.基于聲音的分布式多機器人相對定位[J].自動化學報,2014,40(5):798-809.

[7] 張自嘉,李賀,花曉蕾,等.基于波束形成算法的聲源定位與DSP實現[J].壓電與聲光,2015,37(1):117-121.

[8] Gannot S,Burshtein D,Weinstein E.Signal enhancement using beamforming and nonstationary with applications to speech[J].IEEE Transon Signal Processing,2001,49(8):1614-1626.

[9] 李芳蘭,周躍海,童峰,等.采用可調波束形成器的GSC麥克風陣列語音增強方法[J].廈門大學學報:自然科學版,2013,52(2):186-189.

[10] Markovich-Golan S,Gannot S,Cohen I.Distributed multiple constraints generalized sidelobe canceller for fully connected wireless acoustic sensor networks[J].IEEE Transactions on Audio Speech&Language Processing,2013,21(2):343-356.

[11] 李林劍,陳華偉.一種分布式雙麥克風線陣聲源定位方法[J].應用聲學,2014,33(5):412-418.

[12] Tian Ye,Chen Zhe,Yin Fuliang.Distributed Kalman filter-based speaker tracking in microphone array networks[J].Applied Acoustics,2015,89:71-77.

[13] Wan Xiwang,Wu Zhenyang.Sound source localization based on discrimination of cross-correlation functions[J].Applied Acoustics,2013,74:28-37.

[14] Nadiri O,Rafaely B.Localization of multiple speakers under high reverberation using a spherical microphone array and the direct-path dominance test[J].Audio Speech&Language Processing IEEE/ACM Transactions on,2014,22(10):1494-1505.

[15] Wu F Y,Tong F.Gradient optimization p-norm-like constraint LMS algorithm for sparse system estimation[J]. Signal Processing,2012,93:967-971.

[16] 路青起,白燕燕.基于雙門限兩級判決的語音端點檢測方法[J].電子科技.2012,25(1):13-19.

A Microphone Array Speech Enhancement Algorithm with Tracking Capability Upon Moving Speakers

CHEN Lei1,JIANG Wei-hua1,TONG Feng1*,HONG Qing-yang2
(1.Key Laboratory of Underwater Acoustic Communication and Marine Information Technology of the Ministry of Education,Xiamen University,2.School of Information Science and Engineering,Xiamen University,Xiamen 361005,China)

Microphone array speech enhancement methods such as generalized sidelobe canceller(GSC)algorithm GSC have been widely investigated and applied in fields of audio signal processing.However,when speakers move,the performance of the classic GSC algorithms will seriously deteriorate by leaking of the speech due to errors of the direction of speaker.In this paper,a novel method,which uses two parallel filters embedded in GSCstructure to track the direction of the speaker,is proposed to ensure the denoise performance of the GSC algorithm at the presence of moving speaker.The direction tracking of moving speakers is iteratively updated by gradient descent to facilitate the low complexity implementation.Experimental speech-enhancement results under moving speakers are provided to validate the effectiveness of the proposed method.

speech enhancement;microphone array;gradient iteration;generalized sidelobe canceller

TN 912.3

A

0438-0479(2015)04-0551-05

10.6043/j.issn.0438-0479.2015.04.020

2014-11-06 錄用日期:2015-04-28

國家自然科學基金(61105026);福建省高校產學合作重大項目(2015H6019)

*通信作者:ftong@xmu.edu.cn

陳磊,江偉華,童峰,等.一種可跟蹤移動聲源方向的麥克風陣列語音增強算法[J].廈門大學學報:自然科學版,2015,54(4):551-555.

:Chen Lei,Jiang Weihua,Tong Feng,et al.A microphone array speech enhancement algorithm with tracking capability upon moving speakers[J].Journal of Xiamen University:Natural Science,2015,54(4):551-555.(in Chinese)

猜你喜歡
方向信號
2022年組稿方向
計算機應用(2022年2期)2022-03-01 12:33:42
2022年組稿方向
計算機應用(2022年1期)2022-02-26 06:57:42
2021年組稿方向
計算機應用(2021年4期)2021-04-20 14:06:36
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
2021年組稿方向
計算機應用(2021年3期)2021-03-18 13:44:48
2021年組稿方向
計算機應用(2021年1期)2021-01-21 03:22:38
完形填空二則
孩子停止長個的信號
基于LabVIEW的力加載信號采集與PID控制
一種基于極大似然估計的信號盲抽取算法
主站蜘蛛池模板: 又大又硬又爽免费视频| 欧美特黄一级大黄录像| 无码 在线 在线| 国产香蕉国产精品偷在线观看| 免费国产不卡午夜福在线观看| 国产成人a在线观看视频| 2022国产无码在线| 精品亚洲国产成人AV| 国产不卡一级毛片视频| 国产亚洲高清在线精品99| 激情综合婷婷丁香五月尤物| 九色视频线上播放| 日韩二区三区| 亚洲高清在线播放| 欧美亚洲一二三区| 男女性色大片免费网站| 国产日韩欧美在线播放| 91亚洲视频下载| 少妇精品网站| 日本欧美视频在线观看| 97视频免费在线观看| 久久综合五月婷婷| 色噜噜综合网| 国产麻豆精品在线观看| a级毛片视频免费观看| 91免费观看视频| 国产jizz| 国产精品青青| 日本人妻丰满熟妇区| 欧美日韩中文字幕二区三区| 人人妻人人澡人人爽欧美一区| 日韩欧美国产中文| 婷婷久久综合九色综合88| 欧亚日韩Av| 国产日韩欧美一区二区三区在线| 国产波多野结衣中文在线播放| 亚洲精品国产成人7777| 国产无遮挡猛进猛出免费软件| 中文国产成人精品久久| 久久成人国产精品免费软件| a毛片免费观看| 亚洲天堂福利视频| 日本欧美中文字幕精品亚洲| 国产微拍一区二区三区四区| 国产精品部在线观看| 性激烈欧美三级在线播放| 成人免费午夜视频| 日本欧美视频在线观看| 99久久精彩视频| 国产精品永久不卡免费视频| 尤物视频一区| 国模沟沟一区二区三区| 亚洲高清无在码在线无弹窗| 无码专区第一页| 欧美精品v欧洲精品| 欧美亚洲一区二区三区导航| 大乳丰满人妻中文字幕日本| 中文字幕永久在线观看| 国模视频一区二区| 99精品视频播放| 国产杨幂丝袜av在线播放| 91在线一9|永久视频在线| 亚洲无限乱码| 日韩第八页| 成人毛片在线播放| 国产免费福利网站| 国内毛片视频| 熟妇丰满人妻| 免费一看一级毛片| 国产91av在线| 麻豆国产原创视频在线播放| 免费女人18毛片a级毛片视频| 韩国v欧美v亚洲v日本v| 在线看片免费人成视久网下载| 久久久久久久97| 国产高清无码麻豆精品| 国产三级国产精品国产普男人| 欧美一区二区人人喊爽| 国产三级毛片| 亚洲一区色| 亚洲三级网站| A级毛片无码久久精品免费|