999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于麥克風陣列的聲源定位算法研究

2011-04-12 00:00:00王勇劉穎劉建平
現代電子技術 2011年19期

摘 要:麥克風陣列聲源定位廣泛應用于視音頻會議系統及槍聲定位系統等領域。提出了一種基于最小熵值(ME)的麥克風陣列聲源定位新方法,其特點在于利用最小熵值方法對麥克風陣列進行時延估計,并與離散網格方法相結合,對聲源進行空間搜索。實驗結果表明,在同等混響或噪聲條件下,該方法定位優于廣義互相關-相位變換方法(GCC-PHAT)。

關鍵詞:麥克風陣列; 聲源定位; 最小熵值; 波達時延差

Research on Acoustic Source Localization Algorithm Using Microphone Array

WANG Yong1, LIU Ying2, LIU Jian-ping2

(1. Xidian University, Xi’an 710071, China; 2. Engineering College of CAPF, Xi’an 710086, China)

Abstract: The acoustic source is widely used in audio and video conference system and gunshot localization system. In this article, a novel acoustic source localization algorithm for microphone array based on minimum entropy and stochastic region contraction (ME) is proposed. The algorithm show that the acoustic source can be developed to estimate time delay between microphones on a basis of minimum entropy and localize the acoustic source in search space by using discrete grid search algorithm. Experimental results show that the proposed algorithm is much more robust than GCC-PHAT in noise and reverberation environment.

Keywords: microphone array; acoustic source localization; minimum entropy; TDOA

收稿日期:2011-05-06

基金項目:國家自然科學基金資助項目(60940007)

0 引 言

基于麥克風陣列的聲源定位是聲學信號處理領域中的一個重要問題。麥克風陣列聲源定位技術是指利用空間分布的多路麥克風拾取聲音信號,通過對麥克風的多路輸出信號進行分析和處理,得到一個或多個聲源的位置信息。

麥克風陣列聲源定位具有廣泛的應用前景。它在民用領域可用于電話會議系統、視頻會議系統和可視電話系統中,通過對發聲者的定位,實現會議現場聲源及外接攝像機的實時跟蹤,也可用于語音及說話人識別軟件的前端預處理,以拾取高質量的聲音信號,提高語音及說話人識別軟件的識別率,還可用于助聽器等領域[1]。在軍事領域,可利用麥克風陣列聲源定位技術實現狙擊手定位[2],地面或低空聲目標的定位與追蹤[3]等。

盡管可將用于聲納和雷達系統的波束形成技術引入麥克風陣列,但由于語音信號為寬帶信號,具有短時平穩特性,且所處環境還具有高混響,噪聲大等特點,這些算法針對語音信號的定位精度非常低,需要對算法進行改進。一般來說,常用的聲源定位算法劃分為三類[4]:

一是基于波束成型的方法;

二是基于高分辨率譜估計的方法;

三是基于波達時延差(TDOA)的方法。

其中基于波束成形方法通過對麥克風陣列接收信號進行濾波、加權求和,直接控制麥克風陣列指向使波束具有最大輸出功率的方向,可在目標源多于一個的條件下對多聲源進行定位[5],但存在對初值敏感的問題。另外還需要知道聲源和噪聲的先驗知識,該方法存在計算量大,不利于實時處理等缺點。

基于高分辨率譜估計的方法在理論上可以對聲源的方向進行有效估計,但由于該算法是針對窄帶信號,因此若要獲得較理想的精度,就要付出很大的計算量代價。此外這些算法無法處理高度相關的信號,因此混響會給算法的定位精度帶來較大影響[6]。

基于時延估計的方法是利用廣義互相關等時延估計算法求出信號到陣列不同麥克風的相對時延,并利用時延信息與麥克風陣列的空間位置關系估計聲源位置。該方法計算量小,易于實時實現,近年來得到了高度重視。本文主要采用基于時延估計的方法進行聲源定位。

1 基于TODA方法的基本原理

利用TDOA進行聲源定位可分為兩個部分:

首先,通過采用廣義互相關方法(GCC)[7]等,并利用平滑相干變換(Smoothed Coherence Transform,SCOT)、相位變換(Phase Transform,PHAT)或最大似然(Maximum Likelihood,ML)進行加權,得出聲源到兩兩麥克風之間的時延差。但當定位環境混響或噪聲較大時,基于GCC的聲源定位算法性能會急劇下降,以致無法實現精確定位。為了消除混響及噪聲影響,N.Zotkin提出利用延時累加波束成型技術與SRP-PHAT相結合的聲源定位算法來解決混響和噪聲的影響[8]。Jacob Benesty在文獻[9]中提出了利用最小熵方法進行時延估計,其實驗結果表明,在同等混響或噪聲條件下,其時延估計的準確度優于互相關方法,且更適于小型麥克風陣列。

其次,進行方位估計,即根據時延和麥克風陣列的幾何位置估計出聲源的位置。利用得到的熵值公式對空間中的最小熵值進行搜索是一個典型的全局優化問題。傳統的梯度下降法主要用于單個聲源進行空間搜索。但當空間中存在多個聲源或噪聲、混響較大時,極易陷入局部最優解。盡管離散網格搜索方法占用系統資源較大,不適宜實時定位系統,但可精確獲得全局最優解,且易于計算機實現,因而得到廣泛應用。本文采用離散網格方法對搜索空間進行離散劃分,減小空間域搜索范圍,加快搜索速度。

2 算法描述

2.1 聲音信號建模

在多數語音信號處理應用中,由于語音信號具有非平穩性特征,而短時語音信號的時域分布趨于平穩,常常近似為高斯分布進行離散傅里葉變換。如果聲音傳播滿足線性波動方程,則此時聲源與麥克風間的聲波傳播通道可認為是線性系統[10]。在實際的小型房間環境下,由于房間墻壁的反射等原因,需要考慮混響效應。對于N元麥克風陣列系統,假定聲源信號為s(t),陣列第nth麥克風的接收信號yn(t)可表示為:

式中:αn為聲音空間傳播產生的衰減因子;rn(k)和vn(k)表示第nth麥克風因多徑效應及噪聲產生的沖擊響應;“”表示卷積;xn(k)表示麥克風收集到多徑聲源信息。設定麥克風陣列的第一個單元為參考點;t為未知聲源到參考麥克風的傳播時間;τn,1為麥克風n與麥克風1的相對時延,其中τ1,1=0。

3 實驗驗證

3.1 實驗參數設置

為了驗證算法的有效性,構建了一個仿真實驗環境,并考慮室內噪聲、語音傳播衰減及混響的影響。實驗模擬了4 m×6 m×3 m小型辦公室環境下,環境的起始坐標為(-2,-3,-1.5),終止坐標為(2,3,1.5)。其中,房間混響的沖激響應函數由 IMAGE 模型[11]產生。聲源采用的是語速較快的純凈語音源。為了方便分析,將聲源位置定為(0,0,0)。輸入語音信號以48 kHz的采樣率進行采樣,語音數據幀長為1 024個采樣點,相鄰兩幀重疊 3/4,窗函數為漢明窗(Hamming)。測試的語音長度為10 s。麥克風陣列的結構為“十”字型的13元陣,中心陣元坐標為(2,0,0),陣列的長和寬均為l=1.2 m。陣元間的距離s=20 cm,聲源距陣列中心的距離為d=2 m。麥克風陣列結構如圖1所示。

圖1 麥克風陣列結構圖

對于實驗環境中噪聲的影響,設定環境噪聲服從高斯分布,且噪聲信號與語音信號不相關。因此,相關函

空間搜索方法的優劣直接影響到算法的復雜度及系統的定位時間。傳統的離散網格搜索方法存在兩個主要問題,一是搜索空間針對整個搜索區域進行,而對于實際的室內環境,部分高度空間出現聲源的可能性幾乎為零,因此需要對部分空間進行人為壓縮;二是搜索網格設置過小,過為單一,導致整個搜索過程迭代次數過多,因此需要對離散網格方法進行局部改進。

考慮到實驗所要定位的目標為發音者的頭部,根據人頭部的大小,設定初始的搜索網格大小為20 cm×20 cm×20 cm。由于在會議室中,主要保持坐立兩種狀態,通過對人站立和入座后頭部高度的測量,可測得人頭部高度集中于100~190 cm。由此可將搜索的起始坐標改為(-2,-3,-0.5),終止坐標設為(2,3,0.5)。搜索空間將由72 m3改為24 m3,初始的搜索網格數為3 000。通過計算網格中心點得到的熵值選取其中熵值最小的10個網格,并按照2 cm×2 cm×2 cm的網格大小繼續劃分,計算網格中心點的熵值,并選擇熵值最小點為聲源的位置。

3.2 仿真結果

在此,利用Matlab仿真軟件對ME算法與GCC-PHAT算法進行比較。仿真中采用的語音數據為10 s的男生連續語速錄音,原始語音已通過錄音軟件Cool Edit進行編輯裁剪,盡可能消去非語音幀的存在,并從中任意抽取20幀數據進行分析。定位誤差由聲源估計位置(,)與聲源位置(0,0,0)的距離表示。在混響時間為50 ms,信噪比SNR=10 dB仿真環境下,ME算法與GCC-PHAT算法的定位性能如圖2所示。

圖2 兩種定位算法定位精度比較

通過對兩種算法的定位性能進行比較可以看到,采用離散網格搜索方法可以保證將聲源估計位置的定位誤差準確地判定到20 cm×20 cm×20 cm范圍內,即初始網格大小。但在定位精度上,GCC-PHAT算法的平均定位誤差為13.5 cm,而ME算法的平均定位誤差為5.7 cm,優于GCC-PHAT算法。

4 結 論

本文提出了一種基于最小熵的麥克風陣列聲源定位新方法,其特點是根據語音源符合拉普拉斯分布這一特性,采用最小熵值方法實現麥克風陣列時延估計,并利用離散網格方法對聲源進行空間搜索。仿真實驗結果表明,在同等混響或噪聲條件下,本文方法的定位優于GCC-PHAT。考慮到實際語音環境的復雜性,下一步擬簡化定位算法,增強定位算法的實時性,并加強算法抗噪聲和抗混響的能力,以進一步改進麥克風陣列聲源的定位性能。

參 考 文 獻

[1]MENNITT Daniel, JOHNSON Marty. Multiple-array passive acoustic source localization in urban environments \\. Acoustical Society of America, 2010, 127(5): 2932-2942.

[2]LINDGREN D, WILSSON O, GUSTAFSSON F, et al. Shooter localization in wireless sensor networks \\// Proceedings of the 12th International Conference on Information Fusion. Seattle,Wash, USA: \\, 2009: 404-411.

[3]MARKOVIC' Ivan, PETROVIC' Ivan. Speaker localization and tracking with a microphone array on a mobile robot using von Mises distribution and particle filtering \\. Robotics and Autonomous Systems, 2010, 58(11): 1185-1196.

[4]BRANDSTEIN Michael, WARD Darren. Microphone arrays: signal processing techniques and applications, chapter robust localization in reverberant rooms \\. US: Springer, 2001.

[5]李承智,曲天書,吳璽宏.一種改進的AEDA聲源定位及跟蹤算法[J].北京大學學報:自然科學版,2005,41(5):809-814.

[6]CHEN J C, YAO K, HUDSON R E. Source loclaization and beamforming \\. IEEE Signal Processing Magazine, 2002, 19(2):30-39.

[7]KNAPP C H, CARTER G C. The generalized correlation method for estimation of time-delay \\. IEEE Trans. on Acoustic, Speech and Audio Processing, 1976, 24(4):320-327.

[8]ZOTKIN Dmitry N, DURAISWAMI Ramani. Accelerated speech source localization via a hierarchical search of steered response power \\. IEEE Trans. on Speech and Audio Processing, 2004,12(5):1470-1478.

[9]BENESTY Jacob, HUANG Yiteng, CHEN Jingdong. Time delay estimation via minimum entropy \\. IEEE Signal Processing Letters, 2007, 14(3):157-169.

[10]ZIOMAEK L. Fundamentals of acoustic field theory and space-time signal processing \\// Boca Raton, FL: CRC Press, 1995: 210-248.

[11]SILVERMAN H. Some analysis of microphone arrays for speech data acquisition \\. IEEE Trans.on Acoustic, Speech Signal Processing, 1987, 35(12): 1699-1712.

[12]羅金玉,劉建平,張一聞.麥克風陣列信號處理的研究現狀與應用\\.現代電子技術,2010,33(23):80-84.

[13]王敏科,張一聞,劉建平.基于麥克風陣列聲源定位的硬件系統設計\\.現代電子技術,2010,33(20):23-25.

[14]任勇,胡方明,李自學.基于麥克風陣列聲源定位系統的FPGA實現\\.電子科技,2011(4):72-74,80.

主站蜘蛛池模板: 国产毛片高清一级国语| 人妻丰满熟妇啪啪| 91成人免费观看| 国产精品30p| 欧美在线导航| 欧美精品在线看| 国产欧美精品午夜在线播放| 色综合热无码热国产| 欧美日韩一区二区三区在线视频| 91麻豆久久久| 国产午夜福利在线小视频| 黄色网页在线观看| 欧美成a人片在线观看| 97在线观看视频免费| 99热这里都是国产精品| 亚洲天堂日韩在线| 永久在线播放| 波多野结衣一区二区三区88| 日本三级欧美三级| 国产精品白浆无码流出在线看| 亚洲欧美一区二区三区麻豆| 国产91精品久久| 亚洲一级毛片在线播放| 97se亚洲综合在线天天| 亚洲国产中文在线二区三区免| 日本三区视频| 国产精品第一区| 一级一级特黄女人精品毛片| 国产乱子伦精品视频| 亚洲中文字幕av无码区| 色噜噜中文网| 欧美在线三级| 久久香蕉国产线看观看亚洲片| 欧美一区二区啪啪| 亚洲黄色网站视频| 欧美在线综合视频| 国产高潮视频在线观看| 波多野结衣中文字幕久久| 青青青草国产| 粗大猛烈进出高潮视频无码| 亚洲国语自产一区第二页| 午夜精品区| 91精品啪在线观看国产60岁| 成年人免费国产视频| 久久天天躁狠狠躁夜夜2020一| www.狠狠| 国产日韩精品欧美一区喷| 亚洲无码电影| 免费又黄又爽又猛大片午夜| 国产人人乐人人爱| 亚洲一区二区三区香蕉| 色天天综合| 欧美在线黄| 欧美视频在线播放观看免费福利资源 | 中文字幕日韩视频欧美一区| 不卡网亚洲无码| 精品欧美视频| 中文字幕亚洲乱码熟女1区2区| 亚洲—日韩aV在线| 国产欧美日韩另类| 国产女人18水真多毛片18精品| 无码一区二区三区视频在线播放| 一区二区午夜| 99久久国产综合精品女同| 国产毛片片精品天天看视频| 亚洲欧美成人在线视频| 午夜高清国产拍精品| 国产日本一区二区三区| 青草视频免费在线观看| 美女无遮挡拍拍拍免费视频| 久久狠狠色噜噜狠狠狠狠97视色| 又爽又大又黄a级毛片在线视频| 小说 亚洲 无码 精品| 国产欧美日韩资源在线观看| 成年人免费国产视频| 成年人福利视频| 成人国产免费| 97久久精品人人| 亚洲第一视频网站| 综合色亚洲| 国产精品太粉嫩高中在线观看| 免费国产好深啊好涨好硬视频|