999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于保留部分頻域鏡像分量的聲源定位算法

2016-07-19 02:14:40蔡衛(wèi)平劉瑞娟
關(guān)鍵詞:信號(hào)

蔡衛(wèi)平 劉瑞娟 周 琳

1(九江職業(yè)技術(shù)學(xué)院電氣工程學(xué)院 江西 九江 332007)2(東南大學(xué)信息科學(xué)與工程學(xué)院 江蘇 南京 210096)

?

基于保留部分頻域鏡像分量的聲源定位算法

蔡衛(wèi)平1劉瑞娟1周琳2

1(九江職業(yè)技術(shù)學(xué)院電氣工程學(xué)院江西 九江 332007)2(東南大學(xué)信息科學(xué)與工程學(xué)院江蘇 南京 210096)

摘要針對(duì)傳統(tǒng)的SRP-PHAT(Steered Response Power with Phase Transform)聲源定位算法容易受噪聲影響而導(dǎo)致定位性能降低的問(wèn)題,提出一種頻域補(bǔ)零且保留部分鏡像分量的改進(jìn)算法。該算法首先通過(guò)傅里葉變換將接收信號(hào)變換到頻域,然后在高頻端補(bǔ)零至20倍幀長(zhǎng),同時(shí)保留部分鏡像分量。在此基礎(chǔ)上計(jì)算麥克風(fēng)對(duì)接收信號(hào)的互功率譜密度函數(shù),作傅里葉逆變換得到相位變換加權(quán)的廣義互相關(guān)(GCC-PHAT)函數(shù)。保留的鏡像分量拓寬了信號(hào)頻域,使GCC-PHAT函數(shù)的峰更為尖銳,累加后得到的SRP-PHAT函數(shù)的空間譜峰也就更加尖銳,從而提高定位性能。實(shí)驗(yàn)表明,相比于傳統(tǒng)算法,改進(jìn)算法能顯著提高定位成功率。

關(guān)鍵詞相位變換聲源定位鏡像分量

0引言

由于噪聲和混響的影響,在真實(shí)環(huán)境中實(shí)現(xiàn)較高精度的聲源定位仍然是比較困難的,尤其是小型陣列,受陣列孔徑及陣元個(gè)數(shù)的限制,定位精度較低。在已有的聲源定位算法中,以多重信號(hào)分類(lèi)MUSIC(MultipleSignalClassification)算法[5]為代表的高分辨率譜估計(jì)算法理論上可以達(dá)到很高的精度,但是該算法不能處理高度相關(guān)的信號(hào),混響將使得定位性能急劇下降。文獻(xiàn)[6]提出導(dǎo)引響應(yīng)功率SRP-PHAT聲源定位算法。該算法的定位原理是根據(jù)接收信號(hào)計(jì)算假想聲源位置處的導(dǎo)引響應(yīng)功率,使其取最大值的點(diǎn)即為聲源位置估計(jì)。SRP-PHAT算法在混響環(huán)境中具有較強(qiáng)的魯棒性,但是計(jì)算復(fù)雜度較高,為提高算法的實(shí)時(shí)性,研究人員提出了多種減少其計(jì)算量的方法[7-9]。SRP-PHAT算法在低信噪比、強(qiáng)混響條件下的定位性能仍然較低,對(duì)此,研究人員也提出了多種改進(jìn)方法。文獻(xiàn)[10]提出了最大似然定位算法,該算法在低信噪比、弱混響條件下能較大幅度提高定位性能,而在高信噪比或強(qiáng)混響條件下定位性能與SRP-PHAT接近。針對(duì)分布式陣列的特點(diǎn),文獻(xiàn)[11]提出加權(quán)SRP-PHAT算法,利用各陣元接收信號(hào)質(zhì)量的不同,對(duì)于信號(hào)質(zhì)量較好的陣元賦予較大權(quán)重,從而提高定位性能。文獻(xiàn)[12]則提出了更為簡(jiǎn)單的加權(quán)算法。文獻(xiàn)[11,12]的算法只能用于分布式陣列,小型陣列中,各陣元接收信號(hào)質(zhì)量幾乎沒(méi)有差別,加權(quán)算法不能提高定位性能。文獻(xiàn)[13]提出了基于歸一化算術(shù)平均的寬帶SRP算法,該算法改善了噪聲環(huán)境下的定位性能,但不適用于有混響的室內(nèi)環(huán)境。

SRP-PHAT函數(shù)可表達(dá)成所有麥克風(fēng)對(duì)的廣義互相關(guān)GCC-PHAT(GeneralizedCrossCorrelationwithPhaseTransform)函數(shù)之和[6]。由于采用了相位變換PHAT(PhaseTransform)加權(quán),GCC-PHAT函數(shù)應(yīng)該有尖銳的峰,從而SRP-PHAT函數(shù)有尖銳的空間譜峰,但是由于噪聲,實(shí)際的空間譜峰變得較寬,又由于反射聲的存在,其產(chǎn)生的虛假譜峰與直達(dá)聲的譜峰相互疊加,使得SRP-PHAT函數(shù)的最大值所在位置偏離了真實(shí)聲源的位置,導(dǎo)致定位誤差。根據(jù)上述分析,本文提出一種改進(jìn)的SRP-PHAT算法。該算法將麥克風(fēng)對(duì)接收信號(hào)的互功率譜拓寬,使得其相應(yīng)的互相關(guān)函數(shù)更加尖銳,累加后得到SRP-PHAT函數(shù)的空間譜峰也就更加尖銳,從而提高定位精度。

1信號(hào)模型

假設(shè)麥克風(fēng)陣列的陣元個(gè)數(shù)為M,用s(n)表示聲源信號(hào),則在真實(shí)環(huán)境中,第m個(gè)陣元的接收信號(hào)為:

xm(n)=hm(n)*s(n)+bm(n)

(1)

其中hm(n)為聲源到第m個(gè)陣元的房間沖擊響應(yīng),“*”表示線(xiàn)性卷積,bm(n)表示第m個(gè)陣元的背景噪聲。式(1)中的卷積運(yùn)算表征了陣元接收信號(hào)中既有聲源信號(hào)的直達(dá)聲也有多次反射聲。假設(shè)聲源信號(hào)與噪聲不相關(guān),各通道的背景噪聲也不相關(guān)。

2SRP-PHAT算法

2.1SRP-PHAT的原理

如前文所述,SRP-PHAT函數(shù)可表達(dá)成所有麥克風(fēng)對(duì)的GCC-PHAT函數(shù)之和,即:

(2)

(3)

ζ=[cosφcosθ, cosφsinθ, sinφ]T

(4)

用rm=[x,y,z]T表示第m個(gè)麥克風(fēng)的直角坐標(biāo)矢量,c表示空氣中的聲速(約為342m/s),則:

(5)

聲源位置估計(jì)為:

(6)

其中Q為聲源空間。

2.2SRP-PHAT的實(shí)現(xiàn)

竹林機(jī)械化經(jīng)營(yíng)是一個(gè)全新的課題,不僅要有理念上的轉(zhuǎn)變,也要有模式和方法的創(chuàng)新。目前,雖然對(duì)上述3種模式進(jìn)行了初步的探索與實(shí)踐,但由于試驗(yàn)時(shí)間較短,樣地面積和規(guī)模都較小,其成果應(yīng)用仍有許多局限性。為此,需要業(yè)界朋友集思廣益,群策群力,以期早日形成具有共性的機(jī)械化經(jīng)營(yíng)模式,為竹產(chǎn)業(yè)的振興和可持續(xù)發(fā)展做出新貢獻(xiàn)。

(7)

3改進(jìn)的SRP-PHAT算法

如前文所述,由于噪聲和混響的影響,SRP-PHAT函數(shù)的空間譜峰變寬,容易相互疊加,導(dǎo)致聲源位置估計(jì)誤差。眾所周知,互相關(guān)函數(shù)與互功率譜是一對(duì)傅里葉變換,令:

(8)

(9)

(10)

(11)

相應(yīng)的真實(shí)聲源位置估計(jì)為:

(12)

4實(shí)驗(yàn)與分析

4.1實(shí)驗(yàn)環(huán)境

為了比較改進(jìn)算法與原算法的性能,我們利用在真實(shí)環(huán)境中錄制的數(shù)據(jù)庫(kù)AV16.3[16]來(lái)做聲源定位實(shí)驗(yàn)。AV16.3是在會(huì)議室中錄制的,包括多種情景,專(zhuān)門(mén)供聲源定位研究人員使用。本實(shí)驗(yàn)取單個(gè)靜止聲源的一組數(shù)據(jù),編號(hào)為“seq01_1p_0000”,錄制場(chǎng)景如圖1所示。

圖1 說(shuō)話(huà)人區(qū)域與麥克風(fēng)陣列的位置

圖1中的陰影部分為聲源所在區(qū)域,說(shuō)話(huà)人分別在16個(gè)位置說(shuō)一段話(huà)。麥克風(fēng)陣列為具有八個(gè)陣元的均勻圓陣,半徑為0.1m,放置于會(huì)議桌上。由于陣列孔徑較小,滿(mǎn)足遠(yuǎn)場(chǎng)條件,即只估計(jì)聲源的到達(dá)方向角DOA(DirectionofArrival),麥克風(fēng)陣列與DOA矢量的關(guān)系如圖2所示。

圖2 麥克風(fēng)陣列與DOA矢量

圖2中,坐標(biāo)原點(diǎn)位于陣列圓心,xoy平面就是陣列所在平面,小黑點(diǎn)表示麥克風(fēng),DOA矢量由坐標(biāo)原點(diǎn)指向聲源,其單位矢量就是式(4)所描述的ζ。說(shuō)話(huà)人為男性,說(shuō)英語(yǔ),信號(hào)采樣頻率fs=16kHz。信號(hào)幀長(zhǎng)512點(diǎn)(32ms),幀重疊率50%,加漢寧(Hanning)窗,去掉靜音間隙后,總計(jì)有5646幀信號(hào)用于聲源定位實(shí)驗(yàn)。水平角θ的搜索范圍為-180°~180°,仰角φ的搜索范圍為0°~90°,步長(zhǎng)均為1°。

4.2性能評(píng)價(jià)準(zhǔn)則

(13)

(14)

(15)

4.3實(shí)驗(yàn)結(jié)果

我們用傳統(tǒng)的SRP-PHAT算法和本文提出的改進(jìn)算法處理前文描述的真實(shí)數(shù)據(jù)。為便于描述,改進(jìn)算法記為SRP-PHAT-PZ。IDIAP提供了實(shí)現(xiàn)傳統(tǒng)SRP-PHAT算法的MATLAB程序,其實(shí)現(xiàn)方法如2.2節(jié)所述,可直接使用該程序得到傳統(tǒng)算法的實(shí)驗(yàn)結(jié)果。我們修改IDIAP的程序?qū)崿F(xiàn)改進(jìn)算法。IDIAP的程序中,設(shè)置L=20,為便于比較,本文仍然采用該參數(shù)值。對(duì)于水平角,γ取1°~180°,對(duì)于仰角,γ取1°~90°,步長(zhǎng)均為1°。兩種算法的定位成功率如圖3所示。

圖3 兩種算法的定位成功率比較

由圖3可見(jiàn),在不同的允許誤差下,改進(jìn)算法的定位成功率都比傳統(tǒng)算法的要高,其中仰角的定位成功率提高幅度更大。比較實(shí)用的允許誤差角度通常為幾度到十幾度[10],表1給出了幾種典型的允許誤差角度下,兩種算法定位成功率的具體數(shù)據(jù)。

表1 在典型的允許誤差角度下,兩種算法的定位成功率比較

表2 在典型的允許誤差角度下,兩種算法的均方根誤差比較

5結(jié)語(yǔ)

SRP-PHAT算法能實(shí)現(xiàn)真實(shí)環(huán)境中的聲源定位,但是在信噪比較低、混響較強(qiáng)的環(huán)境中,其定位性能仍然不高。本文提出一種保留部分頻域鏡像分量的改進(jìn)算法。采用在信號(hào)高頻端補(bǔ)零的方法來(lái)提高時(shí)域采樣率,在此過(guò)程中保留了部分頻域鏡像分量,從而拓寬了互功率譜的頻帶寬度,使得互相關(guān)函數(shù)的峰更加尖銳。SRP-PHAT函數(shù)可表示為所有麥克風(fēng)對(duì)接收信號(hào)的GCC-PHAT函數(shù)之和,更為尖銳的GCC-PHAT函數(shù)使得SRP-PHAT函數(shù)中真實(shí)聲源對(duì)應(yīng)的空間譜峰與反射聲對(duì)應(yīng)的譜峰不容易重疊,避免譜峰位置偏移。實(shí)驗(yàn)表明,本文提出的算法比傳統(tǒng)算法的定位成功率有較大幅度提高,同時(shí)減小了估計(jì)的均方根誤差。

參考文獻(xiàn)

[1]FaubelF,GeorgesM,KumataniK,etal.Improvinghands-freespeechrecognitionincarthroughaudio-visualvoiceactivitydetection[C]//ProceedingofJointWorkshoponHands-freeSpeechCommunicationandMicrophoneArrays.Edinburgh,UK:IEEE,2011:70-75.

[2]SunL,ChengQ.Real-timemicrophonearrayprocessingforsoundsourceseparationandlocalization[C]//ProceedingofIEEE47thAnnualConferenceonInformationSciencesandSystems(CISS).Baltimore,MD,USA:IEEE,2013:1-6.

[3]TourbabinV,RafaelyB.Theoreticalframeworkforthedesignofmicrophonearraysforrobotaudition[C]//ProceedingofIEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing(ICASSP).Vancouver,Canada:IEEE,2013:4290-4294.

[4]SeewaldLA,JrLG,VeronezMR,etal.CombiningSRP-PHATandtwoKinectsfor3Dsoundsourcelocalization[J].ExpertSystemswithApplications,2014,41(16):7106-7113.

[5]DmochowskiJP,BenestyJ,AffesS.BroadbandMUSIC:opportunitiesandchallengesformultiplesourcelocalization[C]//IEEEWorkshoponApplicationsofSignalProcessingtoAudioandAcoustics.NewPaltz,NY,USA:IEEE,2007:18-21.

[6]DibiaseJH.Ahigh-accuracy,low-latencytechniquefortalkerlocalizationinreverberantenvironmentsusingmicrophonearrays[D].Providence:DivisionofEngineeringatBrownUniversity,2000.

[7]ZhaoY,ChenX,WangB.Real-timesoundsourcelocalizationusinghybridframework[J].AppliedAcoustics,2013,74(12):1367-1373.

[8]OualilY,FaubelF,KlakowD.Afastcumulativesteeredresponsepowerformultiplespeakerdetectionandlocalization[C]//ProceedingofEuropeanSignalProcessingConference(EUSIPCO).Marrakech,Morocco:IEEE,2013:1-5.

[9]NunesLO,MartinsWA,LimaMVS,etal.ASteered-responsepoweralgorithmemployinghierarchicalsearchforacousticsourcelocalizationusingmicrophonearrays[J].IEEETransactionsonSignalProcessing,2014,62(19):5171-5183.

[10]ZhangC,FlorencioD,BaDE,etal.Maximumlikelihoodsoundsourcelocalizationandbeamformingfordirectionalmicrophonearraysindistributedmeetings[J].IEEETransactionsonmultimedia,2008,10(3):538-548.

[11]MungamuruB,AarabiP.Enhancedsoundlocalization[J].IEEETransactionsonSystems,Man,andCybernetics-partB:Cybernetics,2004,34(3):1526-1540.

[12] 蔡衛(wèi)平,黃印君,陸澤櫞.基于分布式麥克風(fēng)陣列的聲源定位算法[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(5):132-135.

[13]SalvatiD,DrioliC,ForestiGL.Incoherentfrequencyfusionforbroadbandsteeredresponsepoweralgorithmsinnoisyenvironments[J].IEEESignalProcessingLetters,2014,21(5):581-585.

[14]KnappCH,CarterGC.Thegeneralizedcorrelationmethodforestimationoftimedelay[J].IEEETransactionsonAcoustics,Speech,andSignalProcessing,1976,24(4):320-327.

[15]DmochowskiJP,BenestyJ,AffesS.Ageneralizedsteeredresponsepowermethodforcomputationallyviablesourcelocalization[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2007,15(8):2510-2526.

[16]LathoudG,OdobezJM,Gatica-perezD.AV16.3:anaudio-visualcorpusforspeakerlocalizationandtracking[R].Martigny:IDIAPResearchInstitute,2004.

SOUND SOURCE LOCALISATION ALGORITHM BASED ON RETAINING PARTIALMIRRORCOMPONENTSINFREQUENCYDOMAIN

Cai Weiping1Liu Ruijuan1Zhou Lin2

1(School of Electrical Engineering,Jiujiang Vocational and Technical College,Jiujiang 332007,Jiangxi,China)2(School of Information Science and Engineering,Southeast University,Nanjing 210096,Jiangsu,China)

AbstractTo deal with the problem of the sound source localisation algorithm of traditional steered response power with phase transform weighting (SRP-PHAT) that its localisation performance is easily degraded due to noise influence, in this paper we propose an improved algorithm which pads the zeros in frequency domain and retains partial mirror components as well. First, the algorithm transforms the received signals to frequency domain through fast Fourier transform (FFT), and then pads the zeros to reach 20 times of the frame length in high-frequency band while preserving part of the mirror components. On this basis, the cross power spectral density function of the microphone pair on received signals can be estimated, and the corresponding generalised cross correlation with phase transform weighting (GCC-PHAT) function can be obtained by taking inverse fast Fourier transform (IFFT). The retained mirror components broaden the signal spectrum so that the peak of GCC-PHAT function becomes sharper. Consequently, the spatial spectrum peak of SRP-PHAT function, which is the accumulation of GCC-PHAT functions for all of the microphone pairs, becomes sharper, thus the localisation performance is improved. Experiments show that compared with conventional algorithms, the proposed algorithm can considerably enhance the success rates of sound source localisation.

KeywordsPhase transformSound source localisationMirror components

收稿日期:2015-01-18。國(guó)家自然科學(xué)基金青年基金項(xiàng)目(61201 345)。蔡衛(wèi)平,副教授,主研領(lǐng)域:陣列信號(hào)處理。劉瑞娟,講師。周琳,副教授。

中圖分類(lèi)號(hào)TP391.4

文獻(xiàn)標(biāo)識(shí)碼A

DOI:10.3969/j.issn.1000-386x.2016.06.077

猜你喜歡
信號(hào)
信號(hào)
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
7個(gè)信號(hào),警惕寶寶要感冒
媽媽寶寶(2019年10期)2019-10-26 02:45:34
孩子停止長(zhǎng)個(gè)的信號(hào)
《鐵道通信信號(hào)》訂閱單
基于FPGA的多功能信號(hào)發(fā)生器的設(shè)計(jì)
電子制作(2018年11期)2018-08-04 03:25:42
基于Arduino的聯(lián)鎖信號(hào)控制接口研究
《鐵道通信信號(hào)》訂閱單
基于LabVIEW的力加載信號(hào)采集與PID控制
Kisspeptin/GPR54信號(hào)通路促使性早熟形成的作用觀察
主站蜘蛛池模板: 久久国产成人精品国产成人亚洲| 亚洲性影院| 狠狠色婷婷丁香综合久久韩国| 成人福利在线看| 国产va免费精品观看| 99热线精品大全在线观看| 亚洲一区网站| 波多野结衣一区二区三区四区视频| 日本人又色又爽的视频| 亚洲免费黄色网| 国产jizz| 国产精品一线天| 伊人91视频| 国产爽歪歪免费视频在线观看 | 久久亚洲美女精品国产精品| 伊人久热这里只有精品视频99| 在线国产资源| 老司机午夜精品网站在线观看 | 二级特黄绝大片免费视频大片| 久久久久久国产精品mv| 亚洲精品国产综合99| 欧美不卡视频一区发布| 亚洲欧洲日韩国产综合在线二区| 色综合久久88| 国产精品九九视频| 亚洲AV人人澡人人双人| 色网在线视频| 国产精品福利导航| 亚洲国产欧美自拍| 无码中文字幕乱码免费2| 久久国产高清视频| 午夜福利免费视频| 精品伊人久久久久7777人| 亚洲精品老司机| 2020极品精品国产| 欧美国产精品不卡在线观看| 97久久精品人人| 玖玖精品在线| 无码视频国产精品一区二区| 国产成人a在线观看视频| 18禁黄无遮挡免费动漫网站| 在线欧美a| 国产尹人香蕉综合在线电影| 国产玖玖视频| 日韩欧美中文| 被公侵犯人妻少妇一区二区三区| 亚洲综合二区| 91啪在线| 凹凸精品免费精品视频| 久久不卡国产精品无码| 国模私拍一区二区| 精品久久久无码专区中文字幕| 四虎永久在线视频| 91www在线观看| 一本综合久久| 一级毛片高清| 国产婬乱a一级毛片多女| 成人字幕网视频在线观看| 久久亚洲天堂| 日韩第一页在线| 日本亚洲国产一区二区三区| 精品视频在线观看你懂的一区| 97人人做人人爽香蕉精品| 日韩色图在线观看| 精品国产一区91在线| www欧美在线观看| 中文字幕在线日韩91| 国产亚洲现在一区二区中文| 亚洲AV电影不卡在线观看| 无码内射中文字幕岛国片| 91精品啪在线观看国产60岁 | 欧美亚洲日韩中文| 亚洲一区毛片| 人妻一区二区三区无码精品一区| 国产美女丝袜高潮| 久久国产精品电影| 九九热精品在线视频| 国产精品主播| 亚洲欧美精品在线| 99re热精品视频国产免费| 欧美成在线视频| 午夜性爽视频男人的天堂|