劉玉清 吳帶明 李志節



摘要:本文設計了一種基于廣義互相關時延估計的麥克風陣列的聲源定位算法,在建立麥克風陣列時,通過對不同麥克風模型的實驗進行研究,最終選定了X陣列的麥克風陣列作為算法模型來定位聲源,并建立合適的空間坐標系來準確地確定在大廳中走動的人的位置。本文的聲源定位模型算法是建立在遠場模型且排除外界干擾的假設上。本文的創新點在于對解決定位人位置的問題上的算法中采用廣義互相關時延估計算法,其優勢在于原理簡單、運算量小且對混響和抗噪聲能力較強。
關鍵詞:廣義互相關;時延估計;X陣列;聲源定位
中圖分類號:TN912.2? ? ? ? ? ? ? ? 文獻標識碼:A
1 引言
要在空曠的大廳內用麥克風樹來確定位置,首先需要建立合理的麥克風樹,并通過對多支麥克風收搜集的聲音進行對比處理,根據麥克風陣列的聲源定位來確定人的位置。而麥克風陣列的結構設計是決定聲源定位系統定位精度的關鍵因素,根據空間維度的不同,可以將麥克風陣列分為一維陣列、二維陣列、三維陣列。在空間中的聲源定位通常采用三維麥克風陣。為了滿足定位的需求與精確度,本研究選擇X陣列麥克風陣列來進行聲源定位。
2 X陣列麥克風樹的模型建立與仿真
用麥克風收集聲源反饋的信息,并對收搜集到的信息加以處理,來確定聲源的位置,這是基于麥克風陣列的聲源定位系統模型。
2.1 建模的基本思路
本研究選用四個麥克風進行接收信號,然后通過TDOA算法求時延,通過時延獲取聲源相對于坐標原點的方位角和俯視角。從而就可以得到聲源在坐標系中的坐標,于是就實現了定位。通過反射聲音,我們可以獲取聲源相對于對稱的虛聲源到原點的位置信息,進而確定聲源的位置。
2.2 問題1的X陣列聲源定位模型
2.2.1 X陣列聲源定位模型
對于X陣列聲源定位模型至少需要4個麥克風,增加麥克風對定位精度會有所提高,結合實際情況考慮,X陣列聲源定位模型采用4個麥克風做仿真測試。仿真實驗在一個a m×b m×c m的三維空間進行,4個麥克風的坐標分別為S1(D/2,0,0),S2(0,D/2,0),S3(-D/2,0,0),S4(0,-D/2,0)。仿真聲源在聲源處頻率為T0,在麥克風接收到信號時頻率為T1,實驗采樣頻率為fs,實驗在考慮高斯白噪聲的條件下進行[1]。麥克風之間的距離D=20 m,如圖1所示.。
根據假設定義如圖1所示模型,P表示聲源位置,S1、S2、S3、S4表示麥克風,R1、R2、R3、R4分別表示聲源到每個麥克風的距離,D/2表示每個麥克風到陣列中心的距離,距離單位均為(m)。
通過類似LMS定位算法,GCC時延估計算法可以得到聲源的坐標(X,Y,Z)。
2.2.2 廣義互相關法(GCC)估計時延
本文選取了廣義互相關法(GCC)來進行時延的估計。廣義互相關法(GCC)通過計算不同麥克風所接收到的信號之間的相關函數來估計時間值,GCC法就是在功率譜域對信號進行加權,突出相關的信號部分而抑制受噪聲干擾的部分,提高了時延估計的精度。設兩個麥克風接收到的信號為xi(n)和xj(n),s(n)為聲源信號,ni(j)(n)為高斯白噪聲,相互獨立,ti(j)分別為聲波到麥克風Si和Sj的傳播時間,,ai(j)分別為聲源信號到麥克風Si,和Sj的衰減系數,則
GCC基本原理流程如圖2所示。圖中Hi(f)、Hj(f)表示為濾波函數,Pi(t)、Pj(t)為信號的加權函數,最后將加權后的函數進行積分等互相關運算后反變換到時域,得到信號的互相關函數,其峰值對應的時間就是信號間的時延。則相關函數輸出為:
因此通過搜尋互相關函數的最大峰值,就可以得到信號之間的時延差τ。
2.2.3 X陣列聲源定位模型的仿真與分析
為了驗證建立的聲源定位算法模型的準確性,在采樣頻率fs=10 kHZz,麥克風高度z=1.44 m,每個麥克風距離陣列中心的距離為D/2=3.085 m,聲音傳播速度C=344 m/s的情況下進行仿真實驗。在特定的環境下進行聲源到麥克風的距離分別是18m、19m、20m、21m、24m五次實驗,根據廣義互相關延遲算法得到一個麥克風到其他三個麥克風之間的時延。由得到的時延帶入算法計算聲源到原點的距離,具體實驗數據見表1。
由表1可以看出,去除錯誤數據之后,聲源位置的距離誤差在2 m以內,且偏差百分比在0到10%之間。誤差較小,在可以接受的范圍之內。說明構造的算法可以應用于聲源定位。
在空間中已知四個麥克風的空間坐標,經過五次反復試驗仿真得到五次實驗聲源坐標與實際聲源坐標,從表2中可以看出,仿真聲源坐標與實際聲源坐標的誤差在0到2%之間,通過應用廣義互相關算法,計算得到五次實驗的時延數據,根據仿真得到的時延數據,帶入計算得到聲源的方位角、俯仰角等位置信息。[2]
通過對實驗得到的數據進行的分析研究,基本實現了傳聲器陣列聲源定位的功能,但仍存在一些問題誤差,誤差的大小主要受麥克風之間接收延遲的影響,但在可接受范圍內。通過計算坐標偏差百分比,系統坐標偏差誤差在2%以內,距離偏差百分比誤差在10%以內,可見定位系統穩定可靠。
3 結論與推廣
用麥克風樹構建的模型并未考慮聲源的速度,可以適當通過改變聲源的速度,查看聲源速度對于模型結果誤差的影響,獲得一個追蹤聲源較為穩定的高度。真實環境中存在很多環境噪音,聲源信號的傳輸會不可避免地會受到外部因素的影響,這會導致聲源定位系統精度和運行速率。因此可以使用非線性濾波技術對接收到的聲源信息進行處理。[3]隨著信號處理技術和、目標定位技術的不斷發展和完善,利用目標發出特定的聲信號來識別運動過程中的位置的方法逐漸被應用到人類生活、智能醫療和科學研究中。而麥克風樹這一聲源定位技術也將被應用到于更多方面中。
(責任編輯:侯辛鋒)
參考文獻:
[1]張曉光,呂海峰,呂傳茂,王普浩,韓冬,陳龍虎等.X陣列四元十字麥克風陣聲源定位算法研究[J].中國測試,2020,46(02):96-102.
[2]唐浩洋,陳子為,黃維.基于麥克風陣列的GCC時延估計算法分析[J].計算機系統應用,2019,28(12):140-145.
[3]陳藝.室內三麥克風樹的聲音定位數學模型[J].電子世界,2020(13):89-92.