許方煜(重慶郵電大學,重慶 400065)
多聲源下基于耳蝸基底膜的聲源定位
許方煜
(重慶郵電大學,重慶400065)
摘要:傳統麥克風聲源定位在噪聲環境下無法精確的定位出聲源,而人耳卻能準確的辨別出來。根據人耳這一特性,提出一種在多聲源環境下基于耳蝸基底膜的聲源定位。該方法利用多麥克風進行聲音信號的采集[1-2],然后采用基底膜濾波器對聲源信號進行濾波,這里采用GC-4濾波器進行濾波,最后再進行聲源定位。實驗結果證明在多聲源情況下基于耳蝸基底膜的聲源定位能提高定位精度。
關鍵詞:聲源;耳蝸基底膜;濾波器;精度
人耳聽到聲音的過程是:首先通過聽覺系統的外耳,實現對聲音信號的收集和放大!然后經由耳道傳輸至耳膜,經過中耳的阻抗匹配后傳導至內耳的耳蝸[3]。耳蝸基底膜對聲音信號具有頻率選擇特性,即不同頻率會在基底膜的不同位置產生不同幅度的調諧峰,基底膜的這種頻率選擇特性相當于一個帶通濾波的過程,人耳聽覺系統以此實現對聲音信號的濾波.經過基底膜濾波之后的聲波信號傳遞到內毛細胞.內毛細胞接受耳蝸傳來的振動信號,經過半波整流之后將其轉換成神經電信號由聽覺神經纖維實現對聲音信號的脈沖編碼。
聲音信號在耳蝸中傳輸時,耳蝸對聲音信號進行濾波處理,此時耳蝸相當于一組帶通濾波器。而耳蝸基底膜貫穿了耳蝸的底部到頂部,是耳蝸內對聲音信號濾波的主要執行者。耳蝸基底膜主要有以下幾個特性:(1)頻率選擇;(2)頻譜分析特性;(3)濾波器頻率響應的非對稱;(4)濾波器頻率響應的強度相關。
耳蝸基底膜上的每一個點都在一個特定的頻率下響應出現峰值。對高頻聲學信號,耳蝸基底膜的峰值出現在基底膜的底端附近,相反對低頻聲學信號,耳蝸基底膜的峰值出現在基底膜的頂端附近。耳蝸基底膜縱向位置上,存在頻率部位的轉化關系。在耳蝸基地膜的頂端開始,500Hz以上聲音信號,相對帶寬基本為恒量,其最大方位的包絡的線性距離與頻率的對數基本上呈線性關系,耳蝸基底膜的與頻率的這種聯系如(1)式所示:
BF的單位是kHz;x表示的是基底膜某處離基底膜頂部的長度和基底膜的全長的比值,一般數值在0~1范圍內;表示的是常數參量(=2.1);k表示的也是常數參量(k=0.85)。A表示的也是常數參量(這里取值為A=0.1654)。
耳蝸基底膜的特性明顯可以看出耳蝸基底膜具有濾波的作用,由此可建立濾波模型。
基底膜特性可以建立一個更加符合人耳聽覺特性的濾波器,使其具有更好的頻率選擇性能,本文選用GC濾波器,并對其進行改進。GC濾波器是一種標準的耳蝸聽覺濾波器,該濾波器組的沖激響應的典型模式為(2)式所示:
a表示幅度;n和b用來調整伽馬函數的分布;fr表示GC濾波器的中心頻率;ERB(fr)表示當頻率為fr時,聽力正常的人平均聽力的等效矩形帶寬;表示初始相位;lnt表示時間的自然對數;u(t)表示單位階躍函數;c表示啁啾因子。當c=0時,上式可以簡化為GT濾波器的時域表達。
通過傅里葉變換,上式可變為GC濾波器的幅頻響應,如式(3)式所示:
由上述可以知道,GC濾波器是由GT濾波器級聯一個非對稱補償濾波器得到,所以,其改進實質上是在GT-4上級聯一個非對稱補償濾波器。而文章的非對稱補償濾波器沒有沖激響應函數,需要從補償濾波器的設計方法實現。
由式(9)分析可以得到,將GT-4濾波器級聯一個低通濾波器,然后再級聯高通濾波器后,最終形成GC-4濾波器。
然后利用改進后的GC-4濾波器進行濾波,最后利用內毛細胞模型,耳蝸核模型以及神經纖維模型獲取脈沖發放率。最后采用映射求和互相關算法求得雙耳對應頻率通道的互相關函數。這里的加權函數采用相位變化加權函數。具體表達式如公式(10)所示:
相對于空間坐標中的新函數,將其定義為映射GCC函數(mGCC)。通過映射函數,便可以得到左右兩個相同頻率通道求得的空間坐標。然后求得各頻率通道中目標聲源分量的空間坐標。然后將保留下來的空間坐標進行相加,如式(5.35)所示各信號源的位置。該式定義為求和GCC函數(sGCC)。
如公式(14)所示。在一個聲源的時候,值存在一個最大的峰值。而且,當存在多個聲源的時候,求和GCC的結果不僅僅是唯一的峰值,還存在第二個或者多個峰值,這是因為空間坐標相加得到的峰值位置表示的聲源的位置。在多聲源下基于耳蝸基底膜的聲源定位角度誤差明顯小于其他兩種方法。由此證明:在多聲源環境下,基于耳蝸基底膜的聲源定位系統比基于麥克風陣列的定位系統和基于過零點的聲源定位系統具有更高的定位精度。
參考文獻:
[1]趙秀粉.基于麥克風陣列的聲源定位技術研究[D].電子科技大學,2013.
[2]基于小型麥克風陣列的聲源定位技術[J].華中科技大學學報,2013,(41):1671-4512.
[3]曲天書,曹松濰.雙耳時間差和強度差與聲源距離線索關系的研究[J].北京大學學報,2010,46(06):0479-8023.
[4]羅元,陳君.基于耳蝸基底膜特性的語音特征提取方法及在智能輪椅上的應用[J].計算機應用,2012,29(10):1001-3695.
作者簡介:許方煜(1989-),男,福建福鼎人,碩士研究生,研究方向:語音識別。