999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

行車噪聲環境下基于人耳頻率選擇特性的聲學特征提取方法

2015-04-29 00:44:03裴孝中鄭鐵然韓紀慶
智能計算機與應用 2015年3期

裴孝中 鄭鐵然 韓紀慶

摘 要:本文提出了一種基于加權Mel濾波器組的聲學特征提取方法。該方法通過提取音頻信號中的共振峰信息,使用動態自適應方法對中高頻部分的Mel濾波器組進行加權,從而模仿人耳覆膜的頻率選擇映射。相比較于傳統的MFCC特征,更適用于行車噪聲環境下的快速聲學事件檢測任務;彌補了傳統的Mel濾波器組高頻部分分辨率低,從而導致對噪聲魯棒性較差的問題。實驗結果表明:在信噪比較低的行車環境中,該特征有助于提高聲學事件的檢出率。

關鍵詞:聲學事件檢測;魯棒性特征提取;行車噪聲環境;動態自適應;MFCC

中圖分類號:TP391.4 文獻標識號:A 文章編號:2095-2163(2014)02-

An acoustic feature extraction approach based on frequency selectivity of human auditory under driving noisy environments

PEI Xiaozhong, ZHENG Tieran, HAN Jiqing

(School of Computer Science and Technology, Harbin Institude of Technology, Harbin 150001,China)

Abstract:This paper presents an acoustic feature extraction approach based on weighting Mel filter banks. By extracting the formant information of audio signal, this method uses dynamic adaptive method for weighting high-frequency part of the Mel filter bank to achieve the purpose of simulating the auditory frequency selection mapping. Compared to the conventional MFCC feature, the proposed feature is more suitable for the fast acoustic event detection under driving noise task and makes up the poor robustness of the traditional methods which is resulting with the low resolution of Mel filter bank at the high-frequency part. The experiments show that the proposed feature helps to improve the detection rate of acoustic events in the low SNR driving environment.

Keyword: Acoustic Event Detection; Robust acoustic feature extraction; driving noisy environments; Dynamic Adaptive; MFCC

0引 言

聲學事件檢測(Acoustic Event Detection, AED)就是檢測當前環境中發生的特定目標聲學事件,然后把檢測出的聲學事件轉換為人類或者智能設備可以理解的信號,為人類或者智能設備的決策提供信息。在聲學事件檢測研究中,研究者們做出了大量的貢獻。目前研究主要聚焦在提取適合檢測任務要求的聲學特征表示和聲學事件的分類算法方面。在聲學特征方面,研究者們嘗試了各種聲學特征,如:梅爾倒譜系數(Mel-frequency cepstral coefficients, MFCC)[1]、線性預測倒譜系數(Linear prediction cepstral coefficients, LPCC)[2]、 基頻(Pitch)[3]、頻譜質心(Spectral centroid)[4]等。在聲學事件的分類方法中,研究者們也嘗試了各種不同的方法,包括基于支持向量機(Support Vector Machine, SVM) 方法、隱馬爾科夫模型(Hidden Markov Model, HMM)方法、人工神經網絡(Artificial Neural Network, ANN)方法等。近幾年來,SVM方法[5]和HMM方法[6]成為最主流的聲學事件分類方法。

在本文的研究工作中,將會嘗試在行車噪聲環境下,檢測車輛周邊發生的各種目標聲學事件。由于行車中的聲學環境較為復雜,當車輛行駛速度較快或者路況較差等情況存在時,噪聲頻譜污染就較為嚴重,傳統的聲學特征,例如:MFCC在中高頻部分的濾波器分布較為稀疏且處此濾波環境下,而中高頻部分噪聲較強時,目標聲學事件的檢出率即會顯著下降。

對強噪問題,研究者們通常采用降噪模式來增強目標聲音信號的方法,如:高斯模型假設下的維納濾波增強算法[7]、基于聽覺掩蔽效應的增強算法[8]、譜減法[9]等。綜合評析可知,基于高斯模型的濾波方法計算復雜度較高;基于聽覺掩蔽效應的語音增強算法則不能充分地模擬人耳對于聲音的感知;而在降噪中普遍使用的譜減法卻存在“音樂噪聲”的問題,導致降噪后聲音信號的頻譜破壞較為嚴重,使得提取出的特征不能很好地刻畫聲音信號的目標聲學事件的頻譜特性。

耳蝸是人類接收和處理外界聲音信號的主要器官,在提取可辨性的聲音特征,以及對背景噪聲的魯棒性方面均表現出高強的能力。耳蝸生理學研究成果表明,耳蝸的這種能力主要來自于以下幾個方面:基底膜的頻率分析功能、外毛細胞/覆膜的主動選擇性增益功能等[10]。其中,基底膜的主要功能是將接收到的聲音信號分解為各個頻率上的振動峰值,并將相應的振動傳遞給外毛細胞和內毛細胞;外毛細胞/覆膜則主要依據接收到的振動對特定頻率處的能量進行選擇性增益,影響相應位置處的內毛細胞發放強度。

針對傳統聲學事件檢測方法存在的問題以及人耳中耳蝸的聽覺感知特性,本文提出了一種模擬人耳聽覺感知的基于共振峰的Mel濾波器組的加權算法,通過模擬人耳的聽覺感知特性,加強了Mel濾波器組對中高頻的分辨能力,并采用加權后的Mel濾波器組提取FMFCC(Formant-MFCC, FMFCC)系數。實驗證明,FMFCC對噪聲有更好的魯棒性,并且在目標聲學事件信號較弱時,也不會增加誤識率。

1共振峰的提取

聲音信號的倒譜可以通過先對信號做傅里葉變換、取模,得到信號的頻譜密度,然后求頻譜密度的對數,最后求反傅里葉變換得到。根據參數模型功率譜估計的思想,可以將聲音信號 看作一個輸入序列 激勵一個全極點的系統 而產生的輸出,系統的傳遞函數為:

……………………………(1)

其中, 為常數, 為實數, 為模型的階數。

由于頻率響應 反映了被分析信號的頻譜包絡,因此用 來代替頻譜密度,對 求對數后,做傅里葉反變換求出的LPC倒譜系數,也被認為包含了信號頻譜的包絡信息,因此將其看作是對原始信號短時倒譜的一種近似。

的沖擊響應為 。欲求 的倒譜 ,根據同態分析法,因為 是最小相位的,所以 一定可以展開成級數的形式,即 的逆變換 是存在的,可得:

……..….(2)

因此,只要計算出線性預測系數 ,就可以求出倒譜 ,通過對倒譜 進行搜索,找到每一個共振峰所在的頻率,記為 ,其中 表示共振峰的個數。

2 Mel濾波器組的加權

2.1模擬頻率選擇性增益功能

人耳的選擇性增益功能對人耳耳蝸的聽覺感知至關重要,人耳的選擇性增益機制主要包括:頻率相關的增益區間和增益函數。考慮到人耳覆膜的行波振動范圍有限,因此其頻率增益區間僅局限于中心頻率附近[11];增益函數在頻域的對數尺度上近似于高斯函數,在共振峰頻率處的增益幅度最大,而在共振峰頻率兩側的增益幅度迅速衰減。這即導致共振處的頻率振幅能量在急劇增加的同時,兩側的頻率振幅能量急劇降低,表現出人耳的頻率選擇性增益功能。

下面給出一種方法把LPC譜估計法提取出的共振峰的信息應用到Mel濾波器組中,從而彌補Mel濾波器組在中高頻分辨率不足的問題。

考慮到在頻率的對數尺度上,耳蝸的頻率增益曲線類似于高斯密度函數,在共振峰處,耳蝸的頻率增益最大,而在共振峰所在頻率的兩側,耳蝸的增益幅度迅速衰減,根據以上分析,設計了如下函數來模擬耳蝸基底膜與覆膜之間的頻率選擇增益函數:

……(3)

其中, 表示第 個子帶的頻率中心, 表示第 個子帶的寬度, 表示Mel濾波器組中包含的Mel子帶的個數; 表示檢測到的第 個共振峰的頻率, 表示第 個共振峰的振幅在 個共振峰的振幅總和中所占的振幅能量的比例,該比例用來表示第 個共振峰的強弱; 是一個指示性函數,如果共振峰 的頻率在以 為中心,以 為寬度的第 個Mel子帶中,則返回1,否則返回0。

2.2 Mel濾波器組的加權

通過對每一幀中共振峰所處的Mel子帶對應的Mel濾波器系數進行加權,突出共振峰所在的Mel子帶的頻率,從而模仿人耳覆膜的頻率選擇映射,由此即彌補了Mel濾波器組在中高頻分辨率較低的不足,同時也增強了傳統MFCC對噪聲的魯棒性。這符合人耳的聽覺感知機理,如在眾多嘈雜的背景環境噪聲中,要想別人聽清楚自己說話,必須提高聲音的分貝,掩蓋其他背景聲音。

根據Mel濾波器組中每一個Mel子帶在對數頻率中的分布范圍,對目標聲學事件(鳴笛)的每一幀數據在對數頻域上進行劃分,通過對分幀后的每一幀數據利用LPC倒譜估計的方法來提取其中的共振峰信息。圖1中虛線為加權前的濾波器組系數,實線即為加權后的濾波器組系數;通過觀察可以看出:第7、9、11、13、14、16個Mel濾波器明顯得到了增強,解決了傳統的Mel濾波器的中高頻分辨率低的問題。

圖1 加權前后的濾波器組

Fig.1 Filter bank of weights before and after

3 基于加權后的Mel濾波器組的FMFCC特征提取

首先對采集的聲音信號進行預加重、分幀、加窗等預處理,然后對每一幀的數據使用LPC倒譜法提取共振峰的信息,接下來根據提取的共振峰信息以及Mel頻域子帶的劃分確定當前數據幀的每一個Mel濾波器的加權系數,從而獲得加權后的Mel濾波器組,此后對每個濾波器的輸出進行指數壓縮,再對經過指數壓縮的能量譜進行離散余弦變換,并經過升半正弦倒譜提升,最終得到FMFCC特征。

4實驗結果與分析

根據本文提出的加權Mel濾波器組進行車載系統的鳴笛聲學事件的檢出實驗。在實驗中,搭載聲學事件檢測系統的車輛分別在不同的速度和不同的路況下對測試數據進行采集,測試數據中長鳴笛(每一個長鳴笛時長大于1.5秒),包括100個,短鳴笛(每一個短鳴笛時長小于1秒),包括為100個,笛語(由不同的長、短鳴笛序列組成)25個。基線系統使用的特征是傳統的MFCC,而實驗系統使用的是加權后的Mel濾波器組提取的特征,具體的實驗結果如表1所示。

通過分析表1可以獲知,與傳統的MFCC特征相比,加權后的FMFCC特征有著更高的召回率和更低的誤識率,因此FMFCC更適應于行車噪聲環境下的聲學事件檢測。

表1 加權前后的檢測系統性能對比

Tab.1 Comparison of detection systems performance of weights before and after

AE

指標 長鳴笛 短鳴笛 笛語

基線系統 實驗系統 基線系統 實驗系統 基線系統 實驗系統

R(召回率) 75% 86% 72% 80% 63% 75%

D(誤識率) 5.7% 5.9% 9.7% 9.7% 31.3% 31.5%

響應時間(s) 125ms 139ms 125ms 139ms 150ms 169ms

加權前后的MFCC特征魯棒性對比結果則如圖2所示。通過圖2可以看出,隨著車內噪聲的不斷加強,傳統的MFCC的準確率明顯下降,而本文提出的FMFCC卻只有少許下降,說明了FMFCC對噪聲有較強魯棒性。

圖2 加權前后的MFCC特征魯棒性對比

Fig.2 Comparison of MFCCs robustness of weights before and after

5結束語

本文提出了一種基于人耳頻率選擇特性的加權濾波器組的FMFCC特征,使用LPC倒譜法提取共振峰的信息,模擬人耳的頻率選擇特性對Mel濾波器組進行加權,提取FMFCC系數。加權Mel濾波器組提取的FMFCC系數已經應用到行車噪聲環境下的快速聲學事件檢測系統中。實驗表明,在一定程度上提高了系統的準確率,降低了系統的誤識率,并有效增強了傳統MFCC對噪聲的魯棒性。

參考文獻:

[1] MESAROS A, HEITTOLA T, ERONEN A. Acoustic event detection in real life recordings[C]//18th European SignalProcessing Conference, Aalborg: Proc Eusipco (2010),2010:1267-1271.

[2] RUVOLO P, FSSEL I, MOVELLAN J. A learning approach tohierarchical feature selection and aggregation for audio classification[J]. Pattern Recognition Letters, 2010,31(12) :1535-1542.

[3] PORTELO J, BUGALHO M, TRANCOSO I. Non-speech audio event detection[C]//IEEE International Conference on Acoustics, Speech and Signal Processing, Taipei:[s.n.],2009:1973-1976.

[4] WICHERN G, XUE J, THORNBURG H. Segmentation,indexing, and retrieval for environmental and natural sounds[J].IEEE Transactions on Audio, Speech, and Language Processing,2010, 18(3):688-707.

[5] YE LAMOS P , RAMIREZ J, GORRIZ J M. Speech event detection using Support Vector Machines[J]. International Conferenceon Computational Science,2006,4:356–363.

[6] LOJKA M, PLEVA M, JUHAR J. Modification of widely used feature vectors for real-time acoustic events detection [C]//55th International Symposium ELMAR. Zadar : IEEE Communications Society,2013: 199 - 202.

[7] CAPPE O. Elimination of the musical noise phenomenon with the Ephraim and Malah noise suppressor[J]. IEEE Trans. Speech Audio Process., 1994, 2(2):345–349.

[8] VIRAG N. Single channel speech enhancement based on masking properties of the huma auditorysystem[J]. IEEE Trans.Speech AudioProcessing, 1999, 7(2):126-137.

[9] BOLL S. Suppression of acoustic noise in speech using spectral subtraction[J].IEEE transaction on acoustic,speech and signal processing,1979,27(2) : 113-120.

[10]游大濤. 基于聽覺機理的魯棒特征提取及在說話人識別中的應用[D]. 哈爾濱:哈爾濱工業大學,2013:36-37.

[11] RUSSELL I J, LEGAN P K, LUKASHKINA V A. Sharpened cochlear tuning in a mouse with a genetically modified tectorial membrane[J]. Nature Neuroscience,2007, 10(2):215–223.

主站蜘蛛池模板: 国产成人无码综合亚洲日韩不卡| 亚洲人成日本在线观看| 精品久久久久久久久久久| 久久精品人人做人人综合试看| 在线观看国产精品第一区免费| 国产亚洲视频免费播放| 亚洲国产日韩欧美在线| 狠狠做深爱婷婷久久一区| 欧洲成人免费视频| 亚洲三级a| 亚洲成人免费看| 亚洲精品无码久久毛片波多野吉| 中文字幕伦视频| 久久国产精品国产自线拍| 午夜国产大片免费观看| 色婷婷啪啪| 性色在线视频精品| 男女男精品视频| 亚洲系列无码专区偷窥无码| 国产欧美日韩va| 亚洲五月激情网| 亚洲视屏在线观看| 国产福利微拍精品一区二区| 人人91人人澡人人妻人人爽 | 国产亚洲精品自在久久不卡| 1024你懂的国产精品| 欧美福利在线| 99久久这里只精品麻豆| 国产免费好大好硬视频| 天堂成人av| 亚洲三级色| 有专无码视频| 九色视频线上播放| 一本大道香蕉中文日本不卡高清二区 | 强奷白丝美女在线观看| 午夜丁香婷婷| 老司机精品一区在线视频| a色毛片免费视频| 亚洲无码久久久久| a天堂视频| 亚洲美女一级毛片| 亚洲品质国产精品无码| 中文字幕 日韩 欧美| 三级欧美在线| 亚洲中文字幕日产无码2021| 韩国自拍偷自拍亚洲精品| 亚洲国产91人成在线| 91午夜福利在线观看精品| 99re免费视频| 欧洲精品视频在线观看| 在线a视频免费观看| 国产高清在线精品一区二区三区| 美女被操91视频| 国产第四页| www.狠狠| www.youjizz.com久久| 最新无码专区超级碰碰碰| 91精品国产91久无码网站| 国产中文在线亚洲精品官网| 国产精品hd在线播放| 久久久噜噜噜| 免费毛片网站在线观看| 四虎精品黑人视频| 99久久99视频| 国产精品xxx| 国产美女自慰在线观看| 香蕉国产精品视频| 制服丝袜一区| 伊人无码视屏| 中国毛片网| 国产在线拍偷自揄观看视频网站| 19国产精品麻豆免费观看| 成人福利免费在线观看| 久久精品国产一区二区小说| 色爽网免费视频| 2021国产v亚洲v天堂无码| 亚洲精品视频在线观看视频| 久久中文字幕2021精品| 自拍偷拍一区| 欧美亚洲国产视频| 久久人与动人物A级毛片| 怡春院欧美一区二区三区免费|