999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Mel頻率倒譜系數(shù)的說話人識別研究

2016-06-06 05:37:03朱宇軒
西部皮革 2016年10期
關(guān)鍵詞:特征

朱宇軒

(西華大學(xué),四川 成都 610039)

?

基于Mel頻率倒譜系數(shù)的說話人識別研究

朱宇軒

(西華大學(xué),四川 成都 610039)

摘要:由于人耳對聲音頻率的感知不是線性的,通過短時傅里葉變化得到的語音信號短時譜是按實(shí)際語音頻率分布的,但符合人耳聽覺特性的頻率分布是按照臨界頻帶分布的。因此按實(shí)際頻率分布的頻譜作為語音特征時,由于它不符合人耳的聽覺特性,將會降低說話人識別系統(tǒng)的識別性能。

關(guān)鍵詞:頻率倒譜;語音特征

1Mel頻率倒譜系數(shù)(MFCC)

MFCC是在頻譜上采用濾波器組的方法計算出來的,將語音頻率劃分成一系列的三角形濾波器序列,這組濾波器在頻率的坐標(biāo)上是等寬的。這是因?yàn)槿祟愒趯?000Hz以下的聲音頻率范圍的感知遵循近似線性的關(guān)系;對1000Hz以上的語音頻率范圍的感知不遵循線性關(guān)系,而是遵循在對數(shù)頻率坐標(biāo)上的近似線性關(guān)系。

Mel頻率倒譜系數(shù)(MFCC)是使用傅立葉分析提取的語音特征參數(shù),是類似于指數(shù)的形式,Mel頻率可以用如下公式表示:

Mel(f)=2595lg(1+f/700)

(1)

式中:f是以Hz為單位的實(shí)際頻率。對頻率軸的不均勻劃分是MFCC特征區(qū)別于普通倒譜特征的最重要的特點(diǎn)。語音頻率與Mel頻率的對應(yīng)關(guān)系如圖1所示。

2頻率倒譜系數(shù)計算

根據(jù)Zwicker的工作,Mel頻率的增長是與臨界帶寬的變化保持一致的,以Mel為單位的頻率刻度劃分與臨界帶寬在細(xì)節(jié)上并不精確相等,但這個差別是很小的。

(1)將信號進(jìn)行分幀,預(yù)加重和加漢明窗處理,然后進(jìn)行短時傅里葉變換并得到其頻譜。

(2)求出頻譜平方,即能量譜,并用M個Mel帶通濾波器進(jìn)行濾波;由于每一個頻帶中分量的作用在人耳中是疊加的,因此將每個濾波器頻帶內(nèi)的能量進(jìn)行疊加,這時第k個濾波器的輸出功率譜x′(k)。

(3)將每個濾波器的輸出取對數(shù),得到相應(yīng)頻帶的對數(shù)功率譜;并進(jìn)行反離散余弦變換,得到L個MFCC系數(shù),一般L取12~16個左右。得到MFCC系數(shù)為

(2)

它將頻譜轉(zhuǎn)化為基于頻率的非線性頻譜,然而轉(zhuǎn)換到頻譜域上,由于充分考慮了人耳的聽覺特性,在一定程度上模擬了人耳對語音的處理特點(diǎn),而且沒有任何提前假設(shè),MFCC 參數(shù)具有良好的識別性能和抗噪能力,在信道噪聲和頻譜失真的情況下具有較好的穩(wěn)健性。但是計算量和計算精度要求較高。

3MFCC中的能量信息和動態(tài)參數(shù)

短時能量是說話人識別中一個重要的參數(shù),由于短時能量對系統(tǒng)的識別性別有一定的提升作用,因此可以在說話人語音特征中加入能量參數(shù)作為特征向量的一維分量。

假定語音段中長度為N的一幀{si(n),n=1,2,…,N},計算該幀的短時對數(shù)能量的公式如下:

(3)

為了減小不同語音段不同語音幀的能量差別,使其能夠與前面的倒譜特征系數(shù)一起作為向量計算,需對其進(jìn)行歸一化處理。

(4)

前面計算得到的MFCC倒譜系數(shù)為語音信號的靜態(tài)特征參數(shù),它只表征了語音譜的即時信息。研究發(fā)現(xiàn),語音倒譜的動態(tài)信息包含了與說話人有關(guān)的信息,可以將其用于提高說話人識別系統(tǒng)的識別率。

語音信號的倒譜動態(tài)信息表示了語音特征參數(shù)隨時間變化的規(guī)律。語音倒譜特征隨時間的變化規(guī)律可由下式表示:

(5)

4總結(jié)

在實(shí)際的應(yīng)用中窗函數(shù)h(k)一般采用矩形窗,k為常數(shù),一般取2,這樣的動態(tài)參數(shù)就是當(dāng)前幀的前兩幀和后兩幀的線性結(jié)合。用同樣的方法對一階動態(tài)參數(shù)進(jìn)行計算就得到了二階MFCC參數(shù)。在得到倒譜系數(shù)的動態(tài)信息后,一般的做法是將原始特征與動態(tài)特征參數(shù)結(jié)合,組成高維特征矢量作為訓(xùn)練和識別的一幀語音信號特征參數(shù)。實(shí)驗(yàn)表明,使用MFCC及其一階和二階差分參數(shù)作為特征可顯著提高說話人識別系統(tǒng)的性能,它在一定程度上模擬了人耳對語音的處理特點(diǎn),并具有一定的抗噪性能,進(jìn)一步地表示了說話人語音背后的隱性個性差異。

參考文獻(xiàn):

[1]徐波.語音識別技術(shù)與應(yīng)用的發(fā)展趨勢.中國計算機(jī)學(xué)會,2008,2:54~57.

[2]李霄寒.基于概率統(tǒng)計模型的說話人確認(rèn)的研究[D].中國科學(xué)技術(shù)大學(xué),2003.

[3]韓紀(jì)慶,張磊,鄭鐵然.語音信號處理[M].北京:清華大學(xué)出版社,2004,10~50.

作者簡介:朱宇軒,男,漢族,四川南充,工人,大學(xué)本科,西華大學(xué),研究方向:電子、計算機(jī)。

中圖分類號:TN912

文獻(xiàn)標(biāo)志碼:A

文章編號:1671-1602(2016)10-0014-01

猜你喜歡
特征
抓住特征巧觀察
離散型隨機(jī)變量的分布列與數(shù)字特征
具有兩個P’維非線性不可約特征標(biāo)的非可解群
月震特征及與地震的對比
如何表達(dá)“特征”
被k(2≤k≤16)整除的正整數(shù)的特征
不忠誠的四個特征
詈語的文化蘊(yùn)含與現(xiàn)代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 欧洲极品无码一区二区三区| 欧美一级在线看| 午夜视频日本| 久久美女精品| 99视频在线观看免费| 国产亚洲现在一区二区中文| 99精品热视频这里只有精品7| 欧美亚洲另类在线观看| 99久久国产综合精品2020| 首页亚洲国产丝袜长腿综合| 一级毛片免费观看久| 久久天天躁狠狠躁夜夜2020一| 国产玖玖玖精品视频| 丝袜久久剧情精品国产| 中国国产A一级毛片| 久久黄色视频影| 精品人妻系列无码专区久久| 国产亚洲高清在线精品99| 国产91全国探花系列在线播放| 无码又爽又刺激的高潮视频| 亚洲综合二区| 国产福利在线免费观看| 欧美福利在线| 久久99国产视频| 一级高清毛片免费a级高清毛片| 亚洲男女在线| 国产H片无码不卡在线视频| 激情综合五月网| 激情午夜婷婷| 伊人久久婷婷| 亚洲日本中文综合在线| 一级毛片在线直接观看| 免费女人18毛片a级毛片视频| 国产成人凹凸视频在线| 亚洲精品无码久久久久苍井空| 国产福利免费视频| 91国内外精品自在线播放| AV不卡在线永久免费观看| 国产女人综合久久精品视| 全部无卡免费的毛片在线看| 婷婷午夜影院| a级毛片免费在线观看| 国产精品视频白浆免费视频| 超级碰免费视频91| 国产综合色在线视频播放线视| 91伊人国产| 亚洲成人在线网| 中文字幕欧美日韩高清| 亚洲天堂免费在线视频| 9丨情侣偷在线精品国产| 亚洲一区二区精品无码久久久| 中文字幕亚洲精品2页| 国产视频久久久久| 亚洲另类国产欧美一区二区| 视频一区视频二区日韩专区| 亚洲日本www| 亚洲色无码专线精品观看| 精品一区二区久久久久网站| 狠狠色成人综合首页| 国产精品三级专区| 毛片在线播放网址| 亚洲高清在线天堂精品| 在线精品自拍| 国产特级毛片| 麻豆国产精品| 激情网址在线观看| 亚洲欧美另类久久久精品播放的| 亚洲国产成熟视频在线多多 | 国产真实乱子伦视频播放| 国产在线精彩视频二区| 天天干伊人| 四虎永久免费在线| av午夜福利一片免费看| 国产免费久久精品99re丫丫一| 3p叠罗汉国产精品久久| 欧美亚洲另类在线观看| 国内精品视频| 9cao视频精品| 国产自在线拍| 秋霞午夜国产精品成人片| 亚洲乱码视频| 亚洲无线一二三四区男男|