999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GMM的說話人識別系統設計與實現

2014-08-07 12:08:20滕廣超林嘉宇
微處理機 2014年3期
關鍵詞:特征實驗模型

劉 冰,滕廣超,林嘉宇

(1.國防科學技術大學電子科學與工程學院,長沙410073;2.武警湖南省總隊湘潭市支隊,湘潭411104;3.武警黃金一總隊通信科,哈爾濱150086)

基于GMM的說話人識別系統設計與實現

劉 冰1,2,滕廣超1,3,林嘉宇1

(1.國防科學技術大學電子科學與工程學院,長沙410073;2.武警湖南省總隊湘潭市支隊,湘潭411104;3.武警黃金一總隊通信科,哈爾濱150086)

現代通信中,說話人的身份認證技術一直是通信行業研究的重點和熱點。而基于GMM和MFCC的說話人識別技術,是目前為止相對成熟和常用的方法。對說話人識別系統的構成做了相關的研究,并通過MATLAB編程,設計了一款以MFCC作為特征參數,基于GMM模型的說話人識別系統。經過實驗測試,本系統能基本滿足工作及家庭生活環境下的說話人識別需要。

說話人識別;Mel倒譜系數;混合高斯模型

1 引 言

說話人識別(Speaker Recognition)[1],也稱聲紋識別(Voiceprint Recognition),是一種利用說話人的語音特征與預先提取的說話人的語音特征相比較,進而確認和鑒別說話人身份的技術。說話人識別技術的研究始于二戰時期美國的Bell實驗室,經過幾十年的研究和發展,說話人識別技術取得了突飛猛進的發展。特別是1995年,Reynolds[2]對高斯混合模型(Gaussian Mixture Model,GMM)[3-4]進行了詳細介紹和應用,其簡單、實用、高效的特點,使之成為說話人識別模式匹配過程中的重要技術。說話人識別可分為說話人確認(Speaker Verification)和說話人鑒別(Speaker Identification)兩類。

2 說話人識別系統原理

說話人識別系統一般由訓練模塊和識別模塊組成。其原理如圖1所示。

圖1 說話人識別系統原理框圖

2.1 說話人識別系統預處理

說話人識別系統的預處理過程一般可分為:采樣與量化、預加重處理、加窗和端點檢測。

語音信號經過采樣和量化之后,信號由模擬轉為了數字信號。為便于頻譜分析或聲道參數分析,需要對信號進行預加重。預加重可以用一階數字濾波器來表示:

其中μ為預加重系數,取值為0.9375。

根據語音信號在10ms到20ms內近似不變的假設,可以將語音信號分成一些短的段進行處理,即分幀。分幀后進行加窗,采用漢明窗函數。

端點檢測(VAD)方面,采用的是短時能量與短時過零率相結合的方法,由此判斷語音信號的起始點位置。短時能量可用來區分清音段和濁音段,有聲段和無聲段。短時過零率則表示一幀語音中語音信號波形經過零電平的次數。由于短時過零率對噪聲非常敏感,很容易產生虛假過零,故我們對其進行了改進。設立一個門限T,將過零率的定義改進為越過±T的次數。即

經過改進后,短時過零率有了較強的抗干擾能力,同時在進行說話人識別端點檢測時,可以設立多個門限,進一步提高檢測精度。

2.2 MFCC特征提取

Mel頻率倒譜系數(Mel Frequency Cepstrum Coefficient,MFCC)[5-6]是一種基于梅爾尺度的頻域倒譜參數。MFCC運用Mel頻率刻度對實際頻率軸進行彎折來模擬人耳所聽到的聲音高低和聲音頻率之間的非線性關系,因而在說話人識別中得到了極為廣泛的應用。系統中MFCC參數提取的流程是:

(1)對語音信號進行預處理,其中語音采集頻率8000Hz、16-bit、Mono,幀長為20ms,幀移為10ms;

(2)快速傅里葉變換(FFT):使用基2的離散傅里葉變換,將時域能量轉換為頻域能量;

(3)Mel能量:通過40個Mel濾波器組,得到40維的Mel頻子帶能量;

(4)Mel對數能量:對每個MEL頻子帶能量取對數,mel(i)=ln[filt(i)];

(5)離散余弦變換:

其中D=13,mfcc(n)即為原始的mfcc特征;

(6)一階二階差分:在原有13維mfcc特征的后面加入13維的一階和二階差分構成39維的特征。可通過一個長度為5的窗函數來求,從而使得這種靜態特征得到相應的動態特征。通過實驗表明,這種39維的動態特征能夠很好的提高系統識別性能。

2.3 基于GMM混合高斯模型的模式匹配

混合高斯模型對不同說話人語音的短時譜特征矢量所具有的概率密度函數進行建模。通過對這些特征矢量進行聚類,并看做是一個多維的高斯分布函數,然后求出每一類的均值、協方差矩陣和出現的概率,作為每個說話人的模板。最后把觀測序列代入模板,進行模式匹配,找到最大后驗概率,即對應識別的人。

M階GMM概率密度函數如下:

其中s為語音的特征矢量,M為高斯混合模型中分量的個數,αj為混合權值;P(s|λ)表示s屬于λ模型的概率。其中等j個混合高斯概率密度函數可表示為P(s):

其中μj為均值向量,Rj為協方差矩陣。一個完整的混合高斯模型是由參數混合權重、均值向量和協方差矩陣組成,可表示為:

系統中的模式匹配即所有參考說話人構成的一個集合,識別判斷目標說話人與集合中的哪一個說話人相匹配。其目的就是找到目標說話人與集合中模型的最大輸出匹配概率,使得待識別語音特征矢量組X具有最大后驗概率P(λi|X)。

由Bayes理論,最大后驗概率可表示為

3 說話人識別系統軟件開發

3.1 系統設置與數據庫

實驗主要是在PC機平臺上,采用MATLAB 7.0編程語音完成的。系統以有源型麥克風作為錄制語音的輸入工具,運用CoolEdit ProV2.1對錄入后的語音進行處理。

實驗數據來自實驗室環境下的采集。語音庫中包含了30個說話人(15男,15女),年齡范圍在10歲至40歲之間,共進行300次說話人識別測試。實驗所用的主要參數如表1所示。

表1 實驗主要參數列表

3.2 系統功能設計

該說話人識別系統具有以下功能:

(1)能較準確的識別待驗證人是否為合法用戶;

(2)可實現語音波形的顯示;

(3)可訓練說話人語音,增加訓練樣本庫;

(4)可較準確的識別待驗證人的身份信息。

3.3 系統基本結構

說話人識別系統主要分為兩個部分:訓練過程和識別過程。

在訓練階段,首先讀取訓練對象的若干語音文件作為訓練語句,然后對這些訓練語句進行端點檢測、預加重、MFCC特征參數提取,最后為訓練對象建立各自的語音特征參數模型。

在識別階段,首先將事先錄制的語音文件作為測試語句在系統中讀取,然后系統對這些測試語句的特征參數進行提取,然后將這些參數與系統內部建立的各個語音模型進行特征參數相似度計算,最終得到識別結果。

3.4 系統性能評估

一個說話人識別系統的好壞主要由正確識別率、訓練時間長短、識別時間長短、語音環境變化等元素進行反映。一般來說,一個好的說話人識別系統,應該具備較高的正確識別率,較短的訓練時間,較短的識別時間,能適應多種語音環境等特點。

為了測試系統性能,系統使用了39維差分MFCC特征參數進行了小數據庫文本的說話人識別實驗,參與實驗的共有30人(15男,15女)。在錄入訓練樣本時,每人錄入4句文字和2句數字,共錄兩次,累積時長為1分鐘,建模時間約為30s。測試時,每人再錄入1句文字和1句數字,共錄兩次,累積時長為20s。在測試過程中,將每人的測試語音分別截取成1s、2s、4s、8s、10s的語音段,用來測試不同時長的測試語音對于系統正確識別率的影響。實驗結果如表2所示。

表2 在不同測試時間長度下識別準確率和識別時間

4 結束語

通過測試可知,在訓練樣本時間相對一致的情況下,測試樣本時間越長,識別的準確度越高,完成識別所用時間越長;其參數提取采用39維差分MFCC方法能有效提高說話人識別系統性能。實驗結果表明,設計的說話人識別系統具有較高的識別率和較短的識別時間,能基本滿足辦公室、家居環境下較少用戶的說話人識別需要。

[1]吳朝暉,楊瑩春.說話人識別模型與方法[M].北京:清華大學出版社,2009.

[2]D A Reynolds,Thomas F.Quatier and Robert B.Dram.Speaker verification using adapted Gaussian Mixture Models[J].Digital Singal Processing 10,Academic Press.2000:19-24.

[3]蔣偉,范明鈺.基于高斯混合模型的說話人識別研究[D].成都.電子科技大學,2005.

[4]D A Reynolds,Campbell W,Gleason T T.The 2004 MIT Lincoln laboratory speaker recognition system[A].In Processdings of ICASSP[C],Philadel Phia,USA,2008.

[5]何朝霞,潘平.說話人識別中改進的MFCC參數提取方法[J].科學技術與工程,2011,11(18):4215-4218.

[6]王剛,鄧方.電話信道下應用DMFCC進行說話人識別[J].清華大學學報,2009,49(10):1597-1600.

Design and Im plementation of Speaker Identification System Based on GMM

LIU Bing1,2,TENG Guang-chao1,3,LIN Jia-yu1
(1.Shool of Electronic Science and Engineering,National Defense Technology University,Changsha 410073,China;2.Xiangtan City Team,The Armed Police Corps of Hunan,Xiangtan 411104,China;3.Communications Department,Gold Corp I,The Armed Police,Harbin 150086,China)

In modern communication,the technology of the speaker's ID authentication is the focus of research and hotspots in communications industry.At present,the speaker identification technology,based on GMM and MFCC,is usable and poplar.In this paper,the composition of speaker identification system is researched and a system which uses Mel frequency cepstral coefficients(MFCC)as feature parameter and GMM for speakermodel is designed by Matlab.The test results show that the system can generallymeet the requirements of identification for work and life.

Speaker Recognition;MFCC;GMM

10.3969/j.issn.1002-2279.2014.03.018

TP391.4

:A

:1002-2279(2014)03-0063-03

劉冰(1985-),男,湖南省湘鄉市人,工程碩士,主研方向:語音信號處理,說話人識別。

2013-10-30

猜你喜歡
特征實驗模型
一半模型
記一次有趣的實驗
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
做個怪怪長實驗
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
NO與NO2相互轉化實驗的改進
主站蜘蛛池模板: 99re热精品视频中文字幕不卡| 国产91麻豆免费观看| 久久综合婷婷| 性做久久久久久久免费看| 最新国产成人剧情在线播放| 亚洲人成网7777777国产| 国产成人免费观看在线视频| 国产一级毛片网站| 国产网站黄| 婷婷在线网站| 成年网址网站在线观看| 成人在线天堂| 国产香蕉97碰碰视频VA碰碰看| 国产精品尤物铁牛tv| 欧美亚洲国产精品久久蜜芽| 欧美性天天| 久久黄色毛片| 亚洲精品手机在线| 欧美在线一级片| 亚洲日韩欧美在线观看| 亚洲无码免费黄色网址| 91精品国产自产在线老师啪l| 日本高清有码人妻| 亚洲成aⅴ人在线观看| 日韩欧美国产区| 国产成人AV综合久久| 99精品欧美一区| 亚洲无码高清一区二区| 91久久偷偷做嫩草影院电| 中文字幕伦视频| 午夜一级做a爰片久久毛片| 国产网站黄| 欧美三級片黃色三級片黃色1| 91小视频在线播放| 欧洲精品视频在线观看| 在线观看视频99| 久久人与动人物A级毛片| 伊人久久久久久久| 日韩精品专区免费无码aⅴ| 日韩欧美亚洲国产成人综合| 日本91视频| 精品视频免费在线| 久久婷婷六月| 日韩中文无码av超清| 亚洲欧美日本国产综合在线| 国产成人综合在线视频| 黄色网在线免费观看| 国产精品综合久久久| 国内精品小视频在线| 欧美中出一区二区| 露脸国产精品自产在线播| 成人国产精品一级毛片天堂| 国产打屁股免费区网站| 国产91久久久久久| 国产福利免费观看| 国产精品女同一区三区五区| 成人亚洲视频| 性做久久久久久久免费看| 国产精品久久久久久久久| 午夜欧美在线| 国产在线98福利播放视频免费| 中文字幕免费在线视频| 极品性荡少妇一区二区色欲| 精品国产免费人成在线观看| 国产精品污污在线观看网站| 特级毛片免费视频| 九色综合伊人久久富二代| 免费国产不卡午夜福在线观看| 亚洲成人高清在线观看| 国产精品99在线观看| 国产中文一区二区苍井空| 国产主播喷水| 国产在线视频福利资源站| 国产美女在线免费观看| 激情网址在线观看| 中文字幕免费视频| www.亚洲色图.com| 中文字幕人成乱码熟女免费| 波多野结衣一区二区三区四区| 夜精品a一区二区三区| 国产九九精品视频| 97人人做人人爽香蕉精品|