999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高斯混合模型的說話人識別研究

2016-07-01 08:44:49朱宇軒
西部皮革 2016年12期
關(guān)鍵詞:模型

朱宇軒

(西華大學(xué),四川 成都 610039)

基于高斯混合模型的說話人識別研究

朱宇軒

(西華大學(xué),四川 成都 610039)

摘要:說話人識別本質(zhì)上是一個模式識別問題,而模式識別系統(tǒng)的目標(biāo)是要在表示空間和解釋空間之間找到一種映射關(guān)系。高斯分布又稱為正態(tài)分布,是一個在數(shù)學(xué)、物理及工程領(lǐng)域都非常重要的連續(xù)分布函數(shù),它描述了一種圍繞某個單值聚集分布的隨機(jī)變量。

關(guān)鍵詞:高斯分布;隨機(jī)變量

1引言

在實際生活中,許多物理現(xiàn)象以及各種心理學(xué)測試分?jǐn)?shù)都近似地服從高斯分布。在統(tǒng)計學(xué)以及許多統(tǒng)計測試中高斯分布也是應(yīng)用最廣泛的一類分布。高斯混合模型(Gaussian Mixture Model,GMM)是單一高斯密度函數(shù)的擴(kuò)展,由于高斯混合模型可以逼近任意形狀的概率密度分布,所以高斯混合模型被廣泛的運(yùn)用到各種領(lǐng)域,如語音識別,圖像識別等,并取得了理想的效果。

2GMM模型基本概念

GMM混合模型可以看作一種狀態(tài)數(shù)為1的連續(xù)分布的隱馬爾可夫模型CDHMM。它是用M個單高斯分布的線性組合來描述幀特征在特征空間中的分布。一個M階的混合高斯模型的概率密度函數(shù)可以由M個單高斯概率密度函數(shù)加權(quán)和得到,其表達(dá)式如下:

(1)

式中:X是一個D維隨機(jī)向量;M是混合模型的階數(shù);ωi,i=1,…,M是混合權(quán)重,且其滿足以下條件:

(2)

bi(X),i=1,2,…,M是子分布,每個子分布是D維的聯(lián)合高斯概率分布,可表示為:

(3)

式中,μi是均值向量,Σi是協(xié)方差矩陣。

整個高斯混合模型可以通過參數(shù)均值向量、協(xié)方差矩陣和混合權(quán)重來描述。所以高斯模型λ可以表示為:

λ={ωi,μi,∑i},i=1,…M

(4)

3GMM模型的訓(xùn)練

GMM模型的訓(xùn)練就是給定一組訓(xùn)練數(shù)據(jù),依據(jù)某種準(zhǔn)則確定模型的參數(shù)。最常用的參數(shù)估計方法是最大似然(Mxaimum Likehhood,簡稱為ML)估計。最大似然估計是把待估計的量看成固定但未知的量,然后求出能夠使學(xué)習(xí)樣本出現(xiàn)概率最大的參數(shù)值,并把它作為參數(shù)的估值。GMM模型參數(shù)的初始化有兩種不同的方法:第一種是使用一個與說話人無關(guān)的HMM模型對訓(xùn)練數(shù)據(jù)進(jìn)行自動分段。訓(xùn)練數(shù)據(jù)語音幀根據(jù)其特征分到M個不同的類中(M為混合高斯分量的個數(shù)),與初始的M個高斯分量相對應(yīng)。每個類的均值和方差作為模型的初始化參數(shù)。第二種方法從訓(xùn)練數(shù)據(jù)序列中隨機(jī)選擇M個矢量作為模型的初始化參數(shù)。盡管有實驗證明EM算法對于初始化參數(shù)的選擇并不敏感,但是第一種方法訓(xùn)練要優(yōu)于第二種方法。

另外由于條件的限制,通常得不到充分語音數(shù)據(jù)對模型參數(shù)進(jìn)行訓(xùn)練。GMM模型的協(xié)方差矩陣的一些分量可能會很小,這些很小的值對模型參數(shù)的似然對函數(shù)影響很大,嚴(yán)重影響系統(tǒng)的性能。為了避免小的值對系統(tǒng)性能的影響,在EM算法的迭代計算中,可以對協(xié)方差的值設(shè)置一個門限值,在訓(xùn)練過程中令協(xié)方差的值不小于設(shè)定的門限值。門限值設(shè)置可通過觀察協(xié)方差矩陣來定,一般情況下,決大多數(shù)值都大于0.0001。只有極少數(shù)值在這個范圍之外,為此,可將門限值設(shè)置為0.001。

4GMM模型的識別

圖1 GMM模型的說話人性別識別系統(tǒng)結(jié)構(gòu)框圖

根據(jù)貝葉斯理論,最大后驗概率可表示為:

(5)

(6)

其對數(shù)形式為:

(7)

由于P(λt)的先驗概率未知,我們假定該語音信號被判別為男聲和女聲的可能性相等,即:

(8)

對于一個確定的觀察值矢量X,P(X)是一個確定的常數(shù)值,對男聲和女聲模板相等。因此求取后驗概率的最大值可以通過求取P(X/λi)獲得,所以識別該語音是男聲還是女聲可以表示為:

i*=argmaxP(X/λi),i=1,2

(9)

式中:i*即為識別出的說話人性別最大概率。

5總結(jié)

考慮到高斯函數(shù)對真實數(shù)據(jù)的較好描述,另外由于高斯函數(shù)的線性組合仍然是高斯函數(shù),而且在理論上任意形式的總體分布都可以用若干個高斯函數(shù)的混合來逼近。所以采用高斯混合函數(shù)來估計語音特征的概率分布,這樣就得到了說話人的高斯混合模型。

參考文獻(xiàn):

[1]吳朝暉,楊瑩春. 說話人識別模型與方法[M].北京:電子工業(yè)出版社,1995.

[2]鄧英, 歐貴文.基于HMM的性別識別[J].計算機(jī)工程與應(yīng)用, 40(15): 74-75.

作者簡介:朱宇軒,性別:男,民族:漢族,籍貫: 四川南充,職務(wù):工人,學(xué)歷:大學(xué)本科,單位:西華大學(xué),研究方向:電子,計算機(jī)。

中圖分類號:TN915

文獻(xiàn)標(biāo)志碼:A

文章編號:1671-1602(2016)12-0136-01

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产人成午夜免费看| 亚洲成av人无码综合在线观看| 国产无码高清视频不卡| av无码久久精品| 99热精品久久| 九九热精品视频在线| 色婷婷综合在线| 97视频在线精品国自产拍| 99草精品视频| 亚洲欧美精品在线| 国产一二视频| 在线观看国产精美视频| 2021国产在线视频| 一本无码在线观看| 日本妇乱子伦视频| 成人毛片免费在线观看| 91福利片| 中文字幕无码电影| 欧美午夜在线播放| 91在线精品麻豆欧美在线| 人妻丰满熟妇AV无码区| 99一级毛片| 久久综合结合久久狠狠狠97色| 久久国产高清视频| 无码精品国产dvd在线观看9久| 久久青草视频| 人妻91无码色偷偷色噜噜噜| 国产91丝袜| 欧美www在线观看| 亚洲欧洲自拍拍偷午夜色| 国产精品无码一二三视频| 久久不卡精品| 粗大猛烈进出高潮视频无码| 91网在线| 成年人免费国产视频| 波多野结衣一区二区三区四区视频 | 欧美日韩午夜视频在线观看| 露脸真实国语乱在线观看| 欧美黄网站免费观看| 国产成人乱无码视频| 亚洲AV色香蕉一区二区| 理论片一区| 制服丝袜 91视频| 亚洲日韩AV无码精品| 国产女人在线视频| 亚洲一区二区三区在线视频| 国产欧美性爱网| 在线视频亚洲色图| 久久久久久尹人网香蕉 | 在线网站18禁| 亚洲美女一级毛片| 欧美在线视频不卡| 国产另类视频| 国产欧美日韩视频怡春院| 亚洲av综合网| 亚洲国产欧美国产综合久久 | 国产精品页| 亚洲成人高清在线观看| 久久免费精品琪琪| 久久精品国产999大香线焦| 香蕉eeww99国产在线观看| 欧美精品导航| 人妻一区二区三区无码精品一区| 老色鬼欧美精品| 免费日韩在线视频| 91口爆吞精国产对白第三集| 欧美日本视频在线观看| 亚洲性一区| 亚洲欧洲日韩国产综合在线二区| 国产午夜精品一区二区三| 狠狠色噜噜狠狠狠狠色综合久| 国产剧情国内精品原创| 国产一区亚洲一区| 97久久精品人人做人人爽| 在线视频97| 看av免费毛片手机播放| 亚洲欧洲日本在线| 1769国产精品免费视频| 色哟哟色院91精品网站| 在线精品亚洲一区二区古装| 欧美日韩成人在线观看| 精品一区二区三区无码视频无码|