999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聯(lián)合HMM-UBM與RVM的聲紋密碼識別算法

2018-11-20 06:08:52胡志隆賀建飚
計算機工程 2018年11期
關(guān)鍵詞:分類文本模型

胡志隆,文 暢,謝 凱,賀建飚

(1.長江大學 a.電子信息學院; b.計算機科學學院,湖北 荊州 434023; 2.中南大學 信息科學與工程學院,長沙 410083)

0 概述

語音識別是一種生物識別技術(shù),獲取方法簡單且成本低廉。相比于人臉識別、虹膜識別等技術(shù),語音識別使用者的接受程度更高,因此,其被廣泛應(yīng)用于醫(yī)療、社保、金融及公共場所的安全認證等領(lǐng)域。而聲紋密碼識別作為文本相關(guān)的語音識別方法,用文本的上下文關(guān)系和話者聲道信息保護說話人的信息安全,與文本無關(guān)的語音識別方法相比,具有較高的安全性[1]。

目前,語音識別系統(tǒng)常采用高斯混合模型-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM),該算法應(yīng)用話者的聲道信息并通過全局背景模型解決訓練樣本少的問題,在文本無關(guān)的語音識別中取得較好的識別效用。此外,隨著人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、支持向量機(Super Vector Machine,SVM)等機器學習方法的不斷成熟,也出現(xiàn)類似GMM-SVM的融合算法[2-6]。然而,GMM模型僅單一反映話者的聲道信息而忽略語音文本的上下文關(guān)系,因此不適用于聲紋密碼識別。同時,ANN是一個高度非線性的大型網(wǎng)絡(luò),需要大量的訓練樣本才能得到效果較好的模型,導致其難以應(yīng)用于實際。

針對上述方法的不足,本文提出一種隱馬爾科夫模型-通用背景模型(Hidden Markov Model-Universal Background Model,HMM-UBM)聯(lián)合相關(guān)向量機(Relevance Vector Machine,RVM)的聲紋密碼識別算法,該算法采用HMM-UBM模型,利用語音的文本信息及其話者的聲道信息進行時序建模。同時針對HMM模型分類決策能力較差的問題,本文融合相關(guān)向量機作為分類器,做最后的判決決策。

1 聲紋密碼識別算法流程

指定文本的聲紋密碼識別系統(tǒng)主要流程包括語音信號的預處理、特征參數(shù)提取、特征建模和相似性度量等模塊,其中特征參數(shù)的選取及相似性度量的方法決定系統(tǒng)的識別效率[7]。本文針對傳統(tǒng)聲紋密碼識別系統(tǒng)中的相似性度量模塊進行了改進,提出了基于HMM-UBM聯(lián)合改進RVM的聲紋密碼識別算法,算法流程如圖1所示。首先對注冊語音、訓練語音及待識別語音進行預處理,包括分幀、加窗、預加重等;其次采用梅爾倒譜系數(shù)(Mel-Frequency Cepstral Coefficients,MFCC)對處理過的語音提取特征參數(shù);然后將其作為輸入序列,訓練得到HMM-UBM模型后計算每位注冊說話人語音與訓練語音的匹配得分,歸一化后組合成一個特征向量,將每位注冊說話人的特征向量提供給RVM訓練,得到語音分類信息,即RVM分類器;最后對待識別語音采用同樣的方法得到其對應(yīng)的特征向量,輸入訓練好的RVM模型進行分類決策,并最終取得分類結(jié)果。

圖1 聲紋密碼識別算法流程

2 HMM-UBM模型

說話人識別系統(tǒng)中常用的GMM-UBM模型雖然擬合了說話人的聲音特性,但忽視了文本內(nèi)容對識別效果的影響,不適用于特定文本的聲紋密碼識別[8-10]。因此,本文采用HMM來對相關(guān)性進行建模,同時采用全局高斯混合模型作為UBM來表達說話人聲道特征在訓練樣本中的分布概率。模型構(gòu)建流程如圖2所示。

圖2 HMM-UBM模型構(gòu)建流程

與GMM-UBM模型相似,由于UBM的均值矢量利用率較高,因此自適應(yīng)時僅更新該參數(shù),更新過程如下:

1)設(shè)注冊話者的輸入特征矢量為{xi|i=1,2,…,t},計算其在所有訓練樣本中的概率分布,若話者對應(yīng)第i個訓練樣本,則其概率分布為:

(1)

其中,pi(xt)為第i個訓練樣本的密度函數(shù),ωi為第i個訓練樣本的權(quán)重系數(shù),Pr(i|xt)為第i個訓練樣本的后驗概率,表示在測試語音的特征矢量為xt的條件下,測試語音對應(yīng)第i個訓練語音的概率。

2)利用Pr(i|xt)和均值向量進行從分統(tǒng)計,統(tǒng)計式為:

(2)

3)通過所有訓練數(shù)據(jù)產(chǎn)生新的均值統(tǒng)計量,更新UBM第i個混合分量的均值矢量得到第i個分量的HMM-UBM模型,如式3所示。

(3)

3 相關(guān)向量機

RVM是一種基于貝葉斯稀疏核的分類算法。與SVM相比,RVM可以計算出樣本輸出的后驗概率分布,更適用于多分類問題,并且其核函數(shù)不需要限定為對稱正定核,從而可以得到更加稀疏的解[11-15]。因此,本文選用其作為分類器,進行最后的決策,得到更加準確的識別結(jié)果。

ti=y(xi)+εn

(4)

其中,εn是均值為0、方差為σ2的噪聲,y(x)為RVM的分類模型,其定義為:

(5)

設(shè)目標{t|t=t1,t2,…,tN}獨立同分布,則整個訓練樣本的似然函數(shù)可以表示為:

(6)

其中,t=(t1,t2,…,tN)T,ω=(ω0,ω1,…,ωN)T,φ為N×(N+1)矩陣,如式(7)所示。

(7)

假設(shè)式(6)中的ω和σ2采用最大似然估計求解,結(jié)果通常使權(quán)重參數(shù)ω中大部分元素不為0,從而導致過擬合。為了避免過學習的問題,RVM對每個權(quán)重參數(shù)加上先決條件:使其幾率是分布在0周圍的正態(tài)分布,如式(8)所示。

(8)

其中,α為N+1維超向量。

根據(jù)貝葉斯公式直接求得參數(shù)ω的后驗分布:

p(ω|t,α,σ2)=(2π)-(N+1)/2|Σ|-1/N×

(9)

其中,μ=σ-2ΣφTt,Σ為協(xié)方差,Σ=(σ-2φTφ+A)-1,A=diag(α0,α1,…,αN),σ2(x)=(β)-1+φ(x)Σφ(x)。

對于一個給定的樣本x,最終其輸出的概率分布為:

(2π)-N/2·|σ2I+φA-1φT|-1/2

(10)

式(10)中的未知量為超參數(shù)α和β,則求解輸出概率分布的問題轉(zhuǎn)化為求解超參數(shù)α和β,本文通過最大化法來求解參數(shù),如式(11)所示。

(11)

通過最大化式(11),來更新α和β的值:

(12)

(13)

經(jīng)過多次學習,大部分超參數(shù)αi會趨于無窮,而對應(yīng)的權(quán)重向量ωi=0,少部分權(quán)重向量不為0的訓練樣本xi即為相關(guān)向量,通過相關(guān)向量得到其分類模型并作為最優(yōu)分類超平面,以對輸入的測試樣本進行識別。

4 HMM-UBM-RVM聲紋密碼識別算法

HMM算法具有較強的時序建模能力,處理連續(xù)動態(tài)信號時表現(xiàn)優(yōu)異。但HMM是基于先驗知識的統(tǒng)計學習方法,其分類決策能力較差。而RVM是基于貝葉斯稀疏核的回歸分類算法,具有較強的分類效果和泛化能力。本文提出HMM-UBM-RVM聲紋識別算法,將2種方法進行融合,具有較強的時序建模能力和分類效果。

設(shè)訓練樣本中包含n位說話人,每位說話人包含10條語音,對于第i位說話人,其特征序列分別為{i-voice0,i-voice1,…,i-voice9}。其中i-voice0為其注冊聲紋密碼,則該模型的實現(xiàn)流程如圖3所示。

圖3 HMM-UBM聯(lián)合RVM實現(xiàn)流程

聯(lián)合HMM-UBM與RVM算法實現(xiàn)流程如下:

1)錄制語音信號。對語音信號進行預處理,消除干擾信息后提取其MFCC特征參數(shù)。

2)對每位說話人的語音建立HMM-UBM模型。

3)用式(14)計算訓練樣本中每條注冊語音對其他語音的匹配得分:

Οt0-ik(Xt0)=logp(Xt0|λik)-logp(Xt0|λUBM)

(14)

其中,Xt0為訓練樣本中第t位說話人注冊語音的HMM特征序列,λik為訓練樣本中第i位說話人第k條語音的HMM-UBM特征序列,λUBM為背景模型的特征序列。

4)對匹配得分進行歸一化:

(15)

5)將每條注冊語音歸一化數(shù)據(jù)組成超維向量V。例如,對于第t位說話人,其注冊語音的超維特征向量為Vt0={Scoret0-00,Scoret0-01,…,Scoret0-n9}。

6)將得分矢量輸入到RVM進行學習,直到RVM迭代次數(shù)到預設(shè)次數(shù)為止(本文取最大迭代次數(shù)為300次)。至此完成RVM分類器的訓練階段,得到n×(n-1)/2個二分類的子RVM分類器。

7)對待識別的輸入語音信號進行訓練,得到HMM模型。用式(14)計算其得分,歸一化后組成待識別語音的特征向量VVP,VVP={Scorevp1,Scorevp2,…,Scorevpn}。

8)將待識別語音的特征向量VVP輸入到RVM,然后對該向量進行非線性映射。為提高識別精度,本文采用“1V1”模型進行多分類識別,如圖4所示。

圖4 RVM“1V1”分類模型

5 實驗結(jié)果與分析

采用本文設(shè)計的聲紋密碼識別系統(tǒng)作為測試平臺,系統(tǒng)運行界面如圖5所示。

圖5 系統(tǒng)運行界面

5.1 數(shù)據(jù)庫及評測方法

本文采用的數(shù)據(jù)庫是TIMIT語音庫,包含來自美國8個主要方言地區(qū)的630個人,每個人包含10段3 s~6 s的語音。其中,2段為方言句子,每個人的方言句子內(nèi)容相同,其余語音內(nèi)容不同。

方言句1內(nèi)容為“She had your dark suit in greasy wash water all year”,方言句2內(nèi)容為“Don’t ask me to carry an oily rag like that”。

本文采用錯誤接收概率(FA)和錯誤拒絕概率(FR)評判聲紋密碼識別系統(tǒng)的性能,其表達式如式(16)和式(17)所示。

(16)

(17)

其中,nNRVC表示測試語音為非注冊語音時,識別為注冊語音的概率,nNRVT表示采用非注冊語音作為測試語音的實驗次數(shù),nRVW表示測試語音為注冊語音時,識別錯誤的概率(當且僅當測試語音與識別出的注冊語音內(nèi)容和對應(yīng)說話人均匹配時,才認為識別正確),nRVT表示采用注冊語音作為測試語音的實驗次數(shù)。

5.2 UBM混合數(shù)對HMM-UBM模型的影響

通用背景模型的高斯混合數(shù)越大,說話人聲道特征分布概率越精確,但計算復雜度相應(yīng)增加。因此,本文針對這些參數(shù)做以下實驗。

采用數(shù)據(jù)庫中不含噪的dr3部分語音,以其中每個人的方言句1作為注冊語料,以該語音庫全部6 300條語音作為訓練集訓練UBM模型。實驗中HMM的狀態(tài)數(shù)及高斯混合度均取為4,UBM模型的高斯混合數(shù)分別取:8,16,32,64,128,256,512,1 024。

在測試時,隨機選取dr3部分的1條語音作為測試語音進行識別,重復實驗,取FA、FR均值。實驗結(jié)果如圖6所示。

圖6 UBM高斯混合度對識別率的影響結(jié)果

測試結(jié)果表明,隨著通用背景模型的高斯混合度增高,錯誤接收概率及錯誤拒絕概率均有小幅度下降。當混合度超過512時,錯誤接收概率小于1%,盡管錯誤拒絕率仍有3%左右,但錯誤拒絕對用戶信息安全影響較小。因此,取UBM模型的高斯混合度為512。

5.3 RVM采用不同核函數(shù)對模型識別率的影響

采用數(shù)據(jù)庫中不含噪的dr3部分語音,以其中每個人的方言句1作為注冊語料,以該語音庫全部6 300條語音作為訓練集訓練UBM模型。在實驗中,RVM分類器核函數(shù)分別選多項式核、sigmoid核和高斯核,分別選取dr3語料中15位、30位、45位、60位說話人的注冊語音重復進行識別率測試。實驗結(jié)果如表1所示。

表1 RVM采用不同核函數(shù)對模型識別率的影響

從表1可以看出,隨著測試人數(shù)的增加,高斯核的測試精度明顯高于多項式核和sigmoid核。因此,RVM均采用高斯核作為核函數(shù)進行分類決策。

5.4 系統(tǒng)識別率測試

本文所提出的聲紋密碼識別方法與常用于語音識別的GMM-UBM、GMM-SVM及HMM-UBM算法進行對比,實驗采用TIMIT語音庫中所有說話人的方言句1作為注冊語音,為對應(yīng)話者建立模型,采用全部6 300條語音作為訓練集訓練UBM模型,抽取每位話者的注冊語音及隨機兩條其他語音進行識別,共測試630×3=1 890次,取識別正確率、FA及FR均值,實驗結(jié)果如表2所示。

表2 不同算法的識別率比較 %

從表2可以看出,本文方法與GMM-UBM和GMM-SVM識別算法相比,大幅降低了識別算法的錯誤接收概率和錯誤拒絕概率。可以看出,針對文本相關(guān)的聲紋密碼識別,采用更具有時序建模能力的隱馬爾科夫模型-通用背景模型,該模型可反映聲紋的文本信息及話者的聲道信息。相比之下,GMM模型的GMM-UBM算法和GMM-SVM算法都忽視了文本信息,會將說話人的其他語音識別為其注冊語音,從而導致錯誤接收概率較大,影響用戶信息安全。同時,本文方法在HMM-UBM模型基礎(chǔ)上采用RVM作為分類器,回避了該模型分類決策能力弱的問題。

5.5 系統(tǒng)抗噪性能測試

對測試語音進行高斯白噪聲加噪處理,信噪比分別為0 dB、5 dB、10 dB、15 dB、20 dB、25 dB、30 dB。系統(tǒng)抗噪性能測試結(jié)果如圖7所示。

由圖7可以看出,本文算法在各信噪比環(huán)境下,識別率均優(yōu)于基于GMM-SVM和GMM-UBM識別算法。尤其在低信噪比環(huán)境下,其優(yōu)越性更加明顯。一方面是因為該方法采用HMM-UBM模型,兼顧語音的文本信息及話者的聲道信息,更適用于文本相關(guān)的聲紋密碼識別;另一方面,由于HMM是基于先驗知識的統(tǒng)計學習方法,并不具備良好的分類能力,將其與相關(guān)向量機相融合,發(fā)揮HMM的時序建模能力和RVM的分類決策能力,能夠提高其抗噪性能識別精度。

5.6 應(yīng)用測試

本文方法用于模擬門禁系統(tǒng),實現(xiàn)聲紋密碼開鎖。實驗采用實驗室中20位說話人(12男,8女),每位說話人50條語音,語音內(nèi)容為8位0~9的隨機數(shù),取每位話者其中一條語音作為聲紋密碼,注冊其模型,以全部1 000條語音作為訓練集,訓練UBM模型。對每位說話人進行測試,測試語音采用說話人現(xiàn)場說出5條對應(yīng)的注冊語音及5條對應(yīng)的非注冊語音,記錄正確開鎖率(說話人與密碼相匹配并開鎖成功及說話人與密碼不匹配并開鎖失敗2種情況視為正確開鎖)。以基于GMM-UBM、GMM-SVM和HMM-UBM算法的模擬門禁系統(tǒng)作為對比,采用同樣的方法進行測試,對比結(jié)果如表3所示。

表3 算法應(yīng)用結(jié)果對比 %

6 結(jié)束語

聲紋密碼識別廣泛應(yīng)用于各種場所的安全認證,而常用語音識別系統(tǒng)大多采用傳統(tǒng)的GMM-UBM模型及改進算法。GMM模型雖能較好反映說話人的聲道信息,但忽視語音內(nèi)容對識別正確率的影響,不適用于固定文本的聲紋密碼識別。本文提出HMM-UBM聯(lián)合RVM的聲紋密碼識別算法,利用隱馬爾科夫模型的時序建模能力得到語音的文本信息,采用UBM模型解決訓練樣本不足的問題,并通過相關(guān)向量機對測試語音進行分類決策。實驗結(jié)果表明,該算法在進行文本相關(guān)的說話人識別時,識別效果優(yōu)于GMM-UBM算法和GMM-SVM算法,具有較好的應(yīng)用價值。

猜你喜歡
分類文本模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
在808DA上文本顯示的改善
分類討論求坐標
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
3D打印中的模型分割與打包
主站蜘蛛池模板: 91麻豆精品国产91久久久久| 久久人搡人人玩人妻精品一| 97在线视频免费观看| 国产精品福利社| 亚洲视频无码| 天天视频在线91频| 青青操国产视频| 亚洲国产日韩视频观看| 成人一级免费视频| 亚洲v日韩v欧美在线观看| 亚洲最大福利网站| 色爽网免费视频| 久久综合色视频| 亚洲天堂成人| 99久久精彩视频| 日韩美一区二区| 伊人激情综合网| 亚洲一级色| 亚洲综合色吧| 国产一级毛片网站| 操国产美女| 免费一级毛片| 国产人成乱码视频免费观看| 日韩视频福利| 美女一级免费毛片| 国产成人喷潮在线观看| 久久 午夜福利 张柏芝| 久久黄色毛片| 免费亚洲成人| 在线观看精品国产入口| 99re热精品视频国产免费| 亚洲国产天堂久久综合| 超薄丝袜足j国产在线视频| 亚洲天堂福利视频| 欧美日韩国产在线人| 无码福利视频| 一级不卡毛片| 日韩高清欧美| 色综合天天娱乐综合网| 91亚洲视频下载| 亚洲国产精品一区二区第一页免 | 久久网综合| 欧美日韩免费观看| 国产精品白浆在线播放| 午夜视频在线观看区二区| 全午夜免费一级毛片| 亚洲综合激情另类专区| 91www在线观看| 国产人碰人摸人爱免费视频| 久久96热在精品国产高清| 欧美激情二区三区| 日韩av电影一区二区三区四区| 国产成人夜色91| 国产成人艳妇AA视频在线| 91精品国产麻豆国产自产在线| 国产aⅴ无码专区亚洲av综合网| 亚洲二区视频| 久久精品亚洲专区| 女人爽到高潮免费视频大全| 成人午夜精品一级毛片| 国产成人精品一区二区| 亚洲女人在线| aaa国产一级毛片| 亚洲女人在线| 久久国产精品娇妻素人| 五月激情婷婷综合| 国产精彩视频在线观看| 欧美亚洲日韩中文| 欧美一级特黄aaaaaa在线看片| 久久综合丝袜长腿丝袜| 免费看av在线网站网址| 97国产精品视频自在拍| 日本一本在线视频| 亚洲欧美日本国产综合在线| 99久久人妻精品免费二区| 天天综合网色| 99精品国产自在现线观看| 亚洲人成人伊人成综合网无码| 久久永久免费人妻精品| 六月婷婷综合| 午夜丁香婷婷| 九九视频免费在线观看|