999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

DHMM在家用安全門藏文語音識別中的應用

2016-12-12 09:09:26裴春寶
重慶理工大學學報(自然科學) 2016年11期
關鍵詞:模型

裴春寶

( 西藏大學 藏文信息技術研究中心,拉薩 850000)

?

DHMM在家用安全門藏文語音識別中的應用

裴春寶

( 西藏大學 藏文信息技術研究中心,拉薩 850000)

對于家用安全門的防護措施,除了傳統的安全鎖,目前也使用一些指紋識別技術。給出了一種安全性更高的基于DHMM的家用安全門藏文語音識別系統。通過語音的監控方式,引入矢量量化(VQ)算法,同時建立安全門語音的離散隱馬爾科夫模型(DHMM)。通過MFCC的特征參數抽取,將LBG算法應用在藏文碼書設計中,導出多觀察序列的參數重估形式。在實驗中選擇30個人的語音信號作為實現對象,結果表明,識別準確率達到99%以上,驗證了此方法的可適用性。

隱馬爾科夫模型;藏文語音識別;矢量量化

隨著時代的發展,人們對于生活的要求越來越高,應運而生的無線傳感技術、無線通信技術以及無線網絡技術都有了長足的發展。傳統的家用安全門是針對安全鎖進行升級,使得用戶通過盡可能繁瑣地調整鎖來保證人身和財產的安全,但會導致一旦鑰匙丟失,或者密碼鎖的密碼遺忘,都會給用戶帶來不必要的麻煩,對自身的物力和財力都會造成消耗。

本設計提出的離散隱馬爾科夫模型是一種統計模型,在語音識別領域得到了很好的應用。其理論基礎源于1970年左右Baum等[3-4],隨后,CMU的Baker和IBM公司的Jelinek等將它引入到語音識別中[1]。真正的HMM模型被全世界的語音研究人員所認識是通過Bell實驗室的Rabiner等人的努力。隨著HMM模型的進一步演化,它的應用領域也在不斷擴大,目前已在金融市場的波動分析、手寫字識別[9]、手勢識別[11]、旋轉機械啟動故障診斷[2,16]、電源監控[10]、經濟預算、語音識別、神經生理學與生物遺傳等方面有了很好的應用。家用安全門設計的音頻信號是非平穩的,DHMM模型是一種模擬非平穩動態模型的多元統計工具[12]。在很多領域圖形識別和語音識別被廣泛地應用,需要通過對局部結構特征的分析得到關于目標和背景的先驗分布信息,再進一步對比度特征和空間位置關系特征進行抽取[13-14]。

1 DHMM模型算法的應用

DHMM模型是一種隨機過程的統計模型。在某一時刻的一個事件必然是處于一個狀態,t時刻的狀態會受到前一個時刻狀態的影響,同時會產生一個觀測值,觀測值都會對應一個概率分布。

用參數集α=(π,C,D)描述DHMM模型。假設st,是通過有限狀態空間Θ={1,2,…,M}的齊次馬爾科夫鏈,Lt,t≥1是觀測序列,取值范圍為集合R={r1,r2,…,rn}。定義模型的參數:

初始分布η:

(η=(η1,η2,…,ηm)

ηi=P(s1=i),i∈Θ)

狀態轉移概率矩陣C=(cij):

cij=P(st+1=j|st=i),i,j∈Θ

觀察值概率矩陣D=(di(rj)):

di(rj)=P(Lt=rj|st=i),i∈Θ,rj∈R

1.1 DHMM觀察序列的參數重估

給定觀察序列L是DHMM模型的重要內容。通過調整模型參數α,得到概率P(L|α)的最大值,實現參數的重估。標定需要很多樣本的參與才能解決前后向變量的溢出問題。

多觀察序列的Baum-Welch的重估公式為[5-7]:

(1)

(2)

(3)

同理,可得多觀察序列觀察值重估公式的標定形式為:

(4)

1.2 對隱狀態的估計

κt(i)為沿某條路徑s1,s2,…,st,t時刻的狀態st=i同時生成觀察序列l1,l2,…,lt的最大概率:

由歸納法可算出st(i),推理公式為

(5)

然而在計算機上實現時,κt(i)會超出雙精度而出現溢出狀態,所以實際計算κt(i)的對數值的步驟如下:

初始化:

lg[κ1(i)]=lg(ηi)+lg[di(l1)],1≤i≤M;

ψ1(i)=0,1≤i≤M;

對公式(5)取對數得到遞推公式為:

則最佳狀態的概率對數值為:

2 DHMM模型在家用安全門語音識別的應用

DHMM模型在家用安全門語音識別的結構系統主要分為訓練過程和識別過程。這里提取的是語音的倒譜域參數,主要分為MFCC和LPCC參數[15],它們都是多維矢量,分別得出48維的MFCC和LPCC參數。HMM模型可把矢量序列轉換為標量序列,矢量量化能很好地完成這樣的任務。通過LBG算法[8]可完成碼書的設計。

在模型的訓練和語音識別中,以得到訓練和識別語音的特征參數矢量和碼書各個碼字的歐式距離。通過最小序號的碼字為觀察值的幀,可以完成輸入語音到觀察序列的轉換,能很好地應用于DHMM模型的訓練和識別。

2.1 MFCC參數和LPCC參數的特征抽取

MFCC參數和LPCC參數是不同的兩種特性區別,其中,MFCC參數通過人耳聽覺來判斷,而LPCC參數通過語音識別模型獲得。MFCC參數抽取的過程如圖1所示。

圖1 MFCC特征參數的抽取

語音首先通過預加重和分幀以及加窗過程后,通過對每幀進行快速的傅里葉(FFT)轉換,得到短時頻譜;然后頻譜通過48個Mel頻率三角濾波器過濾。通過濾波器輸出的每一個能量去對數,得到對數的能量,由對數能量得出DCT的倒譜。

2.2 DHMM模型的訓練過程

對語音分段的階段,需要選同一樣的語音,一般每段語音的長度為20幀到600幀。訓練過程是一個迭代的過程。觀察值概率矩陣很重要,因此需要首先得出D的初始值。對于影響小的C和α可以根據訓練模型的要求手動設置。計算D的初值,需要根據α、C、D的初值應用Viterbi算法得出語音的隱狀態,同時得出各個觀測值的概率,然后得到D的初值。

通過初始值可以實現參數重估的一直循環。應用Baum-Welch算法對模型進行重估,然后通過Viterbi算法計算重估模式下觀測值序列出現的概率,穩定概率后,才可以停止參數重估的循環。為了確保訓練模型準確率更高,選擇迭代次數為 1 000 次。由多次的循環結束得到的結果,可以看到矩陣D的元素大多值為0,這樣會使Viterbi算法算出的結果無效,需要在每次參數重估以后進行矩陣D的矯正,將0都改為最小的正數10-5,同時還要滿足每一行的元素之和為1。

語音的開始都是從第一個字或者音素,開始和結束的狀態固定。為了計算的方便,把發音的開始狀態強制定義為1,則它的初始概率可以表示為

α=(1,0,…,0)

對于安全門的語音識別信號,需要對信號進行分割。通過隨機的分割,來判斷聲音與原訓練的語音模型是否相符。本文的模型狀態是10個,所以它的初始狀態為等概率狀態為:

α=(0.1,0.1,…,0.1)

DHMM模型的參數C決定了模型的形式。DHMM模型的語音識別方式是開始狀態和結束狀態都是固定的,最后一個只能傳到自身。

2.3 語音識別過程

3 實驗結果分析

選擇30個人的聲音作為語音識別對象進行實驗。每種音頻10個樣本用于訓練DHMM模型,另外10個樣本用于識別,HMM模型的訓練次數是 1 000 次。語音音頻的采樣頻率為6MHz,經過截止頻率為3MHz的低通濾波器后分幀,每幀為256個采樣點,幀移為60個采樣點。訓練出的狀態轉移概率矩陣為Y:

從表1可以看出:語音男的概率對數值大部分相同,語音女的概率對數值大部分也相似,說明他們的音頻相似,與實際情況相同。

語音識別的關鍵在于實時性,因此能無延時地識別語音而自動執行相關命令,具有很高的實用性。采用Viterbi算法實現識別功能,在Matlab仿真中,50幀長度的語音識別需要0.23s左右。

通過選擇合適的幀,使得識別準確率更加的合理。從圖2可以看出幀數與識別率的關系,幀數在30幀到80幀的時候識別準確率是比較高的;在幀數低于10時,識別準確率下降很快,高于80以后識別準確率也稍有下降。

表1 30語音個人在DHMM模型下的概率對數值

圖2 語音的識別準確率與幀數的關系

去噪環境下,對MFCC參數的識別率在93%左右,LPCC的識別率在93.4%左右。在有噪聲干擾的情況下,識別準確性會有所下降。當HMM個數減少時,準確識別率反而增高;碼書的距離越大,識別率也越高,但會由于計算量的增加而延時,這樣更便于用戶對家用安全門的使用。

4 結束語

針對家用安全門的語音識別,采用MFCC作為DHMM模型的特征參數,同時應用矢量量化來進行構造模型和訓練,完成對語音的分析和識別功能,使得語音識別的準確率達到96.5%以上,可應用在家用安全門以及一些其他方面。當有噪聲干擾時,識別率會下降,需要進一步的研究。如果語音的音頻不正確,則拒絕服務,這樣能為人們生活的安全和方便帶來深遠的影響。

[1]JELINEKF.ContinuousSpeechRecognitionbyStatisticalMethods[J].ProceedingsofTricomm,1976,64(4):532-536.

[2] 邵強,馮長建,管麗娜,等.混合密度連續HMM在旋轉機械啟動過程故障診斷中的應用[J].機械科學與技術, 2009,28(11):1439-1443.

[3]LEONARDE,BAUMJ,EAGONA.AninequalitywithapplicationstostatisticalestimationforprobabilisticfunctionsofMarkovprocessesandtoamodelforecology[J].BulletinoftheAmericanMathematicalSociety,1967,73:360-363.

[4]BAUMLE.AninequalityandassociatedmaximizationtechniqueinstatisticalestimationforprobabilisticfunctionsofaMarkovprocess[J].Inequalities,1972(3):1-8.

[5]RABINERLR,LEVINSONSE,SONDHIMM.OntheapplicationofvectorquantizationandhiddenMarkovmodelstospeakerin-dependent,isolatedwordrecognition[J].TheBellSystemTechnicalJournal,1993:321-371.

[6]RABINERLR.AtutorialonhiddenMarkovmodelsandselectedapplicationsinspeechrecognition[J].ProcessingoftheIEEE,1989,77(2):257-285.

[7] 張金良,裴春寶,擁措.隱馬爾科夫模型在列車無線傳輸中的應用[J].西安工程大學學報,2015(4):457-461.

[8] 韓紀慶,徐希利.一種基于矢量量化的音頻場景分析方法[J].電聲技術,2002(3):8-10.

[9] 肖明,賈振紅.基于輪廓特征的HMM手寫數字識別[J].計算機工程與應用,2010(33):172-174.

[10]程延偉,謝永成,李光升.基于加權HMM的車輛電源系統狀態預測[J].計算機應用,2011(6):1696-1698.

[11]嚴焰,劉蓉,黃璐,等.基于HMM的手勢識別研究[J].華中師范大學學報(自然科學版),2012(5):555-559.

[12]闕大順,趙永安,文先林,等.基于DHMM和VQ的關鍵詞識別系統研究[J].武漢理工大學學報,2011(2):140-143,152.

[13]張建勛,汪波,侯之旭,等.圖像多特征融合的障礙物檢測[J].重慶理工大學學報(自然科學),2015(3):65-70.

[14]曾祥鑫,李飚,劉坤.基于對比度和局部結構特征的顯著性檢測[J].重慶理工大學學報(自然科學),2015(9):93-97.

[15]竺樂慶,王鴻斌,張真.基于Mel倒譜系數和矢量量化的昆蟲聲音自動鑒別[J].昆蟲學報,2010(8):901-907.

[16]丁啟全,馮長建,李志農,等.旋轉機械啟動全過程DHMM故障診斷方法研究[J].振動工程學報.2003(1):41-45.

(責任編輯 楊黎麗)

The Application of DHMM in Home-Security Door with Tibetan Speech Recognition

PEI Chun-bao

(Tibetan Information Technology Research Center, Tibet University, Lhasa 850000, China)

Besides the traditional security lock, the protective measures of home-security door includes fingerprint identification.This study provides a more secure Tibetan speech recognition system based DHMM. By voice monitoring methods and the introduction of the vector quantization (VQ) algorithm, it established a security door voice discrete hidden Markov model (DHMM). By MFCC feature parameters extraction, it applied LBG algorithm in Tibetan code-book design, and exported observe parameters revaluation form sequence.30 persons’voice signals was chosen as the experiment object. The result showed a recognition accuracy rate of more than 99%, which verifies the applicability of this method.

hidden Markov model; Tibetan speech recognition; vector quantification

2016-04-18 基金項目:2016年度教育部人文社會科學青年基金資助項目(16XZJCZH001);西藏自治區自然科學基金資助項目(2015ZR-14-1);2014年度西藏大學青年科研培育基金資助項目(ZDPJZK201403);國家哲學社會科學重大項目(14ZDB101);西藏自治區高校青年教師創新支持計劃資助項目(QC2015-19);西藏大學珠峰學者人才發展計劃“杰出青年學者”階段性成果

裴春寶(1980—),女,碩士研究生,主要從事語音識別研究,E-mail:375394610@qq.com。

裴春寶.DHMM在家用安全門藏文語音識別中的應用[J].重慶理工大學學報(自然科學),2016(11):150-154.

format:PEI Chun-bao.The Application of DHMM in Home-Security Door with Tibetan Speech Recognition[J].Journal of Chongqing University of Technology(Natural Science),2016(11):150-154.

10.3969/j.issn.1674-8425(z).2016.11.024

TP39

A

1674-8425(2016)11-0150-05

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 91人妻在线视频| 欧美精品影院| 久久国产成人精品国产成人亚洲| 国产精品久久久久久搜索| 婷婷激情五月网| 成人在线不卡视频| 538国产视频| 国产91熟女高潮一区二区| 亚洲天堂网在线播放| 欧美在线伊人| 内射人妻无套中出无码| 又黄又爽视频好爽视频| 色精品视频| 国产精品亚洲欧美日韩久久| 国产成人精品免费av| 欧美成人午夜视频免看| 波多野结衣的av一区二区三区| 免费在线观看av| 国产一级α片| 成人小视频网| 免费亚洲成人| 亚洲三级色| 国产日韩精品欧美一区灰| 亚洲国产成人综合精品2020 | 一级毛片在线免费视频| 波多野结衣无码视频在线观看| 亚洲国语自产一区第二页| 97久久人人超碰国产精品| 国产真实乱了在线播放| 四虎永久免费在线| 99在线国产| 国产Av无码精品色午夜| 91久久夜色精品国产网站| 五月天在线网站| 91无码国产视频| 71pao成人国产永久免费视频| 99er精品视频| 精品人妻系列无码专区久久| 成人国产免费| 国产性精品| 一区二区无码在线视频| 国产成人免费| 国产91特黄特色A级毛片| 男女性午夜福利网站| 99免费在线观看视频| 精品国产中文一级毛片在线看| 欧美人与性动交a欧美精品| 国产亚洲欧美在线人成aaaa| 日韩第一页在线| 动漫精品中文字幕无码| 国产第一福利影院| 久久成人免费| 国产精品乱偷免费视频| 国产一在线观看| 999在线免费视频| www.国产福利| 国产91熟女高潮一区二区| 丁香六月综合网| 四虎影视国产精品| 国内精品视频区在线2021| 久久中文字幕av不卡一区二区| 国产成人精品一区二区| 内射人妻无码色AV天堂| 在线毛片网站| 国产精品成人观看视频国产| 538精品在线观看| 久久国产拍爱| 国产成人区在线观看视频| 成年人福利视频| 国产又色又刺激高潮免费看| 男女男免费视频网站国产| 国产欧美高清| 天天综合亚洲| 国产h视频免费观看| 免费在线成人网| 在线精品视频成人网| 制服丝袜 91视频| 国产主播喷水| 99热国产这里只有精品无卡顿"| 日韩无码白| 欧美日韩在线亚洲国产人| 国产在线观看一区精品|