999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CHMM語音識別特征參數的選擇方法

2007-01-01 00:00:00李銀國
計算技術與自動化 2007年4期

摘 要:基于CHMM的語音識別系統識別率高,但卻占用系統資源較大,從而限制了其在資源受限的實際應用環境的有效實現。針對上述問題,給出特征參數選擇的理論依據,彌補以往研究僅從實驗結果分析,缺少理論依據的不足;同時提出根據各特征參數對系統誤識率的影響程度來選擇特征參數的新方法。該方法能使系統在訓練,識別過程中的計算量和存儲量明顯減小,同時系統誤識率不會顯著改變。這為資源受限的語音識別系統,提供新的思路和有效的特征參數選擇方法。

關鍵詞:語音識別;CHMM模型;特征參數選擇

中圖分類號:TP391.4 文獻標識碼:A

1 引言

在語音識別的三大算法中CHMM算法的高識別率是以大計算量和大存儲量為代價的,在基于嵌入式技術的語音識別系統或具有較強實時性要求的語音識別系統等特殊情況下,系統的資源和計算能力往往受到較大的限制,在保證一定識別率情況下減少識別算法對系統存儲與計算資源的需求,具有重要意義。而語音識別系統的性能與系統所采用的特征參數密切相關,這就為我們利用特征參數的選取來實現系統識別性能與計算資源需求之間的折衷處理成為可能。目前,有很多文獻做了各類特征參數對識別效果影響程度的研究工作,卻沒有討論同一種類參數分量的問題;則通過對相鄰分量的組合,用實驗結果說明了MFCC分量的相對重要性,但他們都僅用實驗結果加以說明,缺乏理論分析。

本文從CHMM模型的特點出發:一方面從理論上給出了選擇特征參數的數學依據,另一方面提出根據特征參數對系統誤識率的影響程度,選擇特征參數的方法。

2 基于CHMM模型特征參數選擇的理論分析

CHMM的Gauss概率密度函數的協方差矩陣本來應該是對稱的滿矩陣,為了降低對計算復雜度和存儲量的要求,一般簡化為對角矩陣。采用對角協方差陣使模型的參數減少,也有利于避免因訓練樣本不足而影響模型參數估計的可靠性。而且實驗結果表明,概率密度函數的個數較多且取對角協方差陣的方案優于概率密度函數較少且取滿元協方差陣的方案。所以,實際中一般使用具有對角協方差陣的Gauss概率密度函數。CHMM計算

的特征矢量。通常,人們使用MFCC+AMFCC或LPCC+ALPCC作為特征矢量,即將MFCC、AMFCC、LPCC、ALPCC作為整體來處理。需要注意的是MFCC和LPCC雖然分別有其完整的物理意義,即Mel刻度聽覺參數的同態變換系數和聲道參數,將他們的各個分量獨立考慮會破壞其物理意義的完整性,但在基于對角協方差陣的CHMM的模型中,各個分量相互獨立,從而使得我們可以根據各個分量的重要性來選擇分量,構成特征矢量以減少計算量。另一方面,由于舍去的是對誤識率影響較小的分量,所以系統的識別效果不會顯著改變,從而充分有效的利用了特征矢量的區分特性。在減少計算量的同時,保證了識別率。

3 CHMM算法計算量與存儲量的分析

3.1 MFCC、AMFCC求取

目前,在語音識別系統中,最常用就是具有較好抗噪性能的MFCC+AMFCC參數。其求取步驟為:1)對預處理后的每一幀語音信號先進行快速傅里葉變換以獲得頻譜分布信息2)然后將頻域信號通過一組三角濾波器,中心頻率在Mel刻度上均勻分布3)求出每個濾波器的輸出對數能量4)對其進行離散余弦變換得MFCC5)對MFCC求差分得AMFCC

3.2 計算量與存儲量的分析

設CHMM模型采用N個狀態、M階混合Gauss概率密度函數的Markov鏈;特征矢量維數為n;訓練數據為l遍語音數據,為方便表示設每遍語音數據幀數為T,模型庫容量為R。訓練:①每次參數迭代前計算

數下降N*M*T*R*K次;模板庫中Gauss概率密度函數參數個數減少N*M*R*2*K個。

4 實驗及其結果分析

實驗數據:6個女性發音,0~9十個數字,每個數字發音50次,其中30次用于建立CHMM模型;實驗模型選擇:采用六個狀態的從左到右的無跨越的4階混合Gauss概率密度函數的CHMM模型,端點檢測方法選擇經典的雙門限方法。

實驗Ⅰ 在MFCC+AMFCC中去掉某一分量找到對誤識率影響較大的分量(見表1)。

實驗Ⅱ 在MFCC+AMFCC中去掉對誤識率影響小的分量,找到最佳(見表2)。

從實驗結果可以看出,在CHMM模型上采用MFCC1、MFCC2、MFCC4、MFCC5、MFCC7、MFCC8、MFCC10、MFCC11、△MFCCi(i≠11)組成19維的特征矢量,系統的誤識率僅上升2.75%,即系統的識別率仍有95.75%,可以滿足實際需要。而模板庫參數個數下降2400個;同時在訓練中N(U,σ2)的計算次數減少了41,834,880*K次(K為迭代次數);匹配時N(u,σ2)的計算次數減少1200*T次(T為待識語音幀數)。實驗結果表明:與常規的24維MFCC+△MFCC相比,選擇其中對識別率貢獻大的主要分量構成的低維特征矢量,系統在訓練、識別過程中N(u,σ2)的計算次數和模板庫參數個數明顯下降,而系統誤識率僅略微上升。

5 結論

針對實際應用中資源有限的語音識別系統對識別率及計算量的特殊要求,本文根據基于對角協方差陣的CHMM模型的特點,給出了特征參數選擇的理論依據,彌補了以往研究僅從實驗結果分析,缺少理論依據的不足;同時提出根據各特征參數對系統誤識率的影響程度來選擇特征參數的新方法。通過保留對誤識率影響大的分量,舍去對誤識率影響小的分量,尋求次優低維參數組合。使系統在降低特征矢量維數減少計算量的同時,保證了系統誤識率不會顯著上升,系統的識別效果保持相對穩定。從而來滿足語音識別系統對計算量、存儲量等資源消耗指標和識別率的雙重要求。

此外,本文提出的基于CHMM的語音識別系統特征參數的選擇方法,不僅適用于同一類參數分量組合與系統誤識率的關系,而且適用于不同參數組合與系統誤識率的關系分析。所以,在實際應用中,人們可以打破傳統的取整體同一類參數的方法,根據對系統識別率與存儲量、計算量的要求,合理選擇的特征參數組合達以到目標。

主站蜘蛛池模板: 人人91人人澡人人妻人人爽| 亚洲日韩高清在线亚洲专区| 免费激情网址| 国产精品思思热在线| 日韩专区欧美| 91精品啪在线观看国产| 国产成人啪视频一区二区三区| 免费人成在线观看成人片| 欧美日韩亚洲国产主播第一区| 毛片视频网| 国产精品美女在线| 老色鬼欧美精品| 亚洲色精品国产一区二区三区| 中文字幕有乳无码| 国产人人干| 亚洲女同一区二区| 久久综合结合久久狠狠狠97色| 亚洲啪啪网| 国产清纯在线一区二区WWW| 亚洲福利一区二区三区| 无码'专区第一页| 亚洲日韩精品无码专区97| 无码日韩视频| 亚洲精品天堂在线观看| 国产精品久久精品| 天天干伊人| 97在线免费| 国产精品成人一区二区| 国产一区免费在线观看| 极品尤物av美乳在线观看| 东京热一区二区三区无码视频| 亚洲国产中文综合专区在| 国产a在视频线精品视频下载| 日韩精品一区二区三区免费在线观看| 一级毛片免费观看久| 色有码无码视频| 欧美日韩午夜视频在线观看| 国产三级视频网站| 国产精品人成在线播放| 国产欧美综合在线观看第七页| 亚洲一区二区三区香蕉| 亚洲天堂精品视频| 69精品在线观看| 亚洲色图欧美视频| 国产超碰一区二区三区| 精品国产成人av免费| 国产日韩欧美一区二区三区在线| 亚洲精品另类| 爆乳熟妇一区二区三区| 91在线视频福利| 免费无遮挡AV| 久操线在视频在线观看| 国产精品人人做人人爽人人添| 三上悠亚一区二区| 国产午夜精品一区二区三区软件| 亚洲精品自拍区在线观看| 亚洲日韩AV无码一区二区三区人| 久久情精品国产品免费| av在线人妻熟妇| 婷婷伊人五月| 全部毛片免费看| 亚洲福利一区二区三区| 久久亚洲欧美综合| 亚洲日韩精品伊甸| 欧美日韩国产一级| 无码中文AⅤ在线观看| 国产成人午夜福利免费无码r| 中文一区二区视频| 日韩最新中文字幕| 亚洲第一成年人网站| 波多野结衣一二三| 波多野结衣中文字幕一区二区| 91精品最新国内在线播放| 黄片在线永久| 亚洲国产成人久久77| 呦系列视频一区二区三区| 欧美成人免费午夜全| 美女扒开下面流白浆在线试听| 一本大道视频精品人妻| 伊人久久久久久久| 成人国产一区二区三区| 久久久久人妻一区精品色奶水 |