999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多重ANN/HMM混合模型的競爭學習機制研究

2010-04-12 00:00:00史國良
教書育人·高教論壇 2010年12期

一、引 言

我們都知道,語音命令的訓練樣本之間是存在很大差異的,譬如,男女聲發(fā)音之間、不同發(fā)音人之間、甚至于同一個人在不同時段發(fā)音之間,都可能存在較大差異。在差異性較大的訓練樣本集上,訓練的模型很難對所有樣本都有好的建模效果。我們將ANN/HMM混合模型應用于語音識別,取得了較好的效果。但從實驗結果我們也可以看到這種差異造成的識別率并不理想的情況。

由此,我們提出了一種多重ANN/HMM混合模型,為每個待識別命令建立一個多重(多鏈)的結構,以期能夠改善由于樣本差異降低識別率的情況。在多重混合模型中,我們將重點討論如何將多重模型整合到一起,及其競爭學習機制。

二、多重ANN,HMM混合模型

在多重ANN/HMM混合模型中,每個待識別命令都由多個ANN/HMM來一起為它建模。假設每個模式對應M個ANN/HMM,我們稱該模型是M重的,則每個待識別模式的多重ANN/HMM模型結構如下:

如圖l所示的M重ANN/HMM混合模型,AHi(1≤i≤M)表示M重模型中的第i重,每一重都為ANN/HMM識別模式,在這里我們稱它為子識別模式。若待識別模式有K個,可計算得整個識別系統(tǒng)共需要M×K個子識別模式,即M×K個ANN/HMM混合模型。由于每個子識別模式都是一個通過預測網絡(PNN)來預測觀測概率矩陣的隱馬爾可夫鏈,所以我們也可簡稱多重混合模型為多鏈模型。

模型建立好之后,在識別的時候,數(shù)據(jù)特征輸入給每一個鏈,每個鏈都將得出一個平均誤差Ei(i=1,2,?,M),各個鏈通過競爭,將平均誤差最小的那個Ei作為該模型的最終結果。

即,其中,E為模式最終的平均誤差。

三、競爭學習機制

前面我們已經提到,采用多重ANN/HMM模型的目的是為了區(qū)分開差異樣本,提高模型的建模精度。下面我們就來介紹一下實現(xiàn)這一目的的原理以及多重ANN/HMM混合模型的訓練算法。

我們期待建立的多重模型的各個鏈的作用是互補的。例如,對于待識別命令“放大”,它的第一個鏈能夠對樣本中某些發(fā)音相近的部分很好的建模,而第二個鏈則能夠對發(fā)音相近的另一部分進行很好的建模,以此類推。這樣,進來的某一個樣本,總可以找到多重模型中的一個鏈對它的建模效果比較好。這就是“適者生存,優(yōu)勝劣汰”的道理。下面給出了一個示例圖:

如上圖所示,整個圓代表全部訓練樣本,假設我們的重數(shù)M=5,則訓練的過程是將全部樣本按相近性分成五個部分,分別作為5個鏈的訓練樣本集,例如圖中紅色的代號為4的部分代表第4個鏈的訓練樣本集。

問題是:如果人為來進行分割的話,則缺乏通用性和方便性,同時也可能是不客觀的。那么,如何讓訓練算法自身來解決這個問題呢?

于是,我們提出了一種競爭學習方法,該方法的基本思想是:每次將訓練樣本數(shù)送給各個鏈,經計算各自得出一個平均誤差,誤差最小的那個鏈我們認為它在所有鏈中能夠最好地表示該樣本,因此,它在競爭中勝出,如圖1所示,我們將這個競爭結果反饋回來,最終將這個樣本劃歸給該鏈。

四、競爭學習算法

整個多重ANN/HMM混合模型的訓練算法如下:

1.初始化i=1;集合S(k)=NULL(k=1,2,?,M);初始化5個鏈的權值矩陣,循環(huán)控制變量loop與樣本總量F_NUM;

2.如果i>loop,退出算法;否則,j=l,轉步驟3);

3.如果j>F_NUM,轉步驟7);否則,轉步驟4);

4.第j個樣本Fj經過AHk(k=1,2,?,M),計算出各鏈的平均誤差

5.求出平均誤差最小的,將巧加入S(k);

6.j加1,轉步驟3);

7.用s(k)中的數(shù)據(jù)采用第二章中的訓練算法訓練第k個鏈,其中k從1到M;

8.i加1,轉步驟21

在該算法中,各個鏈通過自己適應的競爭機制,得到與自己相適應的訓練樣本子集,而從樣本的角度出發(fā),它們也總能找到對自己建模精度最高的那個鏈,繼續(xù)訓練該鏈,使其獲得更精確的建模效果。

五、實 驗

我們定義了5個待識別語音命令:放大、縮小、全屏、上移、下移。五個女性參與發(fā)音,每人為每個命令發(fā)音60次,其中,40次作為訓練樣本,20次作為識別樣本。實驗所用數(shù)據(jù)的采樣率是16KHz,幀長為25ms,幀移為12,5ms,這里的一幀是指一段語音數(shù)據(jù)。我們采用的是Mel頻率到普系數(shù)(MelFre-quency Cepstrum Coefficient一簡稱MFCC)。

方便多重ANN/HMM混合模型同ANN/HMM時序模型的比較,我們選取了同參考文獻[1][2]相同的實驗數(shù)據(jù)。只是我們只取MFCC自身的12維特征加上1個短時能量共13維特征,而不再使用一階、二階差分,這是由于我們使用的ANN實際上是一種預測網絡PNN,這里實現(xiàn)用前兩幀數(shù)據(jù)預測當前幀數(shù)據(jù),可以近似的代替一階、二階差分。

采用上面的實驗數(shù)據(jù),重數(shù)M從1取到5的實驗結果見表1和圖3。

在圖3中,當M=2時,識別率有些微下降,這是由于采用兩個鏈并不能很好地區(qū)分開所有樣本,而對每個鏈而言,訓練樣本數(shù)卻少了幾乎1/2,識別率也就不會太高。系統(tǒng)在M從3到5的識別率是逐步升高的,在M=5時達到了93.2%。M>5的實驗我們沒有做,但可以看見:如果M過大,完全超出樣本差異性范疇,也就是樣本之間的差異并不需要這么多的子模型去區(qū)分,這樣M的增加不但無法更好地對待識別對象進行建模,還可能在很大程度上影響建模效果。

總體上同參考文獻[2]中的實驗結果的平均識別率85.8%相比較,競爭學習機制下的多重ANN/HMM混合模型的平均識別率可達到96.4%,有了顯著提高。

參考文獻

[1]劉明宇,ANN/HMM混合模型在語音識別中的應用[J],自動化技術與應用,2009(6)

[2]劉明宇ANN/HMM混合模型中狀態(tài)數(shù)的自適應確定方法研究[J]自動化技術與應用,2009(7)

主站蜘蛛池模板: 97视频精品全国免费观看| 在线免费无码视频| 欧美五月婷婷| a天堂视频| 蝴蝶伊人久久中文娱乐网| 免费一极毛片| 欧美成a人片在线观看| 日本不卡在线视频| 国产区精品高清在线观看| 日韩A∨精品日韩精品无码| 成人一区在线| 久久久久亚洲精品成人网| 日本一区二区不卡视频| 亚洲精品视频免费观看| 美女扒开下面流白浆在线试听| 暴力调教一区二区三区| 青青草原国产免费av观看| 一区二区三区在线不卡免费| 日韩欧美成人高清在线观看| 18禁色诱爆乳网站| 狠狠色综合久久狠狠色综合| 亚洲欧洲天堂色AV| 最近最新中文字幕在线第一页| 亚洲国产精品人久久电影| 国产亚洲精品91| 在线观看亚洲国产| 青青操视频免费观看| 欧美在线三级| 亚洲成a人片| 日本亚洲成高清一区二区三区| 91色在线观看| 国产成年女人特黄特色毛片免| 天天做天天爱夜夜爽毛片毛片| 欧美中文字幕在线播放| 午夜高清国产拍精品| 亚洲丝袜中文字幕| 亚洲天堂色色人体| 午夜福利免费视频| 国产免费黄| 无码内射中文字幕岛国片| 亚洲欧美精品日韩欧美| 日本精品中文字幕在线不卡 | 国模沟沟一区二区三区| 亚洲三级网站| 欧美一区二区精品久久久| 六月婷婷精品视频在线观看| 精品無碼一區在線觀看 | 欧美黄网站免费观看| 色婷婷色丁香| 亚洲精品麻豆| 中文字幕在线永久在线视频2020| 国产第八页| 久久综合丝袜长腿丝袜| 在线免费看黄的网站| www.精品国产| 国产亚洲精品无码专| 午夜老司机永久免费看片| 亚洲大尺码专区影院| 国产欧美又粗又猛又爽老| 国产H片无码不卡在线视频| 91www在线观看| 精品黑人一区二区三区| 波多野结衣一区二区三区四区| 精品一区二区三区波多野结衣 | 亚洲欧美日韩久久精品| 国产丝袜丝视频在线观看| 亚洲精品视频在线观看视频| 久久夜夜视频| 亚洲成aⅴ人在线观看| 国产精品自在线天天看片| 久青草免费在线视频| 色综合热无码热国产| 中文字幕 91| 久久综合九九亚洲一区| 久久精品人人做人人| www.亚洲一区二区三区| 日韩不卡免费视频| 亚洲日韩精品欧美中文字幕 | 四虎永久免费在线| a级毛片在线免费观看| 激情五月婷婷综合网| 特黄日韩免费一区二区三区|