999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種改進的有監(jiān)督訓練的TV語種識別方法

2016-11-09 01:11:32張翼飛騰瀟琦
計算機應(yīng)用與軟件 2016年9期
關(guān)鍵詞:監(jiān)督特征效果

張翼飛 騰瀟琦

1(上海大學機電工程與自動化學院 上海 200072)2(訊飛智元信息科技有限公司 安徽 合肥 230088)3(北京市互聯(lián)網(wǎng)信息辦公室 北京 100062)

?

一種改進的有監(jiān)督訓練的TV語種識別方法

張翼飛1,2騰瀟琦3

1(上海大學機電工程與自動化學院上海 200072)2(訊飛智元信息科技有限公司安徽 合肥 230088)3(北京市互聯(lián)網(wǎng)信息辦公室北京 100062)

傳統(tǒng)的GMM-TV(Gaussian Mixture Model-Total Variability,又稱為i-vector)系統(tǒng)得益于它良好的識別效果以及優(yōu)秀的識別效率,在語種識別LID(language identification)中得到廣泛應(yīng)用,然而載荷矩陣T的訓練過程是無監(jiān)督的,使得它的分類空間并沒有得到最好的優(yōu)化。已有的有監(jiān)督TV(Supervised-TV,S-TV)算法,通過在均值超矢量上拼接一個帶有標簽信息的向量,使得T矩陣的訓練過程變成一個有監(jiān)督的過程,但是效果增長較弱,同時帶來了載荷矩陣自由度問題。提出一種改進的有監(jiān)督訓練方法,在目標函數(shù)中引入正則化項來解決自由度的問題,同時大大提升它的分類效果。該方法在NIST LRE09的30s數(shù)據(jù)集實驗中得到了很好的效果,等錯誤率EER(Equal Error Rate)從5.40%下降到4.96%,融合系統(tǒng)的EER達到了3.86%。

語種識別TV系統(tǒng)有監(jiān)督訓練載荷矩陣

0 引 言

語種識別LID是通過對給定的一段語音信號分析處理,識別其所屬語言的種類。它往往作為語音識別和其他相關(guān)應(yīng)用的一個前端處理技術(shù),是在語音識別基礎(chǔ)上發(fā)展起來的[1]。隨著全球化趨勢和國際互聯(lián)網(wǎng)的發(fā)展,人們更加迫切地希望可以突破語言的障礙進行交流,因而對于語種識別技術(shù)的需求也與日俱增,比如音頻和視頻信息檢索、自動機器翻譯、電話自動轉(zhuǎn)接、多語種語音識別和智能監(jiān)測等。不僅如此,語種識別還廣泛應(yīng)用于軍事、國家安全和各個信息產(chǎn)業(yè)領(lǐng)域,具有極為重要的應(yīng)用價值和前景。

目前主流的LID方法有很多,但國際主流的方法都是以GMM-TV[2-4]為基礎(chǔ)的,這主要得益于GMM-TV系統(tǒng)優(yōu)秀的識別效率和良好的識別效果。然而傳統(tǒng)的T矩陣的訓練是無監(jiān)督的過程,這就使得它的分類空間并沒有得到最好的優(yōu)化。2014年李明提出了一種有監(jiān)督的TV系統(tǒng)S-TV[5]。該方法在原TV系統(tǒng)的基礎(chǔ)上,在均值超矢量上拼接了一個帶標簽的語種標識向量,使得T矩陣的訓練過程融入了監(jiān)督信息,以此來增加T矩陣的區(qū)分性。實驗結(jié)果表明,該方法在傳統(tǒng)的TV系統(tǒng)基線上有一定的提升。

然而S-TV系統(tǒng)在迭代過程中T和W的方差不斷地在增大,尤其在迭代了5次以后,方差的增大幅度在10倍以上,遠遠超過了傳統(tǒng)TV系統(tǒng)中T矩陣方差的增長速度。而我們需要的是盡量收斂的T矩陣,于是本文對S-TV做了小小的改進,通過增加正則化項來抑制T和W矩陣的增長幅度,使得識別效果得到了很大的提升。在NIST LRE09數(shù)據(jù)集上,此方法取得了較好的效果。

1 傳統(tǒng)TV系統(tǒng)

給定混合度為C的UBM模型λ,C個分量λc={wc,uc,Σc}。假設(shè)一條語音有L幀,它的特征序列為{x1,x2,…,xL},并且每個特征xi的維度為D,根據(jù)文獻[4]:

z=(I+TtΣ-1NT)-1TtΣ-1Ny

(1)

其中z就是i-vector,維度為K。Σ為CD×CD維的協(xié)方差對角陣。N是一個CD×CD維的對角陣,并且由C個子塊NcI構(gòu)成,Nc為D×D維的對角陣,且所有元素都相同,它的值由下式確定:

(2)

其中,P(c|xt,λ)為xt在λc上的占有率。y是均值超矢量,它由C個分量構(gòu)成:

(3)

于是y可以通過CD×K維的矩陣T映射到K維的空間上:

y→Tz

(4)

在通過式(1)得到i-vector之后,經(jīng)過LDA并計算cosine距離即可實現(xiàn)分類。

2 有監(jiān)督的TV系統(tǒng)

為了讓i-vector具有更好的區(qū)分性,文獻[5]中的有監(jiān)督TV在基線TV的均值超矢量后面加上了一個語種標識向量,語種標識向量的維度M等于語種的類別數(shù)。假設(shè)第j條語音的語種標識向量為Lj=(Lj1,Lj2,…,LjM)T,則有:

(5)

如圖1所示,將M維的L拼接在CD維的均值超矢量后面,構(gòu)成一條(CD+M)維的超矢量,同樣在T矩陣下方拼接一個M×K的W矩陣,構(gòu)成一個(CD+M)×K的矩陣。這樣超矢量就代入了監(jiān)督信息,并且參與了T矩陣的訓練,使最后得到的i-vector的區(qū)分性更強。

圖1 S-TV結(jié)構(gòu)圖

類似于傳統(tǒng)TV系統(tǒng),假設(shè)zj服從于標準正態(tài)分布,則有:

P(zj)=N(0,I)

(6)

(7)

(8)

結(jié)合式(7)、式(8),通過簡化操作得到優(yōu)化函數(shù),可以看出,EM算法的目標在于最小化J:

(9)

(10)

(11)

在M步驟,通過最小化上述函數(shù)J后可得W和T的更新公式:

(12)

(13)

式中,Tc是T矩陣在第c個高斯上的分量,ycj是yj在第c個高斯上的分量。

經(jīng)過幾次EM迭代后,T和W矩陣的參數(shù)會得到很好的修正。后面的提取i-vector階段,利用修正的矩陣,采用傳統(tǒng)的TV方法進行i-vector估計即可。

3 改進的有監(jiān)督TV系統(tǒng)

(14)

則最終的更新公式變?yōu)椋?/p>

(15)

(16)

實驗證明,加入正則化項后,成功抑制住了W和T矩陣過大的增長趨勢,并且使得Supervised-TV的效果有了很大的提升。

4 實 驗

4.1數(shù)據(jù)和參數(shù)

圖2 LID測試流程

本次實驗選用了NIST LRE09的30s數(shù)據(jù)集合,該集合有24個語種。特征選用了PLP-SDC特征[6]和PNCC-SDC特征[7,8],UBM的維度為512,i-vector維度為300。在開發(fā)集上,對S-TV的一些參數(shù)進行了調(diào)優(yōu),正則化項系數(shù)λ的值取1000,初始的W矩陣為隨機生成,并且它的值服從均值為0,方差為1×10-6的高斯分布。后端采用LDA+cosine距離的組合,LDA矩陣的維度為300×23。整個測試系統(tǒng)如圖2所示。

4.2實驗結(jié)果與結(jié)論

首先看正則化項對優(yōu)化函數(shù)J的影響。目標函數(shù)采用式(9),特征為PLP-SDC特征,我們?nèi)〕龅?次中的每一代結(jié)果,分別統(tǒng)計出相同的6條語音的目標函數(shù)J之和放在表1中。

表1 目標函數(shù)

從表1可以看出,帶正則化項后的S-TV對目標函數(shù)J的優(yōu)化更好,理論上會得到更好的結(jié)果。實驗結(jié)果證明了我們的猜想,表2展示了正則化項對實驗結(jié)果的影響。

表2 不同配置下的S-TV系統(tǒng)結(jié)果

對比表2各項,正則化項對S-TV的提升很明顯,特別是在使用PNCC-SDC特征時。表3對比了基線和S-TV的單系統(tǒng)效果(S-TV系統(tǒng)均是帶正則化項的),圖3是它們的DET曲線。

表3 各單系統(tǒng)結(jié)果

圖3 單系統(tǒng)的DET曲線

從以上結(jié)果可以得出結(jié)論,單系統(tǒng)中,PNCC-SDC特征整體上優(yōu)于PLP-SDC特征,并且在使用PNCC-SDC特征時,S-TV令基線系統(tǒng)的EER從5.40%下降到4.96%,效果相對提升達到了8.15%。

表4展示了各種融合系統(tǒng)的效果,可以看出,融合系統(tǒng)的效果有很顯著的提升,說明PNCC-SDC特征和 PLP-SDC特征以及S-TV和TV的互補性都較強。當四個單系統(tǒng)融合時,EER達到了3.86%的最小值。

表4 融合系統(tǒng)結(jié)果

在效率方面,文獻[5]給出了TV和S-TV的時間復(fù)雜度,分別為O(K3+K2C+KCD)和O(K3+K2C+K(CD+M))。在一般情況下,M<

表5 改進S-TV與傳統(tǒng)TV的效率對比

5 結(jié) 語

本文在GMM-TV系統(tǒng)以及已有的有監(jiān)督訓練的TV系統(tǒng)下,提出了一種改進的有監(jiān)督訓練TV系統(tǒng),在原本訓練T矩陣的基礎(chǔ)上給訓練數(shù)據(jù)增加標識向量來增加T空間的區(qū)分性,同時在目標函數(shù)中引入正則化項,來控制空間訓練的自由度。實驗結(jié)果表明,此方法在不影響效率的情況下有效地提高了語種識別的效果,在NIST LRE09數(shù)據(jù)集合上,所提出的融合系統(tǒng)相比基線系統(tǒng)提升非常明顯。本文方法為模型域?qū)用娴母倪M,可以用于國際主流的Bottleneck特征[9]中。

[1] 付強.基于高斯混合模型的語種識別的研究[D].中國科學技術(shù)大學,2009.

[2] 郭武.復(fù)雜信道下的說話人識別[D].中國科學技術(shù)大學,2007.

[3] Dehak N,Kenny P,Dehak R,et al.Front-End Factor Analysis for Speaker Verification[J].Audio Speech & Language Processing IEEE Transactions on,2011,19(4):788-798.

[4] Kenny P.Joint factor analysis of speaker and session variability:Theory and algorithm[R].Technical report CRIM-06/08-13,CRIM,2006.

[5] Li ming,Shrikanth Narayanan.Simplified Supervised I-vector Modeling with Application to Robust and Efficient Language Identification and Speaker Verification[J].Computer Speech & Language,2014,28(4):940-958.

[6] Kohler M A,Kennedy M.Language identification using shifted delta cepstra[C]//Circuits and Systems,2002.MWSCAS-2002.The 2002 45th Midwest Symposium on.IEEE,2002:III-69-72.

[7] Kim C,Stern R M.Feature extraction for robust speech recognition using a power-law nonlinearity and power-bias subtraction[J].Interspeech,2009:28-31.

[8] Kim C,Stern R M.Power-Normalized Cepstral Coefficients (PNCC) for robust speech recognition[C]//2012 IEEE International Conference on Acoustics,Speech and Signal Processing(ICASSP),2012,22(10):4101-4104.

[9] Jiang Bing,Song yan,Wei si,et al.Deep Bottleneck Features for Spoken Language Identification[J].PLOS ONE,2014,9(7):e100795.

AN IMPROVED LANGUAGE IDENTIFICATION METHOD USING SUPERVISED TOTAL VARIABILITY

Zhang Yifei1,2Teng Xiaoqi3

1(School of Mechatronics Engineering and Automation,Shanghai University,Shanghai 200072,China)2(IflytekIntelligentSystemCo.,Ltd,Hefei230088,Anhui,China)3(TheOfficeofInternetInformation,Beijing100062,China)

Traditional GMM-TV (Gaussian mixture model-total variability) system is benefited from its good recognition effect and excellent recognition efficiency, and has been widely used in language identification (LID). However the training process of load matrix T is unsupervised, this leads to its classification space not being optimised the best. Existing supervised-TV (S-TV) algorithm, through stitching a vector with tag information on mean super vector, makes the training process of T matrix become a supervised process, but it only achieves a little performance gain while introduces the problem of load matrix’s freedom. In this paper we propose an improved S-TV method which puts a regularisation item into the objective function for solving the freedom problem and meanwhile greatly improves its classification effect. The improved system achieves excellent effect in the experiment on 30s dataset of NIST LRE2009, the equal error rate (EER) reduces to 4.96% from 5.40% and the fusion system’s EER has even reached 3.86%.

Language identificationTV systemSupervised trainingLoad matrix

2015-05-20。北京市科委項目(Z141100006014002)。張翼飛,碩士生,主研領(lǐng)域:聲紋語種識別。騰瀟琦,碩士生。

TP3

A

10.3969/j.issn.1000-386x.2016.09.038

猜你喜歡
監(jiān)督特征效果
按摩效果確有理論依據(jù)
突出“四個注重” 預(yù)算監(jiān)督顯實效
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
迅速制造慢門虛化效果
抓住“瞬間性”效果
中華詩詞(2018年11期)2018-03-26 06:41:34
抓住特征巧觀察
監(jiān)督見成效 舊貌換新顏
夯實監(jiān)督之基
模擬百種唇妝效果
Coco薇(2016年8期)2016-10-09 02:11:50
主站蜘蛛池模板: 九九热免费在线视频| 5555国产在线观看| 亚洲一区二区三区香蕉| 四虎AV麻豆| 无码人妻热线精品视频| 精品撒尿视频一区二区三区| 亚洲欧美在线看片AI| 国产91全国探花系列在线播放| 鲁鲁鲁爽爽爽在线视频观看| 国产99欧美精品久久精品久久| 黄色网站不卡无码| 青青青视频蜜桃一区二区| av一区二区三区高清久久| 人妻21p大胆| 波多野结衣在线一区二区| 久久亚洲国产最新网站| 久久综合五月| 久操线在视频在线观看| 99re在线观看视频| 久久久久国色AV免费观看性色| 亚洲毛片在线看| 精品成人一区二区三区电影 | 国产乱子伦手机在线| 国产日本一区二区三区| 亚洲欧美日韩中文字幕在线| 精品国产99久久| AV老司机AV天堂| 亚洲熟妇AV日韩熟妇在线| 91成人在线免费观看| 乱系列中文字幕在线视频| 99re精彩视频| 97精品久久久大香线焦| 国产精品手机视频| jizz在线观看| 久久综合伊人 六十路| 国产99久久亚洲综合精品西瓜tv| 亚洲精品视频免费观看| 国产玖玖视频| 久久精品国产999大香线焦| 四虎AV麻豆| 国产人妖视频一区在线观看| 日韩一区精品视频一区二区| 无码aⅴ精品一区二区三区| 日韩高清在线观看不卡一区二区| www.精品国产| 亚洲乱伦视频| 久操线在视频在线观看| 嫩草影院在线观看精品视频| 中文字幕乱码二三区免费| 亚洲大学生视频在线播放| 日本精品视频| 国产欧美网站| 19国产精品麻豆免费观看| 亚洲妓女综合网995久久| 亚洲伦理一区二区| 国产97色在线| 国产午夜小视频| 51国产偷自视频区视频手机观看| 亚洲国产日韩在线观看| 国产在线拍偷自揄拍精品| 自拍偷拍欧美| 国产超薄肉色丝袜网站| 好吊色妇女免费视频免费| 妇女自拍偷自拍亚洲精品| 久久美女精品| 18禁不卡免费网站| 久热精品免费| 欧美精品亚洲二区| аv天堂最新中文在线| 午夜精品区| 呦系列视频一区二区三区| 一区二区自拍| 国产成人综合日韩精品无码首页| 一级毛片免费观看不卡视频| 美女免费黄网站| 亚洲无码91视频| 中文字幕1区2区| 麻豆精品视频在线原创| 国产新AV天堂| 91区国产福利在线观看午夜 | 欧美自慰一级看片免费| 欧美日韩另类国产|