999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于逆梅爾對(duì)數(shù)頻譜系數(shù)的回放語(yǔ)音檢測(cè)算法

2018-05-25 06:36:52林朗王讓定嚴(yán)迪群李璨
電信科學(xué) 2018年5期
關(guān)鍵詞:特征設(shè)備實(shí)驗(yàn)

林朗,王讓定,嚴(yán)迪群,李璨

(寧波大學(xué),浙江 寧波 315211)

1 引言

說(shuō)話人識(shí)別技術(shù)[1]以其自身獨(dú)特的優(yōu)勢(shì),諸如語(yǔ)音獲取方便、使用者接受度高、說(shuō)話人系統(tǒng)算法復(fù)雜度低等優(yōu)點(diǎn),在司法、金融、生活等領(lǐng)域得到了廣泛應(yīng)用。同時(shí),說(shuō)話人識(shí)別技術(shù)的安全性也成為亟待解決的問(wèn)題。如何防止仿冒語(yǔ)音的攻擊已成為研究的重點(diǎn)。

根據(jù)攻擊手段的不同,仿冒語(yǔ)音主要分為兩類:一是模仿特定說(shuō)話人的聲音進(jìn)行攻擊,稱為說(shuō)話人仿冒攻擊;二是通過(guò)專業(yè)的設(shè)備和技術(shù)仿冒說(shuō)話人的聲音[2,3](如合成語(yǔ)音、拼接語(yǔ)音、回放語(yǔ)音等)。對(duì)于第一種攻擊方式,現(xiàn)有的說(shuō)話人識(shí)別技術(shù)已經(jīng)能夠有效地檢測(cè)。而對(duì)于第二種攻擊方式,目前還沒(méi)有比較成熟有效的手段能夠完全檢測(cè)出來(lái)。在實(shí)際場(chǎng)景中,由于合成、拼接語(yǔ)音需要比較專業(yè)的技術(shù)支持,而回放語(yǔ)音相對(duì)來(lái)說(shuō)操作簡(jiǎn)單,便于仿冒,已經(jīng)成為不法分子最善用的攻擊手段[4]。回放語(yǔ)音的產(chǎn)生過(guò)程如圖1所示。

圖1 回放語(yǔ)音產(chǎn)生過(guò)程

由圖1可知,回放語(yǔ)音是真實(shí)地來(lái)源于說(shuō)話人本人的聲音,相較于其他仿冒語(yǔ)音來(lái)說(shuō),對(duì)說(shuō)話人識(shí)別系統(tǒng)威脅更大。與原始語(yǔ)音相比,回放語(yǔ)音多經(jīng)歷了偷錄設(shè)備的錄制和回放設(shè)備的播放等過(guò)程,因此會(huì)不可避免地引入設(shè)備噪聲和設(shè)備編碼、解碼的失真以及環(huán)境噪聲等,使得回放語(yǔ)音和原始語(yǔ)音產(chǎn)生了細(xì)微的差異。目前,針對(duì)回放語(yǔ)音檢測(cè)問(wèn)題,主要分為以下兩類:一種是基于語(yǔ)音隨機(jī)性的檢測(cè)算法,如 Shang等人[5,6]利用語(yǔ)音產(chǎn)生的隨機(jī)性,提出了一種檢測(cè)待測(cè)語(yǔ)音和合法語(yǔ)音在峰值圖上的相似度的算法,此方法只能夠應(yīng)用于文本相關(guān)的聲紋認(rèn)證系統(tǒng);另一種是基于語(yǔ)音信道的檢測(cè)算法,如張利鵬等人[7]通過(guò)探究回放語(yǔ)音產(chǎn)生的機(jī)理,對(duì)語(yǔ)音的靜音段信道進(jìn)行建模,提出了一種基于語(yǔ)音靜音段信道差異的回放語(yǔ)音檢測(cè)算法,該算法由于靜音段幅度很小,容易受到噪聲的污染,因此很難建立精確的信道模型。王志峰等人[8]分析了回放語(yǔ)音產(chǎn)生過(guò)程中由不同設(shè)備引入的信道噪聲,提出了一種基于信道模式噪聲的錄音回放檢測(cè)算法。該方法解決了文本相關(guān)問(wèn)題,但實(shí)驗(yàn)過(guò)程中只涉及一種錄音設(shè)備和回放設(shè)備,存在實(shí)驗(yàn)設(shè)備單一的問(wèn)題。

通過(guò)分析原始語(yǔ)音和回放語(yǔ)音的語(yǔ)譜圖發(fā)現(xiàn),在高頻區(qū)域原始語(yǔ)音和回放語(yǔ)音有顯著的差異。而傳統(tǒng)的 MFCC(Mel-frequency cepstral coefficient,Mel倒譜系數(shù))特征提取使用的 Mel濾波器由于低頻分辨率高、高頻分辨率低的特點(diǎn),使得原始語(yǔ)音和回放語(yǔ)音在高頻區(qū)的差異性削弱,從而不利于人們對(duì)回放語(yǔ)音的檢測(cè)。其次在分析 MFCC特征參數(shù)時(shí),經(jīng)過(guò)實(shí)驗(yàn)發(fā)現(xiàn),使用MFCC提取過(guò)程中去離散余弦變換(discrete cosine transform,DCT)前的梅爾對(duì)數(shù)頻譜系數(shù)(log Mel-frequency spectral coefficient,MFSC)在回放語(yǔ)音的檢測(cè)上有更好的檢測(cè)效果。

基于上述分析,本文提出了一種基于逆Mel濾波器的梅爾對(duì)數(shù)頻譜(log inverse Mel-frequency spectral coefficient,I-MFSC)的算法,逆Mel濾波器的設(shè)計(jì)是由Mel濾波器逆置得到的,表現(xiàn)為高頻區(qū)域頻譜分辨率高、低頻區(qū)域分辨率低的特點(diǎn),這樣使得高頻區(qū)回放語(yǔ)音和原始語(yǔ)音的差異性會(huì)更加顯著地顯示出來(lái)。實(shí)驗(yàn)結(jié)果表明,在回放語(yǔ)音的檢測(cè)上I-MFSC有較好的檢測(cè)效果。將本文提出的回放語(yǔ)音檢測(cè)方法加載到目前主流的 GMM-UBM 說(shuō)話人識(shí)別系統(tǒng)中后,系統(tǒng)安全性能有了顯著的提高。

2 高頻區(qū)回放語(yǔ)音和原始語(yǔ)音差異分析

盡管現(xiàn)有的偷錄和回放設(shè)備都有著良好性能,能夠做到較小的失真錄制和高保真的回放。但原始語(yǔ)音和回放語(yǔ)音仍會(huì)存在一定的差別。本文從語(yǔ)譜圖[9]著手,考究了原始語(yǔ)音和回放語(yǔ)音在頻譜上的差異性,如圖2和圖3所示,實(shí)驗(yàn)語(yǔ)音是由Aigo R6620采集的一段4 s的語(yǔ)音,語(yǔ)音內(nèi)容為“芝麻開(kāi)門(mén),我是土豪,千里共嬋娟”。其中圖(a)代表原始語(yǔ)音的語(yǔ)譜圖。圖(b)、圖(c)、圖(d)分別對(duì)應(yīng)偷錄設(shè)備為iPhone6、Mi4以及Sony PX440的語(yǔ)譜圖。圖2使用的回放設(shè)備為Huawei AM08,而圖3對(duì)應(yīng)的回放設(shè)備為Philips DTM3115。

圖2 原始錄制和回放語(yǔ)音的語(yǔ)譜圖(回放設(shè)備:Huawei AM08)

圖3 原始錄制和回放語(yǔ)音的語(yǔ)譜圖(回放設(shè)備:Philips DTM3115)

從圖2和圖3中可以看出,與圖(a)的原始語(yǔ)音語(yǔ)譜圖相比,3種偷錄設(shè)備高頻區(qū)域(6~8 kHz)的頻率值均小于原始語(yǔ)音,其中圖(c)、圖(d)顯示出了更大的差異性。這表明 Mi4以及 Sony PX440兩種設(shè)備失真度更高。此外在4 kHz左右,原始語(yǔ)音和iPhone6以及Sony PX440語(yǔ)譜圖頻譜過(guò)渡相對(duì)平滑,而Mi4分界線較為明顯,產(chǎn)生了跳變現(xiàn)象,探究后發(fā)現(xiàn)這和Mi4設(shè)備自身固有的設(shè)備性能有關(guān)。

3 基于I-MFSC回放語(yǔ)音檢測(cè)算法

3.1 MFCC特征提取過(guò)程

在說(shuō)話人識(shí)別中,MFCC因能夠較好地模擬人耳聽(tīng)覺(jué)系統(tǒng)的感知能力被廣泛應(yīng)用。圖 4為MFCC特征的提取過(guò)程。

圖4 MFCC特征的提取過(guò)程

首先對(duì)語(yǔ)音信號(hào)x(n)進(jìn)行預(yù)處理,包括預(yù)加重、分幀和加窗,得到分幀后的語(yǔ)音信號(hào)

xi(n),其中下標(biāo)i表示分幀后的第i幀。然后對(duì)每幀語(yǔ)音信號(hào)xi(n)進(jìn)行FFT得到各幀的線性頻譜Xi(k),即:

其中,N表示傅里葉變換的點(diǎn)數(shù);將得到的線性頻譜Xi(k)經(jīng)由Mel濾波器進(jìn)行濾波生成Mel頻譜,然后再對(duì) Mel頻譜計(jì)算對(duì)數(shù)能量得到對(duì)數(shù)頻譜Si(m),即:

其中,M表示濾波器個(gè)數(shù),m=1,2,…,M,這里M通常取 27~40。最后經(jīng)離散余弦變換(DCT)得到L階的MFCC:

其中,C(n)為L(zhǎng)階的MFCC,L通常取12~16。

3.2 基于逆Mel濾波器組的MFSC

傳統(tǒng)的Mel濾波器組,在低頻段帶寬較窄,頻譜分辨率相對(duì)較高。而高頻段帶寬較寬,頻譜分辨率相對(duì)較低。因此在高頻區(qū)域較寬的濾波器平滑了高頻信息,削弱了不同頻率帶之間的差異,使得高頻區(qū)域的部分信息丟失。而由第2.1節(jié)的分析可知,回放語(yǔ)音和原始語(yǔ)音在高頻區(qū)域存在明顯的差異,因此為了利用兩種語(yǔ)音在高頻區(qū)域的差異性,本文采用一種逆Mel濾波器組[10-12]的設(shè)計(jì)來(lái)提取本文特征參數(shù)。逆Mel濾波器組的設(shè)計(jì)如圖5所示。

圖5 逆Mel濾波器組的設(shè)計(jì)

逆Mel濾波器組是基于逆Mel刻度變換得到的,逆Mel刻度變換的物理頻率和Mel頻率的對(duì)應(yīng)關(guān)系為:

其中,fI-Mel表示逆 Mel頻率,fmax表示語(yǔ)音信號(hào)最大頻率,f表示語(yǔ)音信號(hào)的物理頻率。逆 Mel和Mel變換關(guān)系如圖6所示。

圖6 逆Mel和Mel變換關(guān)系

此外,在 MFCC特征提取時(shí),會(huì)將得到的Mel頻譜取對(duì)數(shù)后再進(jìn)行 DCT,得到最后的MFCC特征參數(shù)。這里的DCT有兩種作用[13]:一是利用DCT后較強(qiáng)的能量集中特性,能夠?qū)?shù)據(jù)進(jìn)行壓縮;二是由于 MFCC提取過(guò)程中使用的Mel濾波器之間是有重疊的,因此能量值之間具有很強(qiáng)的相關(guān)性,使用DCT可以達(dá)到去相關(guān)的目的。而 Mohamed等人[14]的研究表明,相較于MFCC特征,MFSC具有更高的相關(guān)性和維度,更適合于機(jī)器學(xué)習(xí)的建模方式。因此將DCT前的MFSC作為參數(shù)特征,在濾波器的設(shè)計(jì)上,采用逆Mel濾波器組,新得到的參數(shù)定義為I-MFSC。

3.3 特征構(gòu)造與選擇

I-MFSC的特征提取過(guò)程和MFCC相似,在第3.1節(jié)MFCC提取的基礎(chǔ)上,將Mel濾波器組換成逆 Mel濾波器組,然后將去 DCT前的對(duì)數(shù)Mel頻譜Si(m)作為本文算法的最后特征參數(shù),最終得到本文的特征參數(shù)I-MFSC。

為了更好地說(shuō)明 I-MFSC特征的性能,分別對(duì) Mel倒譜系數(shù)(MFCC)、Mel對(duì)數(shù)頻譜系數(shù)(MFSC)、逆Mel倒譜系數(shù)(I-MFCC)和逆Mel對(duì)數(shù)頻譜系數(shù)(I-MFSC)在均值上做了對(duì)比分析,圖7分別為這4種特征系數(shù)在均值上的差異。

由圖7可以看出,雖然MFCC和I-MFCC在某些特征維度上也體現(xiàn)了差異性,可以作為檢測(cè)回放語(yǔ)音的特征,但相較于MFSC與I-MFSC兩種,后者在原始語(yǔ)音和回放語(yǔ)音的檢測(cè)上體現(xiàn)出了更好的性能。而盡管MFSC特征與I-MFSC特征都具有很好的檢測(cè)性能,但是第4節(jié)后續(xù)的實(shí)驗(yàn)表明,本文提出的 I-MFSC特征參數(shù)略優(yōu)于MFSC特征參數(shù)。

圖7 4種特征均值分布

3.4 回放語(yǔ)音檢測(cè)算法

實(shí)驗(yàn)分類器的選擇是LibSVM[15],它是一種有監(jiān)督的機(jī)器學(xué)習(xí)方法。在分類訓(xùn)練和測(cè)試時(shí)需要為每一條數(shù)據(jù)設(shè)置標(biāo)簽,這里將原始語(yǔ)音設(shè)置為正樣本,標(biāo)簽設(shè)置為“Y”,回放語(yǔ)音設(shè)置為負(fù)樣本,標(biāo)簽設(shè)置為“N”,LibSVM分類器其他參數(shù)均使用默認(rèn)參數(shù)。

將提取的矩陣特征(MFCC、MFSC、I-MFCC、I-MFSC)按幀求取均值,得到每一條語(yǔ)音的均值特征,并將每一條語(yǔ)音特征設(shè)置標(biāo)簽。在訓(xùn)練階段,使用訓(xùn)練集訓(xùn)練模型參數(shù)。在測(cè)試時(shí),根據(jù)訓(xùn)練階段得到的模型參數(shù)對(duì)測(cè)試數(shù)據(jù)進(jìn)行判別歸類,然后根據(jù)分類結(jié)果和測(cè)試數(shù)據(jù)的已知標(biāo)簽比較,得出回放語(yǔ)音檢測(cè)的準(zhǔn)確率,具體流程如圖8所示。

圖8 回放語(yǔ)音檢測(cè)流程

4 實(shí)驗(yàn)仿真及分析

4.1 實(shí)驗(yàn)設(shè)置

為了說(shuō)明本文算法的有效性和適用性,分別構(gòu)建了原始語(yǔ)音庫(kù)和回放語(yǔ)音庫(kù)。數(shù)據(jù)庫(kù)的具體設(shè)置如下:語(yǔ)料庫(kù)來(lái)源于863語(yǔ)料庫(kù)[16];人員分布為10男6女;考慮到現(xiàn)實(shí)場(chǎng)景中說(shuō)話人驗(yàn)證系統(tǒng)中的語(yǔ)音采集模塊通常采用16 kHz的采樣率,所以在實(shí)驗(yàn)中使用了與其采樣率相同的設(shè)備Aigo R6620;而偷錄和回放設(shè)備則選擇了多款常見(jiàn)的高保真設(shè)備,設(shè)備的具體詳情見(jiàn)表1。

實(shí)驗(yàn)庫(kù)的構(gòu)建環(huán)境為安靜辦公室,具體錄音流程為:說(shuō)話人按照語(yǔ)料庫(kù)語(yǔ)料錄音,并使用采集設(shè)備進(jìn)行語(yǔ)音采集,通常將采集設(shè)備采集到的語(yǔ)音稱為原始語(yǔ)音。與此同時(shí),使用3種偷錄設(shè)備同時(shí)錄制說(shuō)話人語(yǔ)音,并在同樣的環(huán)境下,將偷錄設(shè)備錄制的語(yǔ)音經(jīng)音響回放,并使用采集設(shè)備錄制該回放的語(yǔ)音,將此種條件下采集的語(yǔ)音稱為回放語(yǔ)音。數(shù)據(jù)集共有實(shí)驗(yàn)樣本15 000個(gè),其中原始語(yǔ)音樣本2 400個(gè),兩種回放設(shè)備對(duì)應(yīng)3種偷錄設(shè)備共計(jì)有12 600個(gè)回放語(yǔ)音樣本,所有樣本詳情見(jiàn)表2。

表1 設(shè)備的具體詳情

4.2 實(shí)驗(yàn)結(jié)果與分析

4.2.1 不同特征的實(shí)驗(yàn)結(jié)果與分析

本節(jié)主要檢測(cè)MFCC、I-MFCC、MFSC以及I-MFSC這4種特征對(duì)回放語(yǔ)音檢測(cè)性能影響。實(shí)驗(yàn)所用樣本詳情見(jiàn)表2。表3為不同特征的檢測(cè)結(jié)果,TPR為真陽(yáng)性率(true positive rate),F(xiàn)PR為假陽(yáng)性率(false positive rate),ACC為正確檢測(cè)率。

由表3可知,兩種Mel對(duì)數(shù)頻譜系數(shù)MFSC和I-MFSC的性能顯著優(yōu)于MFCC和I-MFCC。盡管MFSC對(duì)回放語(yǔ)音的檢測(cè)率也有很優(yōu)越的性能,但最好的檢測(cè)結(jié)果仍然是I-MFSC,因此本文后續(xù)實(shí)驗(yàn)所使用的特征選擇I-MFSC作為最后的特征參數(shù)。

4.2.2 不同設(shè)備之間的交叉實(shí)驗(yàn)對(duì)檢測(cè)率的影響

現(xiàn)實(shí)場(chǎng)景中由于偷錄設(shè)備的多種多樣,回放語(yǔ)音檢測(cè)算法能否對(duì)多種偷錄設(shè)備和回放設(shè)備都有較好的檢測(cè)結(jié)果是衡量算法有效性的關(guān)鍵所在。本節(jié)實(shí)驗(yàn)?zāi)康氖菣z測(cè)本文提出的算法在不同設(shè)備之間交叉是否依然有較好結(jié)果。實(shí)驗(yàn)采用的樣本見(jiàn)表 2,實(shí)驗(yàn)采用的特征是本文提出的I-MFSC特征,具體檢測(cè)結(jié)果見(jiàn)表4。

由實(shí)驗(yàn)結(jié)果可知,在不涉及交叉設(shè)備時(shí),每種設(shè)備的檢測(cè)率均達(dá)到了 100%。當(dāng) iPhone6和Sony PX440作為訓(xùn)練樣本時(shí),雖然檢測(cè)效果有所下降,但檢測(cè)效果依舊可觀;當(dāng)Mi4作為訓(xùn)練集樣本時(shí),檢測(cè)效果不甚理想。由第2.1節(jié)的語(yǔ)譜圖分析結(jié)論可知,這是因?yàn)槭艿組i4設(shè)備本身特性的影響,對(duì)高頻區(qū)有些許的抑制作用;但綜合來(lái)看,本文提出的 I-MFSC特征在設(shè)備交叉的實(shí)驗(yàn)檢測(cè)中具有良好的檢測(cè)性能。

表2 原始語(yǔ)音和回放語(yǔ)音樣本詳情

表3 不同特征的檢測(cè)結(jié)果

表4 不同設(shè)備之間的交叉實(shí)驗(yàn)檢測(cè)結(jié)果

表5 噪聲環(huán)境下實(shí)驗(yàn)檢測(cè)結(jié)果

4.2.3 噪聲環(huán)境下幾種特征的檢測(cè)效果

現(xiàn)實(shí)場(chǎng)景中偷錄環(huán)境的多樣性和復(fù)雜性也是影響回放語(yǔ)音檢測(cè)性能的重要因素。考慮到聲紋識(shí)別系統(tǒng)的實(shí)際應(yīng)用場(chǎng)景,過(guò)高的噪聲環(huán)境在聲紋認(rèn)證領(lǐng)域意義不大,且噪聲環(huán)境特別大時(shí),聲紋系統(tǒng)會(huì)直接拒絕待測(cè)語(yǔ)音進(jìn)入系統(tǒng),因此本實(shí)驗(yàn)將回放語(yǔ)音和原始語(yǔ)音加上15~30 dB的高斯白噪聲以檢測(cè)本算法的頑健性。檢測(cè)結(jié)果見(jiàn)表5。

由表5可以看出,噪聲的引入對(duì)回放語(yǔ)音檢測(cè)有一定的影響,當(dāng)信噪比從30 dB降到15 dB時(shí),回放語(yǔ)音的檢測(cè)率總體呈下降趨勢(shì)。但相對(duì)而言,本文提出的算法I-MFSC相較于其他3種特征,在噪音環(huán)境下表現(xiàn)出更好的性能。

4.2.4 對(duì)比試驗(yàn)

為檢驗(yàn)本算法的有效性和適用性,將本文的算法以單獨(dú)的模塊形式加載到 GMM-UBM 說(shuō)話人識(shí)別系統(tǒng)[17]中,加載回放語(yǔ)音檢測(cè)模塊的說(shuō)話人識(shí)別系統(tǒng)如圖9所示。

圖9 加載回放語(yǔ)音檢測(cè)模塊的說(shuō)話人識(shí)別系統(tǒng)

語(yǔ)音進(jìn)入說(shuō)話人識(shí)別系統(tǒng)后,說(shuō)話人識(shí)別系統(tǒng)對(duì)語(yǔ)音進(jìn)行第一次判別,當(dāng)說(shuō)話人識(shí)別系統(tǒng)判決為非法用戶時(shí),系統(tǒng)會(huì)直接拒絕該語(yǔ)音,不再進(jìn)入回放語(yǔ)音檢測(cè)模塊。只有當(dāng)說(shuō)話人識(shí)別系統(tǒng)判決該語(yǔ)音來(lái)自于合法用戶后,才會(huì)進(jìn)行回放語(yǔ)音檢測(cè)模塊;如果回放語(yǔ)音檢測(cè)模塊判決為原始語(yǔ)音,則系統(tǒng)接受該用戶請(qǐng)求,否則拒絕該用戶請(qǐng)求。

此外,將本文算法同參考文獻(xiàn)[4]和參考文獻(xiàn)[5]提出的算法進(jìn)行比較。參考文獻(xiàn)[4]的算法采用短時(shí)能量法提取靜音,并用譜減法進(jìn)行去噪。采用12維MFCC和一階差分ΔMFCC作為特征參數(shù)。而參考文獻(xiàn)[5]的算法則采用高通濾波器進(jìn)行去噪,提取6個(gè)統(tǒng)計(jì)特征及6階Legendre多項(xiàng)式系數(shù)(共12維)作為信道模式噪聲的特征參數(shù)。檢測(cè)檢測(cè)結(jié)果見(jiàn)表6,其中ACC表示檢測(cè)的正確率,EER表示將檢測(cè)模塊加載到 GMM-UBM系統(tǒng)的等錯(cuò)誤概率。

表6 對(duì)比實(shí)驗(yàn)檢測(cè)結(jié)果

由表6可知,本文提出的算法相較于參考文獻(xiàn)[4]和參考文獻(xiàn)[5]在性能上有很大的提升。最后將幾種方法以單獨(dú)的模塊加載到說(shuō)話人識(shí)別系統(tǒng),加載回放語(yǔ)音檢測(cè)模塊前后的等錯(cuò)誤概率如圖 10所示。由圖10可以看出,加載到GMM-UBM系統(tǒng)后,本文提出的算法更能有效地提高說(shuō)話人識(shí)別系統(tǒng)對(duì)回放語(yǔ)音的抵抗能力。

圖10 加載回放語(yǔ)音檢測(cè)模塊前后的等錯(cuò)誤概率

5 結(jié)束語(yǔ)

本文利用原始語(yǔ)音在回放語(yǔ)音在高頻區(qū)的差異,通過(guò)逆Mel濾波器和提取去DCT前的MFSC特征,提出了一種基于高頻區(qū) I-MFSC特征的回放語(yǔ)音檢測(cè)算法。該算法能夠有效地彌補(bǔ)現(xiàn)有算法中設(shè)備單一的問(wèn)題。通過(guò)實(shí)驗(yàn)表明,本文算法能夠有效地檢測(cè)回放語(yǔ)音和原始語(yǔ)音,將本文算法加載到GMM-UBM說(shuō)話人識(shí)別系統(tǒng)時(shí),對(duì)說(shuō)話人識(shí)別的性能有了很大的提高。現(xiàn)實(shí)場(chǎng)景中,偷錄設(shè)備和回放設(shè)備種類繁多,高保真的設(shè)備層出不窮,因此今后的工作將進(jìn)一步探索回放語(yǔ)音產(chǎn)生的機(jī)理以及回放語(yǔ)音和原始語(yǔ)音產(chǎn)生差異性的具體因素。

參考文獻(xiàn):

[1]ZHU D, MA B, LI H.Speaker verification with feature-space MAPLR parameters[J].IEEE Transactions on Audio Speech &Language Processing, 2011, 19(3): 505-515.

[2]易克初, 胡征.一種應(yīng)用矢量量化的語(yǔ)音合成新方法[J].電信科學(xué), 1987(11): 1-6.YI K C, HU Z.A new speech synthesis method using vector quantization[J].Telecommunications Science, 1987(11): 1-6.

[3]郭弘.錄音證據(jù)的真實(shí)性檢驗(yàn)與研究[J].電信科學(xué), 2010,26(Z2): 56-60.GUO H.Authenticity verification and research of recording evidence[J].Telecommunications Science, 2010, 26(Z2): 56-60.

[4]李璨, 王讓定, 嚴(yán)迪群, 等.基于相位譜的翻錄語(yǔ)音攻擊檢測(cè)算法[J].電信科學(xué), 2017, 33(8): 145-154.LI C, WANG R D, YAN D Q, et al.Detection algorithm of riprap voice attack based on phase spectrum[J].Telecommunications Science, 2017, 33(8): 145-154.

[5]SHANG W, STEVENSON M.A playback attack detector for speaker verification systems[C]//IEEE International Symposium on Communications Control and Signal Processing (ISCCSP),March 12-14, 2008, St Julians, Malta.Piscataway: IEEE Press,2008: 1144-1149.

[6]SHANG W, STEVENSON M.Score normalization in playback attack detection[C]//IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP), March 14-19, 2010, Dallas, USA.Piscataway: IEEE Press, 2010: 1678-1681.

[7]張利鵬, 曹犟, 徐明星.防止假冒者闖入說(shuō)話人識(shí)別系統(tǒng)[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版), 2008, 48(S1): 699-703.ZHANG L P, CAO J, XU M X.Prevention of impostors entering speaker recognition systems[J].Journal of Tsinghua University (Science and Technology), 2008, 48(S1): 699-703.

[8]王志峰, 賀前華, 張雪源, 等.基于模式噪聲的錄音回放攻擊檢測(cè)[J].華南理工大學(xué)學(xué)報(bào), 2011, 39(10): 7-12.WANG Z F, HE Q H, ZHANG X Y, et al.Channel pattern noise based playback detection algorithm speaker recognition[J].Journal of South China University of Technology (Natural Science Edition), 2011, 39(10): 7-12.

[9]李富強(qiáng), 萬(wàn)紅, 黃俊杰.基于MATLAB的語(yǔ)譜圖顯示與分析[J].微計(jì)算機(jī)信息, 2005(20): 172-174.LI F Q, WAN H, HUANG J J.The display and analysis of sonogram based on MATLAB[J].Control & Automation,2005(20): 172-174.

[10]BURILLO P, BUSTINCE H.Entropy on intuitionistic fuzzy sets and on interval-valued fuzzy sets[J].Fuzzy Sets & Systems,1996, 78(3): 305-316.

[11]項(xiàng)要杰, 楊俊安, 李晉徽, 等.一種適用于說(shuō)話人識(shí)別的改進(jìn)Mel濾波器[J].計(jì)算機(jī)工程, 2013(11): 214-217.XIANG Y J, YANG J A, LI J H, et al.An improved Mel-frequency filter for speaker recognition[J].Computer Engineering, 2013(11): 214-217.

[12]陶佰睿, 郭琴, 苗鳳娟, 等.基于改進(jìn) Mel濾波器組的聲紋特征提取SoC設(shè)計(jì)[J].微電子學(xué), 2015(6): 785-788.TAO B R, GUO Q, MIAO F J, et al.SoC design of voiceprint features extraction based on improved Mel filter banks[J].Microelectronics, 2015(6): 785-788.

[13]胡永剛, 吳翊, 王洪志, 等.高維數(shù)據(jù)降維的 DCT變換[J].計(jì)算機(jī)工程與應(yīng)用, 2006(32): 21-23.HU Y G, WU Y, WANG H Z, et al.Discrete cosine transform in data dimensionality reduction[J].Computer Engineering and Applications, 2006(32): 21-23.

[14]MOHAMED A.Deep neural network acoustic models for ASR[J].Doctoral, 2014.

[15]CHANG C C, LIN C J.LIBSVM: a library for support vector machines[J].ACM Transactions on Intelligent Systems &Technology, 2012, 2(3): 1-27.

[16]王天慶, 李愛(ài)軍.連續(xù)漢語(yǔ)語(yǔ)音識(shí)別語(yǔ)料庫(kù)的設(shè)計(jì)[C]//第六屆全國(guó)現(xiàn)代語(yǔ)音學(xué)學(xué)術(shù)會(huì)議論文集, 2003年10月1日, 天津,中國(guó).[出版地不詳: 出版者不詳], 2003: 1-4.WANG T Q, LI A J.The design of the continuous Chinese speech recognition corpus[C]//The Sixth National Conference on Modern Phonetics Learning, Oct 1, 2003, Tianjin, China.[S.l.:s.n.], 2003: 1-4.

[17]CHAKROBORTY S, ROY A, SAHA G.Improved closed set ttext-independent speaker identification by combining MFCC with evidence from flipped filter banks[J].International Journal of Signal Processing, 2007, 4(2): 114-122.

猜你喜歡
特征設(shè)備實(shí)驗(yàn)
記一次有趣的實(shí)驗(yàn)
諧響應(yīng)分析在設(shè)備減振中的應(yīng)用
如何表達(dá)“特征”
做個(gè)怪怪長(zhǎng)實(shí)驗(yàn)
不忠誠(chéng)的四個(gè)特征
基于MPU6050簡(jiǎn)單控制設(shè)備
電子制作(2018年11期)2018-08-04 03:26:08
抓住特征巧觀察
NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
實(shí)踐十號(hào)上的19項(xiàng)實(shí)驗(yàn)
太空探索(2016年5期)2016-07-12 15:17:55
500kV輸變電設(shè)備運(yùn)行維護(hù)探討
主站蜘蛛池模板: 国产精品视频第一专区| 重口调教一区二区视频| 中文字幕波多野不卡一区| 国产欧美在线| 成人噜噜噜视频在线观看| 99精品视频在线观看免费播放| 国产午夜精品一区二区三区软件| 国产日韩欧美精品区性色| 成人免费一级片| 午夜a级毛片| AV在线天堂进入| 五月天久久综合国产一区二区| 强乱中文字幕在线播放不卡| 国产菊爆视频在线观看| 欧美a在线| av午夜福利一片免费看| 黄色在线网| 99久久亚洲综合精品TS| 九一九色国产| 欧美激情,国产精品| 亚洲an第二区国产精品| 欧美亚洲激情| 亚洲精品视频网| 人人91人人澡人人妻人人爽 | 亚洲va在线∨a天堂va欧美va| 婷婷久久综合九色综合88| 国产亚洲精| 国产尤物jk自慰制服喷水| 在线观看亚洲国产| 亚洲精品成人7777在线观看| 制服丝袜一区二区三区在线| 99久久精品免费观看国产| 亚洲第一成年免费网站| 亚洲国产精品一区二区第一页免| 狠狠色噜噜狠狠狠狠色综合久| 国产男女免费视频| 极品国产一区二区三区| 国内精品伊人久久久久7777人| 亚洲 欧美 偷自乱 图片| 中文字幕首页系列人妻| 国产一级视频久久| 亚洲国产看片基地久久1024| 国产老女人精品免费视频| 国产真实乱了在线播放| 国产剧情伊人| 国产精品美人久久久久久AV| 亚洲精品777| 亚洲欧洲一区二区三区| 免费播放毛片| 国产成人精品一区二区三区| 亚洲精品人成网线在线| 噜噜噜综合亚洲| 性欧美在线| www.youjizz.com久久| 国内自拍久第一页| 国产麻豆精品久久一二三| 久久婷婷色综合老司机| 超清无码一区二区三区| 亚洲精品你懂的| 欧美不卡视频在线| 国产一级妓女av网站| aⅴ免费在线观看| 综1合AV在线播放| 欧美一区精品| 精品国产电影久久九九| 国产精品无码久久久久久| 亚州AV秘 一区二区三区| 日韩欧美中文在线| 人妻21p大胆| 在线观看国产精品日本不卡网| 一级毛片免费高清视频| 国产手机在线ΑⅤ片无码观看| 亚洲天堂网2014| 91久久性奴调教国产免费| 国产免费精彩视频| 欧美成人精品一区二区| 亚洲AⅤ无码国产精品| 欧美天堂在线| av尤物免费在线观看| 亚洲精品在线影院| 成·人免费午夜无码视频在线观看| 国产成人精品免费视频大全五级|