999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

反蓄意模仿說話人識別系統中特征參數提取的研究*

2016-08-01 07:19:09唐宗渤王茂蓉劉繼錦
網絡安全與數據管理 2016年12期

唐宗渤, 周 萍,王茂蓉,劉繼錦

(1.桂林電子科技大學 信息科技學院,廣西 桂林 541004; 2.桂林電子科技大學 電子工程與自動化學院,廣西 桂林 541004)

?

反蓄意模仿說話人識別系統中特征參數提取的研究*

唐宗渤1, 周萍2,王茂蓉2,劉繼錦2

(1.桂林電子科技大學 信息科技學院,廣西 桂林 541004; 2.桂林電子科技大學 電子工程與自動化學院,廣西 桂林 541004)

摘要:當模仿者蓄意模仿說話人的語音且相似度極高時,說話人識別系統就有可能被欺騙。特征參數的提取是說話人識別的關鍵環節,直接影響了系統的識別性能。MFCC是語音識別中最熱門的特征參數之一,但由于其只反映了語音的靜態特性,為了提取更具個人語音特性的特征參數,引入加權MFCC,同時結合離散小波變換得到DWTWC,根據增減分量法,提出了DWI-MFCC。實驗表明,DWI-MFCC倒譜系數比MFCC能更有效地區分語音的相似度。

關鍵詞:特征參數; MFCC; 蓄意模仿; 增減分量法

引用格式:唐宗渤, 周萍,王茂蓉,等. 反蓄意模仿說話人識別系統中特征參數提取的研究[J].微型機與應用,2016,35(12):18-20.

0引言

生物認證技術[1]作為一種身份鑒別技術,它具有安全、方便等優點。但與其他生物特性相比,聲音更容易被模仿,特別在蓄意模仿與目標說話人的語音相似度極高時,就給識別系統的魯棒性帶來嚴峻考驗。有效的聲學特征,可大大提高識別性能。常用的特征參數有基因頻率、線性預測參數LPC、Mel頻率倒譜系數[2]MFCC等。其中MFCC能充分模擬人耳的聽覺感知特性,應用較多。但其只能體現語音的靜態特征,為了提取更具個人特性的參數,本文對MFCC作加權處理,結合離散小波變換引進DWTWC,根據增減分量法,提出DWI-MFCC。實驗表明,DWI-MFCC比傳統MFCC更能區分語音的相似度,提高識別系統的魯棒性。

1特征參數的提取

1.1Mel頻率倒譜系數

MFCC[2]作為模擬人耳特殊感知能力的參數得到研究者的推崇。其實際頻率f與Mel頻率fMel之間的轉換關系如式(1)所示,其中fMel的單位為Mel,f的單位為Hz。MFCC的提取過程如圖1所示,其參數分布示例圖如圖2所示。

(1)

圖1 MFCC參數提取流程圖

圖2 MFCC的參數分布示例圖

由圖2可知,隨著維數的升高,MFCC變化幅度變小,升高到一定程度后,系統識別性不僅沒有提高,反而增加了運算量。

1.2加權Mel頻率倒譜系數

為了得到更具區分性的加權特征參數,本文采用升半正弦函數[3]進行加權,如式(2)所示:

r=0.5+0.5*sin(π*(i-1)/n)

(2)

其中i=1,2,…,n為維數,本文n=24,0.5是靜態分量。為了更準確地體現不同說話人的個性特征差異[4],本文提出另一種加權函數如式(3)所示,得到改進的加權特征參數IWMFCC。

(3)

1.3DWTWC語音特征參數提取

在提取特征參數時,用離散小波變換代替傅里葉變換,用中頻區域分布密集的Mid-Mel濾波器組[5-6]代替原來的濾波器, DWTWC參數的提取步驟如下:首先對語音信號進行預加重、分幀加窗等;接著用離散小波變換[7]對預處理后的信號進行處理,選擇適當的小波基和分解層數對其分解,并計算小波系數;然后利用頻譜的拼接把系數組成一組參數,求其能量;最后取對數,再經過DCT可得到相應的DWTWC。其提取過程如圖3所示。

圖3 DWTWC的提取流程圖

與MFCC提取流程不同的是其前端處理采用離散小波變換[8],Mel濾波器換成了Mid-Mel濾波器組,有效補充了中頻區域的語音信息。

2DWI-MFCC混合特征參數

為了提高識別率,需對MFCC、WMFCC、IMFCC和DWTWC進行融合,用增減分量法[9]對維度進行篩選,將對識別率貢獻最大的n階分量進行組合,得到新的混合特征參數,如式(4)所示:

(4)

其中,n為階數,p(i,j)為從第i到第j階的識別率,R(i)為第i階分量平均貢獻值,若其大于0,則對識別有貢獻,反之則使識別率下降。文中僅順序摒棄或增添特征分量[10]。由式(4)計算出各參數中對識別率貢獻最大的特征分量,對其組合得到新的特征參數,即 DWI-MFCC。

3實驗結果與分析

3.1不同特征參數歐氏距離排名對比

本文從專業配音網站提取語音庫,采樣頻率為8 kHz,量化精度為16 bit。提取16階MFCC,計算被模仿者與模仿者語音的MFCC和DWI-MFCC的歐氏距離,然后對其從小到大排序得到表1。

表1 MFCC和DWI-MFCC的歐氏距離排名

表2 不同的特征參數的錯誤

由表1可得,采用DWI-MFCC的原語音和模仿語音的排名一致性高達87.5%,證明 DWI-MFCC不但有效補充了MFCC在中頻區域的語音信息,而且很好地體現了語音個性特征;而采用MFCC時,排名一致性只有43.75%,這是因為MFCC中只包含了語音的靜態特性。綜上,本文提出的DWI-MFCC對語音模仿的區分能力更強,能更有效區分出原語音和被模仿語音。

3.2不同特征參數實驗結果的對比

為驗證特征參數的語音模仿區分性能,建立基于SVM的蓄意模仿識別系統,首先選取80人模仿語音庫中16位名人的聲音。訓練階段,先提取目標說話人與待測試說話人的特征參數,將其分別記為“+1”類和“-1”類并用以訓練出目標說話人的SVM模型。測試階段,將待測試語音與目標說話人的模型進行匹配,再和預先設定的閾值進行比較。本文選取徑向基函數作為SVM的核函數,懲罰系數為3,核函數參數為0.6。實驗采用16階的MFCC和DWI-MFCC分別作為樣本建立SVM模型,對數據進行[0,1]歸一化,計算出每個被模仿者使用不同特征參數時的錯誤接受率(FA),如表2所示,圖4給出了兩者的錯誤接受率的對比圖。

圖4 采用不同特征參數的錯誤接受率(FA%)對比

從圖4可知,MFCC的錯誤接受率曲線處于DWI-MFCC的曲線上方,即DWI-MFCC參數的錯誤接受率比MFCC參數的低,從而更有力地說明DWI-MFCC的區分性能比MFCC的要好。

4結論

本文通過對MFCC特征參數的分布分析,提出了加權MFCC,同時結合離散小波變換引入了DWTWC,根據增減分量法,提出了DWI-MFCC。從理論和實驗兩個方面對特征參數的有效性進行了分析,同時采用SVM對反蓄意模仿系統進行匹配分析。實驗表明,本文提出的DWI-MFCC相比于傳統的MFCC,對語音模仿的區分能力更強,有更好的識別性能。

參考文獻

[1] 李建文,張晉平.基于改進語音特征提取方法的語音識別[J].微電子學與計算機,2009,26(7):230-233.

[2] 柯晶晶,周萍,景新幸,等.差分和加權Mel倒譜混合參數應用于說話人識別[J].微電子學與計算機,2014,31(9):89-91.

[3] 吳迪,曹潔,王進花.基于自適應高斯混合模型與靜動態聽覺特征融合的說話人識別[J].光學精密工程,2013,21(6):1598-1604.

[4] 陳明義,余伶俐,朱晗,等.基于特征參數融合的語音情感識別方法[J].微電子學與計算機,2006,23(12):168-171.

[5] 田永紅. 一種優化的語音特征參數提取方法仿真[J]. 計算機仿真,2013,30(12):162-165.

[6] 吳麗芳. 語音轉換系統中特征參數的研究[D].南京:南京郵電大學,2013.

[7] 楊陽,毛永毅,鄭敏,等.基于小波變換的AOA定位算法[J].微型機與應用,2014,33(3):47-49,54.

[8] 胡沁春,何怡剛,何靜,等.高斯類小波變換的開關電流頻域法實現[J].電子技術應用,2014,40(1):44-46.

[9] 曹孝玉. 說話人識別中的特征參數提取研究[D].長沙:湖南大學,2012.

[10] 張璇. 基于Fisher準則的說話人識別特征參數提取研究[D].長沙:湖南大學,2013.

*基金項目:國家自然科學基金資助項目(61363005);國家自然科學基金資助項目(61462017);廣西研究生教育創新計劃資助項目(YCSZ2015152)

中圖分類號:TP391.42

文獻標識碼:A

DOI:10.19358/j.issn.1674- 7720.2016.12.007

(收稿日期:2016-02-29)

作者簡介:

唐宗渤(1986-),男,助理工程師,主要研究方向:語音信號處理與智能控制。

周萍(1961-),女,碩士,教授,主要研究方向:語音識別與智能控制研究。

王茂蓉(1990-),女,碩士研究生,主要研究方向:語音識別與反蓄意模仿。

Research of characteristic parameters extraction in speaker recognition system of anti-deliberate imitation

Tang Zongbo1, Zhou Ping2, Wang Maorong2, Liu Jijin2

(1.Department of Information Science and Technology, Guilin University of Electronic Technology, Guilin 541004, China;2.Department of Electric Engineering and Automation, Guilin University of Electronic Technology, Guilin 541004, China)

Abstract:When imitators deliberately imitate the speaker’s voice, and they have high similarity, speaker recognition system may be deceived. The extraction of feature parameters is key in speaker recognition, which directly affects the recognition performance. MFCC is one of the most popular feature parameters, but due to it only reflects static characteristics of voice, we introduce weighted MFCC to extract parameters of more individual voice. In combination with discrete wavelet transform, we introduce the DWTWC. According to increase or decrease in weight method, DWI-MFCC is proposed. The experimental result shows that the DWTWC is better than MFCC in distinguishing speech similarity.

Key words:feature parameter; MFCC; deliberate imitation; method of increasing or decreasing the component

主站蜘蛛池模板: 很黄的网站在线观看| 亚洲国产成人自拍| 五月天香蕉视频国产亚| 日本一区高清| 无码日韩精品91超碰| 中文字幕日韩欧美| 国产电话自拍伊人| 亚洲第一成年网| 久久人妻xunleige无码| 99伊人精品| 制服丝袜一区| 2020亚洲精品无码| 国内精品自在自线视频香蕉| 青草娱乐极品免费视频| 亚洲AV无码不卡无码| 久久婷婷五月综合色一区二区| 久久国产精品影院| 亚洲精品午夜天堂网页| 亚洲欧美日韩综合二区三区| 色综合久久久久8天国| 欧美日韩一区二区三区四区在线观看| 欧美亚洲国产精品第一页| 无码中文字幕精品推荐| 亚洲成人免费看| 国产99在线观看| 中文字幕在线日韩91| 特级精品毛片免费观看| 国产精品久久国产精麻豆99网站| 久久无码高潮喷水| 国产在线观看第二页| 黄色污网站在线观看| 99热这里只有精品免费国产| 69免费在线视频| 国产麻豆精品久久一二三| 国产激情国语对白普通话| 91福利在线观看视频| 久久久久夜色精品波多野结衣| 98精品全国免费观看视频| 久久永久精品免费视频| 欧美激情视频一区二区三区免费| av一区二区人妻无码| 国产毛片高清一级国语| 国产精品分类视频分类一区| 欧美亚洲中文精品三区| 日韩av电影一区二区三区四区| 在线国产你懂的| 99无码中文字幕视频| 亚洲热线99精品视频| 日韩亚洲综合在线| 久久综合色视频| 国产欧美日韩综合一区在线播放| 综合色在线| 欧美另类视频一区二区三区| 国产一级在线观看www色 | 玩两个丰满老熟女久久网| 国产免费久久精品99re丫丫一| 久久精品这里只有精99品| 欧美视频二区| 久久国产精品娇妻素人| 日本少妇又色又爽又高潮| 成年人久久黄色网站| 暴力调教一区二区三区| 91探花国产综合在线精品| 老司机午夜精品网站在线观看| 国产va视频| 国产美女丝袜高潮| AV无码无在线观看免费| 91精品综合| 人妻丰满熟妇av五码区| 高清不卡一区二区三区香蕉| 久久性妇女精品免费| 国产女人在线观看| 中文字幕资源站| 欧美日本视频在线观看| 欧美日韩另类在线| 欧美日韩在线亚洲国产人| 国产区在线看| 制服丝袜一区二区三区在线| 日韩123欧美字幕| 免费99精品国产自在现线| 亚洲欧洲国产成人综合不卡 | 亚洲天堂啪啪|