999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進C0復雜度和MFCC相似度的端點檢測

2015-05-29 12:19:32許昊張二華
現代電子技術 2015年10期

許昊 張二華

摘 要: 為了提高語音端點檢測的準確率,提出一種基于改進C0復雜度和MFCC相似度相結合的端點檢測算法。首先,計算每一幀語音信號的C0復雜度以及MFCC相似度。然后,結合C0復雜度與MFCC相似度作為新的特征參數,設置閾值進行端點檢測。對信噪比在-15~15 dB范圍內的含噪語音進行端點檢測,使用Matlab軟件進行仿真實驗。實驗結果表明,該方法相對于單獨的兩種方法提高了檢測率,且穩定性更強。

關鍵詞: 音信號處理; C0復雜度; MFCC相似度; 端點檢測

中圖分類號: TN912?34 文獻標識碼: A 文章編號: 1004?373X(2015)10?0007?03

0 引 言

端點檢測算法在語音信號處理領域有著十分重要的意義[1]。對語音信號進行準確的端點檢測既是提高語音識別準確率的重要環節,也是提升語音編碼效率的關鍵。傳統的端點檢測算法常采用短時能量、短時過零率和自相關最大值等方法,這些方法在低噪聲環境下均能取得比較好的結果,但在高噪聲環境下性能則下降明顯。后來又出現了許多新的方法,如基于譜熵的端點檢測[2]、基于LPCC(線性預測倒譜系數)的端點檢測[3]、基于時頻方差的端點檢測[4]等方法。這些方法確實提高了在低信噪比環境下的語音檢測率,然而它們仍有不小的改進空間。由于MFCC(Mel頻率倒譜系數)較好地反映了人耳的聽覺特性,而C0復雜度[5]較好地體現了語音信號的非線性特性,且基于二者的端點檢測方法均被證明具有良好的檢測效果。本文提出一種新的特征MFCC_C0,并將兩種特征進行綜合,該方法在不同信噪比環境下均取得良好的效果,較單獨使用其中一種特征更具優勢。

1 算法描述

1.1 改進的C0復雜度

復雜度是作用于時間序列的一種指標,主要是將信號分解成規則成分和不規則成分兩部分,通過計算其不規則部分所占的相對比例來反應信號的復雜度特性,就是C0復雜度描述的基礎[6]。改進的C0復雜度,引入了參數r,表征超過頻譜均方值r倍,它更好地反應了時間序列的隨機性。語音信號的C0復雜度計算步驟如下:

(1) 對語音信號進行預加重、分幀、加窗處理,得到[fx]。其中預加重系數α=0.937 5,幀移為幀長的一半,使用Hamming窗。

(2) 計算語音信號的頻譜:

[Fk=x=0N-1fxexp-j2πkxN, x=0,1,2,…,N-1] (1)

式中:[Fk]是[fx]的離散傅里葉變換;[x]是時域變量;[k]是頻域變量;[j=-1]。

(3) 計算語音信號頻譜均方值:

[Fk=1Nk=0N-1Fk2] (2)

(4) 引入參數r(r為大于等于1的常數),保留大于頻譜均方值r倍的頻譜,將其余部分置零,大于閾值的部分認為是語音信號中的規則成分,小于閾值的部分認為是語音信號中的隨機成分,即:

[Fk=Fk,Fk2≥rFk0,Fk2

(5) 對[Fk]做傅里葉逆變換:

[fx=1Nk=0N-1Fkexpj2πkxN, x=0,1,2,…,N-1] (4)

(6) 語音信號的改進C0復雜度定義如下:

[C0r=x=0N-1fx-fx2x=0N-1fx2] (5)

當r=1時,[C0r]就是原C0復雜度的定義。本文中取r=8。改進后的C0復雜度比原來C0復雜度更可靠[7]。

1.2 MFCC相似度

MFCC(Mel頻率倒譜系數)從人耳的聽覺出發,與基于實際頻率倒譜的分析不同。人耳感受到的聲音頻率與聲音的實際頻率成非線性關系,而Mel頻率尺度[8]則是根據人耳的聽覺特性設計的。臨界頻率帶寬隨著頻率的變化而變化[9],并與Mel頻率的增長相一致。當頻率低于1 000 Hz時,臨界頻率帶寬大約為100 Hz;當中心頻率高于1 000 Hz時,臨界頻率帶寬呈對數增長。類似于臨界頻帶的劃分,可以使用帶通濾波器組來模擬人耳對不同頻率語音信號的處理。MFCC相似度[2]的計算步驟如下:

(1) 計算語音信號的頻譜[Fk],由式(1)可得。

(2) 根據式(6)將實際頻率映射到Mel頻率上:

[Melf=2595lg1+f700] (6)

式中參數[f]表示實際頻率,單位為Hz。

(3) 設置L個三角濾波器,濾波器的個數由信號的截止頻率決定(本文取L=24)。在Mel頻率尺度上,每個濾波器的中心頻率間隔相等。設[ol]、[cl]、[hl]分別是第[l]個三角濾波器的下限、中心和上限頻率,由于相鄰濾波器組有重疊,它們的關系如下[9]:

[cl=hl-1=ol+1] (7)

(4) 計算每個濾波器的輸出:

[ml=k=olhlWlkFk, l=1,2,…,L] (8)

式中三角濾波器[Wlk]可表示為:

[Wlk=k-olcl-ol ,ol≤k≤clhl-khl-cl ,cl≤k≤hl] (9)

(5) 對濾波器輸出取對數,并做離散余弦變換可得MFCC參數:

[cMFCCi=2Nl=1Llgmlcosl-12iπL] (10)

(6) 假設當前語音信號的前10幀為背景噪聲,取這幾幀信號的MFCC 參數均值作為背景噪聲MFCC參數的估計值。同時為了使背景噪聲估計值實時反映語音信號的實際背景噪聲情況,提出背景噪聲的MFCC參數更新公式[8]:

[Cnoise=pC+1-pCi] (11)

式中:[C]為語音信號前10幀MFCC參數的均值;p為加權因子;[Ci]表示當前幀的MFCC參數。若當前幀被判斷為噪聲幀,則使用當前幀的MFCC參數[Ci]來更新背景噪聲參數[Cnoise。]

(7) 相似度是用來衡量兩個對象之間相似程度的,求取相似度的方法有很多,如明氏距離、夾角余弦距離、相似性函數法等。本文選用相關系數距離法,來衡量兩個特征向量(當前語音幀的MFCC參數[Ci]與噪聲幀的MFCC參數[Cnoise])之間的相似度。[di=1-x-xy-yx-xx-x′12y-yy-y′12] (12)

式中:[x=j=1nxj];[y=j=1nyj]。

1.3 兩種特征聯合檢測

C0復雜度表示信號中隨機運動所占的份額,而噪聲的隨機運動程度遠高于語音的隨機運動程度。MFCC特征參數模擬了人耳的聽覺機制,具有較強的抗噪能力。這兩種特征相關性較低,本文通過對兩種特征分別歸一化后進行綜合加權構建一個新特征MFCC_C0,在此基礎上設置閾值進行端點檢測。當信噪比高于5 dB時,C0復雜度檢測率高于MFCC 相似度算法,此時給予C0復雜度特征更高的權重,反之,則給予MFCC 相似度特征更高的權重。

新特征MFCC_C0定義如下[10]:

[MFCC_C0i=C0_normi+9d_normi,SNR<5 dB9+SNR-55C0_normi+d_normi,SNR≥5 dB] (13)

式中:SNR為信噪比;[C0_normi]為C0的歸一化表示,[d_normi]為[di]的歸一化表示。

2 實驗結果與分析

實驗采用一段新聞聯播的語音信號作為純凈語音。并使用Cool Edit Pro軟件對其重新編輯,只保存單聲道,16 kHz采樣率和16 b量化處理。選用NOISEX?92噪聲庫中的白噪聲,合成不同信噪比的帶噪語音。為了驗證本文提出方法較先前兩種方法有所改進,將三種端點檢測方法的檢測效果顯示在同一幅圖中,進行直觀的比較。本文使用Matlab軟件進行實驗,結果見圖1,圖2。

圖1 信噪比為-10 dB時的三種方法的檢測結果

圖2 信噪比為10 dB時的三種方法的檢測結果

圖1、圖2中,每張圖均由(a)~(e)五個子圖構成[10],其中:(a)為純凈語音;(b)為帶噪語音;(c)為MFCC相似度的檢測結果;(d)為C0復雜度算法的檢測結果;(e)為C0復雜度與MFCC相似度相結合算法的檢測結果。每個子圖中的紅色線條表示一段語音的開始和結束。其中,圖(a)、(b)是由人耳辨別,并在曲線上標示出語音段的起始位置。圖(a)被劃分為10小段語音。圖(c)~圖(e)是由三種端點檢測算法自動檢測出的結果。

圖1給出在信噪比-10 dB下,三種算法的檢測效果。從圖(c)可以看出,MFCC相似度算法檢測出大部分語音段,但未檢測出第6段語音,且未能將第7,8段語音分開,及未能檢測出第9段語音;而從圖(d)可以看出,C0復雜度僅檢測出4段語音,存在大量誤判,且語音段與非語音段區分度很低;從圖(e)可以看出,本文提出的方法檢測效果接近MFCC相似度,好于C0復雜度的檢測結果。

圖2給出了在信噪比為10 dB下,三種算法的檢測效果。從圖(c)可以看出,MFCC相似度檢測出了絕大多數的語音段,包括第6段語音,然而第7,8段語音仍然未能被很好地分離,且未能區分第9,10段語音;而從圖(d)可以看出,C0復雜度檢測出了所有的語音,且區分性非常明顯;從圖(e)可以看出,本文提出的方法檢測效果接近C0復雜度,好于MFCC相似度。

為進一步檢驗本文所提的算法的正確率,對三種端點檢測算法的正確率進行計算并統計。表1是信噪比范圍在-15~15 dB下,三種端點的檢測效果。端點檢測的正確率可由式(14)得出:

[正確率=判斷正確的幀數語音的總幀數×100%] (14)

表1 MFCC相似度、C0復雜度及本文算法端點檢測正確率比照表

由表1可以看出,在-15~15 dB之間,與C0復雜度及MFCC相似度算法相比,改進算法綜合了兩者的優點,取兩者的較高值,且表現穩定。當信噪比低于0 dB時,C0復雜度的誤判逐漸增多,MFCC 相似度檢測的正確率較高,此時改進算法更接近MFCC相似度的檢測效果。當信噪比高于5 dB時,改進算法與C0復雜度算法性能接近,端點檢測的正確度要高于MFCC相似度算法。

3 結 語

本文提出了一種基于C0復雜度與MFCC 相似度的端點檢測算法。 MFCC參數很好地描述了人耳的聽覺機制,能夠很好地區分語音和噪聲,其具有較強的穩定性以及抗噪性。然而基于MFCC相似度的端點檢測算法準確率并不高,特別是當信噪比提高后未有顯著提升。而基于C0復雜度的端點檢測算法在高信噪比的情況下具有較高的檢驗率。MFCC相似度與C0復雜度兩種特征的結合,彌補了它們單一使用時的不足,提高了語音的檢測率及算法的穩定性。實驗結果表明,該算法性能良好,在多種信噪比下均有良好的表現。

參考文獻

[1] 朱曉晶,侯旭初,崔慧娟,等.基于LPCC和能量熵的端點檢測[J].電訊技術,2010,50(6):41?45.

[2] 劉榮,劉珩.低信噪比下基于功率譜上的語音端點檢測算法[J].計算機工程與應用,2009,45(33):122?124.

[3] 李玉萍,樸春俊,韓永成.一種帶噪語音信號端點檢測方法研究[J].電子測試,2008(2):14?17.

[4] 馬靜霞.帶噪語音端點檢測方法的研究[D].秦皇島:燕山大學,2007.

[5] 范影樂,武傳燕,李軼,等.基于C0復雜度的語音端點檢測技術研究[J].傳感技術學報,2006,19(3):750?753.

[6] 王綱金,趙歡,胡煉.基于小波變換C0復雜度的語音端點檢測方法[J].計算機工程與應用,2010,46(29):134?136.

[7] 蔡志杰,孫潔.改進的C0復雜度及其應用[J].復旦學報:自然科學版,2008,47(6):791?796.

[8] 王宏志,徐玉超,李美靜.基于Mel頻率倒譜參數相似度的語音端點檢測算法[J].吉林大學學報:工學版,2012,42(5):1331?1335.

[9] 趙力.語音信號處理[M].北京:機械工業出版社,2009.

[10] 鄧瑞,肖純智,高勇.基于MFCC相似度和譜熵的端點檢測算法[J].現代電子技術,2013,36(21):67?69.

主站蜘蛛池模板: 1769国产精品视频免费观看| 亚洲av日韩av制服丝袜| 欧美视频在线不卡| 黄色网址免费在线| 日本黄网在线观看| 久久久久久午夜精品| 国产香蕉97碰碰视频VA碰碰看| 日本一本在线视频| 无码免费视频| 久久人妻xunleige无码| 亚洲国产成熟视频在线多多| av一区二区无码在线| 国产情侣一区二区三区| 91色在线视频| 亚洲女同一区二区| 天天视频在线91频| 国产成人高清亚洲一区久久| 国产成人免费视频精品一区二区| 找国产毛片看| 久久综合丝袜日本网| 亚洲精品午夜天堂网页| 亚洲成网站| 国产一级二级三级毛片| 久久一色本道亚洲| 91成人试看福利体验区| 日本爱爱精品一区二区| 国产高清免费午夜在线视频| 伊人色综合久久天天| 欧美在线综合视频| 高清国产va日韩亚洲免费午夜电影| 一本久道久综合久久鬼色| 国产成人精品综合| 亚洲天堂久久新| 一级毛片免费观看久| 国产国产人免费视频成18| 无码aaa视频| 国产视频只有无码精品| 久热中文字幕在线观看| 国产主播福利在线观看| 九九线精品视频在线观看| 影音先锋丝袜制服| 天天色天天综合网| 欧美国产在线一区| 色悠久久综合| 中文字幕自拍偷拍| 她的性爱视频| 97国产精品视频自在拍| 亚洲一区二区三区国产精品| 99精品免费在线| AV天堂资源福利在线观看| 久久黄色毛片| 黄色不卡视频| 国产综合日韩另类一区二区| 国产精品人莉莉成在线播放| 亚洲精品国产成人7777| 精品久久高清| 日韩欧美网址| 精品国产自| 亚州AV秘 一区二区三区| 四虎永久免费地址| 国产无遮挡裸体免费视频| 午夜综合网| 日本亚洲最大的色成网站www| 日韩毛片在线播放| 91热爆在线| 一级毛片免费不卡在线| 人妻无码中文字幕第一区| 亚洲国产精品一区二区高清无码久久| 午夜a视频| 丁香婷婷激情综合激情| 久久精品国产国语对白| 亚洲国产精品不卡在线| 欧美一区二区人人喊爽| 国产欧美视频综合二区| 免费a级毛片视频| A级毛片无码久久精品免费| 国产欧美视频综合二区| 五月婷婷激情四射| 欧美成人免费午夜全| 美女潮喷出白浆在线观看视频| 亚洲综合色吧| 精品福利视频网|