999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于對數能量倒譜特征的端點檢測算法

2014-07-07 03:38:45王民孫廣沈利榮劉利
計算機工程與應用 2014年16期
關鍵詞:特征信號檢測

王民,孫廣,沈利榮,劉利

1.西安建筑科技大學信息與控制工程學院,西安 710055

2.西安石油大學光電油氣測井與檢測教育部重點實驗室,西安 710065

基于對數能量倒譜特征的端點檢測算法

王民1,孫廣1,沈利榮2,劉利1

1.西安建筑科技大學信息與控制工程學院,西安 710055

2.西安石油大學光電油氣測井與檢測教育部重點實驗室,西安 710065

端點檢測技術是語音識別的關鍵技術之一,為了克服傳統倒譜距離語音端點檢測算法在低信噪比下檢測效果的不理想,將對數能量(LE)特征和倒譜(C)特征相結合,提出了一種新的對數能量倒譜特征(LEC),采用模糊C均值聚類和貝葉斯信息準則(BIC)方法估計特征門限,得出了正確的語音端點判斷,在三種典型噪聲下,對信噪比從-5 dB到15 dB的帶噪聲語音進行仿真,結果表明LEC法的檢測錯誤率僅為20.25%,明顯低于倒譜法和對數能量法,能有效地確定語音的端點并改善語音識別效果。

對數能量;倒譜距離;模糊C均值聚類;貝葉斯信息準則(BIC);端點檢測

1 引言

目前語音識別與說話人識別的研究中,語音端點檢測的準確率在很大程度上決定著整個系統的識別率。端點檢測的傳統方法是采用語音信號的時域特征,短時能量和短時過零率作為特征參數[1],該方法在高信噪比時具有很好的檢測效果,而在低信噪比時檢測效果則非常不理想。近年來提出了很多優化改進的方法,如基于倒譜距離[2]、譜熵法[3]、對數能量[4],神經網絡法[5]等,檢測效果上得到了很大的改善,然而上述算法也比較容易受噪聲影響,因此,在實際環境應用中體現不出好的推廣前景。

文獻[4]提出了對數能量法,與傳統的線性能量相比,不會出現對數能量特征中噪聲段特征值過大的問題,能較好地區分語音信號中不同的部分。基于文獻[4]通過倒譜與對數能量相結合,提出對數能量倒譜(LEC)法,門限估計采用模糊C均值聚類和貝葉斯信息準則,該方法有好的魯棒性。實驗證明,在低信噪比噪聲環境中,這種LEC法相比對數能量法和倒譜法,能取得更好的檢測效果。

2 基于對數能量倒譜特征的端點檢測算法

2.1 倒譜距離的定義

假定輸入信號s(n),其倒譜變換是c(n)。其中一種信號倒譜的定義是將信號s(n)的倒譜c(n)看作是lgS(w)的傅里葉級數展開[6],即:

其中,c(n)是倒譜系數,且c(n)=c(-n)是實數。根據帕斯維爾定理,無限階倒譜的系數可以用p階倒譜的系數來近似,可以近似如下[2]:

信號和本身的倒譜是一一對應的變換,倒譜距離能作為在端點檢測中的一個判決參數,屬于相似距離范疇。

2.2 對數能量倒譜特征

在語言端點判定方法中,一種好的能量特征應該對不同幅度的語音信號都具有好的區分性。也就是說,既不能使幅度相對較大的語音表征為靜音或噪聲,也不能使幅度小的噪聲表征成語音。在此,本文應用一種對數能量[4]特征LEi,其計算的表達式為:

式中,E(i)為i幀信號的短時線性能量,a為常數,實驗結果測得當a=5×105時效果最好。首先,對LE和C分別依次進行平移和調整,再做相乘運算,將其結果記為P(i),計算公式為:

其中AveLE和AveC分別為前10幀對應的對數能量和倒譜距離的特征平均值。

然后,可得LEC的計算公式為:

其中a取9.5的經驗值。

倒譜特征和對數能量倒譜特征的比較,可以發現倒譜特征不能準確地使語音和噪聲明顯地區分開來,特別是語音樣本在開始的階段,噪聲也被表征出語音特征。而LE卻具有良好的平滑性和區分性,計算LEC的算法框圖如圖1。

圖1 對數能量倒譜特征框圖

3 門限估計和端點檢測

3.1 模糊聚類C均值[7]

模糊C均值算法如下:

(1)設要聚成C個類,由人決定C的個數。

(2)在第C次迭代中,樣本數據的隸屬度用如下方法計算:

i=1,2,…,n,j=1,2,…,c。ml(l=1,2,…,c)為每個聚類的中心,μj(xi)是第i個樣本對于第j類的隸屬度函數。

(3)用由(2)得到的當前的隸屬度函數更新計算各聚類中心。

(4)當其隸屬度不再變化時,則終止。否則返回到(2)。

3.2 貝葉斯信息準則(BIC)

貝葉斯信息準則(Bayesian Information Criterion,BIC)可以用來判定語音端點檢測過程中的門限值[8]。BIC模型定義如式(9):

其中X={xi|i=1,2,…,N}為數據的特征集;Φ={φj|j=1,2,…,K}為模型參數;lg(X,φ)是數據X和模型參數φ的似然函數;nφ是模型參數φ的個數;N是X中數據的個數;λp是其懲罰因子。

由BIC可知,最大化BIC值即為最優模型個數。假設語音片段和背景噪聲均服從高斯分布N(μi,∑i)模型,其中μi為均值向量,∑i為協方差矩陣,則可以通過式(10)得到聚類數為C時的BIC值:

其中N是總數據個數;Ni為第i個聚類中數據的個數;d為特征空間的維數。

對于黏膜型雞痘,則需要用消毒后的鑷子對病雞咽喉處的假膜進行剝離,之后施用1%高錳酸鉀溶液對患處進行清洗,最后涂抹魚肝油。對于結膜炎的病雞,可以通過雙氧水進行消毒,采用抗生素眼藥水來進行對癥治療。在發現雞群中出現雞痘的情況下,應及時采用雞痘疫苗的五倍劑量進行刺種,并且每天對雞以及雞舍進行消毒。如果發病雞較多,可以通過抗病毒以及抗菌消炎的中西藥進行治療,防治發生感染。

對于端點檢測,可設定初始聚類個數C=2,最優聚類數Cbest可以通過以下進行判決:

3.3 端點檢測

本文利用模糊C均值聚類和BIC算法對LEC的門限值進行估計,并完成語音端點檢測,其算法步驟為:

(1)通過式(6)計算信號每一幀的LEC特征。

(2)利用模糊C聚類算法對LEC特征分別進行聚類數目是C=1和C=2時的模糊聚類。

(3)通過式(11)決定最優聚類數Cbest的值。

(4)若Cbest=1,通過第二步得其聚類中心為m11,則LEC特征門限的計算公式為:

此時,LEC特征門限的計算公式為:

其中γhigh,γlow是經驗常數。

(5)由以上步驟得到LEC特征雙門限值進行端點檢測。雙門限端點檢測法見文獻[1]。

4 實驗結果分析

實驗測試語音采用TIM IT標準語音庫中的30條連續語音,16 kHz采樣頻率,16 bit量化,單聲道wav語音格式,采用白噪聲,分別生成-5 dB,5 dB,15 dB的帶噪語音,最后利用NOISEX 92標準噪聲庫中的babble噪聲和pink噪聲,以及實際環境中的噪聲分別進行了語音檢測分析。

由于語音信號在一定時間內具有短時平穩性,本文取幀長為12 ms(每幀包含256個采樣點),幀移為8 m s(每幀包含128個采樣點),FFT點數為256,門限估計參數為:

實驗比較對象為文獻[4]的對數能量法,首先載入一段干凈的語音信號,如圖2,分別用兩種參數對語音信號進行分析,用對數能量檢測的結果如圖3,用對數能量倒譜特征的檢測結果如圖4。

圖3 語音信號的檢測結果

圖4 語音信號的檢測結果

圖2 原始語音

通常在連續的語音條件差下,不能完全地檢測出端點,因為會有輔音的漏檢和噪音的誤檢造成干擾,因此給出如下式(17)~(19)的評價標準。

其中leak_num,false_num和F_num分別表示語音被誤檢是噪聲的幀數,噪聲被誤檢是語音的幀數和總的語音幀數,圖4給出的是本文方法在SNR=15 dB的端點檢測。

為了進一步檢測本文方法的魯棒性,分別對語音信號進行了pink噪聲分析,如圖5,babble噪聲分析,如圖6。本文為了模擬實際環境中的噪聲,用采集到的一段道路十字路口的噪聲,進行實際噪聲下的魯棒性分析,如圖7。

由圖3中的(b)和(c)圖可以看出,在SNR=15 dB時,LE法也可以檢測出語音的起止點位置,但LE法的漏檢率要比LEC法要高,說明LEC法具有更好的語音特征,能正確地區分語音和噪聲。

圖5和圖6中可以得出,本文方法分別在pink噪聲和babble噪聲的干擾下,也顯示出了較高的準確率。在實際噪聲下,如圖7所示,檢測結果在第一個音的截止點處,有略微的下降,因為道路上會有一定的突然噪聲,但整體的檢測率依然比較準確,因此可以說明,在不同噪聲情況下,LEC法有著很好的魯棒性。

同時由表1可知,LEC法在SNR=-5 dB時的總誤檢率僅為20.25%,在信噪比為0~10 dB時,總的錯誤檢測率要明顯低于LE法,并且在pink、babble噪聲條件下,有著良好的抗噪性。

表1 不同信噪比下不同方法的實驗結果

由上述的分析,可以得出結論,在低信噪比條件,LEC法具有更好的檢測性和穩健性。

5 結論

圖5 語音信號的檢測結果

圖6 語音信號的檢測結果

本文把對數能量和倒譜相結合,提出一種新的對數能量倒譜特征,利用模糊聚類C均值算法和貝葉斯信息判決算法進行門限估計,采用雙門限法進行語音端點檢

圖7 語音信號的檢測結果

測。實驗結果表明,與對數能量法比,在連續語音下,其檢測錯誤率明顯要低,并能夠準確地檢測出語音的端點,在不同噪聲環境中表現出了很好的穩健性,特別在低信噪比下,具有更好的檢測性能。這主要是對數能量倒譜結合了對數能量和倒譜各自的優點,同時克服了一定各自的缺點,從而具有更優的檢測性能。這說明多特征相結合的端點檢測方法是以后研究的熱門方法。

[1]Shin J W,Kwon H J,Jin S H,et al.Voice activity detection based on conditional MAP criterion[J].IEEE Signal Processing Letters,2008,15:257-260.

[2]張志敏,郭英,王博.一種基于倒譜特征的語音端點檢測改進算法[J].電聲技術,2006(4):39-42.

[3]趙歡,王綱金,趙麗霞.一種新的對數能量譜熵語音端點檢測方法[J].湖南大學學報:自然科學版,2010(7):72-77.

[4]肖述才,王作英.端點檢測中的一種新的對數能量特征[J].電聲技術,2004(6):37-41.

[5]江銘虎,袁保宗,林碧琴.神經網絡語音識別的研究及進展[J].電信科學,1997(7):1-5.

[6]Haigh J A.Robust voice activity detection using cepstral features[C]//Computer,Communication,Control and Power Engineering,Proceedings of the IEEE Region 10 Conference TENCON,1993,3(3):321-324.

[7]Tian Y.Fuzzy clustering and bayesian information criterion based threshold estimation for robust voice activity detection[C]//IEEE International Conference on Acoustics,Speech and Signal Processing Proceedings(ICASSP). Hong Kong,China:IEEE,2003(1):444-447.

[8]Chen S S.Clustering via the Bayesian information criterion with applications in voice recognition[C]//IEEE International Conference on Acoustics Speech and Signal Processing Proceedings(ICASSP).Munich,Germany:IEEE,1998(I):645-648.

WANG M in1,SUN Guang1,SHEN Lirong2,LIU Li1

1.School of Information and Control Engineering,Xi’an University of Architecture and Technology,Xi’an 710055,China
2.Key Laboratory of Photoelectric Logging and Detecting of Oil and Gas,Ministry of Education,Xi’an Shiyou University, Xi’an 710065,China

Endpoint detection is one of the key technologies of speech recognition,in order to overcome the undesirable detection results of traditional cepstrum distance in speech endpoint detection algorithm under low signal to noise ratio, combined logarithm ic energy feature(LE)with cepstrum features(C)for endpoint detection,proposes a new logarithmic energy cepstrum features(LEC),uses fuzzy C-means clustering and Bayesian information criterion to estimate features threshold,achieves better endpoint judgment,conducts the SNR simulation from-5 dB to 15 dB with noisy speech under three kinds of typical noise.The results indicate that the LEC method’detection error rates is just 20.25%and significantly lower than cepstrum and logarithmic energy method,it also can effectively determine the speech endpoint and improve voice recognition results.

logarithmic energy;cepstrum distance;Fuzzy C-means clustering;Bayesian Information Criterions(BIC); Endpoint detection

A

TP3

10.3778/j.issn.1002-8331.1209-0255

WANG M in,SUN Guang,SHEN Lirong,et al.Voice activity detection using logarithmic energy and cepstrum Distance.Computer Engineering and Applications,2014,50(16):198-201.

國家自然科學基金(No.61073196)。

王民(1959—),男,副教授,主要從事智能信息處理研究,主研方向為智能信息處理;孫廣(1986—),男,碩士研究生,主研方向為語音信號處理;沈利榮(1987—),女,碩士研究生,主要從事測井信號檢測研究。E-mail:sunguang216@163.com

2012-09-23

2012-11-26

1002-8331(2014)16-0198-04

猜你喜歡
特征信號檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
基于FPGA的多功能信號發生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
抓住特征巧觀察
小波變換在PCB缺陷檢測中的應用
主站蜘蛛池模板: 九九九久久国产精品| 毛片基地美国正在播放亚洲| 97精品伊人久久大香线蕉| 99热这里只有精品久久免费| 露脸真实国语乱在线观看| 亚洲婷婷六月| 色呦呦手机在线精品| 亚洲色图欧美一区| www.youjizz.com久久| 亚洲一区二区约美女探花| 精品91自产拍在线| 中文字幕日韩久久综合影院| 亚洲国产成人在线| 国产成人高清精品免费软件| 四虎成人在线视频| 国产精品亚洲片在线va| 欧美日韩一区二区在线免费观看| 青青青视频蜜桃一区二区| 国产区在线看| 免费不卡视频| 国产一区二区三区日韩精品| 噜噜噜久久| 国产成人精品亚洲77美色| 国产农村1级毛片| 成人午夜视频网站| 久久综合亚洲鲁鲁九月天| 国产精品无码作爱| 欧美一级夜夜爽| 91久久精品国产| 欧美综合中文字幕久久| 91久久精品国产| 欧美成人午夜在线全部免费| 视频一本大道香蕉久在线播放| 国产福利一区视频| 欧美一区二区三区国产精品| 亚洲成A人V欧美综合天堂| 亚洲成a人片| 9966国产精品视频| 亚洲成人网在线观看| 国产无码精品在线| 国产69精品久久久久孕妇大杂乱 | 亚洲男人的天堂久久香蕉| 亚洲日本韩在线观看| 国产成人超碰无码| 亚洲午夜福利在线| 亚洲日韩精品欧美中文字幕 | 精品乱码久久久久久久| 日韩精品一区二区三区免费在线观看| 美女被躁出白浆视频播放| swag国产精品| 亚洲欧美自拍一区| 一本综合久久| 国产精品一区在线麻豆| 自拍偷拍欧美日韩| 2024av在线无码中文最新| 日本欧美一二三区色视频| 中文纯内无码H| 国产欧美另类| 国产成人精品亚洲77美色| 国产乱子精品一区二区在线观看| 99人妻碰碰碰久久久久禁片| 成色7777精品在线| 欧美日韩一区二区三区四区在线观看| 亚洲中文在线视频| 人人澡人人爽欧美一区| 丁香五月婷婷激情基地| 尤物午夜福利视频| 无码一区18禁| 天堂在线亚洲| 精品福利国产| 男女男精品视频| 国产精品三区四区| 久久人与动人物A级毛片| 国产午夜人做人免费视频中文| 久久久噜噜噜| 国产精品久久久久久久久kt| 1769国产精品视频免费观看| 午夜小视频在线| 国产福利小视频在线播放观看| 国产精品久久久久鬼色| 亚洲综合婷婷激情| 三级视频中文字幕|