999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于改進(jìn)信息熵的語音端點(diǎn)檢測方法研究*

2018-07-09 06:44:54宣章健蔡曉霞褚鼎立
通信技術(shù) 2018年6期
關(guān)鍵詞:信號檢測

宣章健,蔡曉霞,褚鼎立

(國防科技大學(xué) 電子對抗學(xué)院,安徽 合肥 230037)

0 引 言

人說話的過程中包含大量停頓。一段連續(xù)的語音信號其實(shí)是由一系列無音片段和有音片段組成的。有音語音段的持續(xù)時(shí)間大約占整個(gè)說話過程時(shí)間的40%[1]。無音片段中背景噪聲是主要成分,而有用信息較少。有音片段中的有用信息較多。

語音端點(diǎn)檢測的目的是從一段包含語音的信號中檢測出語音的起始點(diǎn),區(qū)分噪聲段和語音段。語音端點(diǎn)檢測的作用在于減少對語音信號的處理時(shí)長,減小計(jì)算量,同時(shí)排除噪聲段的影響,提高后續(xù)處理的效率和準(zhǔn)確度。1959年,語音端點(diǎn)檢測的概念由貝爾實(shí)驗(yàn)室最早提出。經(jīng)過近60年的發(fā)展,語音端點(diǎn)檢測領(lǐng)域已經(jīng)產(chǎn)生了數(shù)百種方法[2]。這些方法采用不同的參數(shù),主要有時(shí)頻參數(shù)、倒譜系數(shù)、自相關(guān)參數(shù)和信息熵等,同時(shí)產(chǎn)生了許多將多個(gè)特征參數(shù)結(jié)合的檢測端點(diǎn)的方法。經(jīng)典的語音端點(diǎn)檢測算法如短時(shí)能量,目前常用的語音端點(diǎn)檢測方法則主要有短時(shí)能量法、短時(shí)過零率法、基于短時(shí)能量和短時(shí)過零率的雙門限檢測法等。短時(shí)能量法在信噪比良好的條件下取得了理想效果,但在信噪比環(huán)境惡劣的條件下,算法的檢測性能急劇下降。因此,研究一種計(jì)算簡便、檢測效果好的語音端點(diǎn)檢測方法十分必要。對于一段語音信號,通常包括純噪聲段和帶噪語音段。帶噪語音段又分為清音段和濁音段。經(jīng)典的端點(diǎn)檢測方法在取得成功應(yīng)用的同時(shí),暴露出了抗噪能力較弱、單個(gè)參數(shù)往往無法進(jìn)行準(zhǔn)確判決的缺點(diǎn),需要結(jié)合其他方法同時(shí)進(jìn)行檢測。Shen提出處于低信噪比環(huán)境時(shí)將信息熵用于語音端點(diǎn)檢測,并經(jīng)過實(shí)驗(yàn)取得了理想效果[3]。本文闡述短時(shí)能量處理噪聲、清音和濁音的優(yōu)缺點(diǎn)[4],介紹信息熵[5]的概念,驗(yàn)證信息熵算法檢測語音端點(diǎn)的效果[6-7],并在此基礎(chǔ)上提出了信能比方法,最后通過仿真進(jìn)行驗(yàn)證和分析。

1 短時(shí)能量、信息熵和改進(jìn)算法

1.1 短時(shí)能量

語音信號隨時(shí)間的變化比較緩慢,通常可以認(rèn)為在每10~30 ms的短時(shí)間間隔內(nèi)語音信號的特性基本上固定不變。每個(gè)語音幀的短時(shí)平均能量為:

其中,N為語音采樣點(diǎn)數(shù)。

時(shí)域中,語音信號的幅度隨時(shí)間起伏不定。清音和濁音由于幅度不同,因而得到短時(shí)能量值有較大區(qū)別。濁音段的幅度通常比清音段的幅度大,對應(yīng)短時(shí)能量也大。因此,通常由短時(shí)能量法對濁音和清音進(jìn)行區(qū)分,優(yōu)點(diǎn)是計(jì)算方便,算法復(fù)雜度小,缺點(diǎn)是短時(shí)能量法受信噪比約束較大,在高信噪比條件下端點(diǎn)識別效果非常好,但信噪比較小時(shí),由于語音清音段通常被噪聲掩蓋,該方法已經(jīng)很難區(qū)分噪聲和清音,語音端點(diǎn)識別效果較差。在低信噪比條件下,短時(shí)能量法識別效果如圖1所示。

圖1 短時(shí)能量端點(diǎn)檢測效果

可以看出,當(dāng)信噪比下降時(shí),短時(shí)能量法的檢測效果急劇下降,信噪比為10 dB時(shí)已經(jīng)幾乎無法分辨語音端點(diǎn)。

1.2 信息熵

德國物理學(xué)家克勞修斯于1865年提出了熵的概念。熵最初被應(yīng)用于熱力學(xué)領(lǐng)域,用來評測一個(gè)系統(tǒng)可以達(dá)到的狀態(tài)數(shù)。能達(dá)到的狀態(tài)數(shù)越多,熵越大。信息是對不確定性的消除。在信息論中,熵函數(shù)表示信源的平均信息量。假設(shè)信息源發(fā)出有限個(gè)符號S0,S1,S2,…SN-1,它們組成的輸出序列前后符號之間統(tǒng)計(jì)獨(dú)立;P0,P1,P2,…,PN-1分別為N個(gè)符號出現(xiàn)的概率,則信息熵定義為:

語音信號x(n)經(jīng)加窗分幀處理,得到第i幀信號是xi(m)經(jīng)FFT變換得到第k條譜線頻率的分量fk的能量譜。定義每個(gè)信號頻率分量fk的歸一化譜概率密度函數(shù)為:

其中pi(k)是一幀語音信號中第k個(gè)頻率分量的概率密度,N為FFT長度。

語音幀短時(shí)信息熵定義如下:

利用信息熵可以檢測語音與噪聲。信息熵算法分類的原理是通過檢測語音功率譜的突變情況來檢測語音端點(diǎn)。對于一段語音信號來說,非語音段在各個(gè)頻段區(qū)域內(nèi)的功率譜比較平穩(wěn),從信息量區(qū)分,則認(rèn)為其所含的平均信息量較大,故而信息熵較大;而語音段的功率譜通常集中特定的頻段區(qū)域,幅度值突變大,所含的平均信息量較小,故而信息熵較小。語音段和非語音段可以根據(jù)兩者信息熵分布的不同進(jìn)行劃分。

信息熵是頻域的特征參數(shù),相較于短時(shí)能量具有一定的魯捧性。對語音信號進(jìn)行信息熵分析,如圖2所示。對語音信號加入高斯白噪聲進(jìn)行性能分析,其中信息熵曲線下降沿表示語音起始點(diǎn),上升沿表示語音結(jié)束點(diǎn)。可以看出,信息熵法在低信噪比情況下,具有一定的識別效果,但代表語音段的曲線幅度值較大,實(shí)際判決中可能會造成誤判。

圖2 信息熵端點(diǎn)檢測效果

在信噪比低于5 dB時(shí),信息熵曲線已經(jīng)沒有明顯的上升沿與下降沿,此時(shí)無法利用該算法進(jìn)行準(zhǔn)確的端點(diǎn)識別。

1.3 改進(jìn)算法

為了克服信息熵方法在語音端點(diǎn)檢測過程中抖動較大的缺陷,本文將信息熵算法和短時(shí)能量算法相結(jié)合,得到了一個(gè)新方法,即信能比算法。新特征參數(shù)結(jié)合了原方法在語音時(shí)域和頻域的特點(diǎn):短時(shí)能量從時(shí)域出發(fā),在信噪比較高的情況下,可以根據(jù)短時(shí)能量在語音和噪聲中的不同區(qū)分有音段和無音段;信息熵則從頻域出發(fā),在很多情況下,使用信息熵作為特征參數(shù)比單純使用能量更加可靠,有較強(qiáng)的魯棒性。在噪聲環(huán)境達(dá)不到理想狀態(tài)的情況下,與信息熵算法的檢測效果進(jìn)行比較,新算法結(jié)合原方法在時(shí)域與頻域中的特點(diǎn)可發(fā)揮它們各自的長處,又可以在一定程度上規(guī)避它們各自的缺點(diǎn),增強(qiáng)了算法的檢測性能,從而有效地應(yīng)對各種背景噪聲條件下的端點(diǎn)檢測活動。

信能比特征參數(shù)定義為其中 ()H l表示語音幀信息熵, ()E l表示語音幀短時(shí)能量,l表示第l幀。該算法能夠結(jié)合信息熵算法與短時(shí)能量的優(yōu)點(diǎn),同時(shí)平滑曲線可以增強(qiáng)語音端點(diǎn)檢測的穩(wěn)定性,減小檢測誤差。

2 仿 真

信能比算法仿真流程如下:

(1)取語音信號前20幀計(jì)算噪聲信能比熵HE0。

(2)確定語音端點(diǎn)的判決門限α根據(jù)實(shí)驗(yàn)的具體情況確定。

(3)以幀為單位計(jì)算HE參數(shù),并與門限值進(jìn)行比較。

(4)為防止噪聲造成的干擾,如果連續(xù)5幀語音的參數(shù)值低于門限值,則認(rèn)為這些幀為語音幀。第1幀為語音起始點(diǎn),若連續(xù)5幀語音參數(shù)值值大于門限值,則判定為第1幀為語音結(jié)束幀。

本文語音信號生成使用cooledit錄音軟件。語音信號生成環(huán)境為實(shí)驗(yàn)室無顯著噪聲環(huán)境,語音信號指標(biāo)為16 kHz采樣率,單聲道,16 bit采樣位數(shù)。由于不同的檢測方法對語音信號中的清音與濁音有不同的效果,錄制文本內(nèi)容選元濁音“a”和清音“s”。

語音端點(diǎn)檢測前,首先進(jìn)行語音預(yù)處理。本文預(yù)處理過程為預(yù)加重和分幀加窗。預(yù)加重過程使用一階高通濾波器分幀幀長選取20 ms,分幀方式選擇交叉分幀,幀移為10 ms,窗函數(shù)選擇漢明窗。噪聲采用Noisex 92噪聲庫中的典型噪聲——高斯白噪聲、粉紅噪聲和F16噪聲。在信噪比15 dB、10 dB、5 dB條件下,分別對信息熵算法和信能比算法的語音端點(diǎn)檢測效果進(jìn)行檢驗(yàn),仿真結(jié)果如圖3~圖11所示。

圖3 SNR 15 dB白噪聲

圖4 SNR 10 dB白噪聲

圖5 SNR 5 dB白噪聲

圖6 SNR 15 dB粉紅噪聲

圖7 SNR 10 dB粉紅噪聲

圖8 SNR 5 dB粉紅噪聲

圖9 SNR 15 dB F16噪聲

圖10 SNR 5 dB F16噪聲

圖11 SNR 10 dB F16噪聲

其中,F(xiàn)16噪聲條件下,原信息熵算法已經(jīng)無法根據(jù)端點(diǎn)判決原則用紅線標(biāo)注起始點(diǎn),故未曾標(biāo)注。

由仿真分析可以看出:(1)信能比算法對噪聲的適應(yīng)性更強(qiáng),能夠在高斯白噪聲、粉紅噪聲和F16噪聲條件下準(zhǔn)確檢測語音端點(diǎn);(2)抗干擾性能較好,在15 dB、10 dB、5 dB信噪比條件下,均能檢測到端點(diǎn);(3)穩(wěn)定性更強(qiáng),信能比算法檢測曲線相較信息熵算法更加平滑,噪聲造成的抖動更小,因此具有一定的魯捧性;(4)通過比較語音段檢測曲線的抖動情況可知,在不同噪聲干擾情況下,檢測效果為:白噪聲>粉紅噪聲>F16噪聲。

3 結(jié) 語

低信噪比環(huán)境下的語音端點(diǎn)檢測是語音處理的難點(diǎn),而傳統(tǒng)的信息熵端點(diǎn)檢測具有不穩(wěn)定的缺陷。本文提出了一種新的端點(diǎn)檢測算法,即信能比算法。該算法在端點(diǎn)檢測前進(jìn)行了預(yù)加重和分幀加窗處理,不僅有效利用了短時(shí)能量和信息熵算法的優(yōu)勢,而且能夠適應(yīng)多種噪聲。仿真結(jié)果表明,提出的端點(diǎn)檢測算法在低信噪比環(huán)境下具有端點(diǎn)檢測正確率高、穩(wěn)定性好等優(yōu)點(diǎn),是一種行之有效的方法。實(shí)驗(yàn)表明,該算法在信噪比低于0 dB的條件下,檢測效果大幅下降。下一步研究方向是改善該算法,使之能在信噪比低于0 dB時(shí)準(zhǔn)確檢測語音端點(diǎn)。

[1] 鄭雪帆,劉春,陸誠等.AMR語音編碼算法研究及復(fù)雜度剖析[J].電訊技術(shù),2003,43(10):92-96.ZHENG Xue-fan,LIU Chun,LU Cheng,et al.Research on AMR Speech Coding Algorithm and Its Complexity Analysis[J].Telecommunication Engineering,2003,43(10):92-96.

[2] 韓立華,王博,段淑鳳.語音端點(diǎn)檢測技術(shù)研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用研究,2010,27(04):1220-1226.HAN Li-hua,WANG Bo,DUAN Shu-feng.Research Progress of Speech Endpoint Detection Technology[J].Computer Application Research,2010,27(04):1220-1226.

[3] Shen J L,Hung J W,Lee L S.Robust Entropy-based Endpoint Detection for Speech Recognition in Noisy Environments[C].Australian International Speech Science and Technology Conference,Sydney Convention Centre,1998.

[4] 趙力.語音信號處理[M].第2版.北京:機(jī)械工業(yè)出版社,2009.ZHAO Li.Speech Signal Processing[M].2nd edition.Beijing:Machinery Industry Press,2009.

[5] 劉雅琴,陳媛媛.基于信息熵的語音端點(diǎn)檢測[J].計(jì)算機(jī)時(shí)代,2009(03):54-55.LIU Ya-qin,CHEN Yuan-yuan.Speech Endpoint Detection Based on Information Entropy[J].Computer Age,2009(03):54-55.

[6] 許作輝.基于信息熵的語音端點(diǎn)檢測算法研究與實(shí)現(xiàn)[D].長春:吉林大學(xué),2012.XU Zuo-hui.Research and Implementation of Speech Endpoint Detection Algorithm Based on Information Entropy[D].Changchun:Jilin University,2012.

[7] 李榮榮,胡昌奎,余娟.基于譜熵的語音端點(diǎn)檢測算法改進(jìn)研究[J].武漢理工大學(xué)學(xué)報(bào),2013,35(07):134-139.LI Rong-rong,HU Chang-kui,YU Juan.Improvement of Speech Endpoint Detection Algorithm Based on Spectral Entropy[J].Journal of Wuhan University of Music,2013,35(07):134-139.

猜你喜歡
信號檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
“幾何圖形”檢測題
“角”檢測題
完形填空二則
孩子停止長個(gè)的信號
小波變換在PCB缺陷檢測中的應(yīng)用
基于LabVIEW的力加載信號采集與PID控制
主站蜘蛛池模板: 青青青国产视频| 亚洲视频影院| 福利在线一区| 凹凸国产分类在线观看| 欧美专区在线观看| 萌白酱国产一区二区| 亚亚洲乱码一二三四区| 丝袜无码一区二区三区| 不卡色老大久久综合网| 国产精品色婷婷在线观看| 国产精品久久久久久久久kt| 精品视频91| 国产美女在线观看| 2022国产无码在线| 国产日本欧美亚洲精品视| 成人小视频网| 日本三区视频| 久久精品66| 综1合AV在线播放| 亚洲Av综合日韩精品久久久| 青青草原国产av福利网站| 伊人久久婷婷| 国产小视频在线高清播放| 国产亚洲精品91| 成人免费网站久久久| 成人第一页| 看av免费毛片手机播放| 在线国产91| 亚洲高清无码久久久| 福利在线一区| 激情無極限的亚洲一区免费| 不卡的在线视频免费观看| 国产凹凸一区在线观看视频| 538国产在线| 日韩精品久久久久久久电影蜜臀| 中文字幕免费在线视频| 欧美在线一二区| 在线国产综合一区二区三区 | 久久天天躁狠狠躁夜夜躁| 手机在线看片不卡中文字幕| 国产丝袜啪啪| 天天躁狠狠躁| 成人国产免费| 日韩欧美中文字幕在线韩免费| 日本不卡在线播放| 福利在线免费视频| 精品乱码久久久久久久| 红杏AV在线无码| 波多野结衣在线一区二区| 欧美笫一页| 一本大道香蕉久中文在线播放| 99久久这里只精品麻豆 | 一级毛片基地| 国产欧美日韩另类| 亚洲人成人伊人成综合网无码| 国产丝袜丝视频在线观看| 在线看国产精品| 久青草网站| 一级一毛片a级毛片| 欧美中出一区二区| 欧美一级一级做性视频| 经典三级久久| 亚洲综合狠狠| 伊人久久婷婷五月综合97色| 色视频久久| 亚洲不卡无码av中文字幕| 夜夜操天天摸| 亚洲国产91人成在线| 精品国产网站| 欧美日韩理论| 制服丝袜亚洲| 无码国内精品人妻少妇蜜桃视频| 国产亚洲美日韩AV中文字幕无码成人| 另类欧美日韩| 欧美精品v欧洲精品| 日韩精品资源| 色婷婷天天综合在线| 婷婷亚洲最大| 无码aaa视频| 国产精品亚欧美一区二区三区| 色视频国产| 中文字幕人妻无码系列第三区|