數(shù)字助聽器中多通道響度補償算法的研究

2016-02-27 03:41:21張玲華

計算機技術(shù)與發(fā)展 2016年6期

關(guān)鍵詞：信號

沐城，張玲華

(南京郵電大學(xué) 通信與信息工程學(xué)院，江蘇南京 210003)

數(shù)字助聽器中多通道響度補償算法的研究

沐城，張玲華

(南京郵電大學(xué) 通信與信息工程學(xué)院，江蘇南京 210003)

目前數(shù)字助聽器中用的較多的響度補償方法，通常是對語音的高頻部分進行高增益，但由于聽損患者在高頻段的聽覺范圍比較小，直接對高頻部分進行高增益容易超出聽損患者的聽覺范圍。文中引進了寬動態(tài)壓縮技術(shù)，首先將整個語音的動態(tài)范圍按一定比例均勻壓縮到患者的殘余聽力中，然后將頻帶非等寬劃分，再在不同頻段進行響度補償和增益控制，最后對信號進行重構(gòu)，并利用小波閾值去噪技術(shù)去除部分噪聲。實驗結(jié)果表明，該方法能夠使補償后語音的響度完全映射到聽損患者的聽覺范圍內(nèi)，從而有效提高患者的聽力水平，特別對高頻部分語音的辨識，具有較好的效果。

響度補償；寬動態(tài)壓縮；正交鏡像濾波器組；增益控制

0 引言

在聽力損失的情況下，聽閾普遍下移，從而造成聽覺動態(tài)范圍減小、分辨語言的能力下降等問題。響度補償是數(shù)字助聽器的關(guān)鍵算法之一，也是其核心任務(wù)之一。為了對聲音進行壓縮放大，將正常聽力范圍內(nèi)的聲音映射到聽損患者的聽力范圍內(nèi)[1]，就需要用到響度補償。目前，大多數(shù)數(shù)字助聽器都已實現(xiàn)多通道響度補償功能[2]，但多數(shù)響度補償方法主要用于處理等寬頻率間隔。其實人耳對聲音頻率的感受與實際的頻率高低不是線性關(guān)系，而是接近對數(shù)關(guān)系，所以等寬頻率間隔的補償方法不能滿足人耳的聽覺特性。雖然不同患者的聽力損失是不一樣的，但基本上具有低頻聽力損失較小、高頻聽力損失較大的特點。有研究表明，大腦通過相對比率[3-4]來感受頻率，而不是絕對頻率。由于語素的頻譜間存在一定位置關(guān)系[5]，通過按比例壓縮可以保持這種關(guān)系。

考慮到上述情況，文中將寬動態(tài)壓縮技術(shù)[6]應(yīng)用于響度補償。首先將整個語音信號的動態(tài)范圍按一定比例均勻壓縮到患者的殘余聽力中，再讓信號順次通過寬動態(tài)壓縮模塊、響度補償模塊以及增益控制模塊，經(jīng)過這一系列處理后，語音信號處于聽損患者聽閾范圍內(nèi)，再利用小波閾值去噪技術(shù)去除部分噪聲。實驗結(jié)果表明，該方法具有較好的效果。

1 多通道響度補償原理及系統(tǒng)設(shè)計

1.1 多頻段語音信號響度補償原理

一般來說，人耳能感覺到頻率在16～20 000 Hz間的聲音。在這個范圍內(nèi)，可引起人的聽覺的最小聲音強度被稱為聽閾。如果振動強度繼續(xù)增加，當達到一定限度時，將會引起鼓膜疼痛，這個限度稱為痛閾。對于不同頻率，人耳的感覺是不同的，對正常聽力者和聽損患者進行聲強測試，可以分別得到正常人和聽損患者的聽力檢查曲線圖。聽損患者的聽力測試曲線與正常人相比是不同的，他們對聲強的敏感度更低，所以他們的聽閾要比一般人高，而痛閾卻比一般人低，因此聽力范圍比普通人小。一般通過多次測試特殊頻點的閾值，求各頻點閾值的平均值作為聽損程度，連接各閾值所得曲線圖作為聽損患者的聽力檢查圖。圖1是一個聽損患者的聽力檢查曲線圖。

圖1 聽損患者的聽力檢查曲線

從圖1中可以看到,聽損患者在不同頻率損傷情況是不一樣的,一般來說，在低頻區(qū)域損傷較小，聽閾值也較小，在高頻區(qū)域的聽力損失更為嚴重，使得在高頻區(qū)域閾值較大,導(dǎo)致高頻區(qū)域聽力范圍較小。就算是同一患者，在不同頻段上也會有不同程度的聽力損傷，因此使用單通道響度補償方式是不合適的。

對聽損患者進行響度補償,不僅要考慮不同頻率信號的聽力敏感,還要考慮患者可以承受的信號強度。因此，在對聲音進行響度補償?shù)耐瑫r，還要根據(jù)聲音的強度進行控制,以確保小信號能被病人聽清楚,同時保護病人的耳朵在強信號下不受傷害[7]。

圖2是增益控制曲線。其中，UCLn和UCLu分別為正常人和患者的痛閾值，THRn和THRu分別為正常人與患者的聽閾值，MCLn和MCLu分別為正常人和患者的最適閾值。這些參數(shù)的值并不是固定的，不同患者在不同頻率上的值都是不同的，因此需要根據(jù)各患者的具體情況來測定聽力測試曲線(見圖1)。根據(jù)圖2的增益控制曲線對響度補償后的語音進行增益調(diào)節(jié)，正常聽力范圍內(nèi)的聲音被映射到聽障者的聽力范圍上。

圖2 增益控制曲線

1.2 寬動態(tài)壓縮方法

所謂寬動態(tài)壓縮，意思是將整個聲音按照一定的比例進行均勻壓縮，最終壓縮到患者的殘余聽力中。由于聲音具有特殊性質(zhì)，語素之間存在一定關(guān)系,語素之間的聯(lián)系可以通過按比例壓縮來保持。將語音按比例壓縮到患者較好的聽力范圍內(nèi),可以使患者更好地聽到聲音的高頻部分,有助于改善患者的語音識別率[8]。

首先根據(jù)患者的聽力情況，選擇要進行壓縮的頻段和目標頻段，然后計算出高頻部分的壓縮比[9]。設(shè)壓縮比為γ，則：

(1)

其中：ftmax和ftmin分別為目標頻段的最高頻率和最低頻率；fomax和fomin分別為原頻段的最高頻率和最低頻率。

壓縮后信號頻譜表達式為：

(2)

圖3為從實驗語音中截取的一幀語音，采用了寬動態(tài)壓縮方法，選擇壓縮比γ=2，獲得壓縮前后的頻譜比較圖。其中，壓縮前原始語音的頻段為0～8 000Hz，壓縮后的目標頻段取0～4 000Hz。實線表示原始語音的頻譜，虛線表示壓縮后語音的頻譜。

1.3 基于QMFB的多通道子帶濾波器組設(shè)計

從圖1可以看出，不同頻段上的聽損程度是不同的，因此需要將語音劃分為多個頻段，不同頻段使用不同的補償因子。還可以看出，聽損患者在4 000～8 000 Hz頻段上的聽力范圍較小，而在0～4 000 Hz頻段上的聽力范圍較大。因此先將信號整體壓縮到0～4 000 Hz頻段上，這樣使得4 000～8 000 Hz頻段上的信號對應(yīng)到2 000～4 000 Hz頻段上，這時的信號處于患者的殘余聽力中，最后再使用正交鏡像濾波器組(QMFB)對信號進行非等帶寬劃分[10-12]。

圖3 原頻譜及壓縮后頻譜

信號經(jīng)過QMFB的分析，濾波器組被分成若干子帶信號，各子帶信號經(jīng)過處理后，再經(jīng)過合成濾波器組輸出合成信號。假設(shè)分析濾波器組的低通濾波器為H0(ω)，高通濾波器為H1(ω)；合成濾波器組的低通濾波器為G0(ω)，高通濾波器為G1(ω)[13]。若H0(ω)=H(ω)，由于H0(ω)和H1(ω)關(guān)于ω=π/2對稱，兩者頻響關(guān)系滿足：

H1(ω)=H(ω-π)

(3)

(4)

合成濾波器組跟分析濾波器組的差別只是因子不同，兩者結(jié)構(gòu)基本相同。因此合成濾波器組的低通濾波器G0(ω)=2H(ω)，高通濾波器G1(ω)=-2H(ω-π)。

對于濾波器而言，一般來說，階數(shù)提高了，可以使過渡帶變窄，阻帶波動變小，當然濾波效果更接近理想情況，缺點是成本較高。經(jīng)過綜合考慮，文中選取階數(shù)N=99，歸一化截止頻率fp=0.45π的濾波器。由于QMFB是線性相位的，可以消除混疊失真，能夠完美重構(gòu)信號[14]。

1.4 系統(tǒng)結(jié)構(gòu)框圖

首先對原始語音進行響度衰減，模擬患者聽到的語音，然后對該語音進行寬動態(tài)壓縮，將語音按一定比例均勻地壓縮到目標頻段，再使用分析濾波器組對語音進行非等帶寬劃分，并對各子帶信號進行響度補償和增益調(diào)節(jié)，最后使用合成濾波器組將子帶信號合成為最終補償后的語音。

系統(tǒng)框圖如圖4所示。

圖4 系統(tǒng)框圖

具體步驟如下：

第1步：根據(jù)圖1聽力檢查曲線圖模擬患者聽到的聲音。聽力曲線圖是分段曲線，先計算各分段點的聲壓級，相鄰分段頻率點之間是線性關(guān)系，可以計算各頻段聲壓級的衰減曲線，然后在各頻段內(nèi)依據(jù)得到的衰減曲線進行幅度衰減，從而得到患者聽到的聲音。聲壓級計算公式為：

(5)

其中：x是采樣信號；N是信號長度；P0是基準聲壓級，一般取20μPa。

第2步：對語音進行分幀。幀長取20ms，幀移為10ms，加窗為漢明窗。

第3步：對分幀后的語音進行壓縮。從圖1聽力檢查圖可以看到，患者在4 000～8 000Hz上的聽覺范圍較小，而在0～4 000Hz上的聽覺范圍較大，可以取壓縮比γ=2。根據(jù)式(1)將語音進行壓縮，壓縮到目標頻段0～4 000Hz，這樣原始語音在4 000～8 000Hz的頻段就映射到了2 000～4 000Hz頻段上。要根據(jù)不同患者的具體情況來選取原頻段與目標頻段。

第4步：對語音進行分頻處理。使用四通道QMFB分析濾波器組將壓縮后的語音幀分頻，語音被分成0～500Hz，500～1 000Hz，1 000～2 000Hz以及2 000～4 000Hz這四個頻段。

第5步：對子帶信號進行響度補償和增益控制。子帶補償?shù)姆椒ǜ谝徊降倪^程相反。語音經(jīng)過補償后，再對其強度進行增益調(diào)節(jié)。先根據(jù)式(5)計算輸入信號的聲壓級，再確定各子帶的增益調(diào)節(jié)因子，也就是a與b兩段直線的斜率，如圖2所示。假設(shè)a,b兩段直線的斜率分別為CRa=和CRb，則：

(6)

(7)

由圖2可知，當THRn≤SPLin

(8)

當MCLn≤SPLin

(9)

第6步：將子帶信號進行合成。先用QMFB的合成濾波器組將子帶信號合成為一幀完整的信號，再將各幀信號疊加得到響度補償后的語音，并利用小波閾值去噪技術(shù)去除部分噪聲。

2 實驗與仿真

錄制一段語音作為實驗使用語音。先對語音進行分幀，幀長取20ms，幀移取10ms。再根據(jù)圖1的聽力曲線對語音進行衰減，獲得患者聽到的聲音。然后根據(jù)圖4的系統(tǒng)框圖，將衰減語音依次通過寬動態(tài)壓縮模塊、QMFB分析濾波器組、補償控制模塊以及QMFB合成濾波器組，最終獲得符合聽損患者聽覺特性的語音，并利用小波閾值去噪方法去除部分噪聲。

圖5為其中一幀語音經(jīng)過衰減以及響度補償后的波形圖。

從圖5可以看出，衰減后的語音在大多數(shù)頻段內(nèi)的響度值都遠低于聽損患者的聽閾值。信號處于低頻段時衰減相對較小，處于中高頻段時的衰減較大。經(jīng)過響度補償后，原先衰減的語音大部分都處于患者的聽覺范圍，雖然有少部分處于聽閾以下，但是經(jīng)過增益控制后，所有頻段的語音都被調(diào)節(jié)到患者的聽覺范圍內(nèi)，有效實現(xiàn)響度補償。

如圖6所示，這是原始語音、經(jīng)過衰減后語音、經(jīng)過增益控制后語音的時域波形圖。

從圖6可以看出，衰減后的語音幅度非常小，并且波形發(fā)生變化，甚至無法分辨出原始語音。而由增益控制后語音波形圖可以看出，經(jīng)過響度補償和增益控制后的語音與原始語音的波形基本相同，不僅如此，語音的幅度也有了明顯的增強，從而實現(xiàn)了對語音進行響度補償?shù)哪康摹?/p>

圖6 原語音、衰減語音、增益后語音時域波形圖

3 結(jié)束語

上述實驗表明，使用寬動態(tài)壓縮，可將患者聽覺范圍較小的高頻區(qū)域信號移動到患者聽覺范圍較大的低頻區(qū)域，同時對該低頻區(qū)域的語音進行響度補償，這樣可使患者獲得較好的聽覺效果。補償后，語音信號基本上與原來的信號相同，而且聲音的強度明顯增強。再經(jīng)過增益調(diào)整，將處于患者聽閾以下的信號調(diào)整到患者聽閾以上，同時將幅度過大的信號進行適當削弱，這樣既可以使聲音映射到聽損患者的聽力范圍內(nèi)，又能防止聲音過大對患者造成二次傷害。實驗結(jié)果表明，該方法能有效實現(xiàn)響度補償，改善聽覺效果，有效提高患者的聽力水平。

[1] 趙力,張昕然,梁瑞宇,等.數(shù)字助聽器若干關(guān)鍵算法研究現(xiàn)狀綜述[J].數(shù)據(jù)采集與處理,2015,30(2):252-265.

[2]ChongKS,GweeBH,ChangJS.A16-channellow-powernonuniformspacedfilterbankcorefordigitalhearingaids[J].IEEETransactionsonCircuitsandSystemsII:ExpressBriefs,2006,53(9):853-857.

[3]Miller-HansenDR,NelsonPB,WidenJE,etal.Evaluatingthebenefitofspeechrecodinghearingaidsinchildren[J].AmericanJournalofAudiology,2003,12(2):106-113.

[4]StelmachowiczPG,PittmanAL,HooverBM,etal.Theimportanceofhigh-frequencyaudibilityinthespeechandlanguagedevelopmentofchildrenwithhearingloss[J].ArchOtolaryngolHeadNeckSurg,2004,130:556-562.

[5]GoldbaumSM,HalpinC.Exploringthedamagedear:theNIDCDnationaltemporalboneregistry[J].ASHA,1999,41(1):29-33.

[6] 陳廣飛,應(yīng) 俊.數(shù)字助聽器寬動態(tài)壓縮算法研究[J].北京生物醫(yī)學(xué)工程,2006,25(5):454-456.

[7] 雍雅琴.數(shù)字助聽器中主要語音信號處理方法研究[D].北京:北京協(xié)和醫(yī)學(xué)院,2013.

[8] 王青云,趙力,趙立業(yè),等.一種數(shù)字助聽器多通道響度補償方法[J].電子與信息學(xué)報,2009,31(4):832-835.

[9] 張寶琳,張玲華.數(shù)字助聽器中多通道響度補償方法的研究[J].信號處理,2013,29(5):656-661.

[10]RothweilerJH.Polyphasequadraturefilters-anewsubbandcodingtechnique[C]//ProcofIEEEICASSP.[s.l.]:IEEE,1983.

[11] 張晨,李雙田.設(shè)計QMF組的一種新算法及基于GA的優(yōu)化[J].信號處理,2005,21(2):120-125.

[12] 孟君.基于DSP的數(shù)字助聽器多通道響度補償方案[J].南京信息工程大學(xué)學(xué)報:自然科學(xué)版,2010,2(5):420-425.

[13] 李麗.非均勻濾波器組的研究[D].西安:西安電子科技大學(xué),2009.

[14]HuangJ,GuGX.AdirectapproachtothedesignofQMFbanksviafrequencydomainoptimization[J].IEEETransactiononSignalProcessing,1998,46(8):2131-2138.

Research on Multi-channel Loudness Compensation in Digital Hearing Aids

MU Cheng，ZHANG Ling-hua

(College of Telecommunications & Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)

Loudness compensation algorithm is a key technique in digital hearing aid.At present,digital hearing aid in multi-channel loudness compensation method,is usually high gain for the high frequency part of speech.However,because of the relatively small range of hearing loss in the high frequency range,the high gain of the high frequency part is easy to exceed the range of hearing loss.Wide dynamic compression technique is introduced in this paper.First the dynamic range of the speech according to a certain proportion is uniformly compressed to patients with residual hearing,then the band is partitioned with non equal width,and loudness compensation and gain control is carried out in different frequency band.Finally,the signal is reconstructed,removing partial noise by wavelet threshold denoising technology.Experiment shows that the method makes the loudness of speech after compensation completely mapped to range of hearing loss in patients,effectively improving the patient’s hearing level,especially on speech identification of high frequency part with good effect.

loudness compensation;wide dynamic compression;quadrature mirror filter bank;gain control

2015-08-26

2015-11-27

時間：2016-05-05

江蘇省高校自然科學(xué)研究重大項目(13KJA510003)；江蘇高校優(yōu)勢學(xué)科建設(shè)工程資助項目(PAPD)

沐城(1990-)，男，碩士研究生，研究方向為現(xiàn)代語音處理與通信技術(shù)；張玲華，教授，博士，博士生導(dǎo)師，研究方向為傳感器和語音。

http://www.cnki.net/kcms/detail/61.1450.TP.20160505.0831.102.html

TP301.6

1673-629X(2016)06-0123-04

10.3969/j.issn.1673-629X.2016.06.027

數(shù)字助聽器中多通道響度補償算法的研究

0 引 言

1 多通道響度補償原理及系統(tǒng)設(shè)計

2 實驗與仿真

3 結(jié)束語

0 引言