張樹威,梁 蓓,麥宋平
(1.貴州大學 理學院, 貴州 貴陽 550025;2.清華大學 深圳研究生院,廣東 深圳 518055)
人工耳蝸又稱人造耳蝸、電子耳蝸,是目前唯一可以幫助重度耳聾患者恢復聽覺的裝置。相對于助聽器將聲音放大改善耳聾患者的聽力,人工耳蝸是將聲音轉換成電信號,然后以微弱電流刺激聽覺神經纖維的形式傳遞聲音信息,從而產生聽覺。目前商用的人工耳蝸一般由體外語音處理器和體內植入體組成[1],體外部分由麥克風、語音處理器和編碼發射器組成,體內部分由接收解碼器、刺激器和電極整列組成,并通過手術植入患者的體內。目前國內外商用的人工耳蝸語音處理器均采用ASIC設計,投入成本高,可移植性差。隨著現代微電子技術的發展,采用通用集成電路[2]設計實用可靠的人工耳蝸已成為可能,其低成本、移植性好的特性將有助于人工耳蝸更好的普及。該系統基于TI公司的16位定點處理器 TMS320VC5509A[3],由 TLV320AIC23完成語音采集和A/D轉換,系統設計包括硬件設計部分和軟件設計部分。本設計采用雙麥克風接收語音輸入的自適應噪聲消除技術,改善了在低信噪比環境中的語音識別效果。為了提高系統的運行速度、降低系統的功耗,對軟件設計部分進行了優化。
在低信噪比的環境下,耳聾患者的語音識別率大幅下降?;谧赃m應濾波器的噪聲消除法[4]能有效的增強語音,消除背景噪聲,從而提高患者的語音識別率。本文中語音采集部分利用了兩個麥克風接收語音,經過采樣后作為兩個通道的輸入信號,輸入信號中均包括語音信號成分s和噪聲成分n。假設麥克風1的采樣結果為s1+n1,麥克風2的采樣結果為s2+n2。由于麥克風1和麥克風2分別對同一環境中的聲音進行采樣,s1和s2為相關信號,n1和n2為相關信號。假設麥克風1和麥克風2收到的語音信號一樣,即s1等于s2。通過兩路信號相加得到主通道輸入信號x1=2s1+n1+n2,通過兩路信號相減得到參考通道輸入信號x2=n1-n2。由于主通道語音中的噪聲n1+n2與參考噪聲n1-n2是相關的,參考通道中的自適應濾波器在接收n1-n2以后使輸出在最小均方誤差下最接近主通道噪聲n1+n2。輸出端e得到了消除噪聲后的增強語音信號。本文中自適應濾波器采用了歸一化LMS算法[5],當信噪比較大時,采用較小的收斂因子,減少穩定失調誤差;當信噪比較小時,采用較大的收斂因子,加快算法的收斂速度。自適應噪聲消除原理如圖1所示。

圖1 自適應噪聲消除原理Fig.1 Principle of self-adaptive noise elimination
文中設計的人工耳蝸語音處理器采用CIS方案[5],即連續間隔采樣方案(Continuous Interleaved Sampling,CIS)。 語音信號先經過預加重處理,以補償語音信號中的高頻成分,然后做FFT變換,經n個帶通濾波器后劃分為與刺激電極相對應的通道,對各個通道能量求和并利用對數或指數函數壓縮已提高患者的聽力動態范圍。帶自適應噪聲消除技術的CIS方案如圖2所示。

圖2 帶自適應噪聲消除技術的CIS算法原理Fig.2 CIS algorithm principle with self-adaptive noise elimination technology
本系統以 TMS320VC5509A DSP為核心,TLV320AIC23語音Codec芯片等其他外設為輔助設備。TMS320VC5509A控制系統的外設和處理CIS算法程序,TLV320AIC23對外部聲音進行采樣和A/D轉換。TMS320VC5509A是TI公司推出的一款高性能低功耗的16位定點數字信號處理器,它擁有豐富的片內資源,能方便的控制其他設備,輸出處理結果等[7]。TLV320AIC23具有很低的功耗,在ADC和DAC的噪音可分別達到90 dB和100 dB。此外TLV320AIC23支持MIC和LINE IN兩種輸入方式,內部ADC和DAC轉換模塊均帶有完整的數字濾波器,可以在8 kHz到96 kHz的采樣頻率范圍內傳輸數據寬度為16位,20位,24位,32位的數據[8]。
語音采集芯片TLV320AIC23與主處理芯片TMS320VC5509A的接口電路如圖3所示。

圖3 TLV320AIC23與TMS320VC5509A連接示意圖Fig.3 Connection diagram of TLV320AIC23 and TMS320VC5509A
DSP與AIC23的接口有兩個,一個是控制接口采用I^2C模塊,通過編程完成對AIC23的配置;一個是數據音頻接口,通過MCBSP0傳輸數據。
AIC23的控制接口有SPI和I^2C兩種工作方式,由于VC5509A片內外設含有I^2C模塊,因此使用I^2C方式控制AIC23更為方便。此時VC5509A作為I^2C總線的主設備,AIC23作為從設備。在I^2C總線上AIC23有7位外設地址,9位寄存器的設置值。SCL和SDI分別是AIC23的控制端口和數據輸入端,分別和VC5509的I^2C模塊端口SCL,SDA相連。TLV3320AIC23的數據音頻接口支持右判,左判,I^2S和DSP 4種接口模式。本系統采用DSP模式,把AIC23設為主模式,DSP設為從模式,即MCBSP0的移位時鐘和幀同步時鐘全部由AIC23提供。在幀同步脈沖到來時第一個數據字即為左通道數據,右通道數據緊跟著左通道數據。
語音是時變的,非平穩的隨機過程,但由于語音的形成過程與與人類發音系統的生理結構密切相關,通常假設語音信號是短時平穩的,即在10至30 ms的時間段內其頻譜特性和一些物理特征參量可近似的看作是不變的。因此語音信號要進行分幀處理,在采樣率為8 kHz時可將幀長取為N=256較為合適。
本系統中語音信號由LINE IN輸入,LLINE IN和RLINE IN分別對應自適應噪聲消除原理圖中的麥克風1和麥克風2,語音信號分別經過AIC23內部的A/D轉換后,通過MCBSP0通道傳送到VC5509A內。VC5509A對這些語音數據進行CIS算法處理,得到各個通道的刺激脈沖。
系統軟件設計分為系統初始化,系統中斷處理程序和CIS算法程序。系統的初始化包括設置時鐘發生器,MCBSP初始化,I^2C初始化以及對AIC23控制寄存器的配置。系統中斷處理程序設置一個標志位,每中斷一次左右聲道各采集一個數據,當采集滿一幀時能使采樣值保存在兩個數據緩沖區的另一個緩沖區中。系統中主程序一直處于循環處理過程,在一幀信號執行完CIS算法程序后,等待下一幀信號接收完畢,然后重新執行CIS算法程序。為保證語音信號處理的連續性,CIS算法處理時間應當小于一幀數據的采樣時間。本系統CPU時鐘為144 MHz,采樣頻率8 kHz,中斷頻率8 kHz,因此每125 μs采集一個點,采集一幀256個數據需32 ms,即每隔32 ms輸出1個刺激脈沖,CIS子程序運行一次需23.1 ms。圖4為系統設計流程圖。

圖4 系統設計流程圖Fig.4 Flow chart of system design
文中設計的CIS算法首先用MATLAB進行驗證,然后修改成C語言在DSP上實現。為了更方便的分析算法結果,文中利用了集成在MATLAB7.0中的CCSLlink工具。利用該工具可在MATLAB環境下完成對CCS和DSP目標板的操作,自動實現調試,數據傳遞和驗證[9]。在創建好CCS IDE連接對象后,利用MATLAB把工程文件加載到CCS IDE中,經過編譯連接生成DSP可執行文件。把可執行文件加載到DSP目標板,運行程序,由waveread函數讀取wav格式音頻文件。該音頻文件是立體聲的波形文件,采樣精度 16位,采樣率 22 050 Hz,左聲道模擬麥克風1,右通道模擬麥克風2。為了模擬真實環境中的噪聲,左右聲道各加入了相關的高斯白噪聲,通過LINE IN連接線接到DSP目標板。先將自適應濾波前后的結果進行對比,如圖5所示。
自適應消噪后的語音信號經過預加重,FFT變換,帶通濾波,能量求和及非線性壓縮后可得到與每個電極相對應的刺激脈沖。以第一通道為例,同一語音分別經DSP和MATLAB采樣處理的結果對比如圖6所示。

圖5 自適應濾波前后的結果比較Fig.5 Comparison results between the before and after the adaptive filter

圖6 DSP和MATLAB采樣處理的結果對比Fig.6 Comparison results between the DSP and MATLAB sample processing
功耗是人工耳蝸語音處理器設計需要考慮的重要內容,本系統在降低功耗方面做了一些努力。由于語音實時采樣分析的需要,每幀數據的處理時間必須小于每幀數據的采樣時間。CIS算法優化后減少了每幀數據的處理時間,可以使CPU工作在較低的工作頻率,一定程度上降低了系統功耗。CIS算法中開平方運算和FFT運算需要較多的處理時間,其中浮點數開平方運算需要10 ms,浮點數FFT運算需要51 ms。本算法中采用了DSP函數庫中的sqrt_16函數和cfft函數,這些函數全部為優化過的匯編語言,可有C?語言方便調用,執行速度得到了很大的提高。
文中介紹了基于16位定點DSP芯片TMS320VC5509A的人工耳蝸語音處理器的硬件設計和軟件設計。為了提高低噪聲中的語音識別率,本設計采用了雙麥克風接收語音輸入的自適應消噪技術。聲音經過語音Codec芯片TLV320AIC23采集并進行A/D轉換后傳輸到DSP內。系統運行結果表明,該系統可以實現語音信號中噪聲的消除,并得到良好的電極刺激脈沖,其低功耗、低成本、移植性好的特性將有助于人工耳蝸更好的普及。
[1]Soon Kwan An,Se-Ik Park,Sang Beom Jun,et al.Design for a simplified cochlear implant system[J].IEEE Transactions on Biomedical Engineering,2007,54(6):973-980.
[2]Marsman E D,Senger R M,Carichner G A,et al.A DSP architecture for cochlear implants[J].Circuits and Systems,ISCAS,2006,2(6):657-660.
[3]冉涌,陳立萬.基于TMS320VC5509A的超聲波電子筆設計[J].電子科技,2010(4):58-60.RAN Yong,CHEN Li-wan.Design of the ultrasonic electronic pen based on DSP[J].Electronic Science and Technology,2010(4):58-60.
[4]Spriet A,Deun L V,Eftaxiadis K,et al.Speech understanding in background noise with the Two-microphone adaptive beam-former BEAM in the nucleus freedom cochlear Implant system[J]. Katholieke Universiteit Leuven,Departement Elektrotechniek, ESAT-SISTA/TR,2005,28(1):61-71.
[5]赫金.自適應濾波器原理[M].4版.鄭寶玉,譯.北京:電子工業出版社,2003.
[6]Wilson B S,Finley C C,Lawson D T.Better speech recognition with cochlear implants[J].Nature,1991(352):236-238.
[7]TMS320VC5509 Fixed-Point Digital Signal Processor Data Manual,Texas Instruments[S].2004.
[8]TLV320AIC23 Data Manual,Texas Instruments[S].2004.
[9]李真芳,蘇濤,黃小宇.DSP程序開發——MATLAB調試及直接目標代碼生成[M].西安:西安電子科技大學出版社,2003.