基于MIPS處理器的AMR-WB語(yǔ)音解碼器優(yōu)化

2013-08-20 04:58:54崔赫哲

電子設(shè)計(jì)工程 2013年21期

張濤，陳志，崔赫哲

（1.天津大學(xué) 電子信息工程學(xué)院，天津 300072；2.金策工業(yè)綜合大學(xué) 信息系，平壤 999093）

3GPP于2001年3月公布了用于第三代移動(dòng)通信系統(tǒng)WCDMA的自適應(yīng)多速率寬帶（AMR-WB，Adaptive Multi-Rate Wideband）語(yǔ)音編碼算法標(biāo)準(zhǔn)，2002年1月，ITU采納了AMR-WB編解碼算法，公布了數(shù)字寬帶語(yǔ)音編碼的新標(biāo)準(zhǔn)G.722.2，由此AMR-WB編碼算法成為第一種可以同時(shí)用于有線與無(wú)線業(yè)務(wù)的語(yǔ)音編碼系統(tǒng)[1]。

MIPS （Microprocessor without interlocked piped stages）是很流行的一種RISC處理器，最早在80年代初期由斯坦福大學(xué)Hennessy教授領(lǐng)導(dǎo)的研究小組研制出來(lái)，它采用精簡(jiǎn)指令系統(tǒng)計(jì)算結(jié)構(gòu)（RISC）來(lái)設(shè)計(jì)芯片，和英特爾采用的復(fù)雜指令系統(tǒng)計(jì)算結(jié)構(gòu)（CISC）相比，具有設(shè)計(jì)更簡(jiǎn)單、設(shè)計(jì)周期更短等優(yōu)點(diǎn)，并可應(yīng)用更多先進(jìn)技術(shù)，開發(fā)更快的下一代處理器。

隨著移動(dòng)通信與網(wǎng)絡(luò)技術(shù)的飛速發(fā)展，數(shù)字化語(yǔ)音編解碼壓縮的要求也相應(yīng)提高，由于AMR-WB擁有低碼率、多速率、高寬帶、高語(yǔ)音質(zhì)量等特性，使其應(yīng)用領(lǐng)域非常廣泛，另一方面由于算法強(qiáng)大，所以標(biāo)準(zhǔn)定點(diǎn)C代碼執(zhí)行效率低，限制了其在某些硬件條件比較苛刻的領(lǐng)域中的應(yīng)用。這就需要根據(jù)實(shí)際的應(yīng)用需求，在標(biāo)準(zhǔn)代碼的基礎(chǔ)上對(duì)算法進(jìn)行必要的優(yōu)化，并結(jié)合硬件資源的特點(diǎn)降低算法復(fù)雜度，以達(dá)到應(yīng)用的條件。目前有關(guān)AMR-WB的研究，一是就其算法及復(fù)雜度進(jìn)行研究分析，如文獻(xiàn)[2]中詳細(xì)分析了AMR-WB的編解碼過(guò)程，文獻(xiàn)[3]針對(duì)AMR-WB算法及實(shí)現(xiàn)的復(fù)雜度進(jìn)行深入研究；二是就其在DSP芯片上進(jìn)行應(yīng)用，文獻(xiàn)[4]完成了AMR-WB在DSP芯片TMS320VC5509的優(yōu)化實(shí)現(xiàn)，并達(dá)到了實(shí)時(shí)要求。本文依據(jù)現(xiàn)有的AMR-WB算法分析，在MIPS 4Kec平臺(tái)上利用有限的硬件資源實(shí)現(xiàn)AMR-WB的實(shí)時(shí)解碼。

1 AMR-WB編解碼與MIPS處理器

1.1 AMR-WB語(yǔ)音編解碼技術(shù)

AMR-WB編碼技術(shù)是一種由多個(gè)固定模式集成的ACELP語(yǔ)音編碼方案，該算法基于50~7 000 Hz的帶寬語(yǔ)音，與傳統(tǒng)的200~3 400Hz電話帶寬相比，50~200 Hz的低頻部分增加了語(yǔ)音的自然度和聽覺舒適性；3 400~7 000 Hz的高頻部分，增強(qiáng)了語(yǔ)音的可理解性，大大提高了語(yǔ)音質(zhì)量與語(yǔ)音自然度；而且該編碼技術(shù)采用了自適應(yīng)技術(shù)使得其能在系統(tǒng)容量與合成語(yǔ)音質(zhì)量中取得靈活的折衷，最大限度地發(fā)揮系統(tǒng)的性能。

AMR-WB語(yǔ)音編解碼器由多速率語(yǔ)音編碼器、包括了端點(diǎn)檢測(cè)與舒適噪聲生成系統(tǒng)的源控制速率方案和對(duì)付傳輸錯(cuò)誤和丟包后的錯(cuò)誤隱藏機(jī)制組成[5]。多速率共支持9種速率模式，分別為 23.85、23.05、19.85、18.25、14.85、14.25、12.65、8.85和6.60 kb/s，對(duì)應(yīng)模式8~0，其正常工作的采樣頻率為16 kHz，20 ms為一幀，，對(duì)兩個(gè)低、高頻帶 50~6 400 Hz和 6 400~7000 Hz分別進(jìn)行獨(dú)立編碼，以降低復(fù)雜性提高編碼效率[6]；源控制速率的作用就是讓語(yǔ)音編解碼器用一個(gè)低速率來(lái)編碼只包含背景噪音的語(yǔ)音幀，而不是編碼所有的語(yǔ)音；針對(duì)丟幀或失幀的情況，在語(yǔ)音合成時(shí)利用了一組預(yù)測(cè)參數(shù)對(duì)錯(cuò)誤之處利用了隱藏機(jī)制。

AMR-WB大致編解碼過(guò)程如下：以代數(shù)碼激勵(lì)線性預(yù)測(cè)為基礎(chǔ)，通過(guò)線性預(yù)測(cè)分析、基音預(yù)測(cè)分析以及在 12.8 kHz采樣率的固定碼本參數(shù)的分析，以期望得到最小化感覺加權(quán)誤差信號(hào)，處理時(shí)以幀為單位（每幀長(zhǎng) 20 ms，包括 320個(gè)采樣點(diǎn)），分析每幀語(yǔ)音抽取 CELP參數(shù)（LP系數(shù)，自適應(yīng)和固定碼本的索引值和增益），除此還要計(jì)算得到23.85 kb/s模式下的高帶增益索引值。以上所有的參數(shù)編碼后經(jīng)信道傳送至解碼端，在解碼器中這些參數(shù)被解碼，重構(gòu)的激勵(lì)信號(hào)通過(guò)LP合成濾波器重新合成語(yǔ)音信號(hào)[6]。

1.2 MIPS處理器結(jié)構(gòu)特點(diǎn)

32位MIPS處理器和其它處理器的結(jié)構(gòu)不同，它一共由兩個(gè)處理部件組成，一個(gè)是 32位RISC核心CPU，另一個(gè)是用軟件來(lái)實(shí)現(xiàn)的系統(tǒng)協(xié)處理器 CP0，它的組成有浮點(diǎn)運(yùn)算單元、整數(shù)運(yùn)算單元、支持虛擬地址轉(zhuǎn)換的TLB和CP0寄存器、指令 cache和數(shù)據(jù) cache等[7]。

MIPS32寄存器堆包含CPU通用寄存器、CPU特殊寄存器、FPU寄存器，架構(gòu)中有32個(gè)通用寄存器，其中$0永遠(yuǎn)保存數(shù)據(jù)0和$31保存函數(shù)調(diào)用ja1返回地址，其它的寄存器可作為通用寄存器用于任何一條指令中；特殊寄存器有PC、HI和LO，分別用來(lái)保存當(dāng)前指令地址、乘除指令高位結(jié)果、乘除指令地位結(jié)果；FPU則用來(lái)處理相關(guān)的浮點(diǎn)數(shù)據(jù)。

MIPS32架構(gòu)是基于一種固定長(zhǎng)度的定期編碼指令集（32位字），MIPS指令集是一種典型的RISC體系結(jié)構(gòu)的指令集，包含的特點(diǎn)如下：指令種類少且格式規(guī)范，尋址方式簡(jiǎn)化，大量利用寄存器操作，簡(jiǎn)化了CPU結(jié)構(gòu)。

Cache是CPU和主存之間的小容量高速度緩沖存儲(chǔ)器，用來(lái)存放經(jīng)常使用的數(shù)據(jù)和程序指令，有效解決了處理速度和存儲(chǔ)速度之間的匹配問題，在MIPS架構(gòu)中D_cache和I_cache分別存放數(shù)據(jù)和指令，容量較小，分別為32k。

2 AMR-WB解碼器在平臺(tái)MIPS上的移植

文中采用的芯片類型為MIPS公司推出的低功耗高性能數(shù)字信號(hào)處理器MIPS32 4Kec，屬于MIPS32 4K系列，連接平臺(tái)用到的是Green_hill編譯環(huán)境。

由上述MIPS架構(gòu)分析可知，為了使程序能在目標(biāo)板上正確執(zhí)行，使AMR-WB能夠?qū)崟r(shí)地在MIPS32上解碼，首先要清楚并修改程序中有關(guān)的數(shù)據(jù)空間，第一，由于cache的限制，程序中不允許有堆的操作，即 calloc（），malloc（）等函數(shù)要?jiǎng)h去；第二，程序中有關(guān)數(shù)組的數(shù)據(jù)都整合在一起放入外部空間，需要時(shí)再讀??；第三，輸入輸出不再是文件操作，而是以流形式進(jìn)行操作。針對(duì)以上AMR-WB解碼對(duì)空間分配的需求，這里給 DDR（MEMORY）做一個(gè)配給，分別 bss_region段、const_region 段、pcm_region 段，大小各為 16k、64k、64k，其中bss_region存放結(jié)構(gòu)體等數(shù)據(jù)，const_region存放表格等常量數(shù)據(jù)，pcm_region存放輸出音頻pcm數(shù)據(jù)，檢驗(yàn)這些數(shù)據(jù)存放正確的標(biāo)準(zhǔn)是查看在Green_hill環(huán)境中運(yùn)行得到的map文件里 .rodata，.heap，.data等類型的數(shù)據(jù)都為0byte。

數(shù)據(jù)空間劃分之后，再到片內(nèi)和片外數(shù)據(jù)的交換，這里采樣的是DMA讀存機(jī)制，分別用readDDRfromDMA（）和writeDDRfromDMA（）函數(shù)實(shí)現(xiàn)，鑒于大小的限制，每次最多只能讀存4k的數(shù)據(jù)。另外pc平臺(tái)和Green_hill平臺(tái)的編譯器會(huì)有些差別，所以對(duì)程序中的數(shù)據(jù)類型得做一個(gè)統(tǒng)一的規(guī)范，如將原程序中出現(xiàn)的WORD16、WORD32等統(tǒng)一typedef為 I16、I32。

最后在MIPS平臺(tái)運(yùn)行，需要3個(gè)Grennhill編譯生成的binary 文件：text.bin ext﹑data.bin﹑data.bin，運(yùn)行時(shí)先將 text.bin前32K指令寫入I_cache中，剩下所有指令寫入MEMORY中（8字節(jié)對(duì)齊），ext_data.bin寫入MEMORY中，data.bin則寫入D_cache中，運(yùn)行通過(guò)后用ITU提供的標(biāo)準(zhǔn)輸出文件.out和測(cè)試時(shí)輸出得到的dump.out文件進(jìn)行對(duì)比，完全一致；并通過(guò)Adobe audition試聽，直到聽不出任何不同，則說(shuō)明移植成功。

3 算法優(yōu)化

如果直接把未經(jīng)優(yōu)化的C代碼程序進(jìn)行運(yùn)行，會(huì)發(fā)現(xiàn)程序執(zhí)行的效率極低，硬件平臺(tái)耗時(shí)較大，而且編譯連接后也會(huì)產(chǎn)生較大的代碼量，所以為了減少解碼的耗時(shí)與節(jié)約空間的使用，就必須對(duì)代碼及算法進(jìn)行一定的優(yōu)化，以保證能在MIPS平臺(tái)上實(shí)時(shí)解碼。

3.1 代碼精簡(jiǎn)優(yōu)化

從ITU-T官網(wǎng)得到的代碼是比較完整的，具有較健全的功能，但是針對(duì)文中的目標(biāo)而言，很多程序代碼都不是必須的，可以精簡(jiǎn)程序代碼，提高程序運(yùn)行效率。例如程序中有成千上萬(wàn)條諸如 move16（），test（），logic32（）等語(yǔ)句，由于數(shù)量龐大，調(diào)用這些小函數(shù)加起來(lái)的時(shí)間占用的比例就較大，在解碼一幀中占用比例為4%左右，基于其在本次實(shí)驗(yàn)中無(wú)用的前提，可以全部刪除；另外一些小函數(shù)略簡(jiǎn)單，諸如extract_h（），extract_l（）是對(duì)數(shù)進(jìn)行高16位和低16位的操作，而其占用時(shí)間比例也有3%左右，在程序中可以直接進(jìn)行移位取數(shù)操作而不需反復(fù)多次調(diào)用此函數(shù)；本文要實(shí)現(xiàn)的是解碼功能，所以程序中除了解碼部分之外還有大量的編碼函數(shù)和表格變量數(shù)據(jù)等，在這里可以注釋掉，而不進(jìn)行編譯與運(yùn)行。

3.2 匯編專用指令優(yōu)化

因?yàn)镸IPS32中不同于其它的RISC架構(gòu)的地方是其具有整數(shù)乘法部件，使用了兩個(gè)特殊的寄存器HI、LO，并且提供相應(yīng)的指令 mfhi/mthi，mthi/mtlo來(lái)實(shí)現(xiàn)整數(shù)乘法結(jié)果（hi/lo）寄存器與通用寄存器之間的數(shù)據(jù)交換。

在profile生成的文件中，得知算法中乘累加與乘累減占用的時(shí)間比例較大，依照原算法的機(jī)制，先讀取兩個(gè)數(shù)a1、b1到寄存器，相乘后取出得到的結(jié)果到寄存器中，然后再讀取a2、b2，相乘后得到a2*b2，再讀取上一次所得結(jié)果 a1*b1與a2*b2相加或相減，接著再取結(jié)果寫回到寄存器中，然后依次繼續(xù)同樣的操作，直到乘累加乘累減運(yùn)行結(jié)束。根據(jù)MIPS32具有整數(shù)乘法部件的特殊性，這里可以在乘累加乘累減運(yùn)算上充分地利用上，改后的算法機(jī)制是：讀取a1、b1到寄存器，相乘后不取出所得結(jié)果而是放在特殊寄存器HI和LO中保留起來(lái)，再讀取a2、b2相乘后與上次結(jié)果a1*b1直接相加，再進(jìn)行更新保留結(jié)果，而不需頻繁地取數(shù)寫數(shù)，依次進(jìn)行直到乘累加乘累減運(yùn)算結(jié)束。

比如一個(gè)10次乘累加的算法運(yùn)算，原算法耗時(shí)60個(gè)周期，修改之后的算法耗時(shí)則降為30個(gè)周期，而且是匯編語(yǔ)言，所以很明顯這大大降低了整個(gè)程序的耗時(shí)時(shí)間。

3.3 基本算子優(yōu)化

在basicop2.c文件中，都是加、減、乘、除、移位、飽和溢出等等的基本算子函數(shù)，從profile生成文件中得知這些算子函數(shù)調(diào)用次數(shù)無(wú)疑是最多的，占用了大量的時(shí)間。對(duì)此，一方面，剖析函數(shù)實(shí)現(xiàn)的功能及對(duì)語(yǔ)句進(jìn)行分析，用最精簡(jiǎn)的語(yǔ)句來(lái)實(shí)現(xiàn)算子函數(shù)所完成的功能，例如在 L_shr（）、L_shl（）、L_mac（）、L_add（）中把多條語(yǔ)句實(shí)現(xiàn)的功能合并成一條語(yǔ)句來(lái)完成等等；一方面，也可以將在算子函數(shù)中出現(xiàn)的溢出保護(hù)操作刪去，因?yàn)樵O(shè)置保護(hù)是為了最初定點(diǎn)化時(shí)測(cè)試所用；另一方面，鑒于某些算子函數(shù)較小，而又被頻繁調(diào)用，所以可以引進(jìn)內(nèi)聯(lián)函數(shù)，在函數(shù)前加inline修飾，消除了函數(shù)調(diào)用時(shí)的開銷。修改之后的這些小函數(shù)，再放入工程中替代原有的算法，保證測(cè)試結(jié)果的正確性，速度得到了提高。

3.4 重要函數(shù)優(yōu)化

查看每一幀中的profile參數(shù)，對(duì)各函數(shù)占用時(shí)間做個(gè)排名，發(fā)現(xiàn)靠前的都是相同的幾個(gè)函數(shù)，且順序基本不變，所以對(duì)這些函數(shù)需要進(jìn)行進(jìn)一步的優(yōu)化，首先對(duì)這幾個(gè)函數(shù)如Filt_6k_7k （）、Syn_filt（）、Pred_lt4 （）、Interpol（）、Scale_sig（）、HP400_12k8（）和 HP50_12k8（）進(jìn)行分析，得知其具有一個(gè)共同點(diǎn)：函數(shù)體都包含了多重for（）循環(huán)，顯然可見嵌套循環(huán)的耗時(shí)非常大，處理循環(huán)內(nèi)指令運(yùn)行有一種很好的方式就是軟件流水線技術(shù)。

在MIPS運(yùn)行的流水線中，每條指令的執(zhí)行過(guò)程被分成五個(gè) 階段：取指（IF）、譯指（ID）、指令運(yùn) 行（EXE）、訪存（MEM）、寫回?cái)?shù)據(jù)（WB），只有當(dāng)一條指令執(zhí)行階段都完成之后，該指令才算執(zhí)行完畢，在流水線中的每一個(gè)執(zhí)行階段過(guò)程，當(dāng)一條指令在該階段中完成執(zhí)行之后，下一條指令將立刻進(jìn)入到該執(zhí)行階段來(lái)執(zhí)行操作，則當(dāng)流水線處于飽和狀態(tài)時(shí)，將有5條指令在同時(shí)運(yùn)行。具體應(yīng)用其中就是對(duì)循環(huán)次數(shù)確定的循環(huán)進(jìn)行改進(jìn)，比如在Pred_lt4（）中：

另外對(duì)于循環(huán)較短的內(nèi)循環(huán)則可以直接進(jìn)行完全展開，語(yǔ)句較少，對(duì)代碼量不會(huì)有太大影響。

3.5 其他優(yōu)化

為了最大化地提高運(yùn)行效率，還做了一些常用的優(yōu)化，如在if分支語(yǔ)句中，將出現(xiàn)概率較高的分支放在前面；對(duì)乘除法的地方，用移位來(lái)代替；在多重循環(huán)中，可以將次數(shù)最多的放在最內(nèi)層，次數(shù)少的則放在外層，減少CPU跨層的次數(shù)；對(duì)switch－case語(yǔ)句可以采用if－else分支；對(duì)某些數(shù)組，用指針運(yùn)算代替數(shù)組索引，還有用局部變量代替全局變量也能減少訪問內(nèi)存的次數(shù)等等，這些小優(yōu)化也能相應(yīng)提高運(yùn)行的速率。

4 實(shí)驗(yàn)結(jié)果及分析

ITU在2001年發(fā)布了最新的語(yǔ)音傳輸質(zhì)量測(cè)量標(biāo)準(zhǔn)：P.862—PESQ（Perceptual Evaluation of Speech Quality），PESQ 是評(píng)價(jià)語(yǔ)音通信質(zhì)量的最新標(biāo)準(zhǔn)，提供完全量化的語(yǔ)音質(zhì)量衡量方法。這種標(biāo)準(zhǔn)的分值為MOS－LQO （Mean Opinion Score－Listening Quality Objective），其范圍為 0.5～4.5（0.5 最差，4.5最好），此文中用到的解碼語(yǔ)音質(zhì)量評(píng)價(jià)方法即為此標(biāo)準(zhǔn)。

4.1 原始算法性能分析

在分析和研究了AMR－WB編解碼原理的基礎(chǔ)上，先對(duì)其在VS2005編譯環(huán)境下進(jìn)行了仿真實(shí)現(xiàn)，并且通過(guò)ITU－T官網(wǎng)代碼中附帶的標(biāo)準(zhǔn)語(yǔ)音對(duì)算法的性能進(jìn)行了測(cè)試和評(píng)價(jià)。

附帶的標(biāo)準(zhǔn)語(yǔ)音內(nèi)容是嬰兒呀呀學(xué)語(yǔ)的一段4 s話語(yǔ)，音頻屬性為：純二進(jìn)制數(shù)據(jù)，采樣率16 000 Hz，量化位數(shù)為16位。在VS2005環(huán)境下運(yùn)行編解碼器，得到不同編碼模式的重建語(yǔ)音，然后在Matlab下觀察波形圖進(jìn)行比較，如圖1所示，可知該編解碼器可以在給定的速率模式下較好地還原時(shí)域波形，且編碼速率越高，失真越小，波形越接近原始語(yǔ)音。對(duì)解碼語(yǔ)音進(jìn)行主觀聽覺測(cè)試，與原始語(yǔ)音對(duì)比，難以區(qū)別，主觀聽覺感受和自然度都很好。

為了測(cè)試語(yǔ)音質(zhì)量情況，選取了10個(gè)包括男女聲和掃頻信號(hào)的語(yǔ)音文件，來(lái)自3GPP（3rd Generation Partnership Project）提供的標(biāo)準(zhǔn)測(cè)試文件[8]，經(jīng)過(guò)AMR－WB算法編解碼后計(jì)算其PESQ值，計(jì)算PESQ的方法是通過(guò)Matlab軟件工具來(lái)模擬實(shí)現(xiàn)的，表1則是給出了在各模式下其平均PESQ值。

從表1可以看出所選示例語(yǔ)音的PESQ值都在3以上，低模式的音質(zhì)稍差一些，但都達(dá)到了通信質(zhì)量的標(biāo)準(zhǔn)，且通過(guò)主觀測(cè)試試聽，和初始語(yǔ)音相比，聽不出差別，語(yǔ)音質(zhì)量良好。

4.2 移植優(yōu)化算法性能分析

依照3.2中方法進(jìn)行移植后，首先測(cè)試其程序的正確性以及解碼耗時(shí)情況，這里測(cè)試文件用的是ITU－T官網(wǎng)附帶的語(yǔ)音片段，對(duì)優(yōu)化前的算法進(jìn)行測(cè)試，輸出與標(biāo)準(zhǔn)輸出一致無(wú)誤，而耗時(shí)為一幀200 M（mips）左右，而實(shí)時(shí)要求是50 M以內(nèi)，需要對(duì)算法進(jìn)行優(yōu)化。

圖1 原始語(yǔ)音和重建端語(yǔ)音波形圖Fig.1 Wave chart of original and reconstruction voice

表1 10句語(yǔ)音各模式下的平均PESQ值Tab.1 Average PESQ of ten speech in different mode

優(yōu)化的方法如4節(jié)中所述，在每個(gè)函數(shù)或刪減步驟完成后，都要進(jìn)行獨(dú)立測(cè)試，用輸出文件和標(biāo)準(zhǔn)文件進(jìn)行對(duì)比，做到結(jié)果正確。在模式0的情況下，優(yōu)化前后的重點(diǎn)函數(shù)及模塊的耗時(shí)情況如表2所示，表中所列舉的時(shí)間周期數(shù)是指每調(diào)用一次此函數(shù)所耗用的時(shí)間。從表中可以看出優(yōu)化程度是較大的，完全優(yōu)化后再測(cè)試每幀耗時(shí)為45 M左右，滿足實(shí)時(shí)要求，接著對(duì)模式1~8進(jìn)行測(cè)試，發(fā)現(xiàn)都在40 M左右，都達(dá)到了實(shí)時(shí)的要求。

最后再進(jìn)行主觀測(cè)試，解碼輸出的語(yǔ)音都有很好的自然度與流暢性，和輸入音頻相比，主觀上分辨不出差別來(lái)。

表2 重點(diǎn)函數(shù)優(yōu)化前后指令周期數(shù)Tab.2 Instruction cycles of the focus function before and after optimization

5 結(jié) 論

AMR-WB是僅有的一個(gè)提供眾多特性的寬帶技術(shù)，使用AMR-WB編解碼后的語(yǔ)音自然度很高，可以用在3G移動(dòng)通訊系統(tǒng)的多媒體服務(wù)、寬帶包交換網(wǎng)絡(luò)、音頻和視頻會(huì)議、聊天和虛擬現(xiàn)實(shí)等網(wǎng)絡(luò)應(yīng)用、數(shù)字無(wú)線廣播等。文中在分析AMRWB技術(shù)及MIPS處理器的基礎(chǔ)上，成功地實(shí)現(xiàn)了AMR-WB解碼器在MIPS32 4Kec上的算法移植，并通過(guò)對(duì)算法進(jìn)行各種優(yōu)化，最終達(dá)到了解碼器在平臺(tái)上的實(shí)時(shí)運(yùn)行的要求。

[1]王炳錫，王洪.變速率語(yǔ)音編碼[M].西安:西安電子科技大學(xué)，2004.

[2]錢國(guó)榮，李治柱.對(duì)新型寬帶語(yǔ)音編解碼器AMR_WB的研究[J].計(jì)算機(jī)工程與應(yīng)用，2003（28）：194-196.

QIAN Guo-rong，LI Zhi-zhu.The research of new wideband speech codec AMR_WB [J].Computer Engineering and Applications，2003（28）：194-196.

[3]范錦繡，趙歡，張波濤.AMR_WB編碼算法研究和復(fù)雜度分析[J].電聲技術(shù)，2009（7）：68-72.

FAN Jin-xiu，ZHAO Huan，ZHANG Bo-tao.AMR_WB coding algorithm and complexity analysis[J].Audio Engineering，2009（7）：68-72.

[4]杜曉林，張雪英，李鳳蓮.AMR_WB算法仿真及其在TMS 320VC5509的優(yōu)化實(shí)現(xiàn)[J].電聲技術(shù)，2011（1）：67-71.

Du Xiao-lin，ZHANG Xue-ying，LI Feng-lian.Simulation of AMR_WBalgorithmandimplementationonTMS320VC5509[J].Audio Engineering，2011（1）：67-71.

[5]3GPPTS 26.171.AMR speech codec wideband General description[S].2001

[6]G.722.2.Wideband coding of speech at around 16kb/s using Adaptive Multi-Rate Wideband （AMR-WB）[S].ITU-T， 2003.

[7]MIPS R4000 Users Manual:MIPS Computer System[S].1991

[8]3GPP.TS 26.174.Adaptive Multi-Rate Wideband（AMRWB）speech codec test sequences （Release 9）[S].3GPP，2009.