羅曼
浙江傳媒學院,浙江 杭州 310018
人們的生活離不開聲音。在人耳可以識別的音頻范圍內,人們多數情況下是通過語音來獲取信息的,那么語音在復雜環境下的表現也就成為人們關注的焦點,如何最真實地在信號收發端錄制以及播放語音信號就成為一個技術層面的熱點問題。
進入21世紀以來,隨著3G通信體制的高調出現,無線通信技術不論從信息收發技術角度來講,還是終端設備的功能角度來說,都上升到了一個前所未有的層次,多媒體技術在提出若干年后,終于讓人們看到了當初的美好憧憬,現在日益風靡的電子產品的消費就能說明這一點,我們也切實感受到了技術設備變革給我們帶來的方便與快捷。
所有美好愿景的背后,是人們對于無線通信技術的依靠和信賴。人們渴望真實原始的聲音,但是經過采樣量化的數字化聲音,數據量極為龐大。龐大的數據量對應模擬聲音信號的多個頻率,我們希望在某些時刻輸出相應的音頻信號,同時盡可能地抑制掉其它音頻信號,這就需要自適應濾波技術,只需改變相應的抽頭系數,就能實現這一目標,以下我們就自適應技術做一個簡單的介紹。
自適應多碼率(AMR)語音編碼技術是歐洲電信標準協會提出的一種語音編解碼標準,與固定碼率編碼技術相比,AMR提出了一種自適應的解決方案來跟蹤快速變化的無線信道環境和本地流量情況,AMR語音編碼基于碼本激勵線性預測CELP模型,具有多種編碼速率模式,根據實時情況,AMR適時選擇一種音頻模式輸出,從而達到語音編解碼的最優組合,以滿足我們對于音頻信號處理的需求。
AMR各編碼模式均基于碼本激勵線性預測CELP語音編碼模型,CELP采用綜合分析法,是一種典型的混合編碼方案,在中低速率能夠給出高質量的合成語音,且抗噪性能更好。
CELP聲碼器取樣頻率為8000Hz,語音幀長為20ms,每幀160個采樣點,編碼器對語音信號進行分析得到CELP模型中的各種參數,LP濾波器參數,自適應和固定碼本標號及增益等。并將這些參數量化后編碼傳送到接受方,解碼器對接受到的數據進行解碼,重建出的激勵信號通過LP濾波器,最后產生合成語音。AMR聲碼器采用非對稱結構,即編碼器遠比解碼器復雜,它包括以下模塊:預處理、LPC分析、開環基音搜索、自適應碼本搜索、固定碼本搜索和濾波器更新等。
AMR技術的優勢在于從多個音頻信號中“拾取”出目標音頻信號,然后對其放大,檢波,輸出,如果對于單音頻信號,AMR技術不需要對其分揀,直接輸出,這樣就會造成編碼速率的浪費,所以我們人為地在AMR中添加一個語音識別模塊,對于低噪聲環境或單音頻模式,自動降低編碼速率,節省系統帶寬,可以利用這個帶寬放置糾錯碼信息,以保護監督傳送信息的準確性,最大限度地降低誤碼率,提高系統性能。
AMR技術的糾錯碼信息還有分類警示功能,在傳送信息的同時,告知接收端如果信息出錯,那么是在信息的那個部位發生了差錯,通過反饋信道返回后,將這部分信息進行重新發送,直到準確為止,大大提高了系統的可靠性,同時也減輕了系統發送端的檢錯任務。如果系統帶寬允許或傳送信息量不是很大的時候,我們還可以增加糾錯功能,在接收端判斷信息錯誤位置后,同步進行糾錯,這樣就會節省傳輸時間,即系統的響應特性會大大改善。
AMR模式集中的每個聲碼器都有最佳的工作范圍,在一定的信道條件范圍內某一聲碼器通話器質量是所有合成語音中最優的,AMR編碼模式的選擇必須滿足兩個條件。
1)聲碼器的可識別范圍要覆蓋系統所有工作帶寬;
2)模式之間切換要盡量使用軟切換,和平滑過渡,不要在模式間切換時發生誤碼率急劇上升的現象。
同時還應注意模式集維數不能過大,否則用來確定工作模式的模式索引會占據過多頻帶資源,而且會造成整個系統不必要的頻繁切換。
我們知道,如果不斷進行工作模式的切換,就會造成系統輸出特性抖動的現象,即輸出電平不穩,這會大大影響輸出端的誤碼率,對于數字通訊設備,如果發生門限效應,信噪比就會急劇惡化,語音信號在接收端也就不能理想輸出。
有限的頻帶資源應該主要分配常用工作模式,并且要預留保護帶寬,否則極易造成交互調制現象,影響信道特性,不能正常接收語音信號。
自適應技術在錄音,即語音合成階段的優勢,主要是動態特性很好,能夠根據不同場合,不同錄制任務及時調節信道參數以適應音頻的特性,使之最大程度與目標音頻進行匹配,并同時盡可能多地濾除或抑制掉其它音頻信號,達到即時切換目標語音都能夠清晰輸出的目的。
自適應多速率編碼技術的特點就在于能夠自主識別目標語音信號并進行鎖定輸出,在信源編碼和信道編碼之間動態分配編碼比特,編碼模式切換靈活,不僅提高了合成語音質量,還提高了系統的效率,AMR技術不僅可以應用在多音頻環境下的錄音系統中,在其它系統和業務中也有很好的應用效果和表現。現在,語音編碼技術不僅受到相關研究部門、應用部門的重視,而且相關標準的制訂也提到了議程上,因為標準是工業生產的重要前提,對通信體制的確定有很大影響。目前,關于低速率語音編碼的算法發展很快,其中AMR是其中非常重要的一種,應用的范圍也是相當廣泛,人們將從中獲得極大的效益。這些對于推動語音編碼技術的發展是十分有意義的。
[1]鮑長春.低比特率數字語音編碼基礎[M].北京:北京工業大學出版社,2001.
[2]樊昌信.通信原理[M].北京:國防工業出版社,2005.
[3]李昌立.語音編碼實用教程[M].北京:人民郵電出版社,2008.