摘 要:在過去的十年,低速率語音編碼器在民用和軍用通信以及計算機相關的語音應用方面取得重大進展。在這方面已經能夠生產高質量低速率的新的語音編碼器。這些編碼器采用代表講話的頻譜特性,提供語音波形匹配的機制,并為人類的耳朵優化編碼器的性能。文章模擬的低比特速率聲碼器(LPC)利用MATLAB實現。從LPC得到的結果進行了比較與其他實施利用小波變換的語音壓縮。從結果中,我們可以看到,小波變換的性能明顯優于LPC。
關鍵詞:LPC;載重噸;RELP;CELP
1 引言
聲碼器使用完全不同的方法進行語音編碼,稱為參數編碼,或分析/合成編碼,沒有試圖在接收機中再現精確的語音波形,只相當于是信號感知。這些系統在接收端使用一個人類語音機器模型提供更低的數據傳輸速率。最受歡迎的一個分析/合成語音編碼技術,稱為線性預測編碼(LPC),我們將在第一部分里介紹。
2 LPC系統的實現:線性預測編碼(LPC)步驟
2.1 抽樣:首先,在精確的頻率下對語音進行采樣,以便獲得對信號進行處理和重建的所有的必要的頻率成分。
2.2 分割:語音被分割成幀等待處理。語音信號的特性隨著時間變化。我們把它分成一幀一幀的以便有效的處理,每一幀都含有確定數目的樣本。
2.3 預加重:由于嘴唇發聲的輻射效應,典型語音信號的頻譜包絡具有很高的頻率衰落。因此,高頻部分有相對較低的幅度,從而增加語音頻譜的動態范圍。所以,LP分析需要很高的計算精度捕捉在高端的頻譜特征。
2.4 語音探測器:清濁探測器的目的是判定一個給定的幀為語音還是噪音。一個語音探測器可以依靠目前為止所討論的參數(能量,過零率,基音周期)作出正確的決定。一個簡單的探測器可以只使用一個參數作為輸入來完成。
2.5 基音周期估計
基音周期估計算法的設計是一個復雜的任務,由于缺乏完善的周期性,還有聲道共振峰的干擾,濁音段語音的不確定性,和其他現實世界中噪聲和回聲的影響。在實踐中,基音周期估計是計算復雜度和性能之間的一種折衷實現。已經有許多技術被提出了,在這里我們只簡單介紹一個。
自相關法:基音周期可通過計算兩峰之間的平均距離估計。完整的峰和谷在頻域內被稱為共振峰結構(共振的時候就是共振峰)。
平穩序列x(n)的自相關函數定義為
定義為在?子稱為滯后。自動意味著自我或對于同一個信號,相關意味著兩個樣本之間的關系。一個自相關數是來自于一個信號的間隔為?子的兩個樣本之間的平均相關關系。應該指出的是,當?子為正數時,求和的上限將是小于N-1的,當?子是負數時,下限大于0。因此,自相可改寫為
2.6 系數的測定:差分方程的系數(預測系數)描述了共振峰,所以LPC系統需要估計這些系數。通過最小化世紀信號與預測信號的均方誤差來進行估計。這是一個很直接的問題。在實踐中,它包括(1)計算系數矩陣,(2)一組線性方程的解。
2.8 量化:為了確保系數的穩定性(極點必須位于在z平面的單位圓)要求相對高的精度。這是因為即使是預測系數有小的變化也會引起極點位置發生較大的變動。這些中間值稱為線性頻譜系數(LSFs)。
3 結果
在本文中,采樣頻率為8 kHz和比特率為2400比特/秒。研究原始語音序列和現行預測編碼之間的區別。我們已經觀察到重建語音比輸入語音有更低的質量。重建信號聽起來更機械而且噪聲更加模糊了表1顯示了每個信號的規格。
4 離散波變換(DWT):使用離散小波變換的語音壓縮
4.1 選擇的小波:用于高質量語音編碼的小波母函數的選擇是最重要的。可以使用幾個不同的標準選擇最佳的小波函數。以使重構誤差最小化而信噪比最大化。
4.2 小波分解:小波通常把信號分解成不同的分辨率或者工作頻段,而這個任務是由選擇小波函數和計算離散小波變換(DWT)來完成的。
4.3 截斷系數:計算完語音信號的小波系數之后,要在閾值下對小波系數截斷進行壓縮。從實驗中,我們發現,大多數的系數很小。這意味著大多數的語音能量是少數的高值系數。
4.4 編碼:通過截斷值很小的系數進行信號壓縮然后再對它們編碼。把較大的系數在小波變換向量中中按位置存放。
4.5 性能指標
4.6 選擇最優分解層數:為了選擇最優的層數,我們測試了在不同水平下的兩種信號,結果被記錄在下面。
如圖2,我們觀察到,在所有的水平上男性比女性具有更好的質量;另一方面,男性信號比女性信號的壓縮因子更大。這結果是由于女性的聲音頻率更高。另外,分解超過5層后兩種語音都沒有明顯的增強,所有類型的小波幾乎是相同的結果。對于所研究的數據,3層后無明顯有意義的變化,它就是我們實驗的最佳水平。
5 結束語
從離散小波變換在壓縮語音信號的實驗中我們得到以下幾點:在可接受的信噪比情況下有很高的壓縮比。五級是最優分解水平。均方根誤差幾乎保持不變。全局閾值比水平依賴閾值技術有更好的結果。
LPC最常見的問題是在接收端如何合成更真實的語音信號。在許多情況下,一個語音幀不能被歸類為嚴格語音或嚴格噪聲。事實上,有過渡幀存在使LPC模型未能正確分類。比如說文物的嗡嗡聲和音調的噪聲。在一般情況下,為無聲幀的激勵可以用白噪聲近似。但是,對于有聲幀激勵信號是周期的信號和噪聲的組合。因此,用脈沖串進行近似是一種粗略的近似。對LPC編碼器,激勵脈沖通過激勵全通濾波器得到。
參考文獻
[1]Robust spectral parameter coding in speech processing: nadim batry
[2]Wikipedia, the free encyclopedia.
[3]SPEECH CODING ALGORITHMS.Foundation and Evolution of Standardized Coders
[4]WAI C. CHU Mobile Media Laboratory DoCoMo USA Labs San Jose, California