999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

K-L變換語音波形編碼算法研究

2016-09-13 07:25:20李小航姜占才
電子設(shè)計(jì)工程 2016年3期
關(guān)鍵詞:信號實(shí)驗(yàn)

李小航,姜占才

(青海師范大學(xué) 物理系,青海 西寧 810008)

K-L變換語音波形編碼算法研究

李小航,姜占才

(青海師范大學(xué) 物理系,青海 西寧810008)

為了有效改善解碼語音的質(zhì)量,提出了一種K-L變換語音波形編碼算法。由語音幀構(gòu)造協(xié)方差矩陣,并對其進(jìn)行特征值分解,得到特征值及其對應(yīng)的特征向量,由特征向量構(gòu)造正交矩陣;用正交矩陣對語音幀作正交變換得到變換系數(shù)向量;選取適當(dāng)特征值對應(yīng)的特征向量構(gòu)造重構(gòu)矩陣;用重構(gòu)矩陣對變換系數(shù)向量作逆變換得到增強(qiáng)后的語音信號;對增強(qiáng)后的語音抽取并傳輸至解碼端;通過插值技術(shù)重構(gòu)語音信號。在不同信噪比下對不同語音樣本進(jìn)行仿真實(shí)驗(yàn),并同離散余弦變換編碼比較,實(shí)驗(yàn)表明,該算法不僅數(shù)據(jù)壓縮率高、解碼語音清晰和自然,而且同時(shí)實(shí)現(xiàn)語音良好的自適應(yīng)增強(qiáng)。

語音;K-L變換;離散余弦變換;波形編碼;自適應(yīng)增強(qiáng)

隨著數(shù)字通信技術(shù)、多媒體技術(shù)和數(shù)字信號處理技術(shù)的飛速發(fā)展,高音質(zhì)、低碼率的語音編碼方法顯得尤為重要。近幾十年來,人們對數(shù)字化語音壓縮編碼做了大量研究工作,取得了顯著的成果。經(jīng)研究發(fā)現(xiàn),直接對線性PCM碼流存儲和傳輸存在很大程度的信息冗余,至少可以對數(shù)字語音進(jìn)行4倍的壓縮[1]。為了更有效利用信道資源,人們提出許多數(shù)字語音壓縮編碼算法。

語音編碼大致分為波形編碼、參數(shù)編碼和混合編碼三類。波形編碼技術(shù)以盡可能重構(gòu)語音波形為原則進(jìn)行數(shù)據(jù)壓縮,即在編碼端以波形逼近為原則對語音信號進(jìn)行壓縮編碼,解碼端根據(jù)這些編碼數(shù)據(jù)恢復(fù)出語音信號的波形。它具有語音質(zhì)量好、抗噪聲性能強(qiáng)等優(yōu)點(diǎn),所需的碼率一般在64~16kbps之間。在 8 kHz采樣、8 bit量化時(shí),PCM、ADM和ADPCM等編碼器分別在64~16 kbps的速率上獲得了高的編碼質(zhì)量[2-3]。語音信號的頻域非線性波形編碼采用的是分段離散傅里葉變換,在獲得大壓縮比的情況下,仍能保留原始語音信號的細(xì)節(jié)特征[4]。語音信號經(jīng)過小波分解后低頻分量和高頻分量的語音自適應(yīng)壓縮編碼,也取得了一定的成效[5-6]。利用離散余弦變換后的語音信號能量主要集中在低頻段的特點(diǎn),對語音進(jìn)行壓縮編碼,其算法原理簡單,且有快速算法,被廣泛采用[7],但它不能實(shí)現(xiàn)幀間自適應(yīng)。本文提出的KL變換語音波形編碼算法,不僅算法簡單、壓縮率高、解碼語音清晰、自然,而且由于具備幀間自適應(yīng)性,能方便、有效地實(shí)現(xiàn)語音的自適應(yīng)去噪。

1 K-L變換及其編碼原理

1.1K-L變換

信號 x=[x(1),x(2),…,x(N)]T,其協(xié)方差矩陣 Cx定義為:

由λ的N階多項(xiàng)式:|λI-Cx|=0求協(xié)方差陣Cx的特征值λ1,λ2,…,λN再由式

求協(xié)方差矩陣Cx的N個(gè)特征向量A1,A2,…AN,并將其歸一化。構(gòu)造正交矩陣A,即

計(jì)算y=Ax實(shí)現(xiàn)對信號x的K-L變換。

重構(gòu)信號就是解逆變換,由下式完成

對x(n)去除噪聲,直接對x的變換y截取即可,即

1.2K-L變換語音編解碼算法原理

將語音信號分成長度為160點(diǎn)的語音幀x(n),去直流后按(1)式構(gòu)造協(xié)方差矩陣Cx,作特征值分解,構(gòu)造正交變換矩陣A;用A對x(n)作K-L變換得到變換后的信號y,將y按(3)式進(jìn)行截取得到信號y’;將y’按式(2)進(jìn)行K-L逆變換重構(gòu)語音信號x;將重構(gòu)語音x抽取為N點(diǎn)并對其編碼傳輸?shù)浇獯a端;在解碼段通過插值技術(shù)恢復(fù)為160點(diǎn)的語音幀,通過幀間拼接技術(shù),合成出語音。

2 離散余弦變換及其編碼原理

2.1離散余弦變換(DCT)

Ahmed和Rao于1974年首次給出了離散余弦變換的定義。給定序列x(n),n=0,1,…,N-1,其離散余弦變換的定義為:

逆變換定義為:

DCT的各行各列基向量均是正交歸一化的。語音信號經(jīng)過DCT變換后較大的系數(shù)集中在低頻區(qū)域,較小的系數(shù)則集中在高頻區(qū)域,具有很好的能量壓縮性能,如圖1所示。因此用部分DCT系數(shù)表示全部語音信號,可對數(shù)字化的語音信號進(jìn)行壓縮編碼。

2.2離散余弦變換編碼原理

語音信號屬于非平穩(wěn)隨機(jī)信號,大量研究結(jié)果表明,語音信號具有短時(shí)平穩(wěn)性。語音的特征參數(shù)在短時(shí)內(nèi)基本保持不變,如短時(shí)過零率、短時(shí)能量及基音周期等。利用語音信號的短時(shí)平穩(wěn)性的特點(diǎn),將語音信號分成160點(diǎn)(20 ms)的語音幀,每次僅對一幀語音信號進(jìn)行離散余弦變換,再利用離散余弦變換后語音信號的能量主要集中在低頻段的特點(diǎn),去掉高頻段的變換系數(shù)而只傳輸?shù)皖l段的變換系數(shù)。

圖1 一幀語音信號的DCTFig.1 DCT of a frame speech signal

具體實(shí)現(xiàn)步驟:對一幀語音信號進(jìn)行離散余弦變換后,根據(jù)語音信號能量在頻域的集中性,取低頻區(qū)域較大的變換系數(shù)值,舍去高頻區(qū)域較小的變換系數(shù)值,只對較大的變換系數(shù)值進(jìn)行編碼;解碼端通過離散余弦逆變換恢復(fù)原始語音信號。

3 算法仿真實(shí)驗(yàn)

3.1實(shí)驗(yàn)方案

實(shí)驗(yàn)分五組進(jìn)行:1)對同一語音樣本在一定的信噪比(13 dB)下,分別用離散余弦變換和K-L變換兩種算法進(jìn)行2倍壓縮編碼仿真實(shí)驗(yàn);2)對同一語音樣本在不同信噪比(13 dB和10 dB)下,分別用離散余弦變換和K-L變換兩種算法進(jìn)行2倍壓縮編碼實(shí)驗(yàn)仿真;3)對同一語音樣本在一定的信噪比(13 dB)下,分別用離散余弦變換和K-L變換兩種算法進(jìn)行4倍壓縮編碼仿真實(shí)驗(yàn);4)對同一語音樣本在不同信噪比(13 dB和10 dB)下,分別用離散余弦變換和K-L變換兩種算法進(jìn)行4倍壓縮編碼實(shí)驗(yàn)仿真;5)在同一信噪比(10 dB)下,對同一語音樣本分別對離散余弦變換和K-L變換4倍壓縮編碼的解碼語音進(jìn)行基音周期軌跡分析。

3.2實(shí)驗(yàn)材料(語音樣本)

實(shí)驗(yàn)用的語音取自筆者的導(dǎo)師建立的語音樣本庫。其語料為詩詞、短句和文章,錄制轉(zhuǎn)換后的數(shù)字語音均為8 kHz采樣、8 bit量化、線性PCM碼。語音樣本庫的容量是186 MB。實(shí)驗(yàn)時(shí)用的語音是從樣本庫中挑選的詩詞和短句,加入高斯白噪聲后形成帶噪的語音。實(shí)驗(yàn)用的語音樣本幀長、幀移均取160點(diǎn),幀間無重疊。

3.3實(shí)驗(yàn)程序

文中提出的算法按圖1的算法原理用matlab語言編程,以文件名klt_encode.m存儲;同時(shí),對離散余弦變換編碼算法編程,以文件名dct_encode.m存儲;在計(jì)算機(jī)上仿真實(shí)驗(yàn)。通過解碼語音的波形顯示,判定其算法的有效性。

3.4實(shí)驗(yàn)結(jié)果及分析

3.4.1解碼語音波形顯示

部分實(shí)驗(yàn)結(jié)果如圖2~5所示。圖2是同一語音樣本在信噪比為13 dB時(shí),離散余弦變換和K-L變換兩種算法進(jìn)行4倍壓縮編碼的實(shí)驗(yàn)結(jié)果。結(jié)果顯示,對信噪比為13 dB時(shí),KL變換的解碼語音波形幾乎逼近原始語音波形,而離散余弦變換的解碼語音波形稍帶有噪聲的影響。圖3是同一語音樣本在信噪比為10 dB時(shí),離散余弦變換和K-L變換兩種算法進(jìn)行4倍壓縮編碼的實(shí)驗(yàn)結(jié)果。結(jié)果顯示,對信噪比為10dB的帶噪語音樣本,K-L變換解碼語音效果明顯優(yōu)于離散余弦變換解碼語音的質(zhì)量。

3.4.2解碼語音基音周期軌跡分析

圖4是10dB下對語音的特征(基音周期)進(jìn)行比較,因?yàn)榛糁芷谑钦Z音的重要特征,是辨別語義和語者的主要特征之一,也是判定解碼語音效果的重要依據(jù),許多語音處理系統(tǒng)都要依賴于基音周期。結(jié)果顯示,利用K-L變換法解碼語音的基音周期軌跡與原始語音基音周期軌跡的走勢幾乎一致,而DCT解碼語音的基音周期軌跡沒有K-L變換法解碼語音的基音周期軌跡那么平滑,甚至部分幀的周期有減小或消失現(xiàn)象。這是由于DCT處理過程中不能實(shí)現(xiàn)幀間自適應(yīng)導(dǎo)致編碼器抗噪能力較差[8]。

圖2 13 dB下KLT和DCT解碼語音波形Fig.2 Decoding speech waveform with KLT and DCT under 13 dB SNR

圖3 10 dB下KLT和DCT解碼語音波形Fig.3 Decoding speech waveform with KLT and DCT under 10 dB SNR

圖4 10 dB下KLT和DCT解碼語音基音周期軌跡Fig.4 Track pitch of decoding speech with KLT and DCT under 10 dB SNR

4 結(jié)束語

基于K-L變換的語音波形編碼算法,在8 kHz采樣、8 bit量化的情況下,比特率為16 kbps,該算法不僅數(shù)據(jù)壓縮率高、解碼語音清晰和自然,而且同時(shí)實(shí)現(xiàn)語音良好的自適應(yīng)增強(qiáng)。

[1]韓紀(jì)慶,張磊,鄭鐵然.語音信號處理[M].北京:清華大學(xué)出版社,2010.

[2]陳溯.ADPCM語音壓縮編碼的分析與仿真[J].中國西部科技,2008,7(32):52-54.

[3]廖廣銳,劉萍.基于ADPCM的語音壓縮算法研究[J].計(jì)算機(jī)與數(shù)字工程,2007,35(7):39-41.

[4]戴憲華,黃繼武.語音信號的頻域非線性波形編碼[J].通信學(xué)報(bào),1998,19(2):1-6.

[5]劉杰平,余英林.小波域多描述變換編碼算法的研究[J].計(jì)算機(jī)應(yīng)用,2005,25(2):317-319.

[6]唐力.基于小波分解的語音自適應(yīng)壓縮感知[J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,32(2):64-68.

[7]魯業(yè)頻,李鳳亭,陳兆龍,等.離散余弦變換編碼的現(xiàn)狀與發(fā)展研究[J].通信學(xué)報(bào),2004,25(2):106-118.

[8]朱學(xué)濤,張志偉.一種快速DCT變換方法的優(yōu)化[J].電子科技,2004(9):31-33.

Speech waveform encoding algorithm research based on K-L transform

LI Xiao-hang,JIANG Zhan-cai
(Physics Department of Qinghai Normal University,Xining 810008,China)

In order to effectively improve the quality of the decoded speech,a kind of speech self-adaption enhancement algorithm based on K-L transform is put forward.Covariance matrix is constructed by speech frame vectors;eigenvalues and corresponding to eigenvectors are got by decomposing eigenvalues of covariance matrix,orthogonal matrix is constructed by the eigenvectors;the transform coefficient vector is got by orthogonal transform of frame vectors with orthogonal matrix;through the analysis,selecting the appropriate eigenvalues and corresponding to eigenvectors reconstruct the new matrix;the transform coefficient vector is used as the inverse transformation to get the enhancement speech signal with reconstruction matrix.The enhanced speech extracted and transmitted to the decoder;reconstruction speech signal with interpolation technique.Under different SNR simulation experiments on different speech,and compared with the DCT encoding,The results show that the algorithm has high data compression rate,decoding speech is clear and natural,what's more,good selfadaption enhancement of speech is realized.

speech;K-L transform;DCT;waveform encoding;self-adaption enhancement

TN391

A

1674-6236(2016)03-0008-03

2015-03-24稿件編號:201503324

李小航(1990—),男,陜西寶雞人,碩士研究生。研究方向:語音信號處理、語音編碼。

猜你喜歡
信號實(shí)驗(yàn)
記一次有趣的實(shí)驗(yàn)
微型實(shí)驗(yàn)里看“燃燒”
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
做個(gè)怪怪長實(shí)驗(yàn)
孩子停止長個(gè)的信號
NO與NO2相互轉(zhuǎn)化實(shí)驗(yàn)的改進(jìn)
實(shí)踐十號上的19項(xiàng)實(shí)驗(yàn)
太空探索(2016年5期)2016-07-12 15:17:55
基于LabVIEW的力加載信號采集與PID控制
一種基于極大似然估計(jì)的信號盲抽取算法
主站蜘蛛池模板: A级全黄试看30分钟小视频| 国产成人a在线观看视频| 99热这里只有精品5| 日本免费精品| 永久在线精品免费视频观看| 成人国产小视频| 国产一级毛片高清完整视频版| 精品视频一区在线观看| 18禁影院亚洲专区| 毛片手机在线看| 亚洲三级片在线看| 久青草免费视频| 欧美精品在线观看视频| 国产成人精品免费视频大全五级| 国产原创自拍不卡第一页| 国产成人午夜福利免费无码r| 日韩毛片免费视频| 国产一区二区网站| 伊人久久久久久久| 99久久精品久久久久久婷婷| 婷婷色在线视频| 久久久精品久久久久三级| 91在线视频福利| 国产精品成人第一区| 欧美福利在线| 亚洲欧美一区二区三区图片| 自拍亚洲欧美精品| 国产欧美日韩专区发布| 欧美日韩成人| 在线播放真实国产乱子伦| 亚洲欧洲美色一区二区三区| 国产麻豆aⅴ精品无码| 欧美日韩动态图| 9久久伊人精品综合| 国产成人午夜福利免费无码r| 国产亚洲欧美在线中文bt天堂 | 玩两个丰满老熟女久久网| 67194在线午夜亚洲| 国产成人区在线观看视频| 无码免费视频| 亚洲成a人在线观看| 99热亚洲精品6码| 久久久久国产精品嫩草影院| 波多野结衣一区二区三视频| 福利一区在线| 日韩精品毛片| 青草娱乐极品免费视频| 啦啦啦网站在线观看a毛片| 亚洲精品va| 国产精品30p| 国产三级成人| 久久免费看片| 日本免费a视频| 四虎精品国产永久在线观看| 凹凸国产分类在线观看| 亚洲男人的天堂久久香蕉 | 国产精品久久久久久影院| 亚洲日本www| 久久黄色一级视频| 亚洲国产日韩一区| 亚洲欧美激情小说另类| 国产精品人成在线播放| 爆乳熟妇一区二区三区| 全午夜免费一级毛片| 国产成人免费| 婷婷六月在线| 97视频免费看| 在线精品亚洲国产| a毛片免费观看| 麻豆精品久久久久久久99蜜桃| 中文字幕日韩丝袜一区| 欧美色丁香| 妇女自拍偷自拍亚洲精品| 五月天久久综合国产一区二区| 日韩资源站| 欧美日韩精品综合在线一区| 欧美午夜小视频| 国产经典三级在线| 国产精品原创不卡在线| 乱系列中文字幕在线视频| 亚洲国产成人久久精品软件| 亚洲欧洲日韩综合色天使|