999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于預測編碼和矢量編碼的語音信號編碼算法

2018-12-14 09:05:06楊超劉云飛徐向旭朱弘劉傳輝
現代電子技術 2018年24期

楊超 劉云飛 徐向旭 朱弘 劉傳輝

關鍵詞: 編碼算法; 預測編碼; 矢量編碼; 語音質量; 波形編碼; 碼率

中圖分類號: TN911.3?34 ? ? ? ? ? ? ? ? ? ?文獻標識碼: A ? ? ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2018)24?0128?04

Speech signal encoding algorithm based on predictive coding and vector coding

YANG Chao1, LIU Yunfei2, XU Xiangxu3, ZHU Hong4, LIU Chuanhui1

(1. Naval Aviation University, Yantai 264001, China; 2. Naval Aviation University Qingdao Branch, Qingdao 266041, China;

3. Unit 92635 of Chinese People′ Liberation Army, Qingdao 266041, China; 4. Unit 91602 of Chinese People′ Liberation Army, Shanghai 200082, China)

Abstract: A speech signal encoding algorithm combining the linear predictive coding, SOM neural network vector coding and Huffman coding is proposed in this paper to reduce the coding compression rate on the premise of guaranteeing a good voice quality after decoding recovery, so as to reduce the storage space of speech signals. A speech signal codec experiment was carried out by means of Matlab software programming. The experimental results show that the algorithm not only retains the advantages of good decoding voice quality and simplicity that the waveform coding algorithm has, but also has a smaller compression rate than the common waveform coding algorithm. The code rate of the coding algorithm reaches 12.8 kbit/s, smaller than 32 kbit/s, which is the code rate of the waveform coding standard G.721 using the ADPCM coding algorithm, and also the minimum code rate of waveform coding.

Keywords: encoding algorithm; predictive coding; vector coding; voice quality; waveform coding; code rate

0 ?引 ?言

語音編碼基于人類語音的產生模型,通過減少信號的冗余度和模仿人的聽覺特性來達到低碼率下的高質量編碼[1]。由于人類對通信的需求,語音編碼一直處于發展狀態,相對于音頻編碼,其發展也較為成熟。

Homer Dudley是新澤西“貝爾實驗室”的一名物理學家,他于1939年發明了聲碼器,用來進行語音信號的采集、分析與合成。第二次世界大戰期間,聲碼器發揮了舉足輕重的作用,在通信領域有著關鍵的應用。早在 1972 年,ITU?T就發布A/μ率 64 kbit/s,脈沖編碼調制(Pulse?Code Modulation,PCM)語音編碼標準G.711,并作為第一個數字電話系統,配置于世界上不同的公共電話交換網絡[2]。20世紀 80 年代,隨著人們對語音產生原理的深入了解,提出語音發聲的源?系統模型,使得語音編碼得到了突飛猛進的發展。最早的基于源?系統模型的編碼標準是于 1982 年提出的,編碼速率為 2.4 kbit/s的LPC?10聲碼器[3]。1992年ITU?T頒布了以低延遲碼激勵線性預測為核心的G.728,1996年頒布的基于共軛結構代數碼激勵線性預測編碼的G.729語音編碼器[2]。之后又陸續發展了G.723.1和利用變步長ADPCM的G.722.1等。G.718 超寬帶編碼算法也于 2010 年標準化。這類嵌入式混合編碼的共同點是核心層采用了 CELP 技術,并通過在各增強層對低層編碼殘差進行分級處理來實現碼流分層嵌套、編碼質量逐級遞增,有效解決了因互聯網通信中的分組丟失導致合成語音感知上的不連續現象[4]。目前語音編碼技術分為三類:波形編碼、參數編碼以及混合編碼?;謴偷恼Z音質量由好到差的排列情況是:波形編碼、混合編碼、參數編碼。參數編碼恢復的語音失真度較大,混合編碼效果較參數編碼的好,但是算法復雜。為此,本文提出一種波形編碼,旨在恢復的語音效果好于混合編碼,碼率低于之前的波形編碼算法。

1 ?線性預測編碼

語音線性預測編碼(Linear Prediction Coding,LPC)的基本思路是,利用已知過去的若干個語音信號的線性組合對當前的語音采樣值進行逼近(預測),使其線性預測值在最小方均誤差意義上等于語音的當前采樣值,再將預測值和當前采樣值相減,得到預測誤差,最后對預測誤差編碼。計算公式如下:

從過去的[p]個值:[x(n-1)],[x(n-2)],…,[x(n-p)]來推算當前的預測值:

[x(n)=i=1paix(n-i)] (1)

預測器的預測誤差為:

[e(n)=x(n)-x(n)=x(n)-i=1paix(n-i)] (2)

由于語音信號前后具有較強的相關性,所以,在統計意義上說,預測誤差值的變化范圍小于當前采樣值的變化范圍,因而可以用更少的碼元來表示。

2 ?基于自組織神經網絡SOM的矢量量化

矢量量化就是把需要量化的數值每n個作為一組,任何一組的n個數值都可以看成n維空間的一個點,構成一個n維矢量X。由于n維空間的每一維都是模擬量(或連續量),所以n維空間也是一個連續空間,即使每一維的最大值是有限制的,但它包含的矢量數目是無窮多的。矢量量化要做的工作就是將此n維連續空間劃分為有限個區間,在每一個區間找一個代表矢量,凡是落在本區間的所有的矢量都用該代表矢量來表示,這就是矢量量化的基本方法[4?6]。

矢量量化過程中,X′和X兩個矢量的接近程度可以有多種衡量方法,最常用的誤差測度是均方誤差,相當于兩者之間的歐幾里德距離,即:

[d(X,X′)=1ni=1n(xi-x′i)] (3)

人類的神經系統是迄今為止最復雜也是科學史上最智能的系統,即使是最先進的計算機與人腦神經系統比起來也要遜色不少。人腦神經系統可實現自動學習、模式識別和分類歸納等功能。人工神經網絡就是利用一些簡單的自適應原件及其層次組織的大規模并行聯結構組成的網絡,目的在于模仿人腦神經網絡的工作模式來處理客觀數據[7]。神經元是神經網絡的基本單元,它一般是一個多輸入單輸出的非線性結構體。

神經元的結構如圖1所示。

圖1中:[ui]是神經元的內部狀態;[θi]為閾值;[xj]為輸入信號;[wji]表示從[uj]到[ui]連接的權值;[si]為外部用來調節神經元的初始狀態輸入信號。

模型可以用以下公式表述:

[σi=jwjixj+si-θiui=f(σi)yi=g(ui)=h(σi), ?h(σi)=(g?f)(σi)] (4)

人工神經元的信息處理過程為:先對輸入信號和神經元接聯的內積運算,然后將結果通過激活函數,再經過閾值函數判決,若輸出值大于閾值門限,則神經元被激活,否則該神經元處于抑制狀態[8?10]。網絡的學習本質就是神經元根據既定規則和輸出模式自動地調節權值和閾值,以達到最終穩定的神經元狀態。

Kohonen自組織映射算法是由T.Kohonen提出的無監督的學習方式,自組織映射神經網絡SOM就是利用這一算法的人工神經網絡。這種神經網絡的輸出層為按一定規則排列的二維矩陣,網絡神經元局部連接,輸入層與輸出層間通過權值構成全連接。進行學習時,輸出層二維網絡節點對輸入層的特定模式的節點形成特殊反應,隨著輸入節點的變化,輸出節點也從一個節點轉到相應領域,這樣不僅能實現分類識別,還能掌握輸入的整體分布。

3 ?實驗結果與分析

本文提出的編碼方案是線性預測編碼、基于SOM神經網絡的矢量編碼及Huffman編碼的聯合編碼法。具體方法是,將1列語音采樣信號按照奇偶順序轉換成2列,分別對每列信號進行預測,得到誤差值,同時對2列信號的誤差值進行基于自組織神經網絡的矢量編碼;恢復語音時,譯碼過程與編碼過程相反,最后對譯碼數據用切比雪夫Ⅰ型濾波器濾波。

壓縮率的計算公式為:

[壓縮率=編碼后二進制碼總位數初始信號二進制碼總位數×100%] (5)

信噪比的計算公式為:

[SNR=10lg(PsPn)] (6)

式中:原始信號的功率為[Ps];語音的噪聲功率[Pn]。

實驗中,選取一段2 s的女聲朗讀英文的語音信號為處理對象。該語音信號采樣率為16 kHz,量化位數為8,單通道。采用10階線性預測公式計算預測值,進而計算誤差,SOM神經網絡的碼本數為15,碼本訓練次數為300次。濾波器的通帶截止頻率設置在6 000 Hz,阻帶截止頻率設為7 800 Hz,通帶波紋設為0.5 dB,阻帶衰減設為10 dB。人耳的主觀感覺是,恢復的語音信號與原始語音信號相比基本沒有差別。圖2為女聲朗讀英文的語音信號時域恢復情況,其中圖2a)為原始語音信號時域波形圖,圖2b)為對原始信號解碼和濾波計算后得到的恢復的語音信號的時域波形圖。

從圖2a)和圖2b)兩幅波形圖對比可知,與原始語音信號波形相比,恢復的語音信號基本沒有變化,只是個別時間點上語音強度略低,這是由于語音信號的高頻部分略有不同造成的。圖3為女聲朗讀英文的語音信號頻域恢復情況,圖3a)為原始語音信號頻譜圖,圖3b)為對原始信號經過解碼和濾波計算后得到的恢復語音信號頻譜圖。由圖3a)和圖3b)兩幅頻譜圖對比可得,恢復的語音信號頻譜與原始語音信號頻譜基本一致,4 000 Hz以后的高頻段略有不同,但是人耳在這個頻段范圍不敏感[8]。這與人的主觀感覺結果相一致。計算得到的信噪比為10.12 dB,壓縮率為19.97%,碼率為12.8 kbit/s。這個碼率小于采用ADPCM編碼算法的波形編碼標準G.721的碼率32 kbit/s,同時也小于采用LD?CELP編碼算法的混合編碼G.728的碼率16 kbit/s。

4 ?結 ?論

本文提出一種預測編碼、SOM自主神經網絡矢量編碼和Huffman編碼的聯合編碼算法,并在譯碼時用切比雪夫Ⅰ型濾波器對譯碼信號進行濾波。實驗結果表明,本文提出的編碼算法,譯碼語音質量良好,碼率小于采用ADPCM編碼算法的波形編碼標準G.721的碼率32 kbit/s;在保留譯碼語音質量較好和算法較簡單波形編碼算法的優點[9]的同時,本算法甚至可以達到小于采用LD?CELP編碼算法的混合編碼G.728的碼率16 kbit/s,從而可以減少語音信號的存儲空間和傳輸帶寬[10]。

注:本文通訊作者為劉云飛。

參考文獻

[1] 吳家安.現代語音編碼技術[M].北京:科學出版社,2008.

WU Jiaan. Modern speech coding technology [M]. Beijing: Science Press, 2008.

[2] 李曉明.語音與音頻信號的通用編碼方法研究[D].北京:北京工業大學,2014.

LI Xiaoming. Research on universal coding method for speech and audio signals [D]. Beijing: Beijing University of Technology, 2014.

[3] 梁冬蕾.音頻語音聯合編碼算法研究[D].西安:西安電子科技大學,2010.

LIANG Donglei. Research on audio and speech joint coding algorithm [D]. Xian: Xidian University, 2010.

[4] YANG Chao, DONG Shikun. Image compression method based on vector quantization [J]. Journal of Naval Aeronautical and Astronautic University, 2011(1): 11?14.

[5] 楊超,賀一君,任建存,等.碼本均衡矢量編碼算法[J].現代電子技術,2016,39(13):38?40.

YANG Chao, HE Yijun, REN Jiancun, et al. Codebook equilibrium algorithm for vector coding [J]. Modern electronics technique, 2016, 39(13): 38?40.

[6] MAKHOUL J, ROUCOS S, GISH H. Vector quantization in speech coding [J]. Proceedings of the IEEE, 2005, 73(11): 1551?1588.

[7] 錢海軍.基于BP神經網絡的圖像壓縮的Matlab實現[J].電腦開發與應用,2011,24(12):77?79.

QIAN Haijun. Image compression based on BP neural network using Matlab [J]. Computer development & applications, 2011, 24(12): 77?79.

[8] 王龍,杜敦偉,呂曉軍,等.基于SVM和SOM的雷達目標識別[C]//第十屆中國智能交通年會優秀論文集.北京:電子工業出版社,2015:511?515.

WANG Long, DU Dunwei, L? Xiaojun, et al. Radar target recognition based on SVM and SOM [C]// Proceedings of 10th Annual Conference of China Intelligent Transportation Systems Association. Beijing: Publishing House of Electronics Industry, 2015: 511?515.

[9] 楊晨,閆薇.利用SOM網絡模型進行聚類研究[J].網絡安全技術與應用,2014(2):44?45.

YANG Chen, YAN Wei. Research on the clustering by using SOM network model [J]. Network security technology & application, 2014(2): 44?45.

[10] 鄒瑜,帥仁俊.基于改進的SOM神經網絡的醫學圖像分割算法[J].計算機工程與設計,2016,37(9):2533?2537.

ZOU Yu, SHUAI Renjun. Improved segmentation algorithm of medical images based on SOM neural network [J]. Computer engineering and design, 2016, 37(9): 2533?2537.

主站蜘蛛池模板: 这里只有精品国产| 漂亮人妻被中出中文字幕久久| 国产www网站| 中文字幕亚洲第一| 国产精品免费p区| 婷婷亚洲视频| 不卡的在线视频免费观看| 国产国语一级毛片| 国产精品无码一二三视频| 麻豆国产在线观看一区二区| 国产福利小视频高清在线观看| 亚洲成人在线网| 操美女免费网站| 69av在线| 久久福利片| 久久黄色影院| 国产人成网线在线播放va| 亚洲国产精品无码AV| 亚洲av无码专区久久蜜芽| 亚洲IV视频免费在线光看| 国产第二十一页| 欧美不卡视频在线观看| 99热这里只有免费国产精品 | 亚洲婷婷丁香| 国产精品福利社| 乱人伦视频中文字幕在线| 欧美成一级| 国产日韩久久久久无码精品| 国产精品一区在线观看你懂的| 亚洲男人天堂网址| 国产97色在线| 伊人国产无码高清视频| 99精品久久精品| 欧美在线天堂| 国产在线91在线电影| 国产黄色免费看| 欧美成人第一页| 国产高清无码麻豆精品| 另类欧美日韩| 国产jizz| 国产一区二区在线视频观看| av午夜福利一片免费看| 婷婷五月在线视频| 中国国产A一级毛片| 国产在线小视频| 影音先锋丝袜制服| 国产一区三区二区中文在线| 视频二区亚洲精品| 国产精品视频久| 久久黄色小视频| 久久这里只有精品66| 色亚洲激情综合精品无码视频 | 日韩精品久久无码中文字幕色欲| 国产乱人乱偷精品视频a人人澡| 激情网址在线观看| 国内毛片视频| 国产99在线| 国产精品一区二区不卡的视频| 国产18在线播放| 国产精品成人不卡在线观看| 在线欧美一区| 亚洲三级a| 青青青草国产| 亚洲精品无码久久毛片波多野吉| 亚洲日韩精品欧美中文字幕| 国产手机在线小视频免费观看| 亚洲二区视频| 日本人妻一区二区三区不卡影院| 国产精品无码AⅤ在线观看播放| 国产人前露出系列视频| 亚洲VA中文字幕| 色屁屁一区二区三区视频国产| 国产91在线|日本| 国产精品专区第一页在线观看| 熟妇丰满人妻av无码区| 欧美日韩激情| 久久免费成人| 国产成人区在线观看视频| 欧美日本在线观看| 国产精品思思热在线| AV无码无在线观看免费| 精品欧美视频|