999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

自訓練過完備字典和稀疏表示的語音增強

2015-04-12 00:00:00崔曉
現代電子技術 2015年13期

摘 要: 提出的算法利用帶噪信號進行訓練以獲得過完備字典,通過設定較大的字典訓練閾值,訓練過程只對語音信號進行,使得自訓練字典與語音信號之間相關性較強。利用該字典和較小的閾值對語音信號進行稀疏表示,進而實現語音增強。仿真實驗表明,增強后的信號表示系數稀疏度更強,增強效果在信噪比(SNR)和感知語音質量評估(PESQ)得分方面均有較大改進。

關鍵詞: 正交匹配追蹤; 迭代閾值; 字典訓練; 語音增強

中圖分類號: TN912.3?34 文獻標識碼: A 文章編號: 1004?373X(2015)13?0056?03

Abstract: In the proposed algorithm, the dictionary is trained by the signal with noise to obtain over?complete dictionary. By setting the bigger dictionary training threshold, the correlation between self?training dictionary and speech signal stronger is enhanced. The training process aims to speech signal only. The dictionary and the smaller threshold are used to conduct sparse representation of speech signal, and then speech enhancement is realized. Simulation experiment results show that the expression coefficient sparsity of the enhanced signal is stronger, the enhancement effects are greatly improved in scoring aspect of signal?to?noise ratio (SNR) and perceptual evaluation of speech quality (PESQ).

Keywords: orthogonal matching tracking; iterative threshold; dictionary training; speech enhancement

0 引 言

語音信號是人類交流過程中最自然、最常用的方式,語音增強能降低噪聲提高信噪比,是語音信號預處理的一個重要過程。在稀疏表示中,利用過完備字典中少數原子的線性組合來表示樣本信號,其優勢是有更大的靈活性和噪聲情況下更強的穩定性,因而成為目前研究較多的算法,在語音壓縮[1]、識別[2]以及語音增強[3?4]方面均得到較為廣泛的應用。在基于稀疏表示的語音增強中,過完備字典的構成起著一個非常關鍵的作用[5],良好的字典能夠使純凈語音信號的表示更加稀疏,從而與噪聲的區分度更為顯著。在這個過程中,為了得到更為稀疏的系數,所采用的字典從過完備離散余弦變換、過完備小波變換等固定字典到參數化字典設計,進而采用自適應字典學習算法訓練字典,使字典與被處理信號之間的相關性增強[6?7]。文獻[8]利用純凈信號訓練字典,將語音激活檢測估計的噪聲作為重構閾值,對含噪語音進行稀疏分解,將系數與字典重構得到無噪的語音信號。然而,在語音增強處理的過程中目標語音是受到噪聲污染的,純凈語音只能是其他語音信號。本文算法利用閾值正交匹配追蹤(OMP)和K奇異值分解算法(K?svd)直接對含噪語音進行字典訓練,得到的字典與語音信號有更強的相關度,因而得到的表示系數更為稀疏,在語音增強時取得更好的效果。

1 帶噪語音信號的稀疏重構

設觀測到的帶噪語音信號為:

[y(n)=x(n)+z(n)]

式中:[z(n)]是方差為[σ2]的高斯白噪聲;[x(n)]表示純凈語音信號;[n]表示各樣值所在時刻(為表達方便,以下省去[n])。

在無噪情況下,分幀后的純凈語音信號[x∈RM×N]是幀長為[M,]幀數為[N]的信號。對于一個過完備字典[D∈RM×L,][L>M]表示字典的冗余性。[x]可以在該字典下表示為:

[x=D*A] (1)

式中:[A]是系數,它是一個[L×N]的矩陣,各列矢量[A(:,n)0?M,]其中[1≤n≤N;][0]代表0?范數。在稀疏表示中,每幀語音信號的非0系數個數遠小于信號長度。

對于一個適合的過完備字典[D,]語音成分在其上的系數是稀疏的,而白噪聲則不具備這種特性。當已知噪聲方差[σ2]的情況下,在進行原子選擇時通過設定與其有關的恰當的閾值[ε,]可以控制只從帶噪信號中選出與純凈語音相關的系數,而摒棄與噪聲有關的系數以實現語音增強。

2 閾值正交匹配追蹤算法

在信號的稀疏表示中,由于字典的過完備性,[x]在由[D]構成的冗余基上的稀疏表示系數[A]的求解是一個非常困難的過程。快速穩定的稀疏分解與重構算法起著重要的作用,OMP屬于貪婪方法的一種,在精度要求相同的情況下,OMP由于更快且更容易實現而得到廣泛的應用。

為得到最優的稀疏表示結果,OMP使第[k]個殘差[Rk]與當前信號的近似值[yk]正交,此時該殘差與當前[yk]的任意一個原子都線性無關,從而在之后的分解過程中,不會出現之前[yk]中已經選擇過的原子,因此是最優的。傳統的OMP先將選中原子進行正交化處理,然后再將殘差在這些正交原子基上進行分解,以保證殘差與所選中的全部原子正交。改進算法在信號投影過程中,將原信號在所選中的所有原子的列空間進行正交投影,所得殘差與這些被選中的原子都正交[9]。本文采用的閾值正交匹配追蹤算法中,設定迭代結束的閾值條件,當原始信號與重構信號的殘差小于該閾值時,停止迭代。

本文閾值正交匹配追蹤算法描述如下:

輸入:過完備字典[D,]原始信號[y,]迭代閾值[ε;]輸出:稀疏系數[A,]稀疏近似所得信號[y(k)。]

處理過程如下:

(1) 初始化:殘差[r(0)=y,]選中原子索引集[Λ0=?,]迭代次數[k=1;]

循環執行步驟(2)~步驟(6):

(2) 計算殘差[r(k-1)]與字典[D]各個原子[dj]的內積,找出最大內積絕對值所對應的原子[dj]下標[λ,]用公式表示為:[λ=argmaxjr(k-1),dj];

(3) 更新索引集[Λ(k),Λ(k)(k)=λ。]將步驟(2)選中的原子加入到選中的原子集合中,更新已選中原子的集合[D(k)=[D(k-1),dλ];]

(4) 根據最小二乘法,將[y]在選中的所有原子組成的空間進行投影,計算[k]階逼近的系數[A:][A(k)=argmin:y-D(k)A2;]

(5) 更新信號估計值和殘差[y(k)=D(k)A(k),][r(k)=y-y(k);]

(6) 計算殘差的Frobenius范數[r(k)2,]若小于迭代閾值,則結束;否則[k=k+1,]轉至步驟(2)進入下一輪循環。

3 語音樣本自訓練生成的過完備字典

對于給定的語音樣本[Y,]通過訓練設計其最佳表示字典的算法就是尋找字典[D]的各個原子,以及相應的稀疏系數[A]的過程,這個運算過程可按下式進行:

[minA(:,n)0,?n∈[1,N] s.t. Y-DA2≤ε] (2)

初始化的字典可以選擇過完備離散余弦基、隨機信號或者待訓練信號的幀樣本作為訓練的初始值,這個過程要保證字典按列歸一化,即單位歐幾里德范數。在初始化字典選定后,設定迭代次數[k],整個字典學習在稀疏編碼與字典更新之間迭代完成。每次迭代包括兩個步驟:

(1)稀疏編碼階段。對給定的訓練樣本[y],利用閾值正交匹配追蹤從當前的字典[D]中選擇最佳原子,求出稀疏表示的系數[A]。

(2)字典更新。針對步驟(1)得到的稀疏系數[A,]更新字典中每一列即各個原子。K?svd算法通過對殘差矩陣進行奇異值分解,用最大特征值所對應的向量更新字典的一列,同時更新該列相對應的系數[A]的行元素,為保證系數的稀疏性,在奇異值分解計算時只用與待更新字典的列有關的殘差信號[10]。

4 提出算法描述及性能評估

4.1 算法描述

綜前所述,本文提出的語音增強算法可描述為:

(1) 噪聲方差估計。對觀測到的帶噪語音信號利用其前3 000個樣本估計噪聲方差[σ2]。

(2) 字典訓練。設定字典訓練閾值[ε1=k1Mσ]作為K?svd字典訓練時閾值OMP的迭代結束條件,初始化字典選擇過完備離散余弦基,利用分幀后帶噪語音信號訓練字典[D。]

(3) 稀疏增強。設定稀疏表示閾值[ε2=k2Mσ],對分幀后帶噪語音信號根據步驟(2)訓練的字典和[ε2]采用閾值OMP分解,得到估計的純凈語音信號系數[A。]

(4) 語音合成。由[x=DA]計算增強后的分幀語音信號,最后通過迭代相加法(OLA)得到增強的語音。

在帶噪語音字典訓練和語音信號分解的過程中,均通過閾值OMP求解系數。反復實驗表明,為使訓練的字典只與語音信號相關,步驟(1)中[k1]取值為1.6,即設置較大的迭代閾值;在語音增強中,要獲得較大的信噪比和失真度較小的語音,[k2]值設定為1.05,此時迭代閾值比噪聲略大。由于自訓練的字典與語音信號較強的相關性,在純噪聲區系數為0,而帶噪語音區則只得到純凈語音的分解,從而達到語音增強的目的。

4.2 提出算法的性能評估

實驗采用中國科學院自動化研究所開發的CASIA98?99語音測試庫,從中選取女生語料5人次和男生語料5人次作為純凈語音,為便于仿真處理,所有語音采樣率轉換為[fs]=8 000 Hz。所加噪聲為計算機隨機產生的白噪聲,信噪比分別為-5 dB,0 dB,5 dB,10 dB,15 dB,20 dB。仿真幀長取為128,字典中原子個數為384,字典冗余度為3,字典訓練時幀移為2,迭代次數為3次,稀疏增強時幀移為8,對提出算法進行仿真。

4.2.1 波形圖與語譜圖比較

如圖1所示,從上至下依次為一段原始純凈語音信號、加5 dB噪聲信號以及用提出算法增強后的信號對比。圖1(a)為信號隨時間變化的波形圖,圖1(b)為圖1(a)語音信號隨時間變化波形圖與相對應的信號語譜圖。

時域波形圖和語譜圖顯示,語音信號幾乎被5 dB白噪聲淹沒,尤其是語譜圖,僅有少量語音可見。然而經增強處理的信號,信噪比則達14.42 dB,語音波形與原始信號極為相似,語譜圖也較為清晰。表明提出的算法對即使受較強噪聲污染的信號依然有較好的處理能力,這對于語音識別和通信預處理而言非常重要。

4.2.2 對比實驗性能測試

為進一步研究提出算法的性能,將提出算法與文獻[8]中算法增強效果進行比較。測試方法為10種語音信號在不同信噪比下測試數據的平均值作為實驗結果,主要測試增強后的信噪比(SNR)、感知語音質量評估(PESQ)得分以及稀疏程度比較,其中稀疏程度通過增強信號每幀非0系數的個數平均值來反映,該值越小表明增強信號的能量集中在較少的系數,因而稀疏程度越高。對比結果見表1。

表1中數據顯示,在語音增強過程中,使用帶噪信號本身訓練字典,所得的信噪比與對比算法均有提高,最大提升值是15 dB時的1.43 dB,從PESQ得分的角度和增強信號的稀疏程度來看,提出算法除了-5 dB輸入信噪比的信號外,均有所提升,最大PESQ得分提升值是15 dB時的0.20,最大稀疏程度提升值是15 dB時的2.31。究其原因,對于-5 dB而言,過大的噪聲使得訓練字典所用的語音成分較少,所得字典與語音的相關度較小,因而提升效果不如對比算法。

5 結 論

本文在字典訓練階段利用帶噪語音信號自身進行訓練,通過設置較高的閾值,只對語音成份進行訓練得到過完備字典。在增強階段通過設置稍高于噪聲方差的迭代閾值,利用自身訓練字典與語音信號之間較強的相關性,得到更為稀疏的表示系數,獲取純凈的增強語音。仿真結果表明,提出算法能顯著地抑制背景噪聲,在信噪比和PESQ得分方面均優于對比算法,可以提高語音信號的質量,在微處理器速度日漸提高的情況下不失為一種更佳的選擇。

參考文獻

[1] 王天荊,鄭寶玉,楊震.基于自適應冗余字典的語音信號稀疏表示算法[J].電子與信息學報,2011,33(10):2372?2377.

[2] LI W F, ZHOU Y, POH N, et al. Feature denoising using joint sparse representation for in?car speech recognition [J]. IEEE Signal Processing Letters, 2013, 20(7): 681?684.

[3] 周小星,王安娜,孫紅英,等.基于壓縮感知過程的語音增強[J].清華大學學報:自然科學版,2011,51(9):1234?1238.

[4] 程經士.壓縮感知理論在語音信號去噪中的應用[J].現代電子技術,2012,35(7):84?85.

[5] 趙慧民,倪霄.壓縮感知的冗余字典及其迭代軟閾值實現算法[J].電路與系統學報,2013,18(1):59?64.

[6] SIGG C, DIKK T, BUHMANN J M. Speech enhancement using generative dictionary learning [J]. IEEE Transactions on Audio, Speech, and Language Processing, 2012, 20(6): 1698?1712.

[7] 李軼南,張雄偉,曾理,等.改進的稀疏字典學習單通道語音增強算法[J].信號處理,2014,30(1):44?50.

[8] 孫林慧,楊震.基于數據驅動字典和稀疏表示的語音增強[J].信號處理,2011,27(12):1793?1800.

[9] TROPP J, GILBERT A. Signal recovery from random measurements via orthogonal matching pursuit [J]. Transactions on Information Theory, 2007, 53(12): 4655?4666.

[10] AHARON M, ELAD M, BRUCKSTEIN A. K?SVD: an algorithm for designing overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54(11), 4311?4322.

主站蜘蛛池模板: 91无码人妻精品一区二区蜜桃| 亚洲欧美人成电影在线观看| 欧美在线视频不卡第一页| 在线观看国产黄色| 亚州AV秘 一区二区三区| 久久久波多野结衣av一区二区| 国产小视频a在线观看| 成人在线观看一区| 直接黄91麻豆网站| 婷婷成人综合| 亚洲一区二区三区麻豆| 国产精品女人呻吟在线观看| 丁香六月综合网| 成人在线不卡视频| 成人一级黄色毛片| 午夜电影在线观看国产1区| 国产精品欧美亚洲韩国日本不卡| 亚洲综合经典在线一区二区| jizz国产视频| 国产精品偷伦视频免费观看国产| 亚洲中文精品人人永久免费| 国产成人三级| 中文字幕一区二区人妻电影| 国产精品流白浆在线观看| 亚洲天堂视频在线免费观看| 一区二区在线视频免费观看| 久久黄色毛片| 亚洲国产成人精品一二区| 国产高清不卡视频| 久久久久亚洲AV成人网站软件| 中文纯内无码H| 国产黑丝一区| 午夜啪啪福利| 国产男女XX00免费观看| 日韩毛片基地| 国产精品对白刺激| 日韩在线视频网| 国产人人射| 91香蕉国产亚洲一二三区| 男人的天堂久久精品激情| 免费精品一区二区h| 成人在线不卡视频| 亚洲国语自产一区第二页| 亚洲国产理论片在线播放| 日韩视频免费| 国产美女精品人人做人人爽| 国产精品浪潮Av| 国产丝袜啪啪| 香蕉eeww99国产在线观看| 精品乱码久久久久久久| 久久久久久久久久国产精品| 免费看av在线网站网址| 色婷婷国产精品视频| 情侣午夜国产在线一区无码| 香蕉伊思人视频| 亚洲91在线精品| 欧美色香蕉| 国产情侣一区二区三区| 在线观看亚洲国产| 麻豆AV网站免费进入| 天天综合网站| AV不卡无码免费一区二区三区| 亚洲天堂网在线观看视频| 99人妻碰碰碰久久久久禁片| 中文字幕久久波多野结衣| 国产在线精品99一区不卡| 亚洲激情区| 干中文字幕| 91香蕉国产亚洲一二三区| 色综合国产| 狠狠五月天中文字幕| 亚洲人成人无码www| 久久精品视频一| 香蕉久久国产超碰青草| 91精品国产一区自在线拍| 9丨情侣偷在线精品国产| 中文字幕1区2区| 欧美日韩国产在线播放| 特黄日韩免费一区二区三区| 无码aaa视频| 亚洲无码高清一区| 国产成人亚洲欧美激情|