999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于小波變換和K-SVD的應(yīng)急廣播語音壓縮方法

2022-12-31 00:00:00鄢化彪胡超黃綠娥
計算機(jī)應(yīng)用研究 2022年11期

摘 要:針對應(yīng)急廣播中語音傳輸效率低的問題,提出了一種基于小波變換和K-奇異值分解(K-SVD)的語音壓縮方法,以提升應(yīng)急廣播信息傳輸?shù)臅r效性。首先,該方法舍棄語音小波分解得到的高頻分量,在小波合成時用隨機(jī)信號代替;其次,在低頻分量的壓縮感知過程中,用K-SVD字典學(xué)習(xí)算法訓(xùn)練的過完備字典對其稀疏表示;最后,采用改進(jìn)的基于子空間回溯的廣義正交匹配追蹤算法重構(gòu)信號。實驗結(jié)果表明,在壓縮效率為50%時,該方法重構(gòu)應(yīng)急廣播語音的客觀語音質(zhì)量評分(PESQ)達(dá)到3.717,比其他對照算法分別提升了3%~47%,說明在保證壓縮效率的同時,所提出的方法能提升應(yīng)急廣播語音重構(gòu)質(zhì)量,確保應(yīng)急廣播的傳輸時效性。

關(guān)鍵詞:語音壓縮;壓縮感知;K-奇異值分解;廣義正交匹配追蹤

中圖分類號:TN912.3 文獻(xiàn)標(biāo)志碼:A

文章編號:1001-3695(2022)11-034-3417-05

doi:10.19734/j.issn.1001-3695.2022.04.0143

Emergency broadcast speech compression based on wavelet transform and K-SVD

Yan Huabiaoa,Hu Chaoa,Huang Lyu’eb

(a.School of Science,b.School of Electrical Engineering amp; Automation,Jiangxi University of Science amp; Technology,Ganzhou Jiangxi 341400,China)

Abstract:To address the problem of low efficiency of speech transmission in emergency broadcast,this paper proposed a speech compression method based on the wavelet transform and K-singular value decomposition (K-SVD) to improve the information transmission timeliness of emergency broadcast.Firstly,this method discarded the high-frequency components which was obtained from the speech wavelet decomposition,and replaced them with random signals during the wavelet synthesis process.Next,in the compressed sensing process of the low-frequency component,it was sparsely represented by an overcomplete dictionary which was trained by the K-SVD learning algorithm.Finally,this method reconstructed the signal by an improved algorithm of the generalized orthogonal matching pursuit based on subspace backtracking.Experimental results show that the perceptual evaluation of speech quality (PESQ) of the reconstructed emergency broadcast speech reaches 3.717 at a compression efficiency of 50%,the PESQ is 3% to 47% better than the comparison algorithms.It indicates that the method can improve the speech reconstruction quality of emergency broadcast and ensure the timeliness of emergency broadcast transmission while ensuring the compression efficiency.

Key words:speech compression;compressed sensing;K-SVD;generalized orthogonal matching pursuit

基金項目:國家自然科學(xué)基金資助項目(11765008);江西省青年科學(xué)基金資助項目(20161BA216128);江西理工大學(xué)研究生創(chuàng)新計劃資助項目(XY2021-S153)

作者簡介:鄢化彪(1978-),男,江西宜春人,副教授,碩導(dǎo),碩士,主要研究方向為系統(tǒng)建模及仿真、嵌入式系統(tǒng)應(yīng)用;胡超(1997-),男,安徽池州人,碩士研究生,主要研究方向為嵌入式系統(tǒng)應(yīng)用;黃綠娥(1981-),女(通信作者),江西井岡山人,副教授,碩導(dǎo),博士,主要研究方向為信號處理(9320080310@jxust.edu.cn).

0 引言

近年來,自然災(zāi)害、公共衛(wèi)生等突發(fā)公共事件頻繁發(fā)生,諸如地震、暴雨、礦山崩塌和新冠疫情等災(zāi)難因其發(fā)生迅速、波及范圍廣和影響力強(qiáng)等特點給社會造成嚴(yán)重危害。面對突發(fā)事件,為最大程度地減少人員傷亡和經(jīng)濟(jì)損失,建立高效、及時的預(yù)警機(jī)制迫在眉睫。應(yīng)急廣播體系是我國應(yīng)急體系和國家公共服務(wù)體系的重要組成部分,肩負(fù)著第一時間向突發(fā)事件核心區(qū)域傳遞預(yù)警訊息的重要使命[1。隨著互聯(lián)網(wǎng)的快速發(fā)展,應(yīng)急廣播迎來了新的機(jī)遇,數(shù)字化應(yīng)急廣播已逐漸成為研究的熱點,相較于傳統(tǒng)應(yīng)急廣播,傳輸方式的智能化、傳輸手段的多樣化和應(yīng)急服務(wù)的精準(zhǔn)化等突出特點使其在應(yīng)急領(lǐng)域有著更加廣闊的應(yīng)用前景2。為提升數(shù)字應(yīng)急廣播面向突發(fā)事件時應(yīng)急信息傳輸?shù)臅r效性,需要對其傳輸?shù)膽?yīng)急語音進(jìn)行壓縮編碼。近年來針對此類語音壓縮的研究越來越少,本文將對此展開研究,旨在得到一種壓縮效率較高、重構(gòu)效果好、實時性高的應(yīng)急廣播語音壓縮方案。

Nyquist采樣定理要求信號的采樣頻率必須達(dá)到最高頻率的兩倍,在此條件下信號才能完整地被重建出來,這種方式不僅會因為采樣率過高而難以實現(xiàn),而且還經(jīng)常導(dǎo)致大量的數(shù)據(jù)冗余,在頻帶資源高度緊張的今天,這顯然已經(jīng)成為了一種負(fù)擔(dān)。壓縮感知(compressed sensing,CS) [3突破了這一限制,CS理論認(rèn)為,對于具備稀疏性的信號,可對其進(jìn)行稀疏采樣,重構(gòu)時利用采樣值可以較高概率地恢復(fù)出原信號。CS理論對信號邊壓縮邊采樣,在降低采樣率的同時可以很大程度地縮減存儲所需數(shù)據(jù)量。

近年來,很多學(xué)者嘗試將壓縮感知理論與語音壓縮結(jié)合起來,并取得了積極的進(jìn)展[4~7。文獻(xiàn)[8]提出采用最大可行子系統(tǒng)方案對壓縮感知語音信號進(jìn)行稀疏恢復(fù),有效改善了由于語音稀疏性不佳導(dǎo)致重構(gòu)質(zhì)量較低的問題,此方法能較高質(zhì)量地恢復(fù)語音信號,但其以犧牲重構(gòu)速度為代價來提升重構(gòu)質(zhì)量,計算量過大的局限性限制了其廣泛應(yīng)用。文獻(xiàn)[9]基于壓縮感知理論提出了一種語音壓縮和加密相結(jié)合的方案,該方法能同步完成語音信號的壓縮和加密處理,但其所采用的CT變換只能在一定程度上改善語音的稀疏性,此方法的語音重構(gòu)質(zhì)量仍有提升空間。高悅等人[10先對語音進(jìn)行小波變換,再有針對性地對低頻分量進(jìn)行壓縮感知編碼,較大程度地提升了壓縮效率,然而未能充分考慮到小波分解得到的低頻分量稀疏性同樣較差,在常規(guī)正交基上很難準(zhǔn)確地稀疏表示,其語音重構(gòu)質(zhì)量仍需進(jìn)一步提升。

在CS的稀疏表示中,采用DCT基、DFT基等正交字典未能充分考慮到語音時變、稀疏性不佳等復(fù)雜的特點,很難準(zhǔn)確地稀疏表示語音信號,從而影響重構(gòu)質(zhì)量。Aharon等人[11通過K-SVD算法來創(chuàng)建過完備字典,用該過完備字典對信號稀疏表示能提升信號稀疏性,進(jìn)而改善壓縮感知重構(gòu)性能。在壓縮感知重構(gòu)環(huán)節(jié)中,常見的重構(gòu)算法有正交匹配追蹤(OMP)[12算法、正則化正交匹配追蹤(ROMP)[13算法、分段正交匹配追蹤(StOMP)[14算法、子空間追蹤(SP)[15算法、壓縮采樣匹配追蹤(CoSaMP)[16算法、廣義正交匹配追蹤(gOMP)[17算法等,其中廣義正交匹配追蹤算法因其運行效率較高且實現(xiàn)簡單而備受關(guān)注。實際上,gOMP算法只是簡單地選取多個原子以提升重構(gòu)效率,而一旦原子選擇出錯,勢必會對信號的重構(gòu)精度和重構(gòu)成功率造成影響,為此提出一種新的基于子空間回溯的廣義正交匹配追蹤算法,通過引入子空間回溯策略對原子進(jìn)行二次篩選,能在一定程度上改善這個問題。

根據(jù)以上分析,本文提出一種小波變換和K-SVD字典學(xué)習(xí)相結(jié)合的語音壓縮算法。

1 語音信號壓縮感知模型

根據(jù)壓縮感知理論,語音信號xN×1滿足K稀疏的先驗條件,即本身僅有K個非零值或在某一變換域Ψ上僅有K個非零值(K≤N),則語音信號可由投影系數(shù)αN×1表示,這一過程為

此時用一個低維觀測矩陣ΦM×N(Mlt;N)對信號x進(jìn)行觀測投影,得到數(shù)據(jù)量更少的語音觀測值yM×1,從而實現(xiàn)了語音信號的壓縮,即

結(jié)合式(1)有

其中:A=Φ*Ψ為M×N維的傳感矩陣。

直接從式(2)中通過少量測量值yM×1重建原信號xN×1是非常困難的,一般無法直接求解,而當(dāng)觀測矩陣Φ和稀疏字典Ψ不相關(guān)時傳感矩陣A即滿足RIP特性,此時可通過求解式(3)得到稀疏估計系數(shù),再通過求解式(1)得到重構(gòu)語音信號x,這個過程即為求解最小L0范數(shù)下的最優(yōu)解問題18

對于此NP-hard難題,由于稀疏基和觀測矩陣的不相關(guān)性質(zhì),可轉(zhuǎn)換成求解最小L1范數(shù)最優(yōu)解問題:

此類最小L1范數(shù)問題可用凸優(yōu)化算法進(jìn)行求解,雖然此類算法重構(gòu)精度較高,但計算相對復(fù)雜。因此,可通過計算效率較高的貪婪追蹤算法對式(4)進(jìn)行求解。

2 基于小波變換和K-SVD字典學(xué)習(xí)的改進(jìn)語音壓縮算法

為保留語音信號的時域信息,在對語音信號進(jìn)行小波變換前應(yīng)進(jìn)行分幀預(yù)處理,本文實驗中均將語音分成10 ms的幀再進(jìn)行處理。在小波變換和K-SVD字典學(xué)習(xí)相結(jié)合的改進(jìn)語音壓縮方案中,對每幀語音信號進(jìn)行一級離散小波變換,得到高、低頻兩種分量。考慮到這兩種分量自身不同的特點,將高頻分量丟棄,小波合成時用類高頻隨機(jī)信號代替,較大程度地提高了壓縮效率。對稀疏性不佳的低頻分量采用K-SVD算法訓(xùn)練的過完備字典來稀疏表示,并以隨機(jī)高斯矩陣進(jìn)行觀測采樣,重構(gòu)時選擇本文所提出的SgOMP算法。

本文提出的基于小波變換和K-SVD字典學(xué)習(xí)的語音壓縮算法流程如圖1所示。

2.1 語音的離散小波變換

小波變換克服了傅里葉變換在時域和頻率分辨率上的不足,為分析語音這類非平穩(wěn)、時變的信號提供有力支撐。小波變換通過對語音信號進(jìn)行平移、伸縮等運算可實現(xiàn)對語音的多尺度分析[19,連續(xù)小波變換(CWT)表達(dá)式為

其中:s為伸縮因子;τ為平移因子;Ψ*為小波基函數(shù)的復(fù)共軛。對伸縮因子和平移因子進(jìn)行離散化,令s=2-j,τ=k×2-j(k和j分別表示平移尺度和縮放大小),則得到離散小波變換(DWT)公式如下:

從采樣率為8 kHz的語音中截取一幀長為256的語音樣本,經(jīng)一級小波變換后被分解成低頻(近似)分量和高頻(細(xì)節(jié))分量如圖2所示,可以看到低頻分量波形和原始信號極為相似,其保留了原始語音信號的主要信息,是語音信號能否合成的關(guān)鍵,它在時域上稀疏性不佳,對其做傅里葉變換可知其頻域稀疏性同樣較差。高頻分量又稱做細(xì)節(jié)分量,其波形無規(guī)律性,類似隨機(jī)信號,它是語音信號細(xì)節(jié)部分的體現(xiàn),對讀取語音主要內(nèi)容的影響較小,因此本文考慮不對其進(jìn)行傳輸,在小波合成時生成一個幅值類似的隨機(jī)信號代替高頻分量。具體做法是:記錄下高頻分量的平均幅值和長度,在合成時生成一個長度相同的隨機(jī)信號,并根據(jù)平均幅度對隨機(jī)信號進(jìn)行幅值歸一化處理,得到幅度近似等于高頻分量的類高頻信號,用這樣一個類高頻信號來代替高頻分量進(jìn)行小波合成能提高一倍的壓縮效率。圖2采用此種方案進(jìn)行語音合成,可以看到重構(gòu)語音波形與原信號相似度極高,說明此方案的可行性很高。

隨著小波分解級數(shù)的增加,所得到高、低頻兩種分量的比例會發(fā)生變化。同樣對上述一幀原始語音信號進(jìn)行二級小波分解,如圖3所示。

可以發(fā)現(xiàn)攜帶語音關(guān)鍵信息的低頻分量占比減少、高頻分量占比增大,重構(gòu)信號與原信號在波形的差異比一級小波分解的方案下更大。表1對比了上述一幀語音信號在一到三級小波分解的方案下與重構(gòu)信號之間的均方誤差(MSE),可以明顯看出隨著小波分解級數(shù)增加,均方誤差也在逐漸增加,說明重構(gòu)信號與原信號偏離程度越來越大。由于語音信號的重要內(nèi)容都分布在低頻部分,若盲目地追求壓縮效率而增加小波分解級數(shù),勢必會影響語音信號重構(gòu)質(zhì)量。基于上述分析,本文將采用一級小波分解方案。

2.2 基于K-SVD算法的語音信號稀疏表示

2.1節(jié)中提到語音信號經(jīng)小波一級分解得到的低頻分量稀疏性較差,若在常規(guī)基上稀疏表示,將在一定程度上影響語音重構(gòu)質(zhì)量。為了改善這個問題,本文通過K-SVD算法結(jié)合語音信號自身樣本信息訓(xùn)練一個過完備字典代替常規(guī)字典進(jìn)行稀疏表示。K-SVD算法是在K-均值(K-means)聚類算法上擴(kuò)展而來的一種字典學(xué)習(xí)算法,常規(guī)稀疏字典一般為正交方陣,而K-SVD算法通過信號本身的先驗信息構(gòu)建一個過完備字典D,該字典的列數(shù)大于行數(shù),可以更加充分地稀疏表示信號。K-SVD算法[20模型可用下式表示:

其中:X為待稀疏表示的信號;D為過完備字典;S為稀疏系數(shù)矩陣;si為S中的行向量,T為稀疏系數(shù)中非零分量數(shù)目的上限。K-SVD算法主要步驟如下:

a)字典初始化。主要有兩種初始化方法,一是構(gòu)建過完備DCT初始字典,二是選取信號樣本構(gòu)成初始化字典。本文選取語音信號樣本構(gòu)成K-SVD初始字典。

b)稀疏編碼。根據(jù)已有初始字典D,利用匹配追蹤類算法得到信號X在字典D上的最佳稀疏系數(shù)矩陣S。

c)字典更新。固定稀疏系數(shù)矩陣S,尋找最優(yōu)字典D直到滿足迭代停止條件。

本文基于語音信號的過完備字典訓(xùn)練步驟如下:a)選取若干語音信號進(jìn)行分幀處理并進(jìn)行單層小波變換,將得到的低頻分量構(gòu)成訓(xùn)練集樣本;b)初始化字典,確定K-SVD字典的主要參數(shù),即基字典原子長度n、字典原子個數(shù)g,信號稀疏表示的線性組合原子數(shù)L、算法訓(xùn)練時的迭代次數(shù)J,然后從訓(xùn)練集樣本取出信號樣本構(gòu)成初始化字典;c)稀疏編碼,通過正交匹配追蹤算法逐個求解初始字典樣本的稀疏系數(shù)向量si,得到稀疏系數(shù)矩陣S;d)更新字典,固定稀疏系數(shù)矩陣S,隨后通過奇異值分解算法逐個更新每個原子,目的是保證誤差最小;e)當(dāng)?shù)_(dá)到指定次數(shù)或誤差小于指定值時,算法結(jié)束,此時輸出過完備字典D。

根據(jù)語音信號低頻分量本身的特點,用上述K-SVD算法訓(xùn)練出適合語音信號低頻分量的過完備字典,改善了低頻分量稀疏性不理想的問題,可以對語音信號更加稀疏地表示,進(jìn)而提升了語音壓縮感知重構(gòu)質(zhì)量。

2.3 改進(jìn)的壓縮感知重構(gòu)算法

在貪婪追蹤算法中,OMP算法每次只從傳感矩陣中選擇一個相關(guān)性最大的原子因而導(dǎo)致計算效率低下,gOMP算法的提出解決了復(fù)雜的輸入信號和字典矩陣導(dǎo)致信號重構(gòu)效率變差的問題,gOMP算法每次從傳感矩陣A中選擇S列相關(guān)性最大的原子,加速了算法的收斂,很大程度地提高了計算效率。

然而gOMP算法僅僅是簡單地選擇相關(guān)性最大的S列原子加入候選集,沒有充分考慮傳感矩陣中相似原子造成的干擾,一旦選擇到多個錯誤原子極易影響信號重構(gòu)精度甚至直接導(dǎo)致重構(gòu)失敗。受SP算法啟發(fā),本文提出了一種改進(jìn)的基于子空間回溯的廣義正交匹配追蹤(SgOMP)算法,算法在候選集原子個數(shù)達(dá)到一定數(shù)目時開始引入子空間回溯思想來剔除一些錯誤原子、篩選出更可靠的原子構(gòu)成支撐集;同時,隨著支撐集中錯誤原子逐漸被剔除,算法迭代過程中殘差能量應(yīng)該滿足單調(diào)遞減的趨勢,一旦殘差能量比上一次大,說明支撐集中的原子已經(jīng)不能滿足信號重構(gòu)的要求,此時應(yīng)以更大的步長重新篩選支撐集;同時加入候選集的原子個數(shù)S也要同步增大,以提升篩選到正確原子的概率。這種自適應(yīng)調(diào)整支撐集大小的策略很大程度地保障了支撐集中原子的正確率,能進(jìn)一步保證信號的順利重構(gòu)。

綜上,SgOMP算法步驟如下:

輸入:M維觀測值y,M×N維傳感矩陣A,稀疏度K,迭代選擇原子個數(shù)S。

輸出:信號x的稀疏估計系數(shù)。

a)初始化。殘差r0=y,原子索引集Λ0=,回溯檢驗選擇原子步長L=K,算法迭代次數(shù)t=1。

b)計算相關(guān)系數(shù)u=abs[ATrt-1],選擇u中最大的S個值并記錄索引(列序號)為ut,選擇ut對應(yīng)A的列記為cj

c)更新索引集Λtt-1∪{ut},每次從A中選擇的列構(gòu)成候選集Φt={Φt-1,cj}。

d)通過最小二乘法求解y=Φtθt,即t=argminθt‖y-Φtθt‖,得到Φt對應(yīng)的稀疏估計系數(shù)t

e)若支撐集中原子個數(shù)‖Λt0≥K,則進(jìn)入步驟g);否則進(jìn)入步驟h)。

f)開始子空間回溯,從t中選擇最大的L項作為最終稀疏估計系數(shù)tL,由tL對應(yīng)的L個原子組成最終支撐集ΦtL,更新殘差rt=y-ΦtLtL,并令ΦttL,進(jìn)入步驟i)。

g)直接更新殘差rt=y-Φtt,進(jìn)入步驟i)。

h)迭代次數(shù)t=t+1。若‖rt2≤10-6或t≥K,進(jìn)入步驟j);若‖rt2≥‖rt-1‖2,則L=L+1,S=S+1,返回步驟b)繼續(xù)迭代;若‖rt2lt;‖rt-1‖2,直接返回步驟b)繼續(xù)迭代。

i)停止迭代,輸出稀疏估計系數(shù)tLt

3 實驗結(jié)果與分析

本章將對SgOMP算法的重構(gòu)性能和基于小波變換和K-SVD字典學(xué)習(xí)的語音壓縮算法性能進(jìn)行驗證。本文實驗計算機(jī)配置為:Intel CoreTM i5-10200H CPU@ 2.40 GHz,16 GB內(nèi)存,Windows 10系統(tǒng),仿真環(huán)境為MATLAB R2020b。

3.1 SgOMP算法重構(gòu)性能測試

為驗證SgOMP算法的重構(gòu)性能,生成長度N=256的一維高斯稀疏信號進(jìn)行測試,M×N維的高斯隨機(jī)矩陣被用做對信號觀測采樣,實驗另選取OMP、ROMP、StOMP、SP、CoSaMP、gOMP幾種算法作對比。不同稀疏度下的算法重構(gòu)成功率對比如圖4所示,其中測量數(shù)M固定為128。不同測量數(shù)下的算法重構(gòu)成功率對比如圖5所示,其中信號稀疏度K固定為20。實驗重復(fù)1 000次取平均結(jié)果。

圖4中,在信號稀疏度Kgt;35時,其余幾種算法都已經(jīng)無法100%地準(zhǔn)確重構(gòu)出信號,此時只有g(shù)OMP和SgOMP算法仍能保持良好的重構(gòu)性能;在Kgt;60時,由于原信號稀疏性越來越差,信號中非零元素越來越多,多數(shù)算法已經(jīng)很難保證挑選到足夠的正確原子,重構(gòu)已經(jīng)非常困難,只有g(shù)OMP和本文的SgOMP算法仍能以一定的概率重構(gòu)出原信號。SgOMP算法是由于加入了回溯檢驗的思想獲得了主動剔除錯誤原子的能力,所以重構(gòu)概率下降速度要慢于gOMP算法。上述分析說明在測量數(shù)一定時,SgOMP算法重構(gòu)信號時對稀疏度的要求更低。

圖5中,隨著測量數(shù)M的增大,各種算法的重構(gòu)成功率都呈現(xiàn)上升趨勢。在測量數(shù)Mlt;80時,SgOMP算法的信號重構(gòu)成功率明顯優(yōu)于其余幾種算法;在Mgt;80時,SgOMP算法的信號重構(gòu)成功率已經(jīng)接近100%,其余幾種算法需要Mgt;90后才能100%精確重構(gòu)出信號。上述分析說明,在稀疏度K相同時,本文提出的SgOMP算法只需要較少的測量數(shù)就能精確地重構(gòu)出原信號。

3.2 語音壓縮仿真

為驗證基于小波變換和K-SVD字典學(xué)習(xí)的語音壓縮算法的性能,實驗選用NOIZEUS語音庫[21中的干凈語音,該干凈語音由3名男性和3名女性錄制,每人5句共計30句,采樣率為8 kHz,從中隨機(jī)選取20句用做K-SVD字典學(xué)習(xí),從剩下的干凈語音中選取1句進(jìn)行壓縮仿真。實驗中確定K-SVD字典的最佳參數(shù)為:每個原子長度n=44,字典原子總個數(shù)g=1 000,

信號稀疏表示的線性組合原子數(shù)L=2,算法訓(xùn)練時的迭代次數(shù)J=20。實驗中分別選取傳統(tǒng)壓縮感知法(簡稱傳統(tǒng)CS

法)、文獻(xiàn)[9,10,23]和本文方法進(jìn)行實驗對照,實驗重復(fù)50次取平均結(jié)果。其中傳統(tǒng)CS法用FFT基對信號稀疏表示,用隨機(jī)高斯矩陣對信號觀測采樣,重構(gòu)算法為OMP算法。本文中壓縮率CR定義為式(9),同時選取信噪比SNR(式(10))、分段信噪比SSNR(式(11))和語音客觀質(zhì)量評估 (PESQ)[22這三個評價標(biāo)準(zhǔn)來評估算法性能,其中PESQ是一種國際標(biāo)準(zhǔn),被用來估計原語音信號和降級信號的MOS分(平均意見評分),它被認(rèn)為是當(dāng)今最復(fù)雜且最準(zhǔn)確的估計方法。PESQ對兩段語音信號濾波后進(jìn)行聽覺變換再提取兩個參數(shù),最后進(jìn)行輸出映射PESQ得分,映射過程如式(12)所示,其結(jié)果在-0.5~4.5(數(shù)值越大說明語音質(zhì)量越高)。

其中:M為信號測量值;N為原信號長度。

其中:x表示原始語音;z表示原始語音與重構(gòu)語音的差值。

其中:S為總幀數(shù);xss分別為第S幀原始語音和重構(gòu)語音。M為每幀信號長度。

其中:dSYM為對稱干擾;dASYM為非對稱干擾。

表2中,相同的壓縮率下,本文方法重構(gòu)語音的各項評價指標(biāo)均優(yōu)于其余幾種方案。其中壓縮效率為50%時,本文方法重構(gòu)語音的PESQ評分達(dá)到了3.642,比其余幾種方法依次提升約1.05、0.08、0.14和0.07。圖6、7分別給出了原始語音和本文方法重構(gòu)語音的短時傅里葉變換時頻圖以供比較,可以看出,原始語音信號的能量都分布在低頻部分,當(dāng)50%壓縮率時采用本文方法重構(gòu)語音的能量分布與原始語音極為接近,語音主要能量被很好地恢復(fù)出來。

3.3 應(yīng)急廣播語音測試結(jié)果

為進(jìn)一步驗證基于小波變換和K-SVD字典學(xué)習(xí)的語音壓縮算法在應(yīng)急廣播中的可行性,選擇20段多人錄制的應(yīng)急廣播語音構(gòu)成實驗語音庫,采樣率為44.1 kHz,從中隨機(jī)選擇一部分用做K-SVD過完備字典的訓(xùn)練,從剩下的語音中選擇兩段用做壓縮測試。其中,測試語音1的主題為“突發(fā)事件緊急疏散”,時長為24 s,由女性錄制;語音2的主題為“新冠疫情防控宣傳”,時長為30 s,由男性錄制。實驗中確定K-SVD字典的最佳參數(shù)為:字典原子長度n=255,原子個數(shù)g=1500,信號稀疏表示的線性組合原子數(shù)L=2,算法訓(xùn)練時的迭代次數(shù)J=20。本次實驗分別選取傳統(tǒng)CS法、文獻(xiàn)[10,23]和本文方法進(jìn)行實驗對照。

表3、4分別給出了兩段應(yīng)急廣播語音的重構(gòu)SNR、SSNR和PESQ評分,顯然本文方法的語音重構(gòu)質(zhì)量優(yōu)于其余方案。其中壓縮率為50%時,語音1的PESQ評分達(dá)到了3.391,比列舉出的算法依次提升了約1.13、0.2和0.44;語音2的PESQ評分達(dá)到了3.717,分別比傳統(tǒng)CS法和文獻(xiàn)[10,23]提升了約1.2、0.1和0.48。圖8、9分別比較了這兩段語音原始波形和采用本文方法重構(gòu)語音波形,可以看到,重構(gòu)語音波形高度相似于原語音波形,僅少數(shù)采樣點處有細(xì)微的差異。經(jīng)多次測試,在壓縮率為50%時,本文方法重構(gòu)的語音1和2經(jīng)人耳主觀評測均能達(dá)到清晰易懂的程度。

上述分析說明,基于小波變換和K-SVD字典學(xué)習(xí)算法的語音壓縮方法能較大程度地壓縮語音信號且能保持較高的重構(gòu)質(zhì)量,進(jìn)而可以縮短應(yīng)急廣播中的應(yīng)急信息傳輸所用時間,提升了應(yīng)急信息傳輸時效性。

4 結(jié)束語

本文提出了一種基于小波變化和K-SVD字典學(xué)習(xí)的語音壓縮算法,利用離散小波變換出色的時頻分析能力,在多尺度下將信號分解為高頻和低頻兩種分量并分別進(jìn)行有針對性的處理,提高壓縮效率的同時盡可能保留語音的可懂度。將K-SVD算法與語音樣本結(jié)合起來,能更稀疏地表示語音信號,提升了壓縮感知重構(gòu)精度和語音重構(gòu)質(zhì)量。將子空間回溯思想引入傳統(tǒng)的gOMP算法中,賦予了gOMP算法主動糾錯的能力,一定程度上提高了信號壓縮感知重構(gòu)精度和重構(gòu)概率。

實驗結(jié)果表明,基于小波變化和K-SVD字典學(xué)習(xí)的語音壓縮方法比現(xiàn)有的方法有著更加出色的語音重構(gòu)性能,能在一定程度上提升應(yīng)急廣播語音傳輸?shù)膶崟r性。值得注意的是,本文提出的應(yīng)急廣播語音壓縮方案考慮的是一般情況下的語音,未來可進(jìn)一步將噪聲干擾等復(fù)雜因素考慮進(jìn)來,結(jié)合現(xiàn)實中的具體需求設(shè)計出更符合實際應(yīng)用的應(yīng)急廣播語音壓縮方案。

參考文獻(xiàn):

[1]李曉北,王磊.應(yīng)急廣播:彰顯人民廣播初心使命[J].中國廣播電視學(xué)刊,2021(1):23-25,43.(Li Xiaobei,Wang Lei.Emergency broadcast:highlighting the original mission of people’s broadcast[J].China Radio amp; TV Academic Journal,2021(1):23-25,43.)

[2]許志強(qiáng),曹三省.全媒體視域下突發(fā)公共事件智能媒體應(yīng)急平臺研究[J].現(xiàn)代傳播,2016,38(12):133-136.(Xu Zhiqiang,Cao Sanxing.Research on intelligent media emergency platform for public emergency in the perspective of all media[J].Modern Communication,2016,38(12):133-136.)

[3]Qin Shun.Simple algorithm for L1-norm regularisation-based compressed sensing and image restoration[J].IET Image Processing,2020,14(14):3405-3413.

[4]Jia Xiaoli,Liu Peilin,Jiang Sumxin.Speech compressive sampling using approximate message passing and a Markov chain prior[J].Sensors,2020,20(16):4609.

[5]Parkale Y V,Nalbalwar S L.Optimized structural compressed sensing matrices for speech compression[J].IETE Journal of Research,2020,66(6):756-771.

[6]Moreno-Alvarado R,Rivera-Jaramillo E,Nakano M,et al.Simulta-neous audio encryption and compression using compressive sensing techniques[J].Electronics,2020,9(5):863.

[7]Ahmed I,Khan A,Khan A,et al.Efficient measurement matrix for speech compressive sampling[J].Multimedia Tools and Applications,2021,80(13):20327-20343.

[8]Firouzeh F F,Chinneck J W,Rajan S.Maximum feasible subsystem algorithms for recovery of compressively sensed speech[J].IEEE Access,2020,8:82539-82550.

[9]Al-Azawi M K M,Gaze A M.Combined speech compression and encryption using chaotic compressive sensing with large key size[J].IET Signal Processing,2018,12(2):214-218.

[10]高悅,臧明相,郭馥英.基于小波變換和壓縮感知的語音信號壓縮研究[J].計算機(jī)應(yīng)用研究,2017,34(12):3672-3674,3680.(Gao Yue,Zang Mingxiang,Guo Fuying.Research on speech compression based on wavelet transform and compressed sensing[J].Application Research of Computers,2017,34(12):3672-3674,3680.)

[11]Aharon M,Elad M,Bruckstein A.K-SVD:an algorithm for designing overcomplete dictionaries for sparse representation[J].IEEE Trans on Signal Processing,2006,54(11):4311-4322.

[12]Tropp J A,Gilbert A C.Signal recovery from random measurements via orthogonal matching pursuit[J].IEEE Trans on Information Theory,2007,53(12):4655-4666.

[13]Needell D,Vershynin R.Uniform uncertainty principle and signal recovery via regularized orthogonal matching pursuit[J].Foundations of Computational Mathematics,2009,9(3):317-334.

[14]Donoho D L,Tsaig Y,Drori I,et al.Sparse solution of underdetermined systems of linear equations by stagewise orthogonal matching pursuit[J].IEEE Trans on Information Theory,2012,58(2):1094-1121.

[15]Dai Wei,Milenkovic O.Subspace pursuit for compressive sensing signal reconstruction[J].IEEE Trans on Information Theory,2009,55(5):2230-2249.

[16]Needell D,Tropp J A.CoSaMP:iterative signal recovery from incomplete and inaccurate samples[J].Applied and Computational Harmonic Analysis,2009,26(3):301-321.

[17]Asogbon M G,Lu Y,Samuel O W,et al.GBRAMP:a generalized backtracking regularized adaptive matching pursuit algorithm for signal reconstruction[J].Computers amp; Electrical Engineering,2021,92(6):107189.

[18]程準(zhǔn),魯植雄.改進(jìn)SA-SP算法的路面不平度信號壓縮感知采集研究[J].計算機(jī)應(yīng)用研究,2020,37(8):2433-2436.(Cheng Zhun,Lu Zhixiong.Research on compression sensing acquisition of road roughness based on improved SA-SP algorithm[J].Application Research of Computers,2020,37(8):2433-2436.)

[19]彭成,王松松,賀婧,等.基于離散小波變換和隨機(jī)森林的軸承故障診斷研究[J].計算機(jī)應(yīng)用研究,2021,38(1):101-105.(Peng Cheng,Wang Songsong,He Jing,et al.Research on bearing fault diagnosis based on discrete wavelet transform and random forest[J].Application Research of Computers,2021,38(1):101-105.)

[20]李帥永,毛維培,程振華,等.基于VMD和K-SVD字典學(xué)習(xí)的供水管道泄漏振動信號壓縮感知方法[J].儀器儀表學(xué)報,2020,41(3):49-60.(Li Shuaiyong,Mao Weipei,Cheng Zhenhua,et al.Compressed sensing method for leakage vibration signal in water-supply pipelines based on VMD and K-SVD dictionary learning[J].Chinese Journal of Scientific Instrument,2020,41(3):49-60.)

[21]Hu Yi,Loizou P C.Subjective evaluation and comparison of speech enhancement algorithms[J].Speech Communication,2007,49(7-8):588-601.

[22]Rix A W,Beerends J G,Hollier M P,et al.Perceptual evaluation of speech quality (PESQ):a new method for speech quality assessment of telephone networks and codecs[C]//Proc of IEEE International Conference on Acoustics,Speech,and Signal Processing.Piscataway,NJ:IEEE Press,2001:749-752.

[23]劉建生,趙茂君,李忠兵,等.基于廣義Jaccard系數(shù)的SWOMP語音壓縮感知重建算法[J].鄭州大學(xué)學(xué)報:理學(xué)版,2022,54(1):75-80.(Liu Jiansheng,Zhao Maojun,Li Zhongbing,et al.SWOMP speech compression sensing reconstruction algorithm based on genera-lized Jaccard coefficient[J].Journal of Zhengzhou University:Natural Science Edition,2022,54(1):75-80.)

主站蜘蛛池模板: 久久精品一卡日本电影| 日韩毛片视频| 日本一区高清| 亚洲天堂伊人| 亚洲av无码成人专区| 色婷婷在线播放| 亚洲高清中文字幕| 青青操视频在线| 天天综合色网| 国产天天色| 香蕉eeww99国产精选播放| 久久黄色影院| 久久亚洲美女精品国产精品| 专干老肥熟女视频网站| 欧美中文字幕无线码视频| 国产尤物jk自慰制服喷水| 中文字幕永久视频| 国产婬乱a一级毛片多女| 2021国产在线视频| 五月天丁香婷婷综合久久| 亚洲视频在线观看免费视频| 国产精品一区二区不卡的视频| 1769国产精品免费视频| 亚洲清纯自偷自拍另类专区| 亚洲第一在线播放| 亚洲三级影院| 孕妇高潮太爽了在线观看免费| 国产一级毛片yw| AⅤ色综合久久天堂AV色综合| 国产成人av大片在线播放| 国产午夜无码片在线观看网站| 国产高清免费午夜在线视频| 国产在线精品人成导航| 在线观看视频一区二区| 91九色国产porny| 亚洲无码四虎黄色网站| 精品国产免费观看一区| 欧美午夜网站| 欧洲精品视频在线观看| 中文字幕乱码中文乱码51精品| 蜜臀av性久久久久蜜臀aⅴ麻豆| 九九线精品视频在线观看| 尤物成AV人片在线观看| 亚洲,国产,日韩,综合一区| 大香伊人久久| 天堂成人在线| 亚洲一级毛片在线播放| 波多野结衣的av一区二区三区| 日本人妻丰满熟妇区| 在线观看国产精美视频| 免费毛片网站在线观看| 国产精品国产三级国产专业不| 99视频在线免费| 亚洲精品成人片在线观看| 国产乱肥老妇精品视频| 日本一区二区三区精品视频| 日韩av手机在线| 欧美伦理一区| 人妻免费无码不卡视频| 久久96热在精品国产高清| 国产婬乱a一级毛片多女| 国产一级二级在线观看| 国产精品福利导航| 精品视频在线一区| 亚洲综合第一区| 日本精品影院| 女人18毛片久久| 日韩在线视频网站| 欧美成人精品一区二区| 国产一区二区精品高清在线观看| 欧美区一区| 伊人福利视频| 精品国产aⅴ一区二区三区| 在线观看欧美精品二区| 波多野结衣无码视频在线观看| 国产一级视频久久| 亚洲码一区二区三区| 精品无码一区二区在线观看| 国产精品视频观看裸模| 伊人婷婷色香五月综合缴缴情| 亚亚洲乱码一二三四区| 国内精品一区二区在线观看|