





摘" 要: 為提升多軌道數字音頻信號的峰值信噪比,降低噪聲,使音頻更加清晰,提出噪聲環境中多軌道數字音頻信號降噪方法。使用二進小波分解多軌道數字音頻,將信號分解為不同的頻率子帶,使得噪聲和信號在頻率域上分離。通過模極大值計算分解信號的奇異性,由于信號和噪聲在相同奇異性時的變化不同,因此能夠確定信號中的噪聲特點,利用層間相關搜索法找到分解后信號中的噪聲并去除,最后使用交替投影法將去除噪聲的分解信號重構,得到去除噪聲的多軌道數字音頻信號。實驗結果表明:使用該方法進行降噪后,存在噪聲的信號幅值得到了控制,一些單獨突出可認定為噪聲的信號基本消失;對低峰值信噪比的信號降噪,平均峰值信噪比提升了28 dB。
關鍵詞: 多軌道; 數字音頻信號; 信號降噪; 二進小波; 信號分解; 模極大值; 奇異性; 交替投影法
中圖分類號: TN911?34" " " " " " " " " " " " " " 文獻標識碼: A" " " " " " " " " " " "文章編號: 1004?373X(2024)13?0019?04
Noise reduction method for multi?track digital audio signal in noisy environment
ZHAO Dan, LI Rui
(Guangdong Ocean University, Zhanjiang 524000, China)
Abstract: A noise reduction method for multi?track digital audio signals in noisy environments is proposed to improve the peak signal?to?noise ratio (PSNR) of multi?track digital audio signals and reduce noise, so as to make the audio clearer. Dyadic wavelet decomposition is used for multi?track digital audio, and the signal is decomposed into different frequency sub bands to separate noise and signal in the frequency domain. The singularity of the decomposed signal is calculated by the modulus maximum. Because of the different variations of the signal and noise at the same singularity, the noise characteristics in the signal can be determined. The interlayer correlation search method is used to find out the noise in the decomposed signal and remove it. Finally, the alternating projection method is used to reconstruct the decomposed signal that has been denoised, so as to obtain a multi?track digital audio signal that has been denoised. The experimental results show that the amplitude of signals with noise is controlled after using this method for denoising, and some single prominent signals that can be identified as noise are eliminated basically. The average PSNR of the signal with low peak SNR has been increased by 28 dB.
Keywords: multi?track; digital audio signal; signal noise reduction; dyadic wavelet; signal decomposition; modulus maximum; singularity; alternating projection method
0" 引" 言
多軌道音頻信號中包含多個不同的聲道,這些聲道之間可能存在復雜的相互干擾和噪聲[1?2]。因此,如何有效地降低噪聲并保留信號的原始特性是一個具有挑戰性的問題。多軌道數字音頻信號的降噪方法可以分為兩大類:時域降噪和頻域降噪,在實際應用中通常需要根據具體情況進行選擇和優化。
文獻[3]通過重構模型和譜減法提取噪聲特征實現降噪。然而,對于低信噪比信號,譜減法可能難以有效分離噪聲和信號,而對于高信噪比信號,飽和效應可能導致信號細節丟失。文獻[4]利用VMD和SVD分解音頻信號,通過峭度原則優化SVD參數以提取噪聲特征。但峭度的選擇和參數調整需根據信號特點進行,可能影響降噪性能。文獻[5]基于生成對抗網絡構建降噪模型,并引入擴展卷積結構和遷移學習策略。盡管考慮了小樣本情況,但訓練耗時且參數優化復雜,不適用于高質量降噪需求。文獻[6]通過立體聲接收器信號和信號處理規則實現降噪,保留了立體聲分離和頻率響應。但在處理復雜噪聲和信號時,可能引入失真,影響降噪效率。
二進小波具有時間和頻率上的局部化特性[7],能夠有效地捕捉信號的瞬時變化,并且二進小波可以令噪聲和信號在頻域上分離。層間相關搜索去噪可以在去除噪聲的同時保留信號的細節部分,從而避免信號失真,并且層間相關搜索具有極好的魯棒性,基于此,本文提出噪聲環境中多軌道數字音頻信號降噪方法。
1" 多軌道數字音頻信號降噪方法
1.1" 基于二進小波的多軌道數字音頻信號分解
對于一個平方可積的函數集合[L2],對集合中的任意函數進行小波變換:
[ψa,bt=ψt-baa," " a∈R-0, b∈R] (1)
式中:[a]、[b]為尺度和位移因子;[ψ]為基本小波。
對連續的小波[ψa,bt]進行二進制離散處理可得:
[ψ2k,bt=a-k2ψt-b2k] (2)
公式(2)即為二進小波[8]。
若有一平滑函數[θt],且[θt∈L2],對該函數進行二次求導可得其微分函數:
[ψt=dθtdtψt=d2θtdt2] (3)
式中:函數[ψt]、[ψt]為小波函數。
因此對于多軌道數字音頻信號[ft]進行二進小波變換,可得:
[W′cft=cddtfθcW″cft=c2d2dt2fθc] (4)
式中:[c]為尺度,該尺度決定了[θt]的作用大小。
1.2" 基于模極大值和奇異性指數的噪聲特征提取
由于多軌道數字音頻信號[ft]與[θt]的一階微分極值點與二階微分過零點均為信號邊緣,因此,本文選擇模極大值計算多軌道數字音頻信號的奇異值[9],從而得到多軌道數字音頻信號的噪聲特征。
對于多軌道數字音頻信號[ft],若在尺度[d0]時,有一個點[d0,e0]可使:
[?Wftd0,e0?e=0] (5)
那么該點便是多軌道數字音頻信號[ft]的局部極值點,并且該極值點滿足:
[?Wftd0,e0?egt;?Wft-1d0,e0?e?Wftd0,e0?egt;?Wft+1d0,e0?e] (6)
將尺度空間[d,e]中的全部模極大值點進行連接,形成的線稱為極大值線。
對于模極大值和多軌道數字音頻信號奇異性有以下定理:
在整數中,[n]次連續且有緊支集的多軌道數字音頻信號小波[ft∈L1g,h],[g,h∈R]加入在[d0gt;0]且[?dlt;d0],[t∈g,h],多軌道數字音頻信號沒有局部極大值點,因此可以認為在[g+τ,h-τ]區間存在一致Lipschitz [α](利普希茨)。
當對多軌道數字音頻信號進行小波分解后,得到的函數可以使用Lipschitz指數來描述其奇異性[α]的大小。小波分解后的該點越平滑[α]越大,若[α]越小,則表明該點的奇異性越大。基于[α]的變化可以尋找到多軌道數字音頻信號的噪聲,存在多軌道數字音頻信號中噪聲的模極大值會因為尺度增加而減小。
1.3" 基于模極大值和交替投影算法的信號重構
1.3.1" 模極大值重構信號
使用二進小波分解多軌道數字音頻信號后,經過降噪處理后需要重構才可以重新形成音頻信號[10]。
假設存在一個多軌道數字音頻信號的集合[ht],該集合中的信號使用二進小波變換后得到的模極大值與需要降噪的多軌道數字音頻信號[ft]具有相同的模極大值。因此可以在某些條件下,將[ht]無限接近[ft],對[ht]小波變換的結果記為[W2jht],[ht]需要滿足:
1) 兩數字音頻信號在相同尺度[j]下,模極大值的橫坐標為[tjn]時存在:
[W2jhtjn=W2jftjn] (7)
2) 兩數字音頻信號在相同尺度[j]下,[W2jht]的局部模極大值均處于[tjn]中。
對于[ht]無限接近[ft],條件1)僅保證了在[tjn]處[W2jht]具有模極大值,在這種情況對條件2)需要進行變更,即:[W2jht2]在其他位置平均值盡可能小。
為了令[W2jht]的模極大值數量少以及[W2jhtjn22]最小和[W2jht]的導數能量最小,因此額外引進Sobolev(索伯列夫)范數,Sobolev范數公式為:
[h2=?∈z2W2jht22+22jdW2jhtdt22] (8)
利用式(8)可以得到初步逼近的[ht],之后采用交替投影算法得到最佳逼近的[ht],從而重構出多軌道數字音頻信號。
1.3.2" 交替投影算法
假設存在一個空間[V],在該空間內的小波函數序列均屬于[L2],以及一個由[ljt]序列構成的空間[K](該空間滿足式(8)),[?][V∈K]。令[K]包含[Φ],且[Φ]為[K]的閉凸子集,在這種情況下二進小波變換為序列空間[Δ=V?Φ]內的一個元素。因此,最逼近[fx]的[hx]便是[Δ]中的最小函數,通過在零點進行交替投影開始逼近。在空間[V]和空間[Φ]的正交投影算子為[PV]和[PΦ],同時算子滿足:
[P=PV?PΦ] (9)
式中[P]為交替正交投影算子。
對任意的序列[x=ljx∈K],如果[ljx=0]則交替的投影收斂于[Δ]空間中,Sobolev范數達到最小,即[minεjt22+22jdεjtdt22]。通過算子[P]迭代獲取多軌道音頻數字信號[fx]的二進小波變換[W2jft],再由[W2jft]重構出原始信號[fx]。
1.4" 基于層間相關搜索去除噪聲的模極大值
在多軌道數字音頻信號利用二進小波分解后需要將分解后的信號中的噪聲去除,本文利用層間關系搜索法找到噪聲并進行去除。利用層間相關搜索去除噪聲過程如下。
1) 計算全部尺度的多軌道數字音頻信號使用二進小波變換后的模極大值點。
2) 由最大尺度[2j]的極值點開始逐步向下進行處理:
① 設最大模極值點幅度為max;
② 設定噪聲門限:
[T0=(J+R)-1log21+2N] (10)
式中:[J]為模極大值的最大尺度;[N]為噪聲功率。
通過門限即可將幅度小于[T0]、尺度為[2j]的模極大值去除。
3) 向低尺度搜索。設[2j]尺度的極值點為[xi],則[2j-1]極值點為[x′i],以所在尺度[s]為半徑搜索[x′i]。
若[x′i=xi],表明[x′i]為[xi]傳播點,若不存在,則擴大搜索范圍到[xi-s, xi+s]。若存在[x′n]為極值點且幅值小于[xi],則將其作為多軌道數字音頻信號極值點保留,否則,將其視為噪聲極值點去除。重復至尺度為[22]結束。
2" 實驗分析
2.1" 實驗對象
本文選擇CCMUSIC DATASET數據庫部分數據進行實驗,選取數據庫內的具體數據情況如表1所示。
2.2" 實驗數據
在數據庫中隨機選擇一多軌道數字音頻信號,該信號波形如圖1所示,對該信號使用本文方法進行降噪處理如圖2所示。
通過圖1和圖2對比可以看出,原始的多音軌音樂的數字信號幅值極大,并且有多處單獨且突出的信號,基本可以認為是音樂信號的噪聲。經過本文方法降噪后,可以明顯地看出,音樂信號的幅值減小,并且在原始音樂信號中單獨且突出的聲音信號消失,整體信號的波動較為平緩。這表明了降噪算法的有效性,能夠顯著改善多音軌音樂信號的質量。
對數據庫中的每類數據選擇10條,使用本文方法進行降噪,每類數據降噪前后的峰值信噪比的平均值如表2所示。
通過表2可以看出,對數據庫內的音樂數據進行降噪有明顯的效果,搖滾樂的峰值信噪比僅提升了13 dB,是因為搖滾樂的原始信號峰值信噪比高。而其他峰值信噪比較低的音樂信號平均提升了28.7 dB,可見本文方法對多軌道數字音頻信號有著強大的降噪能力。
3" 結" 論
本文創新性地提出了一種多音軌數字音頻信號降噪方法,為音頻去噪領域帶來了新的視角和技術途徑,實現了對噪聲的有效抑制,同時保留了音樂信號的質感和動態范圍。這種集成方法不僅提高了去噪效果,而且具備自適應性強、計算效率高、魯棒性好、靈活性大和易于實現等特點,是處理多音軌數字音頻信號的有效工具。此外,通過精細調整算法參數,該方法能夠適應不同類型和水平的噪聲,為音頻信號的后期制作和品質提升提供了重要支持。
注:本文通訊作者為李蕊。
參考文獻
[1] 李佳,馬建芬,張朝霞.基于秘密分享和SWT的數字音頻水印算法[J].計算機工程與設計,2022,43(3):616?623.
[2] 孫夢青.基于時頻域信息提取的數字音頻樂音識別仿真[J].計算機仿真,2021,38(7):415?418.
[3] 樊一帆,張麗丹.強噪環境基于譜減法的錄音數字音頻信號降噪[J].計算機仿真,2023,40(11):433?436.
[4] 李偉光,蘭欽泓,馬賢武.基于峭度原則的VMD?SVD微型電機聲音信號降噪方法[J].中國測試,2023,49(1):111?118.
[5] 李勇斌,王彬,邵高平,等.一種基于RCGAN的水聲通信信號降噪方法[J].電子學報,2022,50(1):54?62.
[6] HAHN H P. Method for noise reduction in receiving FM stereo signals [J]. Journal of the audio engineering society: Audio, acoustics, applications, 2022, 70(3): 208?238.
[7] 王翠,鄧彩霞,劉國寧,等.一個二進小波變換像空間的再生核函數[J].高等學校計算數學學報,2021,43(1):1?15.
[8] 汪思夢,田中旭,魯洪江.改進小波包降噪與RSSD的滑動軸承聲音診斷方法[J].機械設計與研究,2023,39(3):121?125.
[9] 朱紅求,程菲,胡浩南,等.基于FFT奇異值分解的光譜信號去噪算法[J].光譜學與光譜分析,2022,42(1):277?281.
[10] 王軼楷,謝銳.基于CEEMDAN和改進小波模極大值的高低頻混合信號去噪算法[J].中北大學學報(自然科學版),2023,44(4):366?373.
[11] 李煒,劉禹,李立剛,等.基于自適應降噪的柱塞泵故障音頻特征提取方法[J].國外電子測量技術,2023,42(1):1?6.
[12] 吳蘭,楊攀,李斌全,等.大詞匯量環境噪聲下的多模態視聽語音識別方法[J].廣西科學,2023,30(1):52?60.
[13] 張珺,趙玉霞.基于改進小波變換及神經網絡的電子音樂信號識別方法[J].自動化技術與應用,2023,42(5):48?51.