















摘" 要: 當多個源信號同時存在于同一頻段或時間域內(nèi)時,它們可能會相互干擾,導(dǎo)致信號混疊。這種情況下使用雙路音頻傳感器進行捕捉,無法準確地捕捉到所有源信號的信息,導(dǎo)致分離過程具有不確定性。對此,提出一種基于欠定盲源分離的雙路音頻信號噪聲自適應(yīng)分離方法。首先,構(gòu)建欠定盲源分離模型,基于小波包變換分解和重構(gòu)信號獲取信號分量,并依據(jù)信號和分量之間的互相關(guān)系數(shù)篩選分解后的分量,刪除其中的冗余分量后生成新的觀測信號;然后,依據(jù)貝葉斯信息準則的奇異值分解方法估計該源信號的數(shù)量,將其轉(zhuǎn)換為正定白化信號;最后,利用快速獨立成分分析法將該信號分類,實現(xiàn)雙路音頻信號噪聲自適應(yīng)分離。測試結(jié)果顯示:所提方法能夠在保證信號質(zhì)量的前提下完成信號變換處理,信干比均在15 dB以上;篩選后保留的各個分量相關(guān)系數(shù)均在0.65以上,有效地完成了對信號噪聲的分離。
關(guān)鍵詞: 欠定盲源分離; 雙路音頻; 信號噪聲; 自適應(yīng)分離; 小波包變換分解; 貝葉斯信息準則
中圖分類號: TN911?34" " " " " " " " " " " " " " 文獻標識碼: A" " " " " " " " " " " "文章編號: 1004?373X(2024)24?0068?05
Dual channel audio signal adaptive noise separation based on underdetermined
blind source separation
LAN Zhuangqing
(Guangxi Minzu University, Nanning 530006, China)
Abstract: When multiple source signals coexist in the same frequency band or time domain, they may interfere with each other, resulting in signal aliasing. In this case, using dual channel audio sensors for capture cannot accurately capture the information of all source signals, resulting in uncertainty in the separation process. A dual channel audio signal noise adaptive separation method based on underdetermined blind source separation is proposed. An underdetermined blind source separation model is constructed, which can decompose and reconstruct the signal based on wavelet packet transform to obtain signal components. The decomposed components are selected based on the number of interrelationships between the signal and the components, and redundant components are removed to generate new observation signals. Based on the Bayesian information criterion, the singular value decomposition method is used to estimate the quantity of the source signal and convert it into the positive definite white signal. The fast independent component analysis method is used to classify the signal, so as to realize adaptive noise separation of dual channel audio signals. The testing results show that this method can complete signal transformation processing while ensuring signal quality, the signal?to?noise ratio results are all above 15 dB, and the correlation coefficients of each component retained after screening are all above 0.65, which can effectively separate signal and noise.
Keywords: blind source separation; dual channel audio; signal noise; adaptive separation; wavelet packet transform decomposition; Bayesian information criterion
0" 引" 言
雙路音頻信號也稱為雙聲道,指的是音頻信號同時通過兩個獨立的音頻頻道進行傳輸[1]。這兩個頻道一般為左聲道和右聲道,是相互獨立的,它們共同組成了立體聲效果[2]。在雙路音頻信號噪聲自適應(yīng)分離中,分離目標是將原始信號從觀測到的信號中分離出來,且該觀測信號具備混合特點[3?4],以此提取純凈的目標信號,獲取高質(zhì)量的音頻信號。如何自適應(yīng)地處理噪聲和提高欠定盲源分離的性能,是當前研究的重點之一。文獻[5]為實現(xiàn)信號的有效處理,對音頻信號在強噪下的信號特性進行分析,并構(gòu)建聯(lián)合稀疏信號重構(gòu)模型,計算信號的功率譜后,通過譜減法實現(xiàn)音頻信號的降噪。但是譜減法在處理過程中可能會對語音信號造成一定的失真,尤其是在低信噪比條件下,會導(dǎo)致語音質(zhì)量相對粗糙。文獻[6]為處理小信號中的干擾噪聲,提取信號中描述音頻的特征向量,將提取的結(jié)果作為改進的支持向量機的輸入,對特征進行分類,再對分類出來的噪聲信號進行處理。然而在實際應(yīng)用中,處理大量音頻信號時如果應(yīng)用場景的實時性需求較高,該算法的檢測速度無法滿足。文獻[7]為有效實現(xiàn)噪聲處理,設(shè)計并行計算架構(gòu),以此滿足多時間序列數(shù)據(jù)信號的處理需求,并且采用分批計算方式進行信號處理,采用自適應(yīng)濾波方法處理信號中的噪聲。目前的并行模式在系統(tǒng)柔性、容錯性和冗余性方面存在不足,這可能導(dǎo)致在處理大型噪聲項目時,系統(tǒng)容易受到外部因素的干擾,無法滿足復(fù)雜場景下的應(yīng)用需求。文獻[8]為去除音頻中的噪聲,將音頻信號劃分為多個子帶,并在每個子帶上獨立應(yīng)用自適應(yīng)濾波技術(shù),使用遞歸的方式更新濾波器系數(shù),以最小化濾波后的信號與期望信號之間的誤差,保證噪聲處理效果。該方法在應(yīng)用時如果音頻處理規(guī)模較大并且音頻較為復(fù)雜,可能會存在音頻信號損壞現(xiàn)象。
欠定盲源分離技術(shù)作為一種有效的信號處理技術(shù),可將信號中不確定分布情況、不同的源信號進行分離[9]。基于此,本文提出一種基于欠定盲源分離的雙路音頻信號噪聲自適應(yīng)分離方法。
1" 基于欠定盲源分離的源信號提取
1.1" 欠定盲源分離問題轉(zhuǎn)換
當多個源信號同時存在于同一頻段或時間域內(nèi),它們可能會相互干擾,導(dǎo)致信號混疊。這種情況下即使使用雙路音頻傳感器進行捕捉,也無法準確地捕捉到所有源信號的信息,從而導(dǎo)致分離過程具有不確定性和非唯一性[10]。本文通過構(gòu)建欠定盲源分離模型,并基于信源數(shù)量估計和信號分解重構(gòu)處理,將欠定問題轉(zhuǎn)換為正定問題,從而為實現(xiàn)源信號分離奠定基礎(chǔ)。數(shù)量為[n]的雙路音頻原信號用[st=s1t,s2t,…,sntT]表示,其中[T]表示轉(zhuǎn)置,[t=1,2,…,M]表示信號采樣點數(shù)量。[snt]在傳播以及接收過程中受到環(huán)境干擾后,會導(dǎo)致信號發(fā)生混疊現(xiàn)象[11],此時天線陣列接收的觀測信號用[xt=x1t,x2t,…,xmtT]表示,任意[xt]均為[st]的混疊,則可構(gòu)建線性瞬時混疊欠定盲源分離問題的模型,公式為:
[xt=Ast+εt] (1)
式中:[A]表示混合矩陣;[εt]表示混疊加性噪聲。欠定盲源分離問題時[mlt;n],為有效解決該分離問題,依據(jù)[xt]進行信源數(shù)量估計并獲取[A],在此基礎(chǔ)上實現(xiàn)信號的分解和重構(gòu)處理,將欠定盲源分離問題轉(zhuǎn)換為正定盲源分離問題,再實現(xiàn)源信號分離。該分離的主要目的是將[st]從[xt]中分離出來,以此完成噪聲自適應(yīng)分離。
1.1.1" 基于小波包變換的欠定問題轉(zhuǎn)換
小波包變換是一種有效的信號處理工具,可以通過逐層分解的方式保留更完整的有效信號,實現(xiàn)信號恢復(fù)。本節(jié)利用小波包變換對觀測信號進行分解,以提取頻帶分量中的有效信息分量。被噪聲污染的雙路音頻信號是[st]和[εt]混疊形成,則噪聲信號的公式為:
[εt=st+ε1t+ε2txt] (2)
式中[ε1t]和[ε2t]分別表示電噪聲和聲學噪聲信號。
采用逐層分解的方式對高頻信號部分進行分解,以此保留更完整的有效信號,實現(xiàn)信號恢復(fù)[12]。如果小波包分解系數(shù)用[ξk]表示,則小波包變換的分解和重構(gòu)公式為:
[ξj+1,2ck=εtlh2l-kξj,clξj+1,2c+1k=εtlg2l-kξj,cl] (3)
式中:[j]表示分解尺度;[c]表示第[c]條分叉樹;[ξj,cl]表示該尺度下的分解系數(shù);[l]表示分解層數(shù);[h2l-k]和[g2l-k]分別表示低通濾波器和高通濾波器。
通過小波包變換后獲取的高頻和低頻信號中均包含源信號和噪聲信號,并且信號的能量存在一定差異。[xt]的能量計算公式為:
[Exin=1Nn=1Nξj+1,2c+1kxin2] (4)
通過上述公式即可完成[xt]的分解。根據(jù)能量[Exin]設(shè)定閾值,對高頻和低頻部分的小波系數(shù)進行篩選,高于閾值的系數(shù)被認為是有效信息,以此提取頻帶分量中的有效信息分量[Qit]。
1.1.2" 信號分量篩選
提取頻帶分量[Qit]后需要對其進行篩選,以刪除冗余分量,提高信號分離的效率和準確性[13]。本節(jié)采用互相關(guān)系數(shù)作為篩選標準,通過計算信號和分量之間的互相關(guān)系數(shù)來判斷兩者之間的關(guān)聯(lián)程度。兩者之間的關(guān)聯(lián)程度的計算公式為:
式(5)中[μxin,Qit]的值越大,表示[xin]和[Qit]之間的關(guān)聯(lián)性越大,則說明該信號的效用值越大;值越小表示相關(guān)性越小,冗余越大。將其中相關(guān)性小的信號刪除后,保留的信號重新組合形成新的觀測信號[Xt],其表達式為:
[Xt=Q1t,Q2t,…,Qp-1t,xnTμxin,Qit] (6)
在完成信號分量篩選后,需要進一步對源信號進行估計。
1.2" 源信號估計
針對前文獲取的新觀測信號[Xt],采用貝葉斯信息準則的奇異值分解方法來估計源信號的數(shù)量,并獲取轉(zhuǎn)換后的正定白化信號。
在進行信號分離前,先依據(jù)貝葉斯信息準則的奇異值分解方法估計源信號的數(shù)量,估計步驟如下。
1) 計算[Xt]的協(xié)方差矩陣[χe],公式為:
[χe=EXtXHt] (7)
式中[XHt]表示共軛轉(zhuǎn)置。
2) 通過奇異值分解對[χe]進行處理,獲取其中的主特征,并按照由大到小的順序進行排列,以此獲取主奇異值特征量[Ya],再將[Ya]中特征值等于0的元素刪除后生成長度為[L]的新特征向量。
3) 以貝葉斯信息準則為基礎(chǔ),獲取該準則的最值,從而確定源信號的數(shù)量。貝葉斯信息準則公式為:
[Bk=j=1kλj-L2σ-LL-k2kL-dk+k2χe] (8)
式中:
[σ2k=j=1LλjL-k] (9)
[dk=Lk-kk+12] (10)
式中:[k]表示變量,取值為[1≤k≤L];[j=1,2,…,L];[λj]表示特征值。
通過公式(8)獲取[Bk]的最大值對應(yīng)的特征序號值,該值即為源信號數(shù)量,將獲取的[Xt]轉(zhuǎn)換為正定盲源分離問題,獲取轉(zhuǎn)換后的正定白化信號[Zt],公式為:
[Zt=vXtBk] (11)
式中[v]表示最優(yōu)分離矩陣。
在上述公式的基礎(chǔ)上計算源信號的估計值,公式如下:
[st=vZt] (12)
最后對源信號的估計值[st]進行后續(xù)的噪聲信號自適應(yīng)分離。
2" 噪聲信號自適應(yīng)分離
通過公式(12)獲取[st]值后,采用快速獨立成分分析(FastICA)法進行噪聲信號自適應(yīng)分離。FastICA法主要是利用極大化信號的非高斯性完成分離處理,該方法能夠根據(jù)觀測信號的變化自動調(diào)整分離參數(shù),且具有適應(yīng)噪聲信號的特性可能隨時間、環(huán)境等因素發(fā)生變化的動態(tài)特性,從而可靠地分離出獨立的噪聲信號和有用信號。
如果第[τ]次迭代后的分離矩陣用[vτ]表示,則[τ+1]次迭代后的分離矩陣計算公式為:
[vτ+1=ηZtδvτ-ηvτZtvτst] (13)
式中:[η·]和[δ·]均表示函數(shù),前者對應(yīng)均值運算,后者對應(yīng)非線性,且[η·]導(dǎo)數(shù)用[η·]表示。
當[Δv=vτ+1-vτ]時,且[Δv]小于設(shè)定的迭代誤差,即可獲取[v]和[st],對[st]各個維度進行辨識后,確定各個源信號的類別,以此完成雙路音頻信號噪聲自適應(yīng)分離。為保證信號的分離效果,文中采用相關(guān)性指標量化噪聲信號分離效果,公式為:
[μs,s=vτ+1ψst,stκstκst] (14)
式中:[st]表示真實雙路音頻源信號;[κ·]表示標準差函數(shù);[ψ·]表示協(xié)方差函數(shù)。
3" 結(jié)果分析
3.1" 實驗環(huán)境
為驗證所提方法對于雙路音頻信號噪聲自適應(yīng)分離的效果,以某公司的實時雙向音頻監(jiān)聽和對講產(chǎn)生的雙路音頻信號為例展開相關(guān)測試。共計采集音頻的時序為72 h,該音頻的采集環(huán)境為正常車間內(nèi)的環(huán)境背景,信號的頻率為300~3 400 Hz。測試環(huán)境示意圖如圖1所示。
3.2" 實驗指標
本文方法在進行雙路音頻信號噪聲自適應(yīng)分離前,通過小波變換對采集的雙路音頻信號進行變換。為分析其變換效果,文中采用信干比作為評價指標,衡量信號處理后的質(zhì)量,其值越大表示信號質(zhì)量越佳,即小波變換的效果越佳。信干比的計算公式為:
[?s=10lgxtxt-Qit] (15)
3.3" 實驗測試結(jié)果分析
1) 信干比測試結(jié)果
采用本文方法進行不同頻率的雙路音頻信號處理,依據(jù)公式(15)計算信號處理后的[?s]值(期望標準達到10 dB以上),以此衡量該方法變換后的信號質(zhì)量,測試結(jié)果如表1所示。
對表1測試結(jié)果進行分析后可知,信干比結(jié)果均在15 dB以上,即使信號中噪聲干擾較大時,依舊能夠在保證信號質(zhì)量的前提下完成變換處理。
2) 信號分量篩選測試分析
利用所提方法對信號進行分解后,需對獲取的各個信號分量進行篩選,從而有效處理分量中的冗余信號。為衡量該方法的篩選效果,設(shè)定相關(guān)系數(shù)閾值為0.65,將低于該閾值的分量定義為冗余分量,篩選結(jié)果如圖2所示。
對圖2測試結(jié)果進行分析后可知:通過文中方法進行不同頻率信號的分量篩選后,保留的各個分量結(jié)果均在0.65以上,相關(guān)系數(shù)最大值接近0.96,最小值約為0.72。由此說明文中方法能夠可靠完成雙路音頻信號分量篩選,去除分量中的冗余分量,可為后續(xù)噪聲自適應(yīng)分離提供依據(jù)。
3) 噪聲分離效果分析
為驗證文中方法對于雙路音頻信號噪聲的分離效果,通過該方法對獲取的雙路音頻信號進行分離,獲取該信號的分離結(jié)果,并呈現(xiàn)分離獲取的噪聲信號情況和有效源信號情況,分離結(jié)果如圖3所示。
對圖3測試結(jié)果進行分析后可知:采用文中方法能夠完成雙路音頻信號噪聲分離,分離后源信號被有效保留,并且源信號的幅值相對穩(wěn)定地在一定范圍內(nèi)浮動;噪聲信號則呈現(xiàn)不穩(wěn)定的顯著波動。因此,文中方法能夠有效完成信號噪聲分離。
4" 結(jié)" 論
雙路音頻是多個領(lǐng)域中產(chǎn)生的較為重要的音頻信號,會存在觀測信號數(shù)量少于源信號數(shù)量的情況,此時實現(xiàn)信號中信號噪聲的可靠分離則屬于欠定盲源自適應(yīng)分離。文中為保證分離后信號質(zhì)量,提出一種基于欠定盲源分離的雙路音頻信號噪聲自適應(yīng)分離方法,對該方法的應(yīng)用效果進行相關(guān)分析,得出其能夠較好地完成雙路音頻信號噪聲分離,從而滿足應(yīng)用需求。
參考文獻
[1] 解元,鄒濤,孫為軍,等.面向高混響環(huán)境的欠定卷積盲源分離算法[J].通信學報,2023,44(2):82?93.
[2] 王晶,李煒,洪心睿,等.基于改進密度聚類算法的語音信號欠定盲分離[J].信息與控制,2023,52(6):784?796.
[3] 王力輝,劉通,謝代梁,等.基于SVD的渦街流量計信號處理方法[J].傳感技術(shù)學報,2023,36(5):731?737.
[4] 湯敏,顧煒江.多路音頻傳感信號低功耗實時采集方法設(shè)計[J].傳感技術(shù)學報,2024,37(4):690?695.
[5] 樊一帆,張麗丹.強噪環(huán)境基于譜減法的錄音數(shù)字音頻信號降噪[J].計算機仿真,2023,40(11):433?436.
[6] 高原,鄧艾東,范永勝,等.基于MFCC和MDE?SVDD的滾動軸承音頻信號異常檢測方法[J].動力工程學報,2024,44(2):277?283.
[7] 吳超,衛(wèi)謙,周俊偉,等.基于異構(gòu)計算平臺的背景噪聲預(yù)處理并行算法[J].計算機工程與科學,2023,45(10):1711?1719.
[8] TAHEREH Bahraini, ALIREZA Naeimi Sadigh. Proposing a robust RLS based subband adaptive filtering for audio noise cancellation [J]. Applied acoustics, 2024, 216: 109755.1?109755.10.
[9] 韓燁宸,賀興,艾芊.基于GRU?EEMD算法的非侵入式配電網(wǎng)功率欠定盲源分離[J].電力系統(tǒng)自動化,2023,47(14):64?71.
[10] 潘偉豪,盛卉子,王春宇,等.基于欠定盲源分離和深度學習的生豬狀態(tài)音頻識別[J].華南農(nóng)業(yè)大學學報,2024,45(5):730?742.
[11] 吳宸之,李煒,房琪,等.基于小波包混合優(yōu)化的欠定盲源分離方法[J].電子測量與儀器學報,2023,37(9):213?224.
[12] 白琳,溫媛媛,李棟.動態(tài)變化混疊模型下盲源分離中的源數(shù)估計[J].電訊技術(shù),2024,64(3):396?401.
[13] 庾天翼,李舜酩,陸建濤,等.強噪聲中檢測微弱目標信號特征的量子信號處理算法[J].計算機集成制造系統(tǒng),2024,30(2):482?495.
作者簡介:藍壯青(1979—),男,壯族,廣西南寧人,博士研究生,副教授,研究方向為音頻處理、計算機應(yīng)用。