朱曉雨,曹自平,崔紅濤
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
超聲波作為一種機(jī)械波在金屬內(nèi)傳播時(shí)能量損失較小,面向密閉金屬腔體內(nèi)外間進(jìn)行無線通信時(shí),與具有金屬屏蔽效應(yīng)的電磁波相比是一種更為理想的信息傳輸媒介[1]。超聲波穿金屬無線通信系統(tǒng)的主要信道噪聲是回波,這主要來自于超聲波進(jìn)出金屬時(shí)在超聲換能器/金屬界面產(chǎn)生的反射。隨著超聲波的工作頻率增加,回波會(huì)與主脈沖響應(yīng)信號重疊而導(dǎo)致主脈沖響應(yīng)波形無法被分辨,嚴(yán)重干擾信號解碼,從而極大地限制了通信質(zhì)量和通信速率。
針對超聲波金屬信道回波干擾問題,近年來國內(nèi)外學(xué)者進(jìn)行了大量研究。2007年,Primerano等人[2]使用信道建模的方式對信道進(jìn)行估計(jì),通過預(yù)校正濾波器消除回波干擾的措施改善了通信質(zhì)量。2017年,田棟[3]基于系統(tǒng)辨識的辦法獲得金屬信道傳遞函數(shù),在較好分析回波形成機(jī)制的基礎(chǔ)上,采用在信道前端添加預(yù)校正濾波器的方案來抵消回波??紤]到超聲波金屬信道對環(huán)境條件比較敏感,溫度波動(dòng)以及材料種類和信道長度的變化等都會(huì)對回波的幅度和衰減周期產(chǎn)生影響[4],因此以上回波“硬消除”改善通信質(zhì)量的方法在實(shí)際應(yīng)用中有較多的制約。另一方面,一些學(xué)者嘗試了使用自適應(yīng)濾波器算法等的“軟消除”方法來抑制回波干擾。Pujari等人[5]使用LMS算法設(shè)計(jì)并實(shí)現(xiàn)了一種基于FPGA的自適應(yīng)回聲抵消濾波器。田義德等人[6]提出一種有指導(dǎo)信號的均衡技術(shù),利用基于LMS的自適應(yīng)均衡器辨識出信道回波傳遞函數(shù),使用軟消除方法實(shí)現(xiàn)回波的消除。于偉健等人[7]通過在自適應(yīng)濾波器中使用LMS算法模擬回聲路徑,然后在輸入信號中減去回聲信號,從而實(shí)現(xiàn)回聲消除的目的。需要指出的是,這些自適應(yīng)的“軟消除”方法仍然存在較多制約,如LMS算法會(huì)引入誤差而導(dǎo)致回聲消除不穩(wěn)定[8],而NLMS、RLS算法的計(jì)算復(fù)雜度比較高等[9-12]。
針對現(xiàn)有超聲波穿金屬無線通信系統(tǒng)中回波消除技術(shù)的局限,該文引入深度學(xué)習(xí)方法來實(shí)現(xiàn)一種新的回波消除技術(shù)方案,基于全卷積時(shí)域音頻分離網(wǎng)絡(luò)(Conv-TasNet)從含有回波信號和各種噪聲的混合信號中分離出源信號,從而實(shí)現(xiàn)通信接收端信噪比的改善。
全卷積時(shí)域音頻分離網(wǎng)絡(luò)即Conv-TasNet[13],作為一種近年來興起的盲源分離技術(shù)在語音識別領(lǐng)域顯示了諸多優(yōu)勢,例如與TasNet[14](Time-domain Audio Separation Network)即時(shí)域音頻分離網(wǎng)絡(luò)相比,極大地減少了參數(shù)量和計(jì)算成本。超聲波盡管和通常意義的語音同屬聲波,但是它的頻率要高于語音至少一個(gè)數(shù)量級,同時(shí)超聲波穿金屬無線通信的噪聲主要來自于回波,因此噪聲類型顯著不同。為了充分檢驗(yàn)Conv-TasNet在超聲波穿金屬無線通信中回波消除的可行性,該文選用的超聲波通信頻率為10 MHz,這遠(yuǎn)高于通常意義的語音近三個(gè)數(shù)量級。
Conv-TasNet由編碼器、分離網(wǎng)絡(luò)和解碼器三個(gè)部分組成。編碼器將輸入信號轉(zhuǎn)換為中間特征空間中的相應(yīng)表示,解碼器模塊通過轉(zhuǎn)換掩蔽之后的編碼器特征來重建源波形。編碼器和解碼器之間的分離網(wǎng)絡(luò)是影響信號重構(gòu)性能的關(guān)鍵部分。Conv-TasNet網(wǎng)絡(luò)使用時(shí)域卷積網(wǎng)絡(luò)(Temporal Convolutional Network,TCN)作為分離網(wǎng)絡(luò)的特征提取器,然后將提取的特征作為掩膜對分離網(wǎng)絡(luò)的輸入特征進(jìn)行掩蔽操作,從而估計(jì)出源信號的特征。Conv-TasNet基本框圖如圖1所示。

圖1 全卷積時(shí)域音頻分離網(wǎng)絡(luò)基本框圖

wt=H(Uxt)
(1)
其中,矩陣U是Conv-TasNet的網(wǎng)絡(luò)參數(shù),H(·)是網(wǎng)絡(luò)的ReLU非線性變換函數(shù)。
假設(shè)時(shí)域信號是由C個(gè)源信號混疊的混合信號,則分離網(wǎng)絡(luò)為每幀語音xt都估計(jì)C個(gè)掩膜{mt,1,…,mt,c,…,mt,C},然后將估計(jì)的掩膜應(yīng)用于wt,得到分離后的源信號特征dt,c:
dt,c=mt,c⊙wt
(2)
其中,⊙表示按元素乘。如圖2(a)所示,分離網(wǎng)絡(luò)是一種時(shí)域卷積網(wǎng)絡(luò),TCN的每一層都是由一組一維卷積塊疊構(gòu)而成的,每個(gè)一維卷積算子的內(nèi)部結(jié)構(gòu)如圖2(b)所示。

(a)Conv-TasNet網(wǎng)絡(luò)結(jié)構(gòu) (b)每個(gè)一維卷積算子的內(nèi)部結(jié)構(gòu)
在得到分離后的數(shù)據(jù)幀{dt,1,…,dt,c,…,dt.C}以后,通過以下的線性變換將分離后的特征恢復(fù)為時(shí)域信號波形:

(3)

為驗(yàn)證Conv-TasNet網(wǎng)絡(luò)在超聲波信號中的分離效果,通過采集超聲波通信設(shè)備在進(jìn)行通信時(shí)產(chǎn)生的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證。該實(shí)驗(yàn)將獲取數(shù)據(jù)的超聲波通信設(shè)備[15]分為發(fā)送端和接收端兩部分。發(fā)送端使用攝像頭采集圖像數(shù)據(jù),圖像數(shù)據(jù)經(jīng)FPGA調(diào)制電路后,驅(qū)動(dòng)發(fā)送端超聲換能器。發(fā)送端超聲換能器將電信號轉(zhuǎn)換成易于穿透金屬安全殼的超聲波信號。接收端超聲換能器將超聲波信號轉(zhuǎn)換成電信號,經(jīng)過FPGA解調(diào)電路后驅(qū)動(dòng)VGA顯示器顯示圖像。超聲波通信系統(tǒng)框圖如圖3所示。圖4為超聲波通信采集信號過程。

圖3 超聲通信系統(tǒng)框圖

圖4 超聲通信系統(tǒng)采集信號
使用DSOS604A示波器同時(shí)采集超聲波通信設(shè)備發(fā)送端和接收端的超聲波信號。其中發(fā)送端輸出的超聲波信號是源信號,用作模型的標(biāo)簽,接收端輸入的超聲波信號是混合了噪聲的待模型分離的信號。超聲波通信速率為2 Mbps,采樣頻率為50 MHz,連續(xù)采集20 000組超聲波信號,每組信號都包括一個(gè)混合信號mix和一個(gè)源信號s。將所有數(shù)據(jù)量按6∶2∶2的比例將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測試集。
將網(wǎng)絡(luò)的初始學(xué)習(xí)率設(shè)置為0.001。如果在3個(gè)連續(xù)的epoch內(nèi),驗(yàn)證集的準(zhǔn)確性沒有提高,則學(xué)習(xí)率將減半。優(yōu)化器選擇使用Adam。卷積自動(dòng)編碼器使用50%的stride size。
表1是網(wǎng)絡(luò)的超參數(shù)設(shè)置。

表1 超參數(shù)設(shè)置
主要的模型分離質(zhì)量的評估量包括SDRi(SDR Improvement)、SI-SDRi(SI-SDR Improvement)、波形相似系數(shù)。其中有源失真信噪比(Source-to-Distortion Ratio,SDR)是輸入信號的功率與輸入信號和重構(gòu)信號之差的功率之比。SDR的計(jì)算公式如下:

(4)


Conv-TasNet網(wǎng)絡(luò)直接將優(yōu)化評價(jià)指標(biāo)尺度不變信噪比SI-SDR作為損失函數(shù),將最大化尺度不變信噪比作為訓(xùn)練目標(biāo)。
為了進(jìn)一步評估模型的分離質(zhì)量,本實(shí)驗(yàn)又加入了波形相似系數(shù)和誤碼率兩個(gè)評估量。其中波形相似系數(shù)的計(jì)算公式為:
(6)
其中,λij為波形相似系數(shù),值越大說明波形越相似,其取值范圍為[0,1]。誤碼率的計(jì)算公式為:
其中,信噪比r=20 lg(Vs/Vn),Vs為接收端信號幅度,Vn為接收端噪聲幅度。
2.4.1 文中方法的有效性驗(yàn)證
為了選擇合適的epoch數(shù)量,分別繪制出在不同epoches下訓(xùn)練的網(wǎng)絡(luò)的Train Loss和Valid Loss數(shù)值曲線,如圖5所示。

圖5 Conv-TasNet網(wǎng)絡(luò)模型的損失函數(shù)
從圖5可以看出,驗(yàn)證集損失函數(shù)loss在第45代是最低的,為防止訓(xùn)練過擬合,選擇第45代訓(xùn)練后的模型作為整個(gè)分離系統(tǒng)的模型。
經(jīng)過測試集對訓(xùn)練之后模型的評估,測試集數(shù)據(jù)的SDR平均提升量為13.57 dB,SI-SDR平均提升量為39.70 dB,波形相似系數(shù)為0.977。圖6為分離前后時(shí)域信號對比圖,其中圖6(a)為混合信號時(shí)域圖;圖6(b)為源信號時(shí)域圖;圖6(c)為重構(gòu)信號時(shí)域圖。圖7為分離前后信號的頻譜對比圖,其中圖7(a)為混合信號頻譜圖;圖7(b)為源信號頻譜圖;圖7(c)為重構(gòu)信號頻譜圖。

圖6 分離前后時(shí)域信號對比

圖7 分離前后信號的頻譜對比
從圖6和圖7可以看出,估計(jì)信號波形與源信號波形基本一致,頻譜圖基本一致,可以得出該模型對超聲波信號的分離效果較好。
2.4.2 文中方法的先進(jìn)性驗(yàn)證
通過分析國內(nèi)外文獻(xiàn)發(fā)現(xiàn),目前解決回聲干擾問題的技術(shù)核心仍然是關(guān)于自適應(yīng)濾波器算法的研究。為了體現(xiàn)Conv-TasNet網(wǎng)絡(luò)分離信號的優(yōu)越性,與一種基于符號LMS的自適應(yīng)時(shí)域均衡器消除回波方法[15]進(jìn)行對比。同時(shí),選擇傳統(tǒng)的盲源分離算法FastICA對超聲信號進(jìn)行盲源分離,并將Conv-TasNet網(wǎng)絡(luò)分離效果與其進(jìn)行比較。評估量包括SDR提升量、SISDR提升量、波形相似系數(shù)和誤碼率。表2為三種方法的評估結(jié)果??梢钥闯?使用基于符號LMS的自適應(yīng)時(shí)域均衡器方法后信號的SDR平均提升量為8.62 dB,SI-SDR平均提升量為26.04 dB,波形相似系數(shù)為0.851,誤碼率為4.76×10-3;采用傳統(tǒng)的盲源分離算法FastICA處理后信號的SDR平均提升量為4.76 dB,SI-SDR平均提升量為20.39 dB,波形相似系數(shù)為0.845,誤碼率為1.26×10-2。

表2 三種方法的評估結(jié)果
通過比較三種方法的四個(gè)指標(biāo)結(jié)果可以得出:相比于自適應(yīng)時(shí)域均衡器方法和傳統(tǒng)盲源分離算法FastICA,使用Conv-TasNet網(wǎng)絡(luò)進(jìn)行盲源分離來消除回聲干擾方法具有更好的效果,從而驗(yàn)證了該方法的先進(jìn)性。
針對超聲波穿金屬厚壁通信中發(fā)射的脈沖速率很高時(shí),就會(huì)產(chǎn)生嚴(yán)重的超聲回波這一問題,提出一種基于信號分離技術(shù)的回波抵消技術(shù)方案,使用基于Conv-TasNet的盲源分離算法從混合信號中恢復(fù)出純凈超聲波信號,盡可能去除回波和其他噪聲的干擾,以期進(jìn)一步提高信號的信噪比。在此基礎(chǔ)之上,通過采集超聲波通信設(shè)備在進(jìn)行通信時(shí)產(chǎn)生的數(shù)據(jù)來訓(xùn)練網(wǎng)絡(luò),并進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)評估指標(biāo)表明,該模型對超聲波信號的分離效果比較理想。為了進(jìn)一步驗(yàn)證該方法的優(yōu)越性,將實(shí)驗(yàn)結(jié)果與自適應(yīng)時(shí)域均衡器方法和傳統(tǒng)盲源分離算法fastICA的實(shí)驗(yàn)效果進(jìn)行比較。通過對比四個(gè)評估量,最終得出使用Conv-TasNet網(wǎng)絡(luò)進(jìn)行盲源分離來消除回聲干擾的效果更好的結(jié)論。不過工作仍有一些需要改進(jìn)的地方:第一,在數(shù)據(jù)采集過程中,發(fā)送端和接收端雙方的采集存在一些較小的時(shí)延,需要進(jìn)一步處理;第二,對采集到的實(shí)驗(yàn)數(shù)據(jù)是在離線狀態(tài)下處理的,想要將方法應(yīng)用到實(shí)際場景中還需要做到實(shí)時(shí)處理,這是下一步的工作方向。