殷敬偉,羅五雄,李理,韓笑,郭龍祥,王建峰
(1.哈爾濱工程大學水聲工程學院,黑龍江 哈爾濱 150001;2.中國船舶工業綜合技術經濟研究院,北京 100081)
在日趨激烈的水下對抗領域中,聲吶探測擔任著重要任務,而實現聲吶探測的關鍵是信號檢測。但是,噪聲污染在實際探測過程中是無法避免的,例如在傳輸系統受到的外界干擾時,以及在數據采集過程中都會給實驗數據代入噪聲[1]。
研究表明,水下目標輻射噪聲信號都具有很強的非線性特征,當水下目標輻射噪聲信號的最大李雅普諾夫指數是正值時,表明該輻射噪聲信號是混沌的[2],這給非線性降噪提供了依據。在信號處理過程中,由于噪聲的影響使遠距離探測和微弱信號處理變得非常困難,降噪成為長期困擾研究者的一個課題,也是對信號進行有效分析必不可少的過程。在傳統的信號處理方法中,降噪是通過濾波來完成的。在使用線性濾波方法時,根據信號在頻域中的分布特點,只要時間序列足夠長,對于周期和準周期信號中的噪聲是可以徹底消除的。但是對于非線性系統產生的噪聲,由于信號與噪聲在頻譜上表現均為寬帶連續譜,使傳統方法的濾波效果大大降低,這就需要探索新的適用于非線性信號的降噪方法。
隨著計算機技術的發展,神經網絡算法得到了廣泛應用。深度學習是由Hinton 等[3]于2006 年提出的具有多層學習結構的神經網絡,雖然網絡結構中每一個隱藏層一般只使用了簡單的非線性變換,但是多層網絡的非線性組合就可以產生非常復雜的非線性變換,因此深度學習具有強大的特征學習能力,可以發掘出數據中內在的變化規律。深度學習自提出以來,引起了國內外諸多學者的廣泛關注,不僅在理論算法上不斷推陳出新,在圖像識別、圖片降噪、語音信號處理、模擬人腦等[4]實際場合的應用也日益增多。
本文將深度學習的方法應用于主動聲吶探測系統,對聲吶回波信號中噪聲的參數不做任何前提性假設,通過神經網絡的學習不斷調整網絡權重與偏置,從而去除帶噪信號中的噪聲分量,使輸出信號有較好的目標特性。
本文訓練網絡采用降噪自編碼器(DAE,denoising automatic-encoder)與卷積自編碼器(CDAE,convolutional denoising automatic-encoder)相結合的聯合自編碼器(DAE+CDAE)方式,其過程如圖 1 所示。在預訓練階段,將訓練集(train_clean)加上噪聲稱為加噪信號(train_noise),train_noise 作為DAE 網絡的輸入信號,train_clean作為DAE 網絡的目標信號,通過反向調優訓練好DAE 網絡,將train_noise,test_noise 輸入DAE,得出新的訓練集(train1),新的測試集(test1),預訓練階段結束。將train1作為CDAE 的輸入信號,train_clean 作為CDAE 的目標信號,通過反向調優訓練CDAE 網絡,在訓練完成之后,對test1進行網絡測試,得到最終的去噪信號,完成整個訓練過程。
DAE 是在自動編碼器(AE,automatic-encoder)的基礎上改進而來的[5],是一種執行數據壓縮的網絡結構,利用神經網絡對樣本數據進行學習,可以通過自動學習得到壓縮函數與解壓函數。DAE 的主要思想是首先訓練一個自動編碼器,能夠在該編碼器輸入層手動添加隨機噪聲,在輸出層重建輸入數據;然后,通過訓練后的編碼器模型能夠對輸入數據進行壓縮與解壓,在這一過程中實現降噪,從而為后續的探測任務生成更好的特征表示。
帶有丟棄結構的DAE 基本網絡結構如圖2 所示,其中X為原始信號,為帶噪信號,Y為隱含層,為輸出層。
DAE 以x∈R的向量作為輸入層,通過加入噪聲,并以一定的概率λ隨機丟棄網絡中的神經元,從而得到映射后的輸入層,如式(1)所示。

其中,N 是由原始輸入層和加入x的隨機噪聲的類型確定的一種分布。然后通過向量值函數Φ將映射到隱含層y,如式(2)所示。

其中,W為映射到隱含層網絡的權重參數,b為映射到隱含層網絡的偏置項。

圖1 DAE+CDAE 的訓練過程

圖2 帶有丟棄結構的DAE 基本網絡結構
通過隨機丟棄的方法來進行優化訓練過程中,隱含層中的神經元也以概率q被隨機丟棄。隨機丟棄的方法對復雜結構的神經網絡訓練的優化是非常有效的,因為網絡是跟隨迭代次數更新的,在每次迭代中都會由于隨機丟棄某些隱含層的神經元而產生一個唯一的訓練網絡[6]。
經過隨機丟棄神經元的隱含層特征向量y被反向映射,最后重構出與原始信號相同的輸出層,如式(3)所示。

其中,W′為映射到輸出層網絡的權重參數,b′為映射到輸出層網絡的偏置項。

然后由隨機梯度下降法[7]對整個網絡的權重參數進行更新,求解出目標函數的最優解。降噪自編碼器算法首先初始化權值與偏置參數,然后迭代更新求出最優解,具體算法步驟如下。
步驟1隨機初始化。對所有的l,設ΔW(l)=0,Δb(l)=0。
步驟2迭代次數i=1,2,…,m。
步驟3更新權重參數。

全卷積自編碼器在DAE 的基礎上發展而來[8]。CDAE 是一個無監督的神經網絡,它利用了傳統自編碼器的無監督學習方式,并結合了卷積神經網絡的卷積和池化操作,從而實現特征提取。CDAE 主要由編碼(encoder)和解碼(decoder)兩部分組成,通過分層訓練來優化總體結構。
CDAE 的基本網絡結構如圖3 所示。輸入層的干凈信號首先經過白化層白化,并對其進行加噪處理,然后發送到DAE 的輸入層。該DAE 網絡呈現對稱結構,這種結構在前兩卷積層中先將輸入信號進行編碼,將特征信息壓縮至低維空間,在后兩層卷積層中將隱含層進行解碼,從而將低維特征信息解壓成干凈信號。

圖3 CDAE 基本網絡結構
每個卷積層的輸入均是3 維特征數據,濾波器、池化、上采樣都采用2 維算子,在每個卷積層中,CDAE 通過學習的去噪變換,將輸入信息映射到更抽象、穩健性更強的特征。CDAE 中的編碼器部分由多個卷積層、激活層和池化層組成,卷積層由一組濾波器組成,這些濾波器從它們的輸入層中提取特征,本文中的激活層是對特征圖施加非線性的修正單元。在池化層中,池化函數選擇最大池化函數(max-pooling),max-pooling 通過映射特定空間范圍內的最大值的常數因子,對激活層進行下采樣并生成具有降維的新映射空間。在解碼部分是由卷積層、激活層和上采樣層(up-sampling)組成,上采樣層是通過對前面的激活層進行上采樣,生成高維的新層。
CDAE 網絡的第一層為輸入層,輸入層為時域信號,記作x,長度為N,第二層是卷積層,第i個卷積濾波器算子序列為fi,共使用K個長度均為M的濾波器,通過第一層卷積運算后的特征信號為

在卷積層與卷積層之間包含有激活層和池化層,激活函數g(z)選 擇 tanh 函 數,即第三層為池化層,對激活層進行不重疊的max-pooling 下采樣,網絡參數的集合可以表示為,通過輸入層和輸出層可以定義網絡誤差為

使用隨機梯度法來更新整個網絡的參數。例如,連接自動編碼器的權值更新如式(8)所示。

其中,α是學習率,并且隨著迭代次數的增加而減小。學習速率的更新方法如式(9)所示。

其中,n是迭代次數,γ和t是提前設置的標量。在本文訓練過程中設置初始學習率為0.1,γ=0.1,t=1,每當完成一次迭代,便更新學習率,采用此方法的目的是為了加速模型收斂的速度,同時能防止網絡出現梯度消失或梯度爆炸等現象。
考慮到實驗過程中水聲信道屬于不平整雙界面隨機不均勻介質信道,因而發射信號經過水聲信道傳播過程中時變、空變及多途徑擴展嚴重,接收信號波形發生畸變[9]。水聲信道具有多途徑擴展的特性,發射信號經過不同途徑的聲線先后到達接收水聽器,最后的接收信號是經各個聲線傳播到達信號的干涉疊加。設發射信號為x(t),接收端高斯噪聲干擾為n(t),則接收信號r0(t)為

其中,等號右側第一項是直達聲,第二項是多途徑信號,參數N為通過接收點的本征聲線的數目;Ai、iτ分別為第i途徑到達接收點信號幅度及相對于直達聲信號的時延值。
單頻矩形脈沖信號和線性調頻信號(LFM,linear frequency modulated)是主動聲吶探測過程中經常使用的2 種波形。如圖4 所示,本文采用未受污染的LFM 作為目標信號,首先確定帶寬為2~8 kHz,在48 kHz 的采樣率下,生成10 ms 的LFM信號,然后隨機插入某個時間點中來模擬目標回波出現的位置,生成一段具有1 200 個采樣點的目標信號,共生成200 500 個這樣的目標信號,其中200 000 個信號作為訓練集,剩余500 個作為測試集;在目標信號的基礎上,設本征線數為3,信號幅度依次為區間[0.9,0.6)、[0.6,0.3)、[0.3,0.1]的某個隨機值,時延值依次為(rand×100)個采樣點,隨機加上信噪比為 -20~5 dB 的高斯白噪聲,直接將其時域信號作為輸入信號,能夠更好地保留輸入信號的相位信息。
信噪比(SNR,signal-to-noise ratio)是指在某段信號中目標信號能量與噪聲信號能量的比值,在一定程度上能夠反映信號的質量,通常用于信號檢測領域。一般來說,信噪比越大,表明混雜在該信號中的噪聲越少。SNR 計算式為

本文選用信噪比作為信號的評價指標,通過輸出信號信噪比與目標信號信噪比的對比,從而驗證神經網絡增強算法的有效性,并能從數值上定量地分析,調整神經網絡的結構與參數,達到更好的信號增強效果。

圖4 線性調頻信號
在使用自動編碼器學習時,網絡的深度、壓縮的最小維度(Dmin)、迭代次數能直接影響到最后的增強效果,為了尋找較優的網絡結構與參數,對DAE 的網絡進行多組實驗,并以信噪比作為其評價指標。網絡深度設置為1、2、3、4、5,壓縮的最小維度設置為200、250、300、350、400,迭代次數設置為20、40、60、80、100。將DAE 與DAE+CDAE進行對比實驗,測試信號的信噪比SNRtest=-7.06dB,其降噪效果如圖5 所示。
由圖5 可知,隨著網絡深度和迭代次數的增加,網絡參數優化效果更佳,能夠更好地提取出輸入信號的主要特征,從而達到更好的增強效果。另一方面,隨著Dmin的減小,網絡能夠更好地提取出輸入信號的主要特征,忽略噪聲信號特征,這也同樣能帶來性能的提升。然而,在實驗結果中也可以發現,當訓練數據不夠大,或者輸入信號復雜度有限時,盲目地增加網絡深度和迭代次數,只會增加運算能耗,同時產生過擬合現象,并不能使性能得到顯著提升;而當Dmin過小時,又會出現主要特征丟失的現象。
經過大量對DAE 與DAE+CDAE 的實驗對比后,本文發現在當前的實驗設置下,迭代次數達到80 次時,本文所提算法的性能能夠達到最優。如圖5(c)和圖5(d)所示,DAE 中輸出信號的信噪比為12.99 dB,而DAE+CDAE 的信噪比高達18.77 dB。由圖5(e)和圖5(f)可知,單獨使用DAE 已經能夠達到比較好的降噪效果,但是無法達到局部的最優效果,例如,DAE 無法使無信號區域更平坦,不能將主要信號區域的局部特征得到更優的映射。DAE 與CDAE 網絡進行結合,既能發揮DAE 對輸入信號整體降噪的優勢,同時又能結合CDAE對信號局部降噪的優化,從而能得出高信噪比的輸出信號。
因此,如何使網絡參數的復雜度和性能達成統一,使實際應用價值得以提升,在本文的網絡結構中,DAE 的網絡深度為 4 層,壓縮最小維度Dmin=350,迭代次數為80 次;CDAE 的網絡深度為4 層,每層濾波器16 個,上下采樣均為2,迭代次數為80 次。為了更好地保留數據符號與相位信息,DAE 與CDAE 的激活函數均采用tanh函數,損失函數均采用mse 函數,優化器采用Adam 函數[10]。
各種方法對LFM 的去噪指標如表1 所示。由表1可知,在傳統方法中,對于低信噪比的LFM 信號,奇異值分解方法(SVD,singular value decomposition)降噪比較效果明顯,小波分解與帶通濾波均表現欠佳;在深度學習與傳統方法的對比中,DAE 與CDAE比傳統方法有著顯著優勢,本文方法結合了DAE 與CDAE 兩者的優勢,處理后效果更好。
為了進一步驗證本文所提方法的可行性和有效性,進行了松花江冰下信號傳輸實驗。發射信號采用的是LFM 信號,LFM 信號脈寬為10 ms、帶寬為2~8 kHz。將接收信號輸入本文網絡中得到恢復信號,對恢復前后的信號進行時頻分析與分數階傅里葉變換(FRFT,fractional Fourier transform),得到其分析結果如圖6 所示。

圖5 神經網絡參數、結構與SNR

表1 各種方法對LFM 的去噪指標
從圖6 所示的時頻圖可以發現,恢復后的背景噪聲明顯減小,在目標信號的時間段內,信號更加集中在應有頻帶范圍內,這與理論仿真的結果是一致的。從圖6 中的FRFT 二維搜索圖可見,恢復前的接收信號多徑影響嚴重,恢復后的信號能明顯看到多徑影響大幅度減弱。由于實驗信號難以與發射信號對齊,無法計算其準確信噪比,本文通過將無信號段近似噪聲信號,有信號段近似為目標信號,計算其能量均值,可以得出信號恢復前的信噪比為3.75 dB,恢復后信噪比為17.56 dB。

圖6 信號恢復前后對比
通常匹配濾波能抑制其他干擾,從而提高聲吶檢測的能力。一般在白噪聲情況下,匹配濾波是最優的線性檢測系統,匹配濾波能夠對目標信號進行能量集中,以便于在時域波形上觀測目標。LFM 信號在恢復前后分別與發射信號做匹配濾波的結果如圖7 所示。

圖7 恢復前后的匹配濾波
圖7(a)為信號恢復前的匹配濾波,圖7(b)為信號恢復后的匹配濾波,取前2 個匹配濾波的包絡并求其絕對值,可得圖7(c)。由圖7(c)可以得出,經過匹配濾波后,恢復信號的旁瓣比帶噪信號的旁瓣明顯減少,能量明顯比恢復前更集中,相關系數的峰值也有顯著的提高。
本文結合DAE 的降噪優勢與CDAE 能提取局部特征的特點,提出了一種關于信號增強的深度學習算法。該算法首先通過DAE 和CDAE 的聯合訓練,不僅能夠去除信號中的加性噪聲,還能去除由聲信道不理想引起的多徑效應,使輸出信號的整體特征與局部特征都能夠得到顯著優化。
LFM 信號是目前水聲通信領域內廣為使用的同步信號,有著較好的自相關特性,并且在水聲信道中有著較好的抗干擾能力和同步性能。本文通過深度學習的方法增強了水中的LFM 信號,充分利用DAE 與CDAE 的特性,實現了LFM 在低信噪比下的增強,能夠為水聲通信實現高精度的同步捕獲提供基礎,并能提高水下目標探測、定位導航中的同步系統的抗噪能力。