余春祥,王 彪,朱雨男,吳承希,徐 晨
(江蘇科技大學 電子信息學院,江蘇 鎮江 212100)
水下波達方向估計是水下陣列數據處理的主要任務,相比于空間波達估計,水下聲環境更為復雜。近年來,隨著科技的發展,人類水下活動急劇增多導致水下噪聲水平上升,同時潛艇和水面船艦的制造工藝提升,使得目標信號強度減弱,進一步降低水下信噪比。如何在低信噪比條件下,快速高效的進行方位估計是水下陣列信號處理的核心任務。
相比于標量水下陣列,矢量水下陣列不僅能獲取聲壓單通道信息,在空間共點同步拾取聲場的振速信息。因而矢量水聽器成為水下聲吶技術中一個快速發展的新方向[1]。在矢量陣列信號處理領域,傳統波束形成算法面臨著瑞利限的分辨率限制[2]。基于子空間和特征分解算法的提出解決了分辨率限制,形成了包括MUSIC 在內多種子空間類DOA 估計方法[3],具有較好的估計性能。但是基于子空間和特征分解算法面臨著矢量水聽器聲壓與振速通道接收噪聲功率不一致的問題[4],隨著信噪比逐漸減小,信號子空間與噪聲子空間的劃分變得逐漸困難,算法性能急劇下降。同時信號空間分解計算復雜,不能滿足DOA 估計快速性要求。
隨著深度學習的快速發展,多種類型的神經網絡被應用于水下DOA 估計[5-8]。相比于傳統DOA 估計算法,在神經網絡中,不用考慮對水聲陣列采集數據進一步處理,而是將DOA 估計看作數據分類問題。神經網絡的應用克服了對陣列模型誤差敏感,低信噪比下效果不佳等問題,同時訓練生成的網絡模型,能夠實現DOA 的實時估計[9]。卷積神經網絡在DOA 估計中的應用已取得良好效果,但由于池化層丟失部分位置信息,同時神經元輸出采用標量形式導致細節特征提取不充分,需要大數據樣本才能更好提取詳細特征。
本文采用Hinton 等于2017 年提出的膠囊網絡模型[10],其核心思想是將神經網絡中輸出形式由標量輸出變為矢量輸出,舍棄池化層結構,保留網絡中的位置特征信息,從而實現更好的特征提取效果。采用膠囊神經網絡作為訓練模型,利用膠囊神經網絡基于矢量特征輸出特性,證明了在不同信噪比噪聲環境下,膠囊網絡DOA 估計性能優于傳統子空間類算法和卷積神經網絡模型。
如圖1 所示,在二維平面情況下,建立一個含有N個矢量陣元的均勻線陣,相鄰陣元間距為半波長d=λ/2。在遠場條件下,以位于坐標系原點的陣元1 為參考陣元,假設有一個波長為 λ的窄帶入射信號,入射水平方位角為θ。理想情況下省略時間因子和波阻抗,則矢量線陣接收到1 個聲壓通道信息P和2 個相互正交的振速分量vx和vy,可以表示為:

圖1 矢量水聽器陣列模型Fig. 1 Model of vector hydrophone array
式中,x(t)為該平面波波形。由單個矢量陣元的單位幅度響應可定義:
矢量線陣的空間相位延遲向量表達為:
則矢量水聽器陣列導向矢量為:
式中, ?表示為Kronecker 積。在J次快拍下,這個遠場窄帶信號入射到均勻矢量線陣的輸出數據為:
式中:X為 3N×J維數據矩陣,表示矢量水聽器對該信號J次快拍下的輸出向量;A=a(θ) 為 3N×1維陣列流型;S=[x1(t)...xJ(t)] 是1 ×J維信號矩陣;N=[n1(t)...nJ(t)]是 3N×J維高斯噪聲矩陣。矢量陣列輸出數據的協方差矩陣可以表示為:
式中, ( ·)H和 E [·]表示為共軛轉置和數學期望。
在傳統子空間分類算法中可以將Rx看作是由信號子空間US和噪聲子空間UN構成:
式中:US代表信號子空間;UN代表噪聲子空間,ΛS; ΛN代表著對應的特征值對角矩陣。在理想的條件下,信號子空間與噪聲子空間是相互正交的,所以信號的陣列流型與噪聲子空間也是相互正交,即
Schmidt 利用這個特性構造了經典MUSIC 算法空間譜:
仿真實驗中由于聲波包含幅值與相位角兩部分信息,所得到的Rx矩陣存在復數數值。由于神經網絡訓練過程中不能處理復值數據,不能將Rx直接作為數據輸入。需要對Rx進 行相應數學處理。已知Rx=Re{Rx}+Im{Rx}i, 常見方式為將Rx分為實虛部兩部分,令
式中: Re{·} 表示復數實部, I m{·}表示復數虛部。將Rx的實虛部Q,P看作2 個獨立實值矩陣作為數據輸入。實虛部分離法可視作將協方差矩陣分為2 個維度數據并行輸入神經網絡,已在卷積神經網絡中取得了良好效果。但實虛部分離法削弱了相位與幅值間關聯,考慮到聲波信息中幅值相位相互關聯,采用幅值相位角法進行數據變換輸入。已知對任意復數有:
通過將數據變換為幅值與相位角輸入,最大限度保留幅值與相位角的相關性,使得網絡更好地提取相關位置信息特征,進一步提升模型性能。
2017 年,Hinton 等提出了膠囊網絡概念。核心思想為采用動態路由方式,將神經元標量輸入輸出變為向量輸入輸出。相比于傳統神經網絡,向量輸出的膠囊網絡,具有更豐富的特征表達能力。
在膠囊網絡中,由不同神經元組成的膠囊包含多個特征信息,從而擁有包含空間方向位置等多特征提取能力。膠囊網絡結構如圖2 所示。

圖2 膠囊網絡結構Fig. 2 Capsule network structure
其主要結構包括,卷積特征提取層,主膠囊層,數字膠囊層。卷積層主要功能在于通過卷積運算提取輸入數據中的特征,輸出特征圖。主膠囊層是由卷積層產生的特征圖經過卷積操作后,將生成的標量轉化為所需要的向量膠囊結構。數字膠囊層與卷積神經網絡中全連接層相似,但不再是由神經元求和后以標量形式輸出,而是改造為膠囊結構進行分類輸出。通過輸出的向量模大小進行分類,以模值最大的向量作為輸出類別。
膠囊網絡動態路由算法與卷積神經網絡激活方式對比如圖3 所示。其算法過程如下:

圖3 卷積神經網絡激活方式與膠囊網絡激活方式Fig. 3 Convolution neural network activation mode and capsule network activation mode
1)初始化,l層膠囊i到l+1層 膠囊j的特征傳遞系數為bi j←0。
2)在膠囊網絡中引入新的膠囊權重耦合系數cij,由動態softmax 方式獲取,具體公式為:
3)上層膠囊特征ui傳遞至下層膠囊,得到下層膠囊特征sj,公式為:
4)膠囊的輸出向量的長度來表示某些特征的概率大小。因此,使用一個非線性的“Squashing”函數保證上層膠囊進行特征壓縮得到下層特征,公式為:
實踐發現權值1 改為0.5,可以將模長接近0 的向量放大輸出,加強了特征提取能力。
5)動態迭代更新l層膠囊i到l+1層膠囊j的特征傳遞系數,其公式為:
膠囊網絡中損失函數采用類似支持向量機算法中的邊緣損失函數,其具體公式為:
式中:k為分類數;Tk為分類的指示函數 (存在為 1,不存在為 0);m+=0.9為上界,代表著若數據分類后輸出屬于第k類中,則其對應數字膠囊輸出向量的模長至少>0.9,反之則若數據分類輸出不屬于第k類中,則膠囊輸出的是一個很短的向量,其模長<0.1; λ 為比例系數,調整兩者比重,本文取 λ=0.5。總損失是所有數字膠囊損失之和。
為驗證本文所提膠囊網絡算法的性能,進行數值仿真。考慮到增強算法結果對比以及水下陣列布放難度,采用陣元數較少的均勻線陣。該線陣由3 個矢量水聽器組成,陣元間距為半波長,信號源搜索范圍為[-90°,+90°] , 每隔1°取一個樣本,快拍數為500,對每個角度進行1 000 次Monte-Carlo 仿真實驗。以信噪比為0 dB 時為例,仿真得到181 000 個大小為9×9 的二維協方差矩陣。將數據進行幅值相位處理,以對應入射角度為標簽,得到訓練所需要的訓練集數據 (|Rx|,θ)。
實驗中,采用卷積神經網絡與膠囊神經網絡進行仿真對比。為了保證實驗結果準確性,2 個網絡中卷積核相同,步長為1,模型均采用Relu 激活函數,優化方法為Adam,學習率為率為0.001,訓練過程中單次數據讀入量為32,最大迭代次數設置為50。卷積神經網絡與膠囊網絡具體結構如圖4 所示。

圖4 卷積神經網絡模型與膠囊網絡模型Fig. 4 Convolution neural network model and capsule network model
相鄰陣元間距為半波長d=λ/2,假設有一個角度為 θ ,波長為 λ的窄帶入射信號下得到信噪比為-5 dB,0 dB,5 dB,10 dB,15 dB 的5 組樣本數據。將樣本按照9∶1 的比例隨機劃分為訓練集核驗證集。
圖5為MUSIC,CNN,CapsNet 等3 種算法在不同信噪比條件下的準確率。可以看出,由于存在噪聲條件影響,3 種方法不同程度的受到影響。其中,傳統子空間分解所受影響最大,MUSIC 算法的DOA 估計效果較差。卷積神經網絡具有一定抗噪效果,較MUSIC 算法準確率有一定提升。膠囊網絡在低信噪比條件下,DOA 估計效果優于卷積神經網絡。證明膠囊網絡通過動態路由方式,有效地進行了多特征提取,加強了的網絡分類能力。

圖5 不同信噪比下準確率Fig. 5 Accuracy rate of different SNR
圖6為幾種算法的估計角度均方根誤差統計,其公式為:

圖6 不同信噪比下均方根誤差Fig. 6 Accuracy rate of different RMSE
式中:y為真實波達角度;y?為估計的波達角度;m代表需要估計的數據個數。均方根誤差統計可以較好的反應出算法的精度和穩定性。可以看出,膠囊網絡算法分辨率總體優于卷積神經網絡和MUSIC 算法,且隨著信噪比降低,算法性能優勢更加明顯。高信噪比情況下,3 種算法均能提供較好的分辨能力。總體來說,膠囊網絡在廣泛的信噪比范圍下具有比其他算法更加穩定算法精度與分辨能力。
表1 為快拍數為500 時,各算法單次估計角度的消耗時長。運行時長為測試1 000 所取平均時間。由表1 可知單次估計時,使用網絡模型估計時長低于子空間類算法20 倍左右。卷積神經網絡與膠囊網絡消耗時長相差較小。綜上,膠囊網絡在保證算法估計性能同時在運行時間上有著明顯優勢。

表1 不同估計方法的單次運行時間Tab. 1 Single run time of different estimation methods
本文提出了一種基于膠囊網絡的水下波達估計算法。結合矢量水下均勻陣列仿真實驗,對比不同信噪比環境下膠囊網絡,多重空間分類法與卷積神經網絡3 種方法的方位估計準確率與穩定性能。實驗結果表明,低信噪比環境下,各算法預測均受嚴重影響。相比較其他算法,膠囊網絡所擁有向量動態路由方式,降低了噪聲影響同時加強了特征能力提取能力,使得在低信噪比環境下,方位估計模型準確率與穩定性能均有較大提升,同時滿足DOA 估計的快速性要求。考慮到本文使用信號均為單個信源,如何利用膠囊網絡進行多信源方位估計將是下一步工作中心。