雷波 何兆陽 張瑞
1) (西北工業大學航海學院,西安 710072)
2) (西北工業大學青島研究院,青島 266200)
針對水下前向散射探測中基于敏感核函數的定位方法存在環境失配帶來的穩健性問題,提出了一種基于遷移學習的前向散射定位方法,利用模型生成φ 的目標前向散射聲場擾動信息訓練卷積神經網絡,將目標定位問題轉化為分類問題.在基于先驗信息和仿真數據集的預訓練模型基礎上,通過少量實驗數據集對神經網絡參數進行遷移學習,以提高神經網絡模型的穩健性.仿真結果表明,該方法在聲速剖面失配下可以實現對目標較準確的定位,且對目標散射函數、海底底質、陣元數和布設深度等參數不甚敏感,方法具有較好的穩健性.
近年來,在對水聲目標的探測定位問題中,雙/多基地主動聲吶由于其特有的收發分置特性而越來越受到關注[1?3],但是當目標位于收發連線附近時,直達波與目標前向散射波在接收端上發生嚴重混疊[4],使用傳統時延處理方法在收發連線附近會形成雙基地探測盲區.然而,相對于沒有目標時的接收聲場,目標的前向散射會引起接收聲場的幅度、相位發生擾動變化,已經證明該現象可以作為入侵目標探測的一種思路[5,6].
為了充分利用目標前向散射引起的聲場擾動現象來實現雙基地盲區中的目標探測,國內外學者提出了多種方法.例如,Song 等[7]利用時間反轉鏡技術構建了水聲絆網,將聲能量聚焦于源陣列的探針聲源處,并通過觀察焦區周圍旁瓣的能量變化來檢測目標,該研究結果引起了對時反目標探測的關注.由于時反鏡處理物理上的需求,該方法需要有復雜的硬件系統支持[8],此后水聲工作者又進一步提出了基于虛擬時反的處理方法[9].雷波等[10]基于多個接收點前向散射聲擾動現象的時間差和幾何關系,提出了運動目標定位方法.Folegot 等[11]提出了基于聲射線的定位方法,采用雙波束形成來分辨攜帶主要能量的聲線,利用目標對聲線的“遮擋”效應,對強度衰減的特征聲線進行加權求和,加權系數為聲線能量的衰減程度,將所有處理后的特征聲線繪制在一起,得到的模糊圖上的“亮點”即為目標位置.Marandet 等[12]提出了敏感核定位方法,將目標定位問題轉化為線性反演問題,利用聲場模型計算出每條特征聲線在不同位置處的敏感核,然后從實際接收數據中提取出每條特征聲線的實際聲壓幅度變化量,結合敏感核矩陣構建出以目標位置權值向量為解的線性方程組,通過求解欠定方程組實現對目標的定位,并在超聲波導條件下完成了驗證實驗.Yildiz 等[13]進一步研究了多基地配置下敏感核定位方法,并開展了水池實驗驗證.本質上說,敏感核方法屬于基于模型的匹配場處理,對環境信息敏感,因而易受到環境失配的影響.
近期,機器學習已經越來越多地被用于解決水下聲源的定位問題.牛海強等[14,15]使用機器學習進行聲源距離的估計,獲得了比傳統匹配場處理更佳的性能,并使用殘差神經網絡估計了聲源的距離深度[16].徐及等[17]使用了兩種神經網絡在沒有精確環境信息的復雜水體下對水下目標距離進行估計.李整林等[18]提出了一種在深海直達區的卷積神經網絡聲源測距方法.楊益新等[19]使用仿真與實際數據訓練卷積神經網絡,對深海目標進行距離和深度估計.
遷移學習作為機器學習的一種典型方法[20],可以通過小樣本的更新學習,提高學習方法的適應性.本文提出一種基于遷移學習的水下目標定位方法,從目標前向散射引起聲場擾動的角度出發,利用卷積神經網絡建立起聲場擾動信息與目標位置的映射關系,從而把目標定位問題轉化為分類問題.進一步考慮環境失配帶來的穩健性問題,利用基于先驗信息的仿真數據對卷積神經網絡進行訓練以構建預訓練模型,而后基于遷移學習思想,結合少量實際數據對預訓練模型進行微調,有效降低環境失配對定位性能的影響.
在利用目標前向散射進行目標定位的研究中,通常采用由垂直發射陣和垂直接收陣構成的聲屏障[7]進行入侵目標的探測和定位,如圖1 所示,發射陣和接收陣分別為由M 個發射陣元和N 個接收陣元構成的垂直陣.在沒有目標的情況下,接收信號可以表示為

其中,Pij(t) 表示由第i 個發射陣元發射信號時在第j個接收陣元上的信號,t 為相對于發射時刻的時 間,1 ≤i ≤M,1 ≤j ≤N,s(t) 為發射信號,hij(t)表示水聲信道的沖激響應函數,? 表示卷積運算,n(t) 表示海洋環境噪聲.
在收發連線之間存在目標的情況下,散射聲場可以近似認為是聲源S 發射的源信號經多徑傳播后到達目標處并發生散射,而后散射波經多徑傳播后到達接收點R,如圖1 所示.聲波在目標上的散射與目標的散射函數 f∞有關,是頻率、目標形態、目標材料、散射角等參數的函數.簡正波理論[21]和射線聲學理論[22]的信道散射模型表明,目標的散射函數引起了入射場與散射場之間的耦合,導致聲波能量在聲場空間上重新分配[23].

圖1 聲屏障示意圖Fig.1.Schematic diagram of sound barrier with transmitter and receiver arrays.
假設位于 (r,z) 點的目標處共有X 條入射聲線,Y 條散射聲線,入射聲線到達目標處的沖激響應為 Gp(r,z),時延為 Tp,1≤p ≤X,散射聲線到達接收點的沖激響應為時延為1 ≤q ≤Y,則任意一組入射、出射聲線的沖激響應和時延可以分別近似表示為

其中,φpq表示這一組入射、出射聲線對應的散射角,如圖1 所示.將 X ·Y 組入射和出射聲線形成的沖激響應在時域上按時延疊加在一起,得到目標信道響應函數.實際上由于信道傳播路徑損失,部分路徑上的能量非常微弱,可以忽略不計.假設環境和背景噪聲保持不變,接收信號可以表示為


其中,“*”表示取復共軛.分別對脈沖壓縮輸出信號 Dij(t) 和 Eij(t) 取模值,得到脈沖壓縮輸出包絡,表示為為了提取目標入侵引起的聲場變化,對目標前向散射引起的聲場擾動量進行歸一化處理,即

式中,聲場擾動量 Aij(t)是時間的函數,在脈沖長度時間內認為目標的位置不會發生變化,其表征的是信號包絡相對變化.
Marandet 等[12]對敏感核定位方法的研究表明,由入侵目標引起的接收端聲場擾動與目標位置存在著映射關系.而由本文的(2)式—(4)式也可以看出,收發連線間存在目標時的接收信號與目標位置 (r,z) 有關,也就是說經處理得到的聲場擾動量 Aij(t) 隱含了目標位置信息,如果利用神經網絡來建立聲場擾動信息與目標位置的映射關系,可以將目標定位問題轉化為分類問題.
不失一般性,本文提出的定位方法流程由預訓練和參數遷移兩部分構成,如圖2 所示,其中預訓練過程是利用聲場模型生成的仿真數據對神經網絡模型進行訓練,而參數遷移過程是先凍結預訓練模型的卷積池化層參數,然后利用少量的實際數據對預訓練模型的全連接層參數進行微調,這樣的好處是對實際訓練數據量的需求大幅度減少.和匹配場處理類似,由于對實際環境參數如聲速剖面、海底底質聲學特性、水深等水文環境信息獲取存在失配,預訓練模型的定位能力可能會下降,需通過少量數據的遷移學習來提高環境失配下定位方法的穩健性.

圖2 定位方法流程圖Fig.2.Flow chart of positioning method.
對數據進行合理的預處理可以降低數據維度,加快神經網絡收斂,本文提取聲場擾動的部分特征信息,構建與目標位置相關的三維特征數據作為輸入數據.
一般情況下,為了保證較好的學習性能,神經網絡通常需要大量的訓練數據,但實際水聲目標數據獲取較為困難.因此,先使用基于先驗水文環境信息和聲場模型的仿真數據對神經網絡進行訓練,建立預訓練模型.對距離深度二維平面定位區域進行網格劃分,使用獨熱編碼對劃分的網格區域進行標記.目標位于不同網格內時,將其對應的數據矩陣H 作為神經網絡的輸入,對應的獨熱編碼作為神經網絡的預期輸出.
采用的卷積神經網絡的結構主要由2 層卷積池化層和2 層全連接層構成,如圖3 所示,其他參數見表1.將預處理后的仿真數據輸入卷積神經網絡,通過梯度下降算法調整卷積神經網絡各層的參數以極小化損失函數,本文采用常用的交叉熵損失函數,表示如下:

表1 卷積神經網絡參數設置Table 1.Parameter setting of convolutional neural network.

圖3 卷積神經網絡結構示意圖Fig.3.Structure diagram of convolution neural network.

其中,B 為網格分類數,yb為預期輸出,為神經網絡輸出.
實際水文環境與仿真環境往往存在環境失配,這會嚴重降低預測模型的定位性能,故而此時的預訓練模型并非最終模型,需要對預訓練模型進行參數遷移以降低環境失配對模型的影響.
目標位置與信道特征以聲場擾動的形式給出,卷積神經網絡的卷積池化層可以提取基礎和抽象特征,而全連接層根據特征建立聲場擾動與目標位置的映射關系進行分類,因此可以認為基于仿真數據的預訓練模型和基于實際數據的預測模型共享卷積池化層參數.參數失配使原有映射在實際環境中產生誤差,通過參數遷移方法凍結預訓練模型的卷積池化層參數,并利用少量實際數據對全連接層參數進行修正,建立新的映射以實現目標學習任務,如圖2 中的處理流程所示.全連接層可以表示為


其中,Δwk和 Δbk分別表示第k 層權值和偏置的變化量.本文采用基于適應性低階矩估計的Adam 算法作為梯度下降算法.
將實際數據經過預處理后輸入預訓練模型,凍結卷積池化層的參數,僅調整全連接層的參數以極小化損失函數.這樣將基于仿真數據的預訓練模型遷移到存在環境失配時的定位問題中,經過學習后建立基于實測數據修正后的水下目標定位預測模型,從而根據接收信號數據預測獲得目標的位置.
為了對本文提出的方法進行驗證,假設仿真中的水文環境先驗信息和布陣方式如圖4(a)所示,海深為100 m,收發陣列的水平距離為5 km.垂直發射陣由5 個發射陣元構成,均勻分布于海深20—80 m;垂直接收陣由21 個接收陣元構成,均勻分布于海深20—80 m 處;海底底質為砂泥,其聲速為1664 m/s,密度為1.787 g/cm3,衰減系數為0.756 dB/(m·kHz).考慮到海洋水文環境的隨機起伏變化,先驗聲速剖面采用圖4(a)中5 條實線所示的聲速剖面(在海面以1510 m/s 為中心聲速).各聲源依次發射中心頻率1 kHz、脈沖寬度50 ms、帶寬200 Hz 的線性調頻信號.假設環境噪聲為帶限高斯白噪聲(實際處理中會對接收信號進行濾波),相對于目標散射信號的信噪比為0 dB.考慮到水下目標的尺度和定位精度要求,對定位海域進行網格劃分,深度間隔為15 m,距離間隔為200 m,從而在深度-距離平面上得到5×25 個網格區域.入侵目標為長半軸40 m、短半軸3 m 的剛性長旋轉橢球體,這里采用變形圓柱方法[25]計算其散射函數.

圖4 仿真實驗環境 (a) 仿真實驗示意圖;(b) 接收到的信號波形;(c) 聲場擾動量A(t)Fig.4.Simulation experiment:(a) Diagram of simulation experiment;(b) received signal waveforms;(c) sound field aberration A(t).
發射陣和接收陣最上方陣元記為1 號陣元,按深度向下依次排序.令1 號發射陣元發射脈沖信號,在各接收陣元完成信號采集后,其他發射陣元依次發射同樣的脈沖信號并在接收端完成信號采集.對于1 號發射陣元和11 號接收陣元組成的收發對,在沒有入侵目標時接收到的直達波信號如圖4(b)中點線所示.若目標位于水平距離1900 m、深度50 m 的位置,則散射波信號波形如圖4(b)中實線所示.可以看出目標的散射信號強度遠低于直達波,在前向散射探測中被嚴重淹沒.將該接收信號代入(5)式和(7)式中,可以計算出聲場擾動量A 隨時間t 的變化,波形如圖4(c)所示.可以看出,散射信號在多個時段對聲場的相對擾動量較大,這種擾動可以作為目標位置的定位依據.
使用獨熱編碼對劃分的網格區域進行標記,然后使用BELLHOP 聲場模型[26]對目標位于不同網格區域時的接收數據進行仿真,生成30000 組接收信號數據,并將預處理后的仿真數據按5∶1 的比例隨機劃分為訓練集和測試集.
對卷積神經網絡進行訓練,訓練過程中測試集預測準確率和交叉熵損失函數變化分別如圖5(a)和圖5(b)所示,可以看出隨著迭代次數的增加,卷積神經網絡對測試集的預測準確率逐漸提高,當迭代次數為850 時基本達到收斂,此時得到預訓練模型參數,這將作為存在失配時進行遷移學習的基礎模型參數.
在測試集中隨機選取500 個樣本,預訓練模型對這些樣本的預測結果如圖5(c)所示,統計準確率達到了98.8%,可以看出在沒有環境失配的情況下預訓練模型能夠對目標進行準確定位.

圖5 預訓練模型的訓練過程和預測結果 (a) 準確率變化;(b) 損失函數變化;(c) 無失配時的預訓練模型預測結果Fig.5.Training process and prediction results of the pre-training model:(a) Variation of accuracy;(b) variation of loss function;(c) prediction results of the pre-training model without mismatch.
假設實際環境與仿真環境間存在聲速剖面失配,實際聲速剖面為圖4(a)中的虛線聲速剖面.對于存在失配的實際聲速剖面,仿真生成500 組接收信號數據并進行預處理,作為實際數據.使用預訓練模型對這500 組數據進行預測,預測結果如圖6(a)所示,準確率降低為22.4%,這表明聲速剖面失配嚴重降低了預測模型的定位性能,但預訓練模型和理想預測模型仍具有一定的相關性.此時需要利用這些實際數據對預訓練模型進行遷移學習,以降低聲速剖面失配對定位性能的影響.
將實際數據按3∶1 的比例隨機劃分為訓練集和測試集,按照圖2 所示參數遷移方法流程,保持卷積池化層的權值參數不變,僅調整全連接層的權值參數,對神經網絡模型進行重新訓練.使用經過遷移學習的神經網絡預測模型對實際數據集進行預測,預測結果如圖6(b)所示,統計準確率為96.8%.通過比較圖6(a)和圖6(b)的預測結果可以看出,遷移學習方法在聲速剖面存在失配時仍保持著較高的定位精度.

圖6 環境失配時神經網絡模型預測結果 (a) 預訓練模型預測結果;(b) 遷移學習后預測結果Fig.6.Prediction results of neural network model with environment mismatch:(a) Prediction results of pre-training model;(b) prediction results after transfer learning.
在相同的聲速剖面失配的情況下,使用敏感核函數[12]定位結果進行對比.仿真生成同樣數量的接收信號數據并進行預處理,作為實際數據.使用仿真生成的理論敏感核模型對這500 組數據進行預測,預測結果如圖7 所示.當實際聲速剖面與仿真聲速剖面失配,導致拷貝場向量的計算產生較大誤差,使敏感核函數方法的定位性能嚴重降低,幾乎不能準確對目標位置進行預測.

圖7 環境失配時敏感核函數預測結果 (a) 單個樣本定位結果;(b)多樣本預測結果Fig.7.Prediction results of sensitive kernel function with environmental mismatch:(a) Location results of single sample;(b) results of multiple samples.
目標散射函數通過影響入射聲場和散射聲場的耦合,改變散射過程中能量的重新分配,進而影響到接收聲場.實際情況下目標的散射函數是未知的,預訓練過程中所采用的模擬目標只是對實際目標近似,兩者存在目標散射函數失配,因此有必要分析定位方法對目標散射函數的敏感性.
假設模擬目標為長半軸40 m、短半軸3 m 的剛性長旋轉橢球體,實際目標為剛性圓柱體,長度分別為35,40 和45 m,圓柱半徑分別為2.5,3.0和3.5 m.保持其他仿真參數不變,除目標散射函數失配外無其他失配存在.此時用仿真數據訓練得到的預訓練模型并不發生變化,在預訓練模型的基礎上通過參數遷移進行微調,對于不同尺寸的實際目標,仿真結果如表2 所列.

表2 目標散射函數失配時的仿真結果Table 2.Simulation results of target scattering function mismatch.
可以看出,當實際目標的長度為40 m、圓柱半徑為3 m 時,目標失配的程度較小,預訓練模型對實際數據的預測準確率為79.4%,經過遷移學習后神經網絡模型的預測準確率達到96.0%,有效降低了目標散射函數失配對定位性能的影響;當目標失配程度增大時,預訓練模型的預測準確率出現下降,經過遷移學習后神經網絡模型出現了定位性能的略微降低,但仍可以滿足目標定位的精度需求.以上分析表明定位方法對目標散射函數具有較好的穩健性.
仿真環境的海底參數往往與實際海底參數存在失配,會影響預訓練模型的定位性能.假設水體參數不變,當實際環境的海底底質分別為泥砂、細砂、粗砂時,仿真結果如表3 所列.

表3 海底底質失配時的仿真結果Table 3.Simulation results of sediment properties mismatch.
可以看出,當實際海底底質與仿真海底底質存在失配時,預訓練模型的預測準確率下降了20%左右,定位方法的性能受到較大影響,且失配程度越大,預訓練模型的預測準確率越低.經過遷移學習后神經網絡模型的預測準確率得到提升,盡管隨著失配程度的增大,預測準確率會出現小幅下降,但在實際海底底質為粗砂的情況下仍能達到92%,這表明定位方法對海底底質具有較好的穩健性.
發射和接收點的位置決定了特征聲線的傳播路徑,只有目標位于聲線附近時,才能對聲場產生影響.假設模擬目標和實際目標均為剛性長旋轉橢球體,模擬目標的長半軸為40 m、短半軸為3 m,實際目標的長半軸為60 m、短半軸為5.6 m,無其他失配存在.令接收陣元數為25,發射陣元數分別取3—6,保持其他仿真參數不變,仿真結果如表4所示;令發射陣元數為5,接收陣元數分別取17—23,保持其他仿真參數不變,仿真結果如表5 所列;改變發射陣元的布設深度,令5 個發射陣元的布設深度分別為20—32 m,20—80 m,68—80 m,保持其他仿真參數不變,仿真結果如表6 所列.
由表4 和表5 可以看出,當提高發射、接收陣元數量時,可以得到準確率更高的預訓練模型,且預訓練模型的定位性能受目標尺寸失配的影響更小,經過參數遷移后,與較少陣元數的情況相比模型的預測準確率更高.這是因為發射、接收陣元數量的增多會使得收發連線的數量增多,可以從波導空間結構的維度上得到更多與目標位置相關的信號數據,故而輸入神經網絡的數據矩陣隱含著更多的目標位置特征信息,有助于神經網絡訓練過程中對特征更加高效的提取,能夠更好地訓練和構建神經網絡模型,提高模型的預測準確率.

表4 不同發射陣元數時的仿真結果Table 4.Simulation results of different number of transmitting array elements.

表5 不同接收陣元數時的仿真結果Table 5.Simulation results with different number of receiving array elements.
表6 的結果表明,發射陣元布設深度為20—80 m 時,與布設深度為20—32 m,68—80 m 的情況相比可以得到準確率更高的預測模型.這是因為當發射陣元布設在較小的深度覆蓋范圍時,對于不同的發射陣元,其對應接收信號數據的信道響應函數差異較小,包含的目標位置信息有限;而當發射陣元布設在較寬的深度覆蓋范圍時,接收信號數據的信道響應函數差異增大,此時接收數據中隱含著更多目標位置信息,有助于神經網絡更準確地提取數據的特征,提高模型的定位性能.同時也可以看出,在仿真環境下改變發射陣元數、接收陣元數、發射陣元布設深度的取值,經過遷移學習后模型的預測準確率仍能達到90%以上,這表明定位方法對陣元數、布設深度均具有較好的穩健性.

表6 不同布設深度時的仿真結果Table 6.Simulation results of different layout depths.
海洋環境的起伏會導致聲信道的幅度和相位起伏,從而引起接收信號起伏.為了便于研究本文方法對信道起伏的穩健性,這里分別對信道沖激響應的幅度和相位添加擾動,分析不同擾動強度下的定位效果.
根據信道多途沖激響應,對信道加入幅度擾動,可以表示為

對時域內各收發對間的幅度最大的前10 條聲線添加幅度擾動,以模擬環境起伏引起的信道幅度擾動,幅度擾動相互獨立且本方法在不同幅度起伏強度下的接收信號強度起伏和定位準確率如圖8(a)所示,定位準確率隨著信道幅度起伏方差與信道沖激響應最大值之比的增大逐漸減小,接收信號能量起伏隨該比值的增大逐漸增大.當該比值小于0.2 時,信號強度起伏不超過1.7 dB,定位準確率保持85%以上;當該比值增大至大于0.3 時,信號強度起伏超過2.7 dB,定位準確率小于75%.
根據信道多途沖激響應,對信道加入相位擾動,可以表示為:



圖8 定位準確率隨起伏變化 (a) 定位準確率隨幅度起伏的變化;(b) 定位準確率隨相位起伏的變化Fig.8.Position accuracy with fluctuation variation:(a) Position accuracy with magnitude fluctuation;(b) position accuracy with phase fluctuation.
以上仿真表明,本文方法對海洋環境起伏導致的信道擾動具有一定的穩健性,在較為穩定的信道環境下可以保持較好的定位準確率.
在無目標信道中存在起伏時,分別考慮幅度和相位起伏.計算起伏環境下的定位預測結果,如圖9所示,環境隨機擾動使得無目標定位結果具有較強的隨機性,無法判定目標的存在與位置.這是由于無目標時,由(7)式得到的擾動量變化只由噪聲和信道擾動決定,因此具有較強的隨機性.

圖9 起伏信道下無目標定位預測結果 (a) 無目標幅度起 伏 σ/max(h)=0.6 的定位預測結果;(b) 無目標相位起伏φ=2π/3 的定位預測結果Fig.9.Position result without target in fluctuated channel:(a) Position results without target in magnitude fluctuated channel σ/max(h)=0.6 ;(b) position results without target in phase fluctuated channel φ=2π/3.
由仿真結果可以看出,方法的定位預測結果在起伏信道中有無目標的情況下有顯著差別,相比于有目標情況,無目標時定位預測結果的分布呈現很強的隨機性,因此不能作為目標定位依據.
本文研究了一種基于遷移學習的水下目標前向散射穩健定位方法,提取目標前向散射引起的聲場幅度擾動作為特征,利用仿真數據訓練神經網絡構建預訓練模型,而后使用少量實際數據對預訓練模型進行參數遷移.淺海環境仿真結果表明,在聲速剖面失配時可以獲得穩健的定位結果;對多種失配情況進行了敏感性分析,仿真結果表明該方法對目標散射函數、海底底質具有較好的穩健性,雖然在存在失配時預測性能出現小幅下降,但仍可以滿足目標定位的精度需求;對發射接收陣元數目以及陣元布設深度進行了敏感性分析,仿真結果表明增大以上參數可以使得接收數據隱含更多的目標位置特征信息,提高神經網絡的特征提取能力和定位性能,實際中需綜合考慮布陣設計與定位性能,選取合適的發射、接收陣元數與布設深度;進一步對信道幅度與相位擾動進行了敏感性分析,結果表明方法在較穩定的環境下可保持較好的定位性能.
該方法由模型和數據共同驅動,可以較好地解決環境失配問題,但值得注意的是遷移學習的前提是源域和目標域具有一定相似性,這意味著預訓練模型不能和理想預測模型在結構上相差過大,選取先驗水文環境信息構建預訓練模型時應盡可能考慮多種水文情況,使得預訓練模型具有較好的泛化能力,這也有助于避免遷移學習時出現過擬合的問題.