鹿紹慶,計 方,*,徐 鵬,李國楠,劉力溟
(1.中國艦船研究院,北京 100192;2.中國人民解放軍第92730 部隊92 分隊,海南 三亞 572016)
大型水下航行體特征提取是海洋工程中一個重要的基礎性研究課題,尤其是針對遠場低頻特征的相關研究,近年來逐漸成為了熱點與難點。通過分析低頻特征有利于掌握水下航行體的許多信息,對水下目標探測與鑒別起到了積極作用。
由于大型水下航行體存在水聲數據樣本少、環境時變、信噪比低等問題,各種方法的特征提取難度大大增加。一方面,從水聲數據中提取出高質量的特征具有一定困難;另一方面,對于特征的提取與鑒別機制尚不完善,目前較流行的基于數據的智能方法尚無法取得可解釋性的效果,基于專家知識的傳統提取鑒別方法由于嚴重依賴經驗使得結果穩定性不足。因此,對于水下大型航行體遠場低頻特征提取問題,尋求一種滿足現有數據條件的方法顯得尤為重要和迫切。本文對當前使用的幾種水下大型航行體特征提取方法進行了綜述,并展望了未來特征提取方法的發展方向,希望對于改進當前水下低頻特征提取的不足產生積極意義。
隨著水聲領域探測技術的發展,對水下目標的探測頻率甚至能夠低至幾赫茲,由于深海聲信道具有時變性、低信噪比等特點,對于水下大型航行體遠場低頻特征的提取鑒別變得異常困難。目前較為流行的方法有2 種,一種是使用傳統方法與智能方法相結合,另一種是直接使用智能方法進行特征提取,后者一般是通過深度神經網絡完成。然而,多數神經網絡方法對數據樣本的要求過于苛刻,而這正是水聲領域一直以來所面臨的短板。因此,小樣本的水下大型航行體目標低頻特征提取問題亟待解決。本文從傳統方法和智能方法2 個方面對國內外在相關領域的研究做了綜述。
傳統方法針對水下大型體的低頻特征主要是從時頻域單獨、時頻域結合和人體感官等方面進行提取[1]。
水下航行體時域特征提取比較簡單,主要是分析目標傳回來的時域波形結構,用統計的方法提取出目標比較明顯的特征。國內研究者對此進行過比較深入的研究。1999年,蔡悅斌等[2]利用噪聲信號的過零點、幅值、波長差、波列面積等特性提取噪聲信號的特征,得到了11 維特征信息,并對噪聲信號的時域波形結構特征進行分類。2015年,孟慶昕等[3]類比音色特征,對商船和水面運輸機2 類水面目標時域波形結構特征進行提取,得到了9 維特征矢量,將其輸入分類器中可以有效識別兩類水面目標。
水下航行體時域波形結構特征提取方法雖然比較簡單,但是使用范圍受限嚴重,在隱身技術飛速發展的現代,信噪比過小時,水下航行體的時域波形特征提取很難實現,因此研究者轉而分析信號的頻域特征。但是單獨的頻域分析使用較少,常用的是對信號的連續譜和線譜分析,因為線譜的唯一性,以線譜為特征具有很高的識別率,這在吳國清等[4]的調查中曾被證明。
相較于單獨使用水下航行體的時域特征和頻域特征,時頻域結合的特征提取在國內外的研究中更為流行[1]。起初人們發現單獨的頻域分析雖然對有限平穩的周期信號非常有效,可以處理時域上難以提取的特征,但是卻無法時、頻兩域結合分析,因此人們引入了短時傅里葉變換。然而,在研究中發現,無論傳統傅里葉變換的頻域分析還是短時傅里葉變換的時頻兩域分析,都對非平穩信號的處理效果欠佳,而且短時傅里葉變換中固定窗長使得信號有時分辨率不足。針對于此,研究者們引入了一種新的數學工具——小波函數。
小波變換的多種形式中有一種是離散二進制小波變換,可以保持信號的時移不變形性,對信號的奇異點進行檢測。趙建平等[5]用二進離散小波變換提取信號回波邊緣特征,到了四階以上就對4 種湖底介質返回的無規、低SNR 信號有很高的分辨力,而且離散二進小波變換計算量小,有快的處理速率。卜英勇等[6]針對傳統Hilbert 變換復解析信號時遇到直流會出現毛刺的問題,構造了新的包絡濾波器,使信號的實對稱小波滿足條件以得到信號的包絡,用離散小波變換提取信號包絡尾部特征,分辨出細、中、粗沙和礫石4 種水底介質。離散小波變換提取信號特征較連續小波變換計算量小,可以在提取信號特征的同時起到壓縮的作用,處理速度快。目前對于奇異點處目標信號特征提取,二進離散小波變換是一種非常有效的手段,可以得到目標的表面形狀、結構、材料等特征。張靜遠等[7]基于小波變換實現了包括奇異性特征提取在內的4種特征提取方法,另外3 種分別是提取的信號能量特征、熵特征以及適應性小波網絡的特征,得到了很好的效果。上述幾種小波變換方法進行的特征提取雖然效果都很好,但都是對水底不同類型的底質回波信號進行特征提取,與實際目標特征關系不是很大。郭雪松[8]基于李秀坤對彈性亮點模型特征的研究,提出將連續小波變換和離散小波變換應用于目標彈性亮點干涉譜的提取。該研究更加貼近于水雷、潛艇等實際目標。CANG 等[9]使用二階同步壓縮變換提取信號特征,他們先對信號進行連續小波變換,再計算解調信號頻率初值估計,最后重新分配壓縮連續小波變換,較通常的小波變換有更強的時頻特征提取能力。
低頻分析和記錄(Low Frequency Analysis and Recording,LOFAR)、噪聲包絡調制檢測(Detection of Enveloped Modulation on Noise,DEMON)是2種常用的信號分析手段[10],前者可以提取信號中寬帶線譜特征,卻無法提取信號的軸頻和倍頻特征,后者可以解調以提取信號的低頻包絡譜,從而提取信號中的軸頻、葉頻等特征。二者互補中可以提取出較為準確的信號時頻特征,是如今水下大型航行體低頻特征提取的常用方法。需要注意的是,傳統的LOFAR 譜與DEMON 譜相結合進行特征提取時,可能會出現2 類特征的“兼并”現象,無法分辨出是2 個信號特征,導致特征的遺漏。針對于此,CHO 等[11]提出來一種基于調制譜圖域的水下信號綜合分析算法,可以分辨不同信號特征的視覺差異,提高計算效率,對“兼并”現象有一定的改進效果。
基于人體感知的特征提取也可以處理水下大型航行體特征,而且有利于聲吶操作人員判斷目標的類型。
聽覺方面:之前已有基于聽覺響度的特征提取計算模型,但響度易受到海況等因素的影響。因此,楊陽[12]研究了基于音色參量的聲吶回波特征,結合高階譜,可以更有效地抑制噪聲,提高信混比。音色參量和高階譜的結合可以減小海況對信號特征提取的影響,有利于更準確地識別目標特征。吳姚振[13]提出了5 種基于聽覺濾波的特征提取方法,其性能優于傳統的MFCC、LPCC、PLP 方法。不過他的實驗是在加性噪聲的前提下進行的,對加性和卷積混合的噪聲并沒有分析。
視覺方面:基于人體視覺感官的特征提取一般是二維特征提取,可以對水下圖像進行特征提取。計算機視覺工具是不可或缺的一個重要工具,ZHANG 等[14]將視覺檢測應用于水下圖像特征提取求解魯棒性問題,形成了更穩定、更貼近人類認知機制的特征提取算法。NAGARAJA 等[15]先利用同態濾波、曲波去噪和LBP 擴散相結合增強水下圖像,再從中提取出有效的、魯棒性的特征,可以提高圖像特征的識別度。
上述幾種基于人體感官的特征提取在實際應用中有一定的優勢,但并不完善,無法完全貼合人體的感覺以分辨不同的目標,所以此類特征提取方法仍有發展空間。
針對水下大型航行體遠場低頻特征,傳統的方法通常在預處理和特征提取過程中需要一定的先驗知識,并且需要引入某些假設,容易出現信息丟失的問題。雖然現存的水下航行體聲學不變特征的提取方法五花八門,但由于開展水下試驗需要投入大量人力物力,數據獲取代價較大,普遍缺乏對水下航行體的系統性認識,提取結果往往易受非目標干擾影響,不僅如此,復雜的水聲環境、目標的運動姿態等因素也對特征提取增加了難度。從文獻可知,現存的水聲目標特征提取方法大多不能實現對非目標特征、環境噪聲和目標噪聲的有效分離,提取結果往往包含大量的非目標干擾,這無疑給下一步的特征鑒別造成了一定困難。因此,研究人員致力于尋找性能更優的智能方法。
針對水下大型航行體低頻特征的提取與鑒別,智能的方法有專家系統、統計類方法和人工神經網絡方法。其中專家系統依靠領域內專業知識來推理分析目標特征,以實現目標識別;統計類方法依靠各種判決系統來分類識別目標,如支持向量機(SVM)[16-18];淺層人工神經網絡(Artificial Neural Network,ANN)方法是目標識別領域潛力最大也是最為火熱的目標識別方法。
在人工神經網絡推廣之前,最早的水下航行體特征分類算法是經典統計模式分類方法[19],它利用之前已經收集到目標特征范例進行統計分析和基于距離度量的模式匹配,這種方法在當時對可識別目標的決策速度很快,但難以識別與模板不匹配的目標。20世紀70年代,基于模型的算法、知識的算法和模糊集合理論的分類技術被廣泛應用于水聲目標識別,這些算法、技術的性能要優于傳統的統計模式分類方法,然而實現較為復雜、知識驗證和獲取困難、主觀性太強使它們的發展受到了限制。80年代,人工神經網絡技術被應用于水聲領域的目標自動識別,為后來的自動識別技術打開了良好的開端。21世紀初,深度神經網絡步入歷史的舞臺,水聲工作者也由此嘗試使用深度神經網絡提取常規方法難以分辨的深度特征,并且取得了良好的進展。如今,水下大型航行體特征提取方法引入了深度學習模型,基于深度神經網絡的各種方法層出不窮,在許多應用中展現了強大的特征提取能力和優秀的識別效果。
人工神經網絡技術是模仿大腦神經元的結構而發明的,包含許多結構單元,可以根據學習方式及內容不同而具有不同的功能。神經網絡減少了聲吶操作人員的工作量,提高了效率。神經網絡的使用可以分為2 個階段:第1 個階段是學習階段,第2個階段是應用階段。神經網絡通過學習集(Learning Set)作為輸入信號,分類識別已知參數的目標,以此來訓練該神經網絡,類似與人類學習知識。當該神經網絡可以達到一定的識別率之后,進入應用階段,可以用來分類判決未知的目標信號,以此達到最終自動識別目標的效果。目前自動目標識別技術還未發展至最終成熟階段,基于人工神經網絡得到的識別結果并不能完全被信賴,所以很多時候是機器自動識別與操作人員的判斷相結合,以提高識別的準確率。
水聲領域使用的神經網絡有BP 神經網絡、反饋神經網絡、RBF 神經網絡[20-21]、自組織競爭神經網絡、有限脈沖神經網絡[22]、概率神經網絡[23]、深度學習神經網絡等多種類型。其中RBF 神經網絡有著良好逼近能力、分類能力和學習速度,而且不易陷入局部極小值、訓練時間比BP 神經網絡時間短,但是目前對水下大型航行體特征的研究較少,沒有BP 神經網絡的應用廣泛。在很多深度模型中也需要BP 網絡來調整參數。
BP 神經網絡的誕生是 20世紀 80年代的RUMELHART 和McClelland 對神經網絡的第3 次里程碑式的優化,否定了之前研究人員認為多層感知器毫無意義的觀點[24],從此神經網絡進入了快速擴張的時期。基于BP 算法的多層感知器較單層感知器有強大的非線性映射能力、泛化能力和容錯能力[25]。每一個BP 神經網絡至少包含3 層結構,即輸入層、隱含層和輸出層,有時候也可以有多個隱含層。BP 算法的學習過程包括輸入信號的正向傳播和誤差的逆向傳播2 部分,如果輸出信號誤差超出期望值,它就會轉向誤差逆向傳播,調整各層權值,再進行計算輸出,周而復始,直到誤差符合期望或者達到預設循環次數,學習過程結束,該神經網絡進入應用階段。
傳統的BP 網絡收斂速度慢,國內外研究人員對于該缺點,常用的解決辦法有動態調整學習步長、自適應改變慣性權值等[26],對于易受局部極小值影響的缺點,王菲提出了一種基于自適應遺傳BP算法[27],與之前利用動量規則的改進算法比較,都可以改進傳統的BP 算法,王菲的自適應遺傳BP 算法效果更優;自1992年,ZHANG[28]提出小波神經網絡的概念,許多學者將其不斷優化,BAKSHI[29]將小波函數和尺度函數結合,給出了網絡的全局誤差和局部誤差的指標,ZHANG 等[30]將正交小波基引入神經網絡,不過這種正交小波網絡的解析形式很難構造,因此目前在實際中應用較少;SZU[31]提出共軛梯度算法的小波神經網絡,比文獻[28]的隨機梯度算法更快。ZHANG 等[32]以人工魚群算法(AFSA)[33]為基礎,提出了一種改進的神經網絡,該神經網絡也可以優化傳統BP 神經網絡收斂速度慢和易陷入局部最優的問題。袁駿等[34]將主成分分析(PCA)方法與BP 神經網絡結合,實驗結果表明,在主成分個數較少時,可以有效提高目標識別率,但是當主成分個數較多時會降低識別率,因此需要合理選擇主成分個數。
早期智能方法中,專家系統存在可移植性差、學習能力差、上限低等問題,支持向量機對大規模的訓練樣本處理能力不足,并且難以勝任多分類問題,傳統的BP 神經網絡收斂速度較慢,在遇到2種類別的目標數量差距較大時,小類目標的識別率很低,而且在多層網絡中容易出現梯度消失的問題,所謂的梯度消失,是當BP 網絡層數較低時,可以得到較好的目標識別效果,但隨層數的增加,BP 神經網絡無法正常完成學習階段。這是由于BP神經網絡使用的sigmoid 激活函數,該函數的導數值域非常小。
如圖1所示,sigmoid 函數的導數取值范圍很小,當神經網絡的層數增加,多個sigmoid 函數的疊加作用下,就容易產生梯度消失問題,無法使BP 神經網絡的參數得到優化。

圖1 Sigmoid 函數及其導數Fig.1 Sigmoid function and its derivative
綜合來看,雖然有許多研究人員對BP 網絡做了一些改進,但仍有各自的缺陷存在。因此,傳統的BP 神經網絡在水下大型航行體目標特征提取和識別中發揮的作用有限,單純地對BP 神經網絡優化改進無法滿足當前水下低頻目標特征提取和識別的需求,因此,深度神經網絡逐漸成為研究的熱點。
由于多層BP 神經網絡容易出現梯度消失問題,所以當時深層的神經網絡在各個領域一度陷入灰暗。直到2006年,HINTON 等[35]提出深度置信網絡(DBN)這種快速算法,將深度學習帶入新的發展階段。時至今日,深度學習神經網絡已被廣泛應用于包括水聲在內的各個領域。
深度神經網絡較其他方法可以學習到更穩定的深度特征,這些深度特征有更高級的不變性,對于獲得水下大型航行體的特征更有優勢。目前針對水下大型航行體目標的特征提取和識別,常用的深度神經網絡方法有:深度置信網絡、卷積神經網絡(CNN)、循環神經網絡(RNN)、自編碼器(AE)神經網絡和其他神經網絡。其他神經網絡主要指生成對抗網絡(GAN)和遷移學習使用的深度網絡。
國外學者HINTON 等[35-36]提出了一種深度網絡結構 DBN,其基本結構為受限玻爾茲曼機(RBM),如圖2所示,RBM 結構中同一層的神經元之間沒有連接,相鄰的顯層和隱層之間的神經元全連接。DBN 在訓練時采用逐層貪婪的算法,以層層遞進的方式,將前一層網絡訓練好之后再訓練下一層,這種方法弱化了梯度消失的問題。近些年國內外對此有多種應用。

圖2 RBM 結構Fig.2 Structure of RBM
KAMAL 等[37]使用深度置信神經網絡在航行體信號中提取深層次的不變性特征,相對于人工設計的傳統特征提取方法更加穩定,在多種干擾源干擾的情況下,該深度置信網絡在實例測試集上的分類識別正確率達到了90.23%。王強和曾向陽[18]使用DBN 和CNN 對實測水聲數據進行特征提取和識別,并與傳統的SVM 分類識別MFCC 特征作比較,其結果由于數據量的限制,三者相差不大,是水聲學引入深度神經網絡的一次嘗試。近年來西北工業大學楊宏暉老師所在的團隊對DBN 也有研究[38-41]:在DBN 中引入互信息分組策略結合而成的MIGS-DBN 可以稀疏傳統的DBN 提取的特征,使模型更加簡潔高效;在CDBN 模型中,首先初始化的單元分組,然后在競爭層中獲得隱層單元中特征較優的分組,從而實現了較少的特征與較高的正確識別率并存;此外,在競爭網絡中再進行剪枝處理,將冗余的參數去除,再次提高了深度網絡的效率。YUE 等[42-43]構建的DBN 模型用于艦船輻射噪聲的特征提取和識別,其分類結果的正確率達到了 96%以上。XIE 等[44]的深度玻爾茲曼機(DBM)模型與DBN 模型類似,也取得了優秀的特征提取效果,對水聲信號的識別正確率在90%以上。在姚思冰的研究中[45],將測試樣本的線譜特征、LOFAR 譜特征、MFCC 特征和DEMON 譜特征分別作為DBN 的輸入,對水面目標進行識別,其總體識別率在80%~90%。
綜合國內外的研究來看,DBN 方法一方面可以依靠自身完整的深度網絡結構提取目標特征并識別,也可以與傳統特征提取方法相結合,處理傳統方法預處理過的特征數據集,從文獻的研究來看,其識別結果都比較優秀。
卷積神經網絡最初是為了二維形狀的識別而被設計出來的,對于圖像類的特征提取與分類識別性能很好,同時也可以用于水下大型航行體的特征提取與鑒別。一般卷積神經網絡都是多層的深度結構,其組成是輸入層、多個卷積層和池化層交替連接、全連接層、輸出層。其中的卷積層是卷積神經網絡的核心,也是該種神經網絡的主要特征,卷積層中有多個卷積核,來提取圖像的多個特征,使卷積神經網絡有更好的識別效果。現在的應用多為改進的卷積神經網絡,研究者們根據不同的任務來設計相應的卷積網絡結構。
王小宇等[46]將卷積層中的卷積核設為1,并且以全局平均池化層(GAP)代替全連接層,可以把原始時域信號作為輸入,更加突出目標信號的局部特征,而且提高了結果的可解釋性。金磊磊等[47]使用的卷積神經網絡對聲吶圖像進行識別,他們將輸入的數據先經過顯著性分割處理,并且引入金字塔池化層(SSP),可以將輸入數據的維數統一,聲吶圖像識別提高了便利性,并且有良好的準確性和實時性。WILLIAMS[48-49]使用深度卷積神經網絡對合成孔徑聲吶圖像進行分類識別,較傳統的分類器有更卓越的性能。深度卷積神經網絡在目前的水下目標識別方面已經是非常先進高效的特征提取和分類識別方法。PARK 等[50]以CNN 模型處理聲吶低頻分析和記錄(LOFAR)譜圖,將LOFAR 譜圖分為曉得斑塊來尋找其中的頻率特征,從而實現快速、高精度的自動化識別船舶目標。
近五年,基于聽覺感知的CNN 特征提取模型展現出了很好的性能[51-56]。聽覺感知模型模擬人耳對聲音的感知過程,以原始聲學信號作為輸入,在“耳蝸”部分由時間卷積層將輸入信號進行初始化;在“聽覺皮層”部分,由置換層、能量池化層、二維頻率卷積層、全連接層、全局平均池化層等將初始化的信號轉換到頻域,并且可以保留局部性特征并減少船舶噪聲的頻譜變化;最后通過目標函數對網絡進行優化并分類識目標。文獻[57]對傳統卷積神經網絡的卷積核特征提取方式進行改進,使提取的特征具有物理意義,增強了深度特征的可解釋性。DOAN 等[58]也是將原始的時域信號作為輸入,用深度DNN 進行特征提取和識別,在0 dB 的信噪比下對聲吶數據的整體識別精度達到了98.85%。此外,哈爾濱工程大學[17,59-61]、國防科技大學[43]、中國艦船研究院[62]、杭州電子科技大學[63]均對水下目標特征提取和分類識別的CNN 模型有所研究。
CNN 還可以作為一個完整深度神經網絡框架的一部分來發揮特征提取的作用。在文獻[64]中,SONG 等提出了一種雙路徑循環神經網絡模型,該模型的作用主要是實現水聲信號的降噪處理,模型包括特征提取、模板分離和信號回復3 個部分,其中特征提取部分就是使用的CNN 來提取信號的高階非線性特征并進行分塊處理。
CNN 在各個領域的應用都極為廣泛,從國內外的文獻來看,在特征提取和目標識別領域,CNN方法也是所有深度網絡方法中應用最多的,這與其優秀的特征提取能力和識別精度、便于構建的網絡結構密切相關。
聲音信號作為一種序列信號,是與時間有關的。RNN 對時間先后相關的數據集處理的能力極為優秀,它的結構特點是:隱層的輸入不僅來自于顯層,而且與隱層上一時刻的輸出有關,RNN 可以讓信息在網絡中循環,在進行當前任務時調用以往的信息。
RNN 中有一種典型的網絡結構是長短期記憶網絡(Long Short Term Memory,LSTM)[65]。LSTM網絡改進了RNN 時間跨度小,不能長期依賴的問題。在水聲領域中,RNN 可以與CNN 組合使用。Das 等[66]將LSTM 網絡應用于水聲傳感器網絡異常檢測;MU 等[26]將LSTM 網絡引入AUV 導航,比之前的方法有更好的精度和容錯性;盧安安[17]建立了多隱層的DBLSTM 模型作為目標識別的主網絡,可以保留有意義的梯度,這有利于水聲目標識別。MU 和盧的研究中都證明了雙向LSTM 網絡優于單向LSTM 網絡,盧的實驗還證明了LSTM網絡優于常規的RNN 和DNN。正因如此,LSTM 網絡越來越受水聲研究者的喜愛。KAMAL 等將CNN與雙向長短時記憶網絡(BLSTM)結合,可以減輕淺水聲信號頻譜–時間變量的影響[67-68]。ZHANG 等[69]所使用的遞歸和卷積神經網絡(R&CNN)由循環層、卷積層和全連接層組成,該深度神經網絡結合RNN 和CNN 二者,提高了神經網絡的自動提取特征能力和學習能力,在對比實驗中的識別精度達到了最高,并且所消耗的平均時間也較少。
如今國內外用RNN 處理水聲低頻特征提取和識別任務的研究比較匱乏,RNN 的設計是針對時間相關的信號,而時域的水聲信號正是一種時間序列信號,因此在以后的研究中,可能會有越來越多的RNN 方法應用于水下低頻特征提取和識別中。
AE 神經網絡也是水下大型航行體特征提取效果很好的一種神經網絡。單個AE 一般由編碼器和解碼器組成,經過編碼和解碼之后要求輸出逼近輸入。多個AE 堆棧形成的棧式自編碼器(SAE),也是一種深度結構。AE 神經網絡可以無監督地提取特征,不需要已知的標簽標注,因此在許多水下目標特征提取的場景中有許多優勢。
國內外的研究中,CAO 等[70]建立的SAE-softmax模型利用堆棧稀疏AE 神經網絡提取航行體信號譜圖中的深度特征,稀疏AE 神經網絡還可以提取其中隱藏的相關性特征,使用該SAE-softmax 模型對三類真實水聲目標進行分類識別,其正確識別結果均在92%以上,整體識別率達到了94.12%。在此基礎上,CAO 等[71]將各個子帶的軸頻特征、高維對數功率譜特征(LPS)和小波包分量能量特征(WPCE)聯合構建多域特征,作為堆疊稀疏自編碼器(SSAE)的輸入,較單域特征更有優勢。YANG等[72]使用去噪AE 和稀疏AE 對水下接收信號的調制類型進行識別,在低信噪比的環境中可以保留較好的魯棒性。SATHEESH 等[73]提出一種超參數的變分自編碼器(β-VAE)的無監督生成框架,在航行體信號的分類識別中表現出優秀的成績。陳卓[74]使用稀疏降噪AE 對被動聲吶數據進行特征提取,鞠東豪等[75]使用堆棧稀疏去噪AE 訓練特征提取神經網絡,宋奎勇等[76]使用去噪AE 和不同的降維方法進行特征級融合,這些研究展現了AE 神經網絡在水聲數據的特征提取中強大的無監督處理數據的能力。
綜上,AE 網絡的深度模型常用的是SAE,由多層編碼器與解碼器堆疊而成,在其中加入稀疏、去噪等功能較為常見,其強大的無監督提取特征的能力深受研究人員喜愛。
在水聲目標的特征提取領域,除了上述幾種發展比較成熟的深度智能方法,還有GAN 和遷移學習的新興方法。二者相較于其他的深度模型,所需的數據量更小,是新興的2 種針對水下大型航行體特征的分析方法。
對于GAN 模型,文獻[77]以基于GAN 的模型提取深層特征進行水聲信號的識別實驗,在低信噪比下的正確識別率可以達到85%以上,較相同數據集訓練的CNN 模型更高。文獻[78]將self-attention模塊引入GAN 模型,生成了高質量的LOFAR 譜樣本,在數據不足的情況下可以提高模型的準確度。文獻[79]使用輔助分類器生成對抗網絡(ACGAN),使用無監督學習的方式進行對抗訓練,對從印度洋獲取的水聲數據進行分類識別實驗,其結果較監督、非對抗式的對比模型更優。
對于遷移學習方法,JIN 等[80]通過ImageNet上大量的光學圖像數據集遷移學習少量的聲吶圖像數據,實現了快速高效的聲吶圖像特征提取和識別。李俊豪等[81]提出了一種聽覺感知的深度卷積網絡(ADCNN)遷移模型,以已有的艦船輻射噪聲大量數據訓練該網絡后,將特征參數遷移到小樣本的識別任務中。實驗表明:以遷移學習的方法較之前小樣本識別的正確率提高了4.17%。胡鋼[82]、劉璐[83]研究的模型中,均是在大量ImageNet 圖像中訓練出參數后,通過遷移學習引入水聲領域,令原水聲目標識別的準確率得到提高。
深度神經網絡對先驗知識的依懶性不強,但是DBN,CNN 和RNN 想要發揮出優異的性能,對數據量及數據格式有較為苛刻的要求,這對于水下大型航行體特征而言是很難實現的,有時需要付出巨額的成本。而小樣本的GAN、遷移學習方法屬于新興的技術手段,還存在許多未知的挑戰。對于遷移學習來說,所基于的大數據圖像和所要實際分類的聲吶圖像之間的統計特征會有一定的區別,這樣進行微調的時候缺乏跨域適應性,可能無法獲得令人滿意的遷移效果。
此外,智能方法中深度神經網絡存在一種“黑箱”性質,這意味著不知道神經網絡如何以及為何會得出一定的輸出,在水下大型航行體遠場低頻特征提取問題中這是缺乏可解釋性的,因此深度模型對水下航行體特征的識別結果往往并不能被完全信賴。
對于小樣本的大型航行體遠場低頻特征提取問題,依靠大數據提高性能的深度網絡在未來的應用中可能略顯無力,而對于GAN、遷移學習等對數據依賴不大的深度神經網絡方法,在這些場景中可能會發揮出越來越重要的作用。使用累積數據訓練好模型,再通過遷移學習的方法來解決新的小樣本問題將成為未來水下大型航行體遠場低頻目標特征提取和識別的常用方法。對于深度神經網絡方法的可解釋性不足的問題,研究人員對此積極尋求解決方案,已經有學者初步提出將高維特征低維化,以獲得可以解釋的特征,這將是未來的一個研究方向。結合傳統方法與智能方法各自的優點,將低維、高維特征相結合來共同構建水下大型航行體目標的特征表達,更有利于正確識別目標。未來,打破各種方法之間的壁壘,建立一種機器深度學習與專家系統、傳統方法更深度融合的水下航行體低頻特征鑒別機制,在水下大型航行體遠場低頻特征提取和目標識別任務中,有望改善各方法存在的不足。