晏 媛,孫 俊,孫晶明,于俊朋
(1.南京電子技術研究所,江蘇 南京 210039;2.中國電子科技集團公司智能感知技術重點實驗室,江蘇 南京 2100039)
雷達目標識別技術不受天氣、光照等諸多條件影響,能夠及時準確地提供場景中每個實體目標的詳細屬性信息,具有較高的軍用和民用價值。但實際應用場景的時效性約束和資源限制導致該領域一直存在小樣本問題,這嚴重制約了雷達目標識別技術的發展[1]。雖然傳統雷達目標識別技術對數據的需求量較小,但人工提取特征的方式導致該類算法環境適應性差且工程推廣能力低[2]。深度學習技術依靠其優秀的自動特征提取能力,大幅提升了雷達目標識別的準確率[3-4],但其對大數據的需求依舊制約著模型性能的發揮[5-6]。因此,如何提升深度學習技術在雷達小樣本目標識別應用中的性能成為亟需解決的問題,也是本文的研究重點。
目前小樣本學習問題在光學圖像識別領域的研究最為廣泛,主要研究機器學習模型面對新類少量樣本的快速學習能力,代表方法是元學習和遷移學習[7]。元學習要求系統通過觀察機器學習方法在不同任務中的學習過程,積累經驗以實現新任務的快速學習[8]。元學習方法可分為3類:基于度量的元學習[9-12]、基于模型的元學習[13-14]和基于優化的元學習[15-16]。其中基于度量的元學習方法由于強解釋性和優越的識別性能而備受關注。不同于元學習,遷移學習的核心思想是從相關領域遷移標注數據或知識結構用于改進目標領域或任務的學習效果,根據可遷移的內容分為4類:模型遷移、特征遷移、樣本遷移和關系遷移[17]。其中模型遷移方法能夠降低小樣本模型的訓練難度,加速網絡學習,因此在小樣本學習領域也得到了一定的應用[18-21]。文獻[20]將元學習方法與模型遷移相結合后算法性能明顯優于普通元學習方法。
綜上可以看出,小樣本學習問題在光學領域已經取得了一定的研究成果。相較于光學領域,雷達領域的小樣本目標識別問題研究十分有限[22-26]。文獻[22-24]分別改進原型網絡等光學領域小樣本學習模型,提升雷達小樣本目標識別性能,但實驗場景均設置簡單,無法滿足復雜的實際應用需求,同時模型性能優勢驗證不明確。文獻[25]遷移光電域知識以提升雷達圖像域的小樣本目標分類性能,但其未考慮目標任務數據的難獲取問題,同樣未結合雷達實際應用場景。
針對以上問題,本文通過探究元學習和遷移學習這兩類最主流的小樣本學習方法,提出了一套綜合解決方案用于處理實際工程應用中的雷達小樣本目標識別問題。該方案使用了具有強表示性的特征提取模塊,且能夠針對不同的應用場景選擇合適的模型學習方式和分類方式,因此能夠最大程度發揮模型優勢,展現優越的識別性能。同時本文基于雷達實測數據集,對元學習和遷移學習在不同實際應用背景下的模型性能進行深入挖掘,進一步驗證了所提出方案的有效性和可行性。
小樣本學習問題的核心關注點在于研究模型的快速學習能力,目前研究者們通過提升數據利用率解決此類問題,主要從元學習和遷移學習兩個角度出發進行研究。
元學習通過學習多個任務的識別過程積累經驗,從而面對全新的目標任務時只需要少量樣本就能夠實現快速學習[8]。其中元訓練和元測試階段的算法思路相同,具體流程如下。
步驟 1確定目標任務。假設全新的待識別目標包括K個類別,目標任務為僅通過學習每類目標的M個樣本,就能實現對全新K類目標的正確分類。
步驟 2從數據集中隨機采樣K類目標,每類N個樣本作為一個元任務數據集。
步驟 3從元任務數據集的每類樣本中隨機采樣M張樣本作為支撐集Ss,其余各類的N-M張樣本作為查詢集Qs。
步驟 4模型學習支撐集樣本,并對查詢集樣本類別進行預測。
步驟 5最小化查詢集樣本的損失函數實現分類模型的訓練。
算法需要重復迭代步驟2至步驟5,這在元訓練階段能夠幫助模型實現更充分的經驗積累,也能在元測試時通過目標任務識別結果的反復驗證更準確地判斷模型性能。同時,元測試階段模型不需要重新調整便可以直接學習分類。
綜上可以看出,算法流程中元任務與目標任務的數據學習形式相同,這種模擬目標任務的模型訓練方式能夠很好地提升模型的泛化能力。同時,多任務訓練機制能夠幫助模型學習元任務的共性特征,如學習樣本相似性比較等,而忽略任務針對性強的部分,因此在面對新的目標任務時能夠發揮較好的性能。
遷移學習中的模型遷移方法因其高效性在深度學習圖像識別領域受到廣泛關注,通過知識遷移提升模型學習效率,具體算法流程如下。
步驟 1在源任務上對模型進行預訓練。
步驟 2遷移預訓練模型的部分或全部結構作為目標任務模型的淺層模塊,并凍結該部分模型權重參數和網絡結構。
步驟 3通過目標任務的學習對模型的非凍結部分進行微調完成模型訓練。
模型遷移方法之所以有效,是因為深度學習通常使用神經網絡提取樣本特征向量,而神經網絡淺層部分權值是具有強適應性的共性知識。因此,當源任務與目標任務存在一定相關性時,模型遷移能夠實現知識積累,從而降低訓練難度,提高模型學習效率。
本文提出了一套結合元學習和遷移學習的綜合方案用于解決雷達小樣本目標識別問題。該方案能夠根據實際應用場景選取合適的模型學習方式和分類方式,實現目標任務的快速學習。圖1體現了本文所提出方案的整體思路。

圖1 小樣本識別綜合解決方案Fig.1 Comprehensive solution for few shot recognition
算法首先通過模塊fθ進行樣本的特征提取,并根據實際需求選擇后續合適的模型學習方式。首先,當應用場景源任務信息量缺乏或源任務與目標任務間差異性大時,算法選擇模型的上支路,即遷移學習方式。其遵循模型遷移的學習流程,遷移預訓練模型的特征提取模塊并訓練新的分類模塊C1(·|Wn)。遷移學習的知識積累優勢一定程度上解決了源任務信息量缺乏的問題。同時,微調機制能夠較好地克服任務間的差異,使模型更好地適配于目標任務。其次,若源任務信息量充足或源任務與目標任務間差異性小時,算法選擇模型下支路即元學習方式進行小樣本識別。其按照元學習流程采樣獲得支撐特征向量和查詢特征向量,并通過比較查詢特征向量和支撐特征向量原型之間的歐氏距離,使用分類模塊C2(·|Wbn)進行查詢特征向量的分類。元學習的多任務訓練機制能夠幫助模型更好地處理新的目標任務,同時訓練過程中對目標任務環境的模擬也很好地提高了模型的泛化能力。因此,本文所提方案通過在不同應用情境下選擇不同支路能夠最大限度地發揮模型優勢,提升雷達小樣本目標識別的效率和準確率。本文的實驗結果驗證了所提方案的有效性和可行性。
下面重點介紹本文提出的綜合方案中的3個關鍵模塊:特征提取模塊,元學習支路和遷移學習支路。
小樣本學習方法通常采用的特征提取結構為4層卷積神經網絡[11-12],該網絡易于訓練,但結構簡單,學習能力有限。因此,本文提出使用殘差網絡進行特征提取。該網絡能在避免過擬合和退化問題的情況下保證網絡學習能力,盡可能擬合復雜的雷達目標特征提取過程,從而提升目標識別的準確率。
殘差網絡由殘差塊構成,如圖2(b)所示為一個殘差塊,其與普通卷積模塊的區別在于通過快捷連接在神經網絡前向傳播時跳過一層或多層連接實現了恒等映射。恒等映射的引入保證了層數加深后的模型性能永遠優于等于模型較淺時的性能。

圖2 恒等映射圖示Fig.2 Diagram of identity mapping
本文使用3個殘差塊堆疊構建了一個10層的殘差網絡,如圖3所示。每個殘差塊內包含3層卷積模塊,每個卷積模塊包含卷積層、批歸一化層和激活層。

圖3 特征提取器的網絡結構Fig.3 Network structure of feature extractor
原型網絡作為元學習的代表模型由于性能優越而備受關注,因此本文的元學習支路也將借鑒原型網絡的學習方式,實現模型的高效識別。
元學習支路的數據學習方式與經典元學習方法相同,均模擬目標任務進行學習。模型的整體思路參見圖1中的元學習支路,其具體思想如圖4所示。

圖4 原型網絡算法思路Fig.4 Prototypical network algorithm thinking
圖4(a)體現了每類支撐特征向量通過累加求均值獲得每類支撐樣本的原型ck,計算公式為
(1)
式中,Sk表示第k類目標的支撐特征向量集,|Sk|表示第k類目標支撐特征向量集的向量數量;(xi,yi)表示支撐特征向量集Sk中的各個向量,xi表示單個支撐特征向量,yi表示該支撐特征向量的標簽信息。
圖4(b)則體現了單個查詢特征向量通過求解與每類原型的歐氏距離來獲得其類別概率分布,表達式為
(2)

(3)
最終模型的損失函數如下:
J(θ)=-lnpθ(y=k|x)
(4)
元學習支路模型魯棒性強,泛化能力好,且相似性度量的使用強調類內聚集性和類間疏遠性,提升模型的學習效率。
模型遷移在深度學習領域應用較為廣泛,但將其與小樣本學習結合的研究較少,在雷達小樣本學習問題中的性能表現也常被低估。因此,本文引入模型遷移方法作為方案的遷移學習支路解決雷達小樣本目標識別問題。
小樣本遷移學習的流程如圖5所示,源任務的訓練過程與傳統模型遷移方法相同。在目標任務模型訓練過程中,本文采用與元學習相同的數據學習方式,對數據集進行小批量采樣以形成目標任務數據集。目標任務數據集包含少量的支撐集樣本ds和查詢集樣本dt。面對各個目標任務時,模型均通過學習少量的支撐集樣本進行模型微調,創建新的分類器C1(·|Wn)實現查詢集樣本的識別。模型每完成一個目標任務就會對分類模塊重新初始化以避免經驗記憶問題,從而保證模型每次面對的目標任務都是全新的。本文通過多次小批量采樣并不斷初始化的方式反復驗證了模型在目標任務的表現性能。

圖5 小樣本遷移學習Fig.5 Few shot transfer learning
模型通過最小化標準交叉熵分類損失函數完成訓練。函數表達式為
(5)

遷移學習支路通過改進數據學習方式將模型遷移用于小樣本學習問題,不僅提高了模型訓練效率,還能幫助模型實現更好的適應性學習。
為驗證本文所提綜合解決方案的可行性,本節對方案的兩條支路算法元學習和遷移學習進行多組對比試驗,為方案的最優選擇支路提供依據。
本文基于DARPA/AFRL提供的MSTAR數據集完成實驗。該數據集由Sandia國家實驗室使用的X波段合成孔徑雷達(synthetic apeture radar,SAR)傳感器收集。其中包括十類地面軍用車輛,即自行榴彈炮2S1、裝甲偵察車BRDM2、裝甲運輸車BTR60、BTR70(SN_C71)、推土機D7、坦克T62、T72(SN_132)、貨運卡車ZIL131、自行高炮ZSU234、履帶式步兵戰車BMP-2(SN_9563)[9-11]。其中2S1,ZSU234和BTR70涉及15°,17°,30°和45°的4個姿態角。其余目標僅涉及15°和17°姿態角。目標類型及樣本數量等詳細信息如表1所示。其中,第3.3.1節和第3.3.2節實驗均使用數據集中的BTR70(SN_C71),BTR60,D7,T62,ZIL131,BMP2(SN_9563),T72(SN_132)這七類樣本作為源數據,使用2S1,BRDM2和ZSU234作為目標任務數據。

表1 MSTAR數據集Table 1 MSTAR dataset
遷移學習實驗中使用源任務數據集進行模型預訓練,并按照3:1獲取訓練樣本和驗證樣本。訓練時批處理量為15,共訓練200次。目標任務微調過程中的數據學習方式與元學習相同,均采用3way-5shot模式,每次實驗需從數據集中隨機取3類目標,每類20張樣本作為此次任務數據集,該數據集中隨機取5張為支撐集樣本,其余15張為查詢集樣本。元學習的訓練過程需要重復采樣訓練10 000次,遷移學習和元學習的測試過程均需要重復6 000次后取測試結果平均值作為最終的識別結果。
實驗采用Adam優化器,初始學習率為1e-3。
小樣本識別應用通常關注兩個問題:一是指定目標任務時源任務信息量的選取問題;二是源任務與目標任務間的差異性問題。為更高效地完成以識別為目的的雷達成像,需分析小樣本識別算法所關注的顯著性特征。本文針對這3個問題,在第3.3.1節、第3.3.2節和第3.3.3節分別進行探索,設置不同的應用場景,探索模型性能并最終形成了幾條可有效指導雷達小樣本目標識別的工程應用結論,同時為雷達成像提供指導建議。
3.3.1 源任務信息量實驗
本節探索當目標任務確定時,源任務信息量變化對模型性能的影響。本文通過改變源任務樣本類別數體現源任務信息量的變化。共設置5組實驗,每組實驗分別從源數據中隨機選擇3類、4類、5類、6類和7類目標作為源任務數據集樣本。涉及目標均只考慮15°和17°姿態角,訓練樣本和測試樣本數量均為400。
圖6展示了當目標任務類別數為3的情況下,對于元學習來說,當源任務樣本類別由3類增加到5類時,識別率增加了21.4%,在這之后識別率提升幅度變小。峰值出現在源任務類別數為6類時,為95.4%。對于遷移學習來說,平均樣本識別率為82.78%。源任務類別數為4時,識別率達到峰值為83.1%。

圖6 小樣本識別率與源任務類別數變化關系Fig.6 Change relationship between few shot recognition rate and the number of source task categories
從實驗結果可以看出,當目標任務確定時,隨著源任務樣本類別數的增加,元學習性能有較大提升,遷移學習性能受影響很小。首先,因為元學習模型關注不同類別之間的信息,源任務目標類別數的增多會使得模型經驗積累更加豐富最終幫助提高模型識別率。但由于目標任務簡單,源任務信息增加到一定程度后出現信息冗余狀況。其次,對于遷移學習來說,雖然總樣本量增加,但其每類樣本量不變,而樣本類別數的增加導致目標類間差異性變弱,模型的特征提取能力沒有得到增強,因此隨著類別數增加遷移學習沒有得到提升。
由此給出兩點工程應用建議:第一,當源任務樣本類別數缺乏時,采用遷移學習可取得較好結果;第二,當源任務樣本類別數充分時,采用元學習可取得較好的模型識別性能。
3.3.2 樣本差異性實驗
本節探索樣本差異性變化對模型性能的影響,主要從源任務樣本與目標任務樣本間的差異性和目標任務樣本的類內差異性兩個角度考慮。雷達SAR圖像成像過程中,目標外形特征受姿態角影響較大,因此實驗使用姿態角差異性表示樣本差異性,設置了11組對比實驗進行探索。具體實驗設置及實驗結果如表2所示。

表2 樣本差異性實驗數據設置與實驗結果Table 2 Experimental data setting and experimental results of sample difference
針對源任務與目標任務間的差異性影響,從a~d和e~h實驗繪制的折線圖(見圖7)可以看出隨著目標任務樣本與源任務樣本間的差異性不斷增大,元學習和遷移學習識別性能均下降。圖7(a)展示了源任務姿態角為15°時,隨著源任務與目標任務間姿態角差異性增大,元學習識別率由97.3%降到了75.26%,下降了22.04%。而遷移學習識別率由84.9%下降到74.1%,下降了10.8%。二者的差距從12.4%縮小到1.16%。圖7(b)展示了源任務姿態角為15°和17°時,隨著任務差異性的增大,模型性能變化趨勢與圖7(a)相同。當目標任務姿態角達45°且與源任務差異性達到最大時,元學習模型識別率相較于遷移學習低3.2%。

圖7 小樣本識別率與任務差異性關系Fig.7 Relationship between few shot recognition rate and task difference
當任務差異性增大時,元學習和遷移學習性能均有明顯下降。但二者受影響程度不同,元學習的波動幅度更大,遷移學習波動幅度相對較小。因此,隨著源任務與目標任務間差異性增大,元學習的優勢逐漸消失,遷移學習性能優勢凸顯。當任務差異性增大到一定程度后,遷移學習性能將優于元學習性能。這一性能優勢主要得益于微調學習,遷移學習通過對目標任務的適應性學習獲取了良好的識別性能。
在針對目標任務樣本類內差異性實驗中,為避免任務間差異性影響,本文根據e~k的實驗結果分開對比并繪制了圖8。從圖8(a)可以看出,元學習中,姿態角混合后的i識別率為94.7%,而單個姿態角e和f的識別率分別為96.7%和97.7%。姿態角混合后的i識別率低于單個姿態角識別率均值的2.5%。遷移學習中,姿態角混合后的i識別率為81.6%,而單個姿態角e和f的識別率分別為86.2%和86.8%。姿態角混合后識別率較單個姿態角識別率的均值下降了4.9%。圖8(b)和圖8(c)與圖8(a)的整體變化趨勢相同,姿態角混合后的模型性能均差于單個姿態角下的性能。因此,可以得出結論,隨著目標任務樣本類內差異性的增大,遷移學習和元學習識別性能均呈下降趨勢,這說明類內差異性對小樣本學習模型的性能影響較大。


圖8 小樣本識別率與類內差異性關系Fig.8 Relationship between few shot recognition rate and intra class difference
由此本文建議在實際工程應用時,當源任務與目標任務之間差異性小時,應使用元學習解決雷達目標小樣本識別問題,當二者差異較大時應使用遷移學習;當樣本類內差異性大時,現有的遷移學習和元學習方法均無法保證良好的識別性能,應尋求適用于解決類內差異性的模型進行解決。
3.3.3 顯著性特征提取實驗
本節探究小樣本學習模型的顯著性特征提取問題,從而為以目標識別為目的的雷達成像提供建議。對于地面雷達軍事目標,其外在的履帶特征和炮管特征較為顯著。因此,本文根據有無炮管特征和有無履帶特征對MSTAR數據集內的10類目標樣本進行歸類,歸類結果如圖9所示。

圖9 炮管特征和履帶特征歸類結果 Fig.9 Categorization results of barrel characteristics and track characteristics
在實驗探究過程中,根據有無履帶特征和有無炮管特征分別設置源任務和目標任務,并將源任務與目標任務交換形成4組對比試驗。實驗具體設置及結果如表3所示,實驗涉及目標均只考慮15°和17°姿態角情況。對表3的實驗結果分析可知,對于元學習,源任務是否學習炮管特征對目標任務識別率影響較小,僅相差1.4%;但源任務是否學習履帶特征對目標任務識別率影響較大,學習履帶特征的模型性能較未學習履帶特征的模型性能提高了7.9%。對于遷移學習,源任務是否學習炮管特征和履帶特征對目標任務識別率影響均較大,分別相差17.9%和9.6%。

表3 顯著性特征提取實驗數據設置與實驗結果Table 3 Experimental data setting and experimental results of salient feature extraction
而小樣本學習方法為提高模型泛化性能,通常會學習泛化性好的共性特征,結合表3的實驗結果分析可知,元學習模型對履帶特征敏感而對炮管特征不敏感,說明履帶特征為元學習模型關注的共性特征,而模型并未關注炮管特征這種非顯著性特征。因此,在元學習方法下履帶特征是應該被重點關注的顯著性特征。而遷移學習性能受炮管特征和履帶特征的影響均較大,說明遷移學習同時學習了這兩個特征。
所以,本文建議在進行以目標識別為目的的雷達成像時,應該重點關注顯著性特征部位的成像質量。在使用元學習方法進行小樣本目標識別時,其雷達成像過程應該重視車輛履帶部位的成像質量,保證此處的成像效果;而炮管部位的成像質量不必過分關注。如此不僅能夠提高雷達目標成像效率,減少成像成本,還能夠提升模型識別性能。
針對雷達小樣本目標識別問題,本文結合元學習和遷移學習,提出了一套綜合解決方案,使用具有強表示學習能力的殘差網絡作為特征提取模塊,并結合實際需求分成元學習和遷移學習兩條處理分支。該方案能夠依據實際應用場景的不同,提供最恰當的小樣本學習算法,最大限度發揮模型優勢,從而大大提升了雷達小樣本目標識別的效率和準確率。同時,本文通過多組完備實驗挖掘了小樣本學習方法在實際雷達目標識別場景下的模型性能,探索了元學習和遷移學習方法的實際應用條件,進一步驗證了所提方案的有效性和可行性,并獲得5點能夠指導實際工程應用的重要結論:① 元學習性能優越的前提為源任務樣本量充足以及源任務與目標任務之間差異性較小,否則遷移學習性能表現更好;② 當目標任務確定時,源任務信息量(本文主要指源任務樣本類別數)的變化對遷移學習影響較小,但對元學習影響較大,隨著源任務樣本類別數的增加,元學習模型性能大幅提升;③ 源任務與目標任務間差異性的增大將導致元學習和遷移學習模型性能變差,但元學習性能波動更大,而遷移學習模型性能表現更為穩定,這得益于遷移學習的微調學習機制;④ 小樣本學習算法對雷達目標不同外在特征的關注度存在差異,因此以目標識別為目的的雷達成像應重點關注模型需求的顯著性特征。⑤ 元學習和遷移學習的小樣本識別性能均受目標樣本類內差異性影響較大,這是未來工作中需重點考慮的問題,將在下一步工作進行深入分析研究。