劉 飛, 高紅艷, 衛澤剛, 劉亞軍, 錢 郁
(1. 寶雞文理學院 物理與光電技術學院,陜西 寶雞 721013;2. 寶雞文理學院 寶雞先進鈦合金與功能涂層協同創新研發中心,陜西 寶雞 721013)
通過對合成孔徑雷達(Synthetic Aperture Radar,SAR)獲得的高分辨率圖像進行處理,可實現對聚焦區域或感興趣目標的分析解譯。SAR目標識別技術可用于偵察以及情報解譯[1-2]。自20世紀90年代以來,隨著模式識別、人工智能技術的發展,SAR目標識別方法不斷豐富,取得了長足的進步。主流SAR目標識別方法通常運用特征提取和分類階段的兩級流程實現未知樣本的類別確認。SAR圖像典型目標特征包括幾何形狀、投影變換以及電磁散射等類別。以目標輪廓、區域、陰影等為代表性的形狀特征,具備區分不同類別的能力[3-6]。投影變換算法包括數學投影和變換域分解等,前者包括矩陣分解、流形學習等[7-9],后者包括小波、單演信號、模態分解等[10-12]。電磁散射特征體現目標的后向散射特性,如峰值、散射中心、極化方式等[13-14]。分類決策階段與特征提取緊密耦合,利用特征的差異性判定輸入樣本的所屬類別。近鄰分類器(最近鄰、多近鄰等)[15]、支持向量機(Support Vector Machine,SVM)[16]、稀疏表示分類(Sparse Representation based Classification,SRC)[17]是現有SAR目標識別方法運用最為廣泛的分類器。隨著近年來深度學習技術的迅猛發展,以卷積神經網絡(Convolutional Neural Network,CNN)[18-20]為代表的深度學習模型已成為SAR目標識別中的主流算法。
本文在現有研究的基礎上提出了結合深度學習模型和傳統分類機制的SAR目標識別方法。在特征學習階段采用深度殘差網絡(Deep Residual Networks,Res-Net)[21-22]進行目標多層次的特征圖學習。相比傳統的手工設計特征,基于Res-Net訓練得到的特征圖具有描述能力更強的優勢,可為決策階段提供更充分的鑒別力信息。考慮到SAR目標識別中廣泛存在擴展操作條件(Extended Operating Condition,EOC),即測試樣本與訓練樣本存在較大的差異,待識別樣本經過Res-Net獲得的多層次特征圖中可能存在若干無效成分。剔除這些無效成分有利于提高識別算法的整體效率和精度。為此,本文采用結構相似性準則計算各個特征圖與原始樣本的相關性[23],并通過門限法提出低相似度的部分。對于判決保留的特征圖,基于聯合稀疏表示模型[11-12]進行表征分類。在實驗中,基于MSTAR數據集設置標準操作條件(Standard Operating Condition,SOC)和擴展操作條件對方法進行測試驗證,結果證實了其有效性和穩健性。
Res-Net由Kaiming He提出并在多項圖像檢測、分割等大賽中得到了充分驗證[21-22]。隨著網絡層數的不斷增加,其學習得到的特征愈加豐富,更能反映圖像中感興趣目標的多方面特性,但同時也會導致嚴重的梯度消失問題。為此,Res-Net提出殘差學習克服網絡優化困難的問題。假設H(x)表示最佳映射,利用堆疊的非線性層獲得新的映射F(x)=H(x)-x,進而獲得當前最佳映射F(x)=H(x)+x。F(x)+x可在前饋網絡增加“快捷連接”操作獲得。該操作具有高效穩健的優勢,不會帶來額外的運算復雜度。
現有研究成果已經驗證了Res-Net在圖像處理(如目標檢測、識別)領域的有效性。為此,本文將其引入SAR目標識別,主要用于多層次深度特征的學習和獲取。圖1顯示了本文應用于SAR圖像特征學習的Res-Net結構,共包含20層。相比一般卷積神經網絡,Res-Net可實現輸入與后續非相鄰層的直接連接,從而最大程度減少信息丟失以及損耗等問題。Res-Net簡化了網絡學習的難度并提高了整體訓練效率。基于圖1可學習獲得SAR圖像多層次的特征圖。這些深度特征可從不同側面反映圖像中目標的各類特性,可為目標識別提供有效的鑒別力信息。

圖1 Res-Net結構示意圖Fig.1 Architecture of designed Res-Net
基于Res-Net學習的SAR圖像多層次特征圖能夠從不同方面反映目標的特性。然而,SAR目標識別中存在多種擴展操作條件,當測試樣本與訓練集差異較大時,其學習的深度特征可能存在若干無效成分。為此,本文基于結構相似性進行有效深度特征的篩選,并用于后續的分類決策[23]。
記參考圖像和輸入圖像分別為I1和I2,并具有相同尺寸。結構相似性指數(SSIM)從亮度、對比度、結構3個方面評價兩幅圖像的相關性[23],定義如下:
SSIM(I1,I2)=l(I1,I2)·c(I1,I2)·s(I1,I2),
(1)
式中,l(I1,I2),c(I1,I2),s(I1,I2)分別對應亮度、對比度以及結構比較函數,定義如下:
(2)
(3)
(4)
式中,(μ1,σ1)、(μ2,σ2)分別為I1和I2均值和方差;σ12代表兩者之間的協方差;C1、C2和C3均為大于零的常數。
本文基于結構相似性進行Res-Net深度特征的篩選。分別計算各個層次的特征圖與輸入圖像的結構相似性指數。對于相似性較高,認為其能夠保持原始圖像的特性,予以保留并用于后續的分類;反之,則剔除。本文設置相似性門限T,對于結構相似性大于門限的予以保留。
聯合稀疏表示模型是傳統SRC分類器的拓展延伸,具備同時處理多個稀疏表示問題的能力。假設經過結構相似性準則篩選得到K個深度特征矢量,記為[y(1)y(2)…y(K)],采用稀疏表示對它們進行表征的基礎模型如下:
y(k)=A(k)α(k)+ε(k)(k=1,2,…,K),
(5)
式中,A(k)為對應k深度特征的全局字典,通過對所有訓練樣本的處理獲得;α(k)為系數矢量。
聯合稀疏表示框架下,采用式(6)對K個稀疏表示問題進行統一考察:
(6)
式中,β=[α(1)α(2)…α(K)]。
不足的是,式(6)的優化過程并沒有體現同一SAR圖像不同層次深度特征之間的關聯,影響系數矢量的求解精度,經典的聯合稀疏表示模型調整優化目標函數如下:
(7)
在l1/l2范數的約束下,式(7)中的矩陣β各列中的系數矢量傾向相同的分布規律,體現不同深度特征的內在關聯。針對上述問題,較為成熟的求解算法包括多任務貝葉斯壓縮感知、同時正交匹配追蹤等。根據求解結果,按照式(10)計算不同訓練類別對測試樣本(相應的深度特征矢量)的重構誤差并判定其類別。
(8)

根據前文論述,構設如圖2所示的方法流程,描述本文方法的主要步驟。首先,采用所有訓練樣本對圖1所示的Res-Net進行訓練,獲得可用于特征學習的模型。對于測試樣本,將其輸入訓練后的Res-Net獲得多層次深度特征,進而根據結構相似性準則選取若干高鑒別力深度特征(結構相似性門限T設置為0.6)。此時,對訓練樣本的深度特征進行對應成分選取并分別構建全局字典。最終,在聯合稀疏表示模型的處理下,獲得各個訓練樣本對于測試樣本的重構誤差,進而獲得目標類別。

圖2 基于結構相似性的深度特征篩選及SAR目標識別流程圖Fig.2 Flowchart of SAR target recognition based on selected deep features by structural similarity
實驗中以MSTAR公開數據集為基礎,構設典型測試場景對所提方法進行測試。該數據集包含外形尺寸相近的10類目標(圖3)不同條件下獲取的數千幅SAR圖像。據此,可設置訓練和測試樣本開展訓練和分類。表1給出了基于MSTAR數據集設置的一種代表性測試場景,常視為標準操作條件。其中囊括了全部10類目標,訓練樣本俯仰角為17°,訓練樣本俯仰角為15°。除此之外,還可設置擴展操作條件對方法的穩健性進行考察,包括后續實驗中的俯仰角差異(測試場景2)和噪聲干擾(測試場景3)。
實驗過程中,選用當前文獻中較為常見的幾類方法進行比較,包括SVM[16]、SRC[17]、A-ConvNet[18]以及Res-Net(直接用于分類,不經過特征選取和聯合表征)。這幾類方法主要是采用了不同的分類機制,其中A-ConvNet和Res-Net采用CNN作為基礎分類器,但在網絡結構上有所區別。與Res-Net方法比較,本文主要是在特征學習之后進行了篩選,并利用聯合稀疏表示進行最終分類。為定量對比不同方法的性能,本文定義平均識別率如下:
(9)
式中,Nc和Nt分別表示正確分類以及全部測試樣本數目。


圖3 MSTAR目標示意圖Fig.3 Illustration of MSTAR targets

表1 場景1~10類目標標準操作條件Tab.1 Scenario 1 ~ 10 targets under SOC
基于表1中的測試和訓練樣本對所提方法在標準操作條件下進行測試。圖4顯示了所提方法對10類目標的混淆矩陣,其中縱坐標為樣本的實際類別,其與橫坐標對應類別的元素對應分類精度。因此,圖4中的對角線元素反映了不同類別的正確識別率,按照式(9)計算得到10類目標的平均識別率為99.02%,表明了方法的有效性。表2為所有方法在當前場景下的結果統計。4類對比方法的平均識別率依次為98.16%(SVM)、98.32%(SRC)、98.78%(A-ConvNet)和98.80%(Res-Net),均低于所提方法。特別地,與兩類基于CNN的方法相比,本文通過有效選取Res-Net多層次深度特征并利用聯合稀疏表示進行分類,進一步提升了最終性能。表2同時對比了各類方法的時間消耗。SVM和SRC由于分類器相對簡單,其效率處于優勢水平。與直接運用Res-Net的方法相比,本文由于進一步引入了深度特征構造和聯合稀疏表示,增加了時間消耗。

圖4 場景1下所提方法對各類別識別結果Fig.4 Recognition results of each class by the proposed method under scenario 1

表2 場景1下結果統計Tab.2 Results under scenario 1
在測試場景1時,設置的測試與訓練集俯仰角十分接近。實際過程中,SAR傳感器可能工作在不同的高度,這導致待識別樣本可能來自于訓練樣本差異較大的俯仰角。基于MSTAR數據集的SAR圖像樣本,本實驗設置如表3所示的測試場景,包含3類目標。其中,訓練樣本均為17°俯仰角下的SAR圖像;測試樣本區分30°和45°兩個子集。圖5統計了各類方法對兩個子集樣本的平均識別率。對比而言,在45°俯仰角時,因測試樣本與訓練樣本差異過大,導致各性能顯著降低。分別比較兩個角度下的結果,可驗證所提方法的識別最高,穩健性最強。本文采用結構相似性選擇有效選取了對于適宜當前測試條件的深度特征,通過聯合稀疏表示得到的識別結果更為可靠,對于俯仰角差異的穩健性更強。

表3 場景2—俯仰角差異Tab.3 Scenario 2 — depression angle variance

圖5 場景2下的結果統計Fig.5 Results under scenario 2
雷達成像過程中,可能受到自然或人為的干擾,導致最終獲得的圖像信噪比(Signal-to-Noise Ratio,SNR)降低。此時,正確識別目標類別的難度大大加劇。MSTAR數據集中原始SAR圖像均來自合作測試條件,信噪比相對較高,且保持在相近水平。為測試所提方法對于噪聲干擾的有效性,本實驗對表1中的測試樣本按照文獻[13]的策略條件不同程度的噪聲,進而測試方法在不同信噪比下的平均識別率,并將此條件記為“測試場景3”。如圖6所示,所提方法在-10,-5,0,5,10共5個噪聲水平下均保持最高的識別率,顯示其噪聲穩健性。與SVM、A-ConvNet和Res-Net方法相比,SRC方法在低于0 dB的噪聲水平時性能更優,表明稀疏表示機制對于噪聲為適應性。本文通過有效的特征篩選并結合聯合稀疏表示對于噪聲干擾的適應性進一步提升了方法的整體性能。

圖6 場景3下的結果統計Fig.6 Results under scenario 3
本文基于Res-Net和聯合稀疏表示設計SAR圖像目標識別方法。對于測試樣本,采用Res-Net選取其多層次深度特征,并基于結構相似性準則選取其中的高鑒別力成分。通過聯合稀疏表示進行表征及分類。實驗在MSTAR數據集上設置并開展,綜合分析識別效率、識別精度和識別穩健性,結果證明了所提方法的有效性。后續研究中,本文將從Res-Net的結構優化以及深度特征的選取策略方面進一步深化成果。