吳桐,劉云清,姜淑華
(長春理工大學 電子信息工程學院,長春 130022)
合成孔徑雷達(SAR)是一種以航天飛機、人造衛星等載體為基礎的高分辨率成像雷達,不容易受到光照及天氣情況的影響,具有高穿透力的特點[1]。目前,SAR己廣泛應用于軍事目標偵察[2]、地球科學[3]、環境系統監測[4]等國防和國民經濟領域。然而,隨著SAR成像技術的成熟,SAR系統獲得的數據越來越多,如何從海量的數據中獲取感興趣的目標已成為一個熱點問題。
邵楨等人[5]提出通過將嵌入空間信息的模糊聚類算法與水平集方法相結合來識別海洋溢油污染的SAR圖像。張婷等人[6]提出了一種基于屬性散射中心匹配的魯棒SAR圖像目標識別方法。該方法首先利用稀疏表示方法提取SAR圖像的目標屬性散射中心。然后,利用匈牙利算法建立測試樣本的散點集與模板散點集的一一對應關系,通過評價匹配對的屬性差異和可能出現的虛警和漏警,得到兩組屬性散射中心的相似度。最后,根據最大相似度原理確定測試樣本的SAR圖像的目標類別。楊佐龍等人[7]采用二維線性決策分析方法,在行和列方向同時壓縮圖像矩陣進行特征提取,并結合支持向量機對SAR圖像分類識別。這些方法雖然能很好地識別SAR圖像目標,但是提取SAR圖像特征時往往依賴專業知識和手工設計,且特征設計費時,并且提取的特征往往只對特定識別任務有效,識別模型的泛化能力較差。
卷積神經網絡(CNN)的興起,為SAR圖像識別開辟了新的方向。卷積神經網絡具有從海量數據中自動學習到層次化特征,不需要復雜的手工設計特征的優點,在理論上可以取得較好的SAR圖像識別效果。基于卷積神經網絡,崔福彬等人[8]提出一種基于改進的卷積神經網絡的SAR圖像目標識別算法,使用布斯沃特濾波算法對圖像進行濾波處理,降低相干噪聲,并改進卷積神經網絡結構,引入改進的線性修正單元作為激活函數,使用丟棄法(Dropout)增強網絡的泛化性,訓練時采用自適應矩估計優化器更新模型參數。曲長文等人[9]提出采用分割后的卷積神經網絡進行SAR圖像識別,在多尺度SAR圖像目標識別中取得了較好的準確率。胡紅萍等人[10]提出了一種基于卷積神經網絡與隨機森林的SAR圖像目標識別方法,該方法將卷積神經網絡的softmax分類器替換成隨機森林,在移動與靜止目標搜索識別數據集(MSTAR)上取得了較高的識別精度。
雖然這些改進的神經網絡模型取得了很好的SAR圖像目標識別效果,但是卷積神經網絡有兩個問題亟待解決。一是需要大量的樣本訓練網絡。二是網絡參數的隨機初始化會導致訓練緩慢和過擬合的問題。為了解決這兩個問題,提出了一種基于遷移學習的SAR圖像目標識別方法,該方法通過MSTAR數據集中的三類目標樣本預訓練網絡,然后將訓練的網絡參數應用到數據集中的十類樣本上,通過對網絡應用Dropout技術和組合小卷積核的方法來減少網絡的參數,加快網絡訓練速度和抑制過擬合問題。
遷移學習是以任務A開發模型為出發點,在開發模型B中使用的一種機器學習方法。在遷移學習中,有兩個重要的概念:域(Domain)和任務(Task)。分別表示為:

其中,X是特征空間,X=(X1,X2…,Xn);Y是標簽空間,Y=(Y1,Y2,…,Yn);f(?)是預測函數,可以通過訓練集(xi,yi)得來,xi∈X,yi∈Y。域分為源域Ds和目標域Dt,任務分為源任務Ts和目標任務Tt。遷移學習可以定義為:利用Ds和Ts中已有的知識,幫助Dt改進預測函數f(?)的學習,完成目標任務Tt。其中Ds≠Dt,Ts≠Tt。與傳統的機器學習方法相比,遷移學習有三個優點:第一,不需要訓練數據和測試數據滿足獨立相同分布的條件。第二,不需要大量的樣本訓練就可以得到一個好的模型。第三,不需要對每個任務建模,可以重用前面的模型。
Dropout最初是由 Hinton 提出的[11]。Dropout是指在深度學習網絡的訓練過程中,神經網絡單元以一定概率暫時從網絡中脫落,可以顯著減少過擬合現象。即神經網絡在前向傳播時,某個神經元的激活值會以一定的概率停止工作,這可以增強模型的泛化,因為它不會過于依賴某些局部特征,如圖1所示。

圖1 丟棄法示意圖
Dropout具體執行過程如下:
(1)輸入待訓練神經網絡模型,訓練數據批數設置為n;
(2)通過給定點概率的p刪除網絡中的部分神經元;
(3)第i批數據通過修改后的網絡傳播進行輸入,通過隨機梯度下降方法更新未刪除神經元參數;
(4)恢復被刪除的神經元;
(5)重復(2)-(5),直到n批訓練數據訓練完成;
(6)輸出訓練好參數的神經網絡模型。
在卷積神經網絡中,感受野是指網絡各層輸出的特征圖上的像素點在輸入圖片上的大小。增大感受野特征圖可以獲得更多的信息,通常卷積網絡使用的是5×5的卷積核。為了改進卷積神經網絡結構,提出用兩個3×3的組合小卷積核代替一個5×5的卷積核。下面給出這種方法的可行性證明:
假設:輸入圖片大小為M×M,卷積核大小為K×K,步長為S,填充的像素數為P,進而可以得到卷積輸出的特征圖大小=(M+2×P-K)/S+1。
假設輸入的圖片是28×28,使用5×5的卷積核對其卷積,步長為1,填充為0,得到的結果是:(28-5)/1+1=24。然后使用兩個卷積核為3×3,這里的兩個是指兩層,同樣步長為1,填充為0,第一層3×3得到的結果是:(28-3)/1+1=26,第二層3×3得到的結果是:(26-3)/1+1=24,所以最終結果和5×5的卷積核是一樣的。
而且應用多個3×3的卷基核比一個大尺寸卷積核卷基層有更多的非線性(使用更多的非線性激活函數),使得判決函數更加具有判決性。同時多個組合小卷積核有更少的參數,如采用的兩個組合的3×3的卷基核的參數為18個,一個5×5卷基核的參數為25個,更少的參數,意味著訓練速度更快,同時網絡復雜度降低。
圖2為基于遷移學習的SAR圖像車輛目標識別算法的流程。算法具體步驟如下:

圖2 算法流程
將MSTAR數據集中的三類數據較小的目標數據作為源域訓練樣本,對源域中的三類識別任務進行卷積神經網絡訓練,得到預訓練模型。
構造與預訓練模型結構相同的卷積神經網絡,將十類目標識別作為目標域的目標任務,將源域預訓練獲得的模型參數作為網絡的初始參數遷移到網絡中,采用MSTAR數據集中的十類目標數據作為訓練樣本對網絡進行微調:
①前饋網絡
a.通過目標域網絡的卷積層提取出十類SAR圖像車輛目標的信息,對每個卷積層應用Dropout技術;
b.通過池化層對卷積神經網絡提取的特征信息進行降維,減少計算量;
c.通過卷積層代替全連接層將得到的特征圖數據輸出,利用Softmax分類器,對提取到的結果進行識別。
②誤差反向傳播
利用交叉熵損失函數計算梯度,調整網絡的權值和偏置,直到網絡收斂。
為了驗證提出的SAR圖像車輛目標識別方法的有效性,采用MSTAR數據集進行實驗。MSTAR數據集為高分辨率聚束合成孔徑雷達采集的靜止車輛SAR剖面圖像,包括多類型SAR圖像的車輛目標數據。
本文進行實驗的計算機配置:處理器為英特爾 Xeon E5-2620v3,主頻 2.4 GHz;顯卡為 NVID?IAGeForceGTX1070,顯存為 8 GB;操作系統為Ubuntu 16.05;編程環境為 OpenCV3.1.1,cuda8.0;深度學習框架為caffe;編程語言為python。
設計采用兩個組合的3×3小卷積核代替一個5×5的大卷積核。構造的網絡有5個卷積層和4個池化層,卷積層可以提取輸入SAR圖像的特征,采用多個卷積層,可以使提取特征更加充分,而且網絡具有更強的非線性表達能力,每個卷積層后的池化層可以降低網絡的參數,減少過擬合。其中最后一個卷積層代替了傳統的全連接層,進一步減少了網絡的參數,第三個卷積層選擇的是2×2的卷積核是為了調節特征圖尺寸。網絡的輸入為進行數據歸一化后的128×128的SAR圖像車輛目標,由于SAR圖像為灰度圖像,所以通道數為1。最后網絡的輸出為一個N維的向量,N為識別目標的類別數。設計的卷積神經網絡結構如表1所示。

表1 設計的卷積神經網絡結構
源域預訓練模型的訓練樣本采用MSTAR數據集中數量較少的三類目標。三類目標數據如表2所示,訓練樣本為方位角17°下的坦克、步兵戰車和運輸車的數據。在三類目標預訓練中,卷積神經網絡結構的N=3。

表2 三類目標訓練樣本數據分布
針對源域的源任務,即三類SAR車輛目標的識別,預訓練神經網絡選擇小批量隨機梯度下降法訓練網絡,小批量處理的數據的批量大小設置為25,學習率設置為0.001。將10 000次訓練迭代的網絡參數保存為預訓練模型。
為了實現網絡信息從源域到目標域的遷移,目標域采用與源域相同的網絡結構,如表1所示。設置卷積神經網絡輸出的N=10,通過對源域預訓練模型進行訓練后的參數進行遷移,得到網絡的初始參數。目標域采用MSTAR數據集中的十類目標作為數據樣本。十類目標數據包括坦克、裝甲坦克、運輸車、裝甲運輸車、步兵戰車、裝甲偵察車、推土機、自行榴彈炮、貨運卡車、自行高炮。訓練樣本為方位角17°的十類目標數據,測試樣本為方位角為15°的十類目標數據。目標域的十類SAR圖像車輛目標數據分布如表3所示。

表3 十類目標訓練樣本數據分布
對目標域的識別任務,選擇小批量梯度隨機下降算法訓練網絡,其中批量大小設置為30,學習率設置為0.001,迭代次數設置為10 000次,每迭代1 000次進行一次統計。
因為提出的基于遷移學習的SAR圖像車輛目標識別方法的卷積神經網絡的初始參數是從預訓練網絡遷移過來的,所以選用卷積神經網絡參數隨機初始化的SAR圖像識別模型進行對比。同時,為了驗證預訓練網絡的樣本對目標域訓練的影響,對源域的訓練樣本選取MSTAR數據集的五類目標訓練的SAR圖像識別模型進行對比。不同方法得到的十類合成孔徑雷達圖像車輛目標識別正確率如表4所示。

表4 十類合成孔徑雷達圖像車輛目標識別正確率
SAR圖像車輛目標識別過程中訓練誤差如圖3所示,測試正確率變化如圖4所示。

圖3 訓練誤差對比

圖4 測試正確率對比
結合表4、圖3和圖4可以得出,首先用三類目標做預訓練網絡的遷移學習的SAR圖像車輛目標的識別效果優于隨機初始化網絡參數的方法,而且相比選用五類SAR圖像車輛目標的預訓練網絡,也具有微弱優勢。這是因為,選用三類目標做源域的訓練樣本,相比五類目標得到的網絡參數,輸入到目標域后,更加具有靈活性。可以用極端情況做出解釋:假設選用的是十類目標做源域的預訓練樣本,將訓練的參數輸入到目標域進行十類目標的訓練,那么此時的遷移學習是沒有意義的,即和隨機初始化網絡參數的識別模型是沒有區別的。所以也可以得出,遷移學習源域選擇的數據不宜和目標域的數據高度相似。
針對SAR圖像車輛目標的識別,提出了一種基于遷移學習的方法。該方法采用MSTAR數據集中三類車輛目標數據作為源域的訓練樣本,十類目標數據做目標域的訓練樣本,對目標域的神經網絡參數進行微調。通過這種遷移方式,在目標域的十類目標上取得了98.39%的識別精度,同時相比隨機初始化網絡參數的SAR識別卷積神經網絡模型,在收斂速度上也有了一定的提高。由于提出的SAR識別方法的源域樣本是從MSTAR數據集中提取的一小部分,因此提出的方法不適用于小規模數據集的識別。下一步的研究方向可以在小規模數據集上進行,進一步研究卷積神經網絡的過擬合和泛化問題。