耿杰 范劍超, 初佳蘭 王洪玉
基于深度協同稀疏編碼網絡的海洋浮筏SAR圖像目標識別
耿杰1范劍超1,2初佳蘭2王洪玉1
浮筏養殖廣泛存在于我國近海海域,可見光遙感圖像無法完全準確地獲取養殖目標,而基于主動成像的合成孔徑雷達(Synthetic aperture radar,SAR)遙感圖像能夠得到養殖目標,因此采用SAR圖像進行海洋浮筏養殖目標識別.然而,海洋遙感SAR圖像包含大量相干斑噪聲,并且SAR圖像特征單一,使得目標識別難度較大.為解決這些問題,提出一種深度協同稀疏編碼網絡(Deep collaborative sparse coding network,DCSCN)進行海洋浮筏識別.本文方法對預處理后的圖像先提取紋理特征和輪廓特征,再進行超像素分割并將同一個超像素塊特征組輸入該網絡進行協同表示,最后得到有效特征并分類識別.通過人工SAR圖像和北戴河海域浮筏養殖SAR圖像的實驗驗證所提模型的有效性.該網絡不僅具有優異的特征表示能力,能夠獲得更適合分類器的特征,而且通過近鄰協同約束,有效抑制相干斑噪聲影響,所以提高了SAR圖像目標識別精度.
合成孔徑雷達,深度學習,稀疏自動編碼器,浮筏養殖,目標識別
引用格式耿杰,范劍超,初佳蘭,王洪玉.基于深度協同稀疏編碼網絡的海洋浮筏SAR圖像目標識別.自動化學報,2016,42(4):593?604
合成孔徑雷達(Synthetic aperture radar,SAR)是一種主動成像傳感器,具有全天候、全天時、高分辨率的數據獲取能力[1?2].SAR圖像目標識別是SAR圖像解譯的重要內容,在軍事偵察、資源探測、地理測繪、海域監測等領域有著廣泛的應用.隨著SAR成像技術的發展,分辨率的不斷提高,SAR圖像目標識別成為海量SAR數據處理的主要手段.典型的SAR圖像目標識別模型分為檢測(Detection)、鑒別(Discrimination)和分類(Classification)三個階段[2].海洋浮筏養殖是海域監測的重要組成部分,自動識別浮筏信息對實現大面積海域動態使用監測有著重要意義[3?4].由于海洋散射信號較弱,光譜成像衛星數據難以獲取浮筏信息,而SAR是主動式微波成像,利于獲取浮筏信息,在海域監測中具有明顯優勢[5].因此,利用SAR圖像進行海洋浮筏養殖自動識別,不僅可以大范圍、宏觀調查海域使用情況,而且為海洋遙感業務化動態監測提供了有力手段.但是,由于海洋周期性波浪的影響,后向散射系數相干疊加使得成像存在嚴重的相干斑噪聲;同時由于海洋每個區域的流、浪、涌、內波都不一樣,導致后向散射特性非常不規律,同一目標在不同海域特征存在明顯差異[6].這些問題增加了海洋SAR圖像目標識別難度,有效的特征表示是解決問題的關鍵.
在SAR圖像目標識別問題中,紋理特征被廣泛用于SAR圖像的特征提取.紋理特征是圖像灰度或色彩在空間上的重復或者變化的特征,提取紋理特征的方法可以分為三類:基于統計的方法、基于模型的方法和基于變換域的方法[7].在基于統計的方法中,灰度共生矩陣(Gray-level co-occurrence matrix,GLCM)統計圖像上保持某距離的兩個像素的灰度狀況,主要包括均值、方差、對比度、熵、自相關等元素.在基于模型的方法中,馬爾科夫隨機場模型是最常用的分析模型.在基于變換域的方法中,小波變換得到變換域各個方向的系數能反映目標的后向散射特性.
為了更加有效地分析理解圖像,多尺度幾何分析(Multi-scale geometric analysis,MGA)方法陸續被提出,它是一種多方向、多尺度和局部性的圖像稀疏表示方法,被稱為后小波分析.由于小波分析的方向受限、頻率分辨率低,而MGA可以利用圖像的幾何正則性,能夠保持豐富的細節信息.目前常用的MGA方法有Gabor變換、曲波變換、輪廓波變換、剪切波變換等.Gabor變換是具有高斯函數的傅里葉變換,二維Gabor函數相當于一個高斯函數調制的復正弦函數,可以提取圖像不同空間位置、空間頻率的局部結構信息[8].由于二維Gabor變換在表征圖像紋理變化方面的優勢,已經被普遍用于人臉識別等模式識別問題中.為了更好地逼近圖像的輪廓信息,Do等提出了輪廓波變換[9],通過多尺度分解和方向分解,可以有效地表示圖像輪廓.然而,對圖像輪廓波變換時,要進行降采樣和上采樣,這樣就不具備平移不變性,而平移不變性在邊緣保持、目標檢測等方面起著重要作用.為了解決這一問題,Da Cunha等提出一種非下采樣輪廓波變換(Nonsubsampled contourlet transform,NSCT)[10],具有平移不變性,可以很好地保持圖像的細節和邊緣信息.當前,NSCT已經被廣泛用于圖像融合問題中[11].考慮到二維Gabor變換和NSCT在圖像特征表示方面的優勢,本研究利用這兩種方法分別提取SAR圖像的紋理特征和輪廓特征.
在目標識別問題中,有效的特征表示對于識別準確度起著關鍵作用.但是在許多研究中,特征提取和表示都需要大量的經驗知識和人為地參數設置,這個過程比較復雜而且效率較低,尤其是當圖像分辨率較高、尺寸較大時,更增加了特征表示的難度.近年來,深度學習神經網絡被用于特征自主學習和表示,在智能識別任務中表現出極其優異的性能[12?15].深度學習網絡具有類似于人腦感知視覺的層次化結構,不過分依賴研究人員的經驗知識,能逐層抽象學習數據的特征,從而發現數據的內在結構信息并改善分類識別的效果.研究表明,深度網絡可以很好的挖掘圖像的低層特征(如邊界)和中層特征(如形狀),在圖像去噪、圖像分類識別等問題中取得較好的效果.在分類識別問題中,利用深度網絡得到的特征表示,不同類別的區分度更大,更適合于監督分類.常用的深度網絡結構有深度置信網絡(Deep belief networks,DBN)[12]、卷積神經網絡(Convolutional neural networks,CNN)[16]和堆疊自動編碼器(Stacked auto-encoders,SAE)[17].
本文提出一種深度協同稀疏編碼網絡(Deep collaborative sparse coding network,DCSCN)來進行SAR圖像目標識別,并用在海洋浮筏養殖監測任務中.為了從SAR圖像獲得更優異的特征,提高目標與背景特征差異性,DCSCN利用了自動編碼器在特征表示中的優勢,獲得更適合于分類器的特征.為了克服海洋SAR圖像嚴重的相干斑噪聲,對超像素分割的近鄰像素特征利用DCSCN進行協同表示,使得同個超像素塊特征更相近并平滑掉相干斑噪聲,減小噪聲對目標識別的影響.
傳統的神經網絡都是隨機初始化模型的參數,然后通過反向傳播來優化參數.然而深度網絡如果利用這種方式,很容易陷入局部極值或者造成梯度彌散,使得網絡參數無法最優.為了解決這一問題,提出了逐層學習參數的預訓練,再對預訓練后的模型進行反向傳播來優化參數的方法[18].常用的預訓練單元有限制玻爾茲曼機(Restricted Boltzmann machine,RBM)和自動編碼器(Auto-encoders),多層預訓練單元堆疊起來構成深度網絡.
1.1自動編碼器
一個自動編碼器由輸入層、隱含層和輸出層構成,訓練學習的目標是使得網絡的輸出盡量逼近輸入[19].自動編碼器訓練過程由編碼過程和解碼過程組成,編碼過程將輸入樣本進行線性映射和非線性映射變換得到隱含層表示.設樣本集為輸入樣本對應的隱含層表示為



訓練好一層自動編碼器后,將其隱含層的激活值作為下一層自動編碼器的輸入.這樣將多層自動編碼器堆疊起來構成了堆疊自動編碼器.
1.2堆疊自動編碼器
堆疊自動編碼器是一種典型的深度神經網絡,被廣泛用于特征學習與表示.該網絡先逐層貪婪學習來確定參數,再從最頂層反向傳播來微調(Finetune)整個網絡的參數.如果最頂層不加入標簽信息,則這個學習過程為無監督的特征學習過程;如果最頂層加入樣本的標簽信息來反向微調整個網絡的參數,則這個學習過程是監督學習過程.圖1給出了堆疊自動編碼器結構圖.

圖1 堆疊自動編碼器結構圖Fig.1 The structure of SAE
由圖1所示,該堆疊自動編碼器共M層,最高層自動編碼器的隱含層就是網絡的輸出.通常在堆疊自動編碼器后連接Softmax分類器進行分類識別.在有監督學習網絡中,樣本的標簽也是在Softmax分類器加入的,整個網絡的參數通過后向傳播來整體調整.網絡整體參數微調的目標函數為

2.1預處理
衛星拍攝的SAR圖像需要先進行幾何校正,來解決由于傳感器以及地球自轉等因素造成的圖像相對于地面目標發生的幾何畸變.由于原始的SAR圖像對比度較差,需采用灰度拉伸來提高圖像灰度級的動態范圍.為了增大目標與背景間的對比度,利用非線性函數對圖像進行灰度拉伸處理.為了抑制相干斑噪聲對目標識別的影響,采用增強Lee濾波算法進行去噪.
2.2紋理特征提取
二維Gabor濾波器可以提取圖像多尺度、多方向的紋理特征.二維Gabor變換是具有高斯函數形式的傅氏變換,由一個高斯函數乘以正弦函數,正弦函數的頻率決定特征的尺度,相位決定特征的方向,具體公式如下[20]

其中,x0=xcosθ+y sinθ,y0=?xsinθ+y cosθ,x和y代表像素點的位置,ω0表示濾波器的中心頻率,θ表示濾波器的方向,σ表示高斯函數的標準差. exp(jω0x0)代表交流分量,代表直流分量.當直流分量趨于0時,Gabor濾波器對光照強度不敏感.θ和σ不同取值得到一組濾波器,將濾波器組與圖像進行卷積得到與圖像相同大小的分解圖像,這些圖像代表紋理特征.
2.3輪廓特征提取
非下采樣輪廓波變換(NSCT)[10]可以將圖像分解為不同頻率和不同方向的子帶圖像,各個子帶圖像表示了圖像在各個頻率和各個方向上的系數,可以看作原圖的一張特征圖,即輪廓特征圖.NSCT交替利用非下采樣的塔型濾波器組和非下采樣的方向濾波器組,來得到多方向、多尺度的二維分解圖像.圖2給出了具體分解的過程.

圖2 非下采樣輪廓波變換Fig.2 Nonsubsampled contourlet transform
如圖2所示,NSCT先利用非下采樣的塔型濾波器組將圖像分解為低通、帶通和高通子帶圖像,然后利用非下采樣方向濾波器組對子帶圖像進行方向濾波,得到各個頻域方向的子帶圖像.具體過程如下:NSCT的非下采樣塔型濾波器由多個雙通道非下采樣濾波器級聯構成.設定分解的尺度為j,則在尺度j上的理想低通濾波器包含的區域為理想高通濾波器H1(z)包含的區域為由于每次分解中都只對上次分解結果進行上采樣,而不使用下采樣,所以保證算法的平移不變性.經過k級非下采樣塔型濾波,可以得到k+1個與原圖像相同尺寸大小的子帶圖像.NSCT所采用的方向濾波器組也是一組二通道非下采樣濾波器,其理想頻域區域是扇形形狀,對扇形濾波器采用不同的采樣矩陣進行上采樣,再對上一級方向分解的子帶進行濾波,得到頻域的方向分解.當方向濾波器組數目較多時,得到的子帶圖像代表各個方向的分解圖像,具有優異的輪廓和邊界保持效果.如果對某尺度下子帶圖像做t級方向分解,可以獲得2t個與原圖像相同尺寸大小的方向子帶圖像.因此,圖像經過K級NSCT后可得到個與原圖像尺寸大小相同的子帶圖像,其中tk是尺度k下的方向分解級數[21?22].綜上描述,NSCT分解得到的子帶圖像具有平移不變性、良好的輪廓和邊界保持效果,這些子帶圖像可以用來作為目標識別的特征圖.
海洋SAR圖像存在嚴重的相干斑噪聲,使得圖像像素的灰度值不完全反映地物的后向散射特性,基于單個像素特征進行分類識別往往達不到很好的效果.考慮到圖像的統計特性,近鄰像素點的特性比較接近,可以聯合起來進行協同表示.為了增加不同類別特征的差異性,并且抑制相干斑噪聲的影響,本研究提出一個深度協同稀疏編碼網絡(DCSCN),采用超像素分割的方法將圖像進行分割,然后對每個超像素塊內像素點對應的特征聯合優化,使得同個超像素塊的像素特征更趨于相似并平滑掉相干斑噪聲.為了獲得更豐富的特征,在DCSCN網絡前先進行預處理,再通過二維Gabor變換和NSCT來提取紋理特征和輪廓特征.圖3給出了整個算法的流程圖.

圖3 基于深層協同稀疏編碼網絡算法流程圖Fig.3 The flow chart of the proposed algorithm
如圖3所示,本文算法先對輸入SAR圖像進行幾何校正、灰度拉伸和增強Lee濾波去噪的預處理過程,再利用二維Gabor濾波器和NSCT濾波器提取圖像的特征,并進行超像素分割,然后將各個超像素塊特征組輸入DCSCN網絡進行特征優化和分類識別,最后輸出識別結果.
本研究中使用了一種基于幾何流的水平集方法(TurborPixels)[23],將SAR圖像分割成M 個超像素塊{S1,S2,···,SM}.把每個超像素塊特征組輸入到DCSCN網絡進行協同表示和分類識別.下面詳細描述了DCSCN網絡結構和網絡訓練過程.
3.1DCSCN網絡結構
根據第1節描述,堆疊自動編碼器可以學習到圖像更高層次的特征,使得不同類別樣本特征區分度增大.為了讓隱含層單元激勵的平均輸出較小,對每個自動編碼器進行稀疏約束,可以避免參數取值過大,防止過學習.稀疏自動編碼器的目標是使得解碼輸出盡量接近輸入,本文為了有效抑制相干斑噪聲,希望各個像素特征通過編碼器的解碼輸出與其相應的超像素塊特征組的平均特征接近,提出了協同稀疏編碼器來對每個超像素塊的特征組聯合訓練學習.將多個協同稀疏編碼器堆疊起來構成了深度協同稀疏編碼網絡(DCSCN),圖4給出了網絡結構圖.圖中網絡共包含L層,第1層到第L?1層網絡為協同稀疏編碼器,第L層網絡為Softmax分類器.為了進行協同表示,各層協同稀疏編碼器的輸入對輸出進行約束,即每個特征的輸出都要與輸入的這組特征的平均值盡量接近.因此,在前向逐層訓練過程中,每層參數都是將特征組的特征依次輸入網絡后確定的.完成逐層貪心訓練后,整個網絡的參數通過后向反饋整體微調.

圖4 深度協同稀疏編碼網絡結構圖Fig.4 The structure of deep collaborative sparse coding network
3.2DCSCN網絡訓練
DCSCN網絡需要先確定各層參數,然后再進行分類識別.網絡各層參數的優化分為預訓練(Pretraining)和整體微調(Fine-tune)兩個過程.預訓練是逐層優化各層網絡的參數.整體微調是從頂層引入標簽信息來優化整個網絡參數,可以使得網絡輸出的特征更適合于分類器.
3.2.1DCSCN網絡預訓練
預訓練過程是將訓練樣本的特征輸入到網絡,逐層訓練得到各層網絡的參數.對于第k層網絡,參數優化的目標函數為


其中,ρ是稀疏性參數.ρ?j表示第j個隱含單元在所有超像素塊特征組編碼后的平均激勵值,其中可知,j的大小由網絡權重和偏置決定[24].ρ是人為設定的接近0的數值,目的是讓j的值接近0,這樣隱含層的輸出值接近0,使得隱含層具有稀疏性.目標方程(6)利用此約束項求解網絡權重和偏置,目的是使得網絡的隱含層輸出具有稀疏性.
根據網絡的目標函數,通過梯度下降法來確定網絡的參數.對于第k層協同稀疏編碼器,設定


根據以上分析,下面給出了利用梯度下降法求第k層網絡參數的具體過程:

3.2.2DCSCN網絡整體微調
通過預訓練逐層學習各層參數,再從頂層加入訓練樣本標簽信息來優化整個網絡參數,可以使得網絡輸出的特征更適合于分類器,即不同類別的樣本特征差異更大.整體微調網絡參數采用了誤差反向傳播梯度下降算法,設網絡層數為L,則目標函數表示如下

步驟1.設權重系數的修改量為?WWW,考慮到學習速率η,有

同理,可得偏置系數的修改量


3.2.3分類識別
訓練好整個網絡的參數后,最后一層Softmax分類器可以用來對樣本進行識別.如果樣本是目標,則對應的標簽為+1;如果樣本不是目標,則對應的標簽為?1.樣本是否為目標的概率計算如下


本文采用人工合成SAR圖像和真實SAR圖像-北戴河海域Radarsat-2數據進行實驗.本文與其他幾種常用的識別方法進行比較,分別是支持向量機(Support vector machine,SVM)[25]、聯合稀疏表示分類算法(Simultaneous orthogonal matching pursuit,SOMP)[26]、未做改進的堆疊自動編碼器(SAE)[24]和稀疏編碼-池化分類算法(Lasso-Pooling)[27].Lasso-Pooling算法,先采用Lasso算法對每個像素點稀疏編碼得到稀疏向量,然后對超像素分割后同一像素塊的各個像素點稀疏向量采用最大值池化(Max pooling)得到一個稀疏向量,最后利用聯合稀疏表示分類器進行分類.為了比較各個算法的識別效果,采用總分類精度(Overall accuracy,OA)和Kappa系數(Kappa coefficient,κ)作為識別精度的評價指標.總分類精度反映了整體圖像識別的誤差性,計算公式如下

Kappa系數反映了樣本的識別結果與真實標記類型相一致的概率,計算公式如下

其中,M表示誤差混淆矩陣(Confusion matrix),是一個C×C的矩陣,C是類別數量,Mji表示類別j被誤分類為類別i的樣本數量.N表示總的樣本數量.
本文實驗還比較了各個算法的計算效率,實驗所用的計算平臺為PC(Intel Core i7 4.0GHz CPU,32GB RAM),操作系統為Windows 7,所有算法采用Matlab編寫.
4.1仿真實驗
4.1.1人工SAR圖像
為了驗證DCSCN網絡在目標識別上的可行性和有效性,設計人工SAR圖像進行實驗.該圖像中包含了多個不同形狀的目標,圖像大小為200×200.通過對該圖像的目標識別來說明DCSCN網絡的普適性.圖5(a)和圖5(b)分別給出了人工SAR圖像及其相應的目標真值圖.

圖5 人工SAR圖像數據Fig.5 The artificial SAR data
4.1.2網絡參數設置
根據第3節介紹,本文分別利用二維Gabor變換和NSCT來提取圖像紋理特征和輪廓特征,初始特征會對最后的識別精度有一定影響.根據經驗,采用5個尺度、8個方向的二維Gabor濾波器組來提取圖像紋理特征,利用3級NSCT分解得到15個子帶圖像作為輪廓特征,將這些特征堆疊起來構成55維的特征.然后,采用TurborPixels將圖像分割為1000個超像素塊,將各個小塊特征組輸入到DCSCN網絡中進行特征學習和分類識別.
DCSCN網絡的結構和參數對識別精度有很大的影響.考慮到算法的復雜度,設計三層結構的DCSCN,前兩層進行特征稀疏編碼,最高層進行分類識別.根據實驗經驗,網絡的權重衰減系數λ設置為0.005,稀疏性懲罰因子β設置為0.1,稀疏性參數ρ設置為0.2.各層隱含單元數目對分類識別的精度有明顯影響,因此這里詳細描述了隱含單元數目的確定過程.由于最高層用于識別,最高層隱含單元數等于類別數,所以只需要分析前兩層隱含單元數目對識別結果的影響.實驗中,隨機選取20%的超像素塊作為訓練集,其他超像素塊用來驗證算法的識別精度.通過改變其中一個參數的同時固定另一個參數,來討論隱含單元數目對結果的影響.
圖6(a)和圖6(b)分別給出了總分類精度和Kappa系數隨著兩層隱含單元數目變化的變化情況.實驗中,第一層隱含單元數目在20到150之間變化,第二層隱含單元數目在20到100之間變化.實驗結果表明,當前兩層的隱含單元數目分別為100和40時,網絡的識別精度最高.當第二層隱含單元數目一定,第一層隱含單元數目取值在90到110之間時,識別的精度優于其他情況的結果.即第一層隱含單元數目比輸入樣本特征維度要高,其原因是輸入的樣本初始特征是非線性的,當隱含單元數目比輸入單元數目大時,網絡第一層相當于對特征進行高維空間映射,使得特征更加線性化、更利于分類識別.當第一層隱含單元數目一定,第二層隱含單元數目取值在30到40之間時,識別的精度優于其他情況的結果.網絡第二層的作用相當于對特征進行降維,降維處理不能降得太低或者太高.這是因為降維維度過低會壓縮掉有用信息,而降維維度較高時訓練分類器容易發生過擬合現象.

圖6 DCSCN網絡參數設置Fig.6 Parameter setting of the DCSCN
4.1.3對比實驗結果與分析
為了證明DCSCN在SAR圖像目標識別中的效果,本文與SVM算法、SOMP算法、Lasso-Pooling算法及未做改進的SAE網絡進行對比.對比算法采用的樣本特征與輸入到DCSCN網絡的特征一致,都是由二維Gabor濾波器和NSCT濾波器得到的55維特征.根據前述實驗分析,DCSCN網絡為三層,前兩層的隱含單元數目分別為100和40.SVM采用了高斯徑向基作為核函數,參數通過十次交叉驗證得到.SOMP算法、Lasso-Pooling算法中的主要參數為稀疏度和重建誤差極值,分別設定為10和10?3.SAE網絡采用了與本文提出的DCSCN網絡相同的結構,都設計了三層結構的網絡,前兩層的隱含單元數目分別為100和40,最高層進行分類識別.通過五次實驗來分析各個算法的識別效果,每次實驗隨機選取20%的樣本作為訓練集,其他樣本作為測試集,計算五次實驗結果的均值和標準差.表1給出了各種算法識別精度和算法效率的結果對比.
根據表1結果,DCSCN識別精度要明顯高于其他四種算法.對比SAE和DCSCN實驗結果,基于SAE提出的DCSCN網絡可以提高目標識別精度,說明本文對DCSCN網絡的設計是有效的.DCSCN網絡考慮了近鄰像素的協同性,通過聯合優化得到近鄰像素特征表示,能平滑掉相干斑噪聲,從而有效降低相干斑噪聲對識別結果的影響.由于SVM算法、SOMP算法、Lasso-Pooling算法和DCSCN網絡輸入的初始特征都是由二維Gabor濾波器和NSCT濾波器分別提取的紋理特征和輪廓特征,而DCSCN網絡識別精度得到明顯提高,這說明經過DCSCN網絡優化后的不同類別特征的區分度更大,更適合于分類器進行識別.對比各個算法的計算耗時發現,DCSCN網絡計算效率比SVM算法略差,但要優于其他方法.這是由于SOMP算法和Lasso-Pooling算法的計算復雜度隨著樣本數成高次方增長,而DCSCN網絡計算復雜度隨迭代次數、樣本數和網絡節點數線性變化.因此,基于深度學習神經網絡的DCSCN網絡計算復雜度低于基于稀疏編碼的SOMP算法及Lasso-Pooling算法.

表1 各個算法在人工SAR圖像上識別結果對比Table 1 Recognition performance comparison of different algorithms on the artificial SAR image
圖7顯示了五種算法的目標識別結果圖.對比五幅圖可知,DCSCN網絡表現出更好的識別結果,誤分類點比其他方法更少.同時發現,SOMP算法和Lasso-Pooling算法結果圖的孤立誤分類點也很少,這是因為SOMP算法、Lasso-Pooling算法和本文DCSCN網絡都考慮了近鄰像素的協同性,而通過空間近鄰協同可以平滑掉相干斑噪聲,所以這三種算法對相干斑噪聲抑制作用明顯.由于DCSCN算法有優異的特征表示能力,所以其識別精度明顯高于SOMP算法和Lasso-Pooling算法.此外,SVM算法和SAE算法結果的孤立誤分類點很多,原因是這兩種算法是基于像素的分類識別,未考慮空間協同相關性,相關斑噪聲對識別產生很大的影響.

圖7 人工SAR圖像目標識別結果Fig.7 Target recognition results of the artificial SAR image
4.2浮筏識別實驗
為了驗證DCSCN網絡在海洋浮筏養殖目標識別的有效性,選取北戴河海域作為研究區域.圖8(a)和圖8(b)是北戴河海域的兩個不同傳感器的多光譜圖像,分別是Landsat-8衛星圖像和資源三號衛星圖像.圖8(c)為Radarsat-2衛星的SAR圖像,極化方式為HH,分辨率為5m.比較這三幅圖可以發現,多光譜圖像不能有效地獲取北戴河海域的浮筏目標,而在SAR圖像中有清晰的浮筏目標.這是由于海洋散射信號較弱,光譜成像衛星數據難以獲取浮筏信息,而SAR是主動式微波成像,利于獲取海洋信息.圖8(d)為現場測繪時拍攝的實景圖片.從圖8(c)選取兩塊海域的圖像來驗證本文提出算法的效果,選取的圖像1和圖像2分別如圖8(e)和圖8(g),圖像大小分別為1275×1140和600×600.根據現場測繪的數據繪制出相應的真值圖如圖8(f)和8(h).

圖8 北戴河區域SAR數據Fig.8 The original SAR data of Beidaihe area
在SAR圖像1上進行實驗,先做幾何校正、灰度拉伸和增強Lee濾波去噪,再采用二維Gabor變換和NSCT提取圖像紋理特征和輪廓特征.與仿真實驗相同,采用3級NSCT分解和5個尺度、8個方向的二維Gabor濾波器得到55維的特征.采用TurborPixels將圖像分割為40000個超像素塊,將各個小塊輸入到DCSCN網絡中進行特征學習并分類識別.DCSCN網絡共三層,前兩層的隱含層單元數目分別設置為100和40.網絡其他參數的設置與仿真實驗相同.同樣,為說明本文算法在海洋浮筏養殖目標識別的優越性能,本文與SVM、SOMP、Lasso-Pooling和SAE進行了比較.表2給出了各個算法識別精度和算法效率的對比,這里每個算法效率的統計都是指整個識別過程,即從輸入圖像到最后得出分類識別結果.圖9給出了各個算法目標識別結果圖.
根據表2結果,DCSCN網絡的總分類精度和Kappa系數都明顯好于其他四種算法.結果表明,本文DCSCN網絡具有優異的特征表示能力,可以得到區分性更大、更適合分類器的特征.同時,DCSCN通過空間近鄰協同約束,有效地抑制SAR圖像相干斑噪聲的影響,所以在分類精度上明顯優于現有的三種方法.此外,DCSCN的算法效率更優,比其他四種算法耗時都少.這是由于DCSCN網絡計算復雜度隨迭代次數、樣本數和網絡節點數線性變化,而SVM算法、SOMP算法和Lasso-Pooling算法的計算復雜度隨著樣本數成高次方增長,所以DCSCN網絡計算復雜度較低.在圖像尺寸較大、樣本較多的時候,DCSCN能夠有效地降低計算量,使得計算效率優于其他算法.

表2 各個算法在SAR圖像1浮筏識別結果對比Table 2 Recognition performance comparison of different algorithms on the first SAR image
對比圖9各個算法的結果圖,DCSCN識別效果要明顯優于其他四種算法的結果.分析發現,SVM和SAE識別結果圖存在較多誤分類噪點,而本文算法、SOMP算法和Lasso-Pooling算法誤分類噪點較少.這是由于這三種算法都采用了近鄰協同約束,可以有效抑制SAR圖像相干斑噪聲.同時,本文算法的誤分類噪點更少,說明本文算法在抑制相干斑噪聲方面的效果更好.本文算法要優于SAE算法結果,說明稀疏約束和協同約束能使得深度網絡學到區分性更大的特征.此外,在實際SAR圖像上的實驗結果與人工SAR圖像的實驗結果得到了一致的結論,充分證明了算法的有效性和適應性.
由于海洋不同區域的后向散射特性存在差異,為了說明本文DCSCN網絡對不同海域浮筏的識別能力,對SAR圖像2進行相同的實驗.與SAR圖像1上實驗一樣,先進行幾何校正、灰度拉伸和增強Lee濾波去噪,再采用5個尺度、8個方向的二維Gabor濾波器和3級NSCT濾波器提取出55維的特征,然后采用TurborPixels將圖像分割為10000個超像素塊,最后將各個小塊輸入到三層結構的DCSCN網絡中進行特征學習和分類識別.表3給出了各個算法識別精度和算法效率的對比,圖10給出了各個算法目標識別結果圖.
分析圖10和表3結果,DCSCN網絡的識別精度和算法效率都優于其他四種算法,這一結論和前面分析一致.這充分說明,不同海域即使海洋后向散射特性有差別的情況下,DCSCN網絡都能達到較好的浮筏養殖識別結果.

表3 各個算法在SAR圖像2浮筏識別結果對比Table 3 Recognition performance comparison of different algorithms on the second SAR image

圖9 SAR圖像1浮筏識別結果Fig.9 Target recognition results of the first SAR image

圖10 SAR圖像2浮筏識別結果Fig.10 Target recognition results of the second SAR image
本文針對海洋遙感SAR圖像嚴重的相干斑噪聲污染和SAR圖像特征單一的問題,提出一種深度協同稀疏編碼網絡,進行SAR圖像特征表示和目標識別.通過人工SAR圖像和北戴河兩個海域浮筏養殖SAR圖像的實驗,證明本文所提網絡的有效性和適用性.結果表明,深度協同稀疏編碼網絡不僅可以有效優化近鄰像素特征組來提高識別精度,而且能有效抑制SAR圖像相干斑噪聲的影響.此外,深度協同稀疏編碼網絡計算效率較高,在圖像尺寸較大時表現出更好的效率.
References
1 Yu Hang,Jiao Li-Cheng,Liu Fang.Context based unsupervised hierarchical iterative algorithm for SAR segmentation. Acta Automatica Sinica,2014,40(1):100?116(余航,焦李成,劉芳.基于上下文分析的無監督分層迭代算法用于SAR圖像分割.自動化學報,2014,40(1):100?116)
2 Zhao Ming-Bo,He Jun,Fu Qiang.Survey on fast CFAR detection algorithms for SAR image targets.Acta Automatica Sinica,2012,38(12):1885?1895(趙明波,何峻,付強.SAR圖像CFAR檢測的快速算法綜述.自動化學報,2012,38(12):1885?1895)
3 Chu Jia-Lan,Zhao Dong-Zhi,Zhang Feng-Shou.Wakame raft interpretation method of remote sensing based on association rules.Remote Sensing Technology and Application,2012,27(6):941?946(初佳蘭,趙冬至,張豐收.基于關聯規則的裙帶菜筏式養殖遙感識別方法.遙感技術與應用,2012,27(6):941?946)
4 Fan Jian-Chao,Zhang Feng-Shou,Zhao Dong-Zhi,Wen Shi-Yong,Wei Bao-Quan.Floating raft aquaculture extraction based on high resolution satellite remote sensing SAR images.In:Proceedings of the 2nd Symposium on Disaster Risk Analysis and Management in Chinese Littoral Regions. 2014.59?63(范劍超,張豐收,趙冬至,文世勇,衛寶泉.基于高分辨率衛星遙感SAR圖像的海洋浮筏養殖信息提取.見:第二屆中國沿海地區災害風險分析與管理學術研討會.2014.59?63)
5 Qazi W A,Emery W J,Fox-Kemper B.Computing ocean surface currents over the coastal california current system using 30-min-lag sequential SAR images.IEEE Transactions on Geoscience and Remote Sensing,2014,52(12): 7559?7580
6 Pan De-Lu,Lin Ming-Shen,Mao Zhi-Hua.Microwave Remote Sensing and Application of Ocean.Beijing:Ocean Press,2013.(潘德爐,林明森,毛志華.海洋微波遙感與應用.北京:海洋出版社,2013.)
7 Collins M J,Allan J M.Modeling and simulation of SAR image texture.IEEE Transactions on Geoscience and Remote Sensing,2009,47(10):3530?3546
8 Liu C J,Wechsler H.Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition.IEEE Transactions on Image Processing,2002,11(4):467?476
9 Do M N,Vetterli M.The contourlet transform:an efficient directional multiresolution image representation. IEEE Transactions on Image Processing,2005,14(12): 2091?2106
10 Da Cunha A L,Zhou J P,Do M N.The nonsubsampled contourlet transform:theory,design,and applications. IEEE Transactions on Image Processing,2006,15(10): 3089?3101
11 Yang X H,Jiao L C.Fusion algorithm for remote sensing images based on nonsubsampled contourlet transform.Acta Automatica Sinica,2008,34(3):274?281
12 Hinton G E,Osindero S,Teh Y W.A fast learning algorithm for deep belief nets.Neural Computation,2006,18(7): 1527?1554
13 Salakhutdinov R,Tenenbaum J B,Torralba A.Learning with hierarchical-deep models.IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(8): 1958?1971
14 Goh H,Thome N,Cord M,Lim J H.Learning deep hierarchical visual feature coding.IEEE Transactions on Neural Networks and Learning Systems,2014,25(12):2212?2225
15 Zheng Yin,Chen Quan-Qi,Zhang Yu-Jin.Deep learning and its new progress in object and behavior recognition.Journal of Image and Graphics,2014,19(2):175?184(鄭胤,陳權崎,章毓晉.深度學習及其在目標和行為識別中的新進展.中國圖象圖形學報,2014,19(2):175?184)
16 Chen X Y,Xiang S M,Liu C L,Pan C H.Vehicle detection in satellite images by hybrid deep convolutional neural networks.IEEE Geoscience and Remote Sensing Letters,2014,11(10):1797?1801
17 Chen Y S,Lin Z H,Zhao X,Wang G,Gu Y F.Deep learningbased classification of hyperspectral data.IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(6):2094?2107
18 Feng Bo,Chen Bo,Wang Peng-Hui,Liu Hong-Wei.Feature extraction method for radar high resolution range profile targets based on robust deep networks.Journal of Electronics&Information Technology,2014,36(12):2949?2955(馮博,陳渤,王鵬輝,劉宏偉.基于穩健深層網絡的雷達高分辨距離像目標特征提取算法.電子與信息學報,2014,36(12): 2949?2955)
19 Li Shuai,Xu Yue-Lei,Ma Shi-Ping,Ni Jia-Cheng,Wang Kun.SAR target recognition using wavelet transform and deep sparse autoencoders.Video Engineering,2014,38(13): 31?35(李帥,許悅雷,馬時平,倪嘉成,王坤.基于小波變換和深層稀疏編碼的SAR目標識別.電視技術,2014,38(13):31?35)
20 Rai P,Khanna P.A gender classification system robust to occlusion using gabor features based 2D2PCA.Journal of Visual Communication and Image Representation,2014,25(5):1118?1129
21 Zhang Qiang,Guo Bao-Long.Fusion of multi-sensor images based on the nonsubsampled contourlet transform.Acta Automatica Sinica,2008,34(2):135?141(張強,郭寶龍.基于非采樣Contourlet變換多傳感器圖像融合算法.自動化學報,2008,34(2):135?141)
22 Yan C M,Guo B L,Yi M.Fast algorithm for nonsubsampled contourlet transform.Acta Automatica Sinica,2014,40(4): 757?762
23 Levinshtein A,Stere A,Kutulakos K N,Fleet D J,Dickinson S J,Siddiqi K.TurboPixels:fast superpixels using geometric flows.IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(12):2290?2297
24 Ng A.Sparse autoencoder[Online],available:http://web. stanford.edu/class/cs294a/sae/,November 8,2015.
25 Chang C C,Lin C J.LIBSVM:a library for support vector machines.ACM Transactions on Intelligent Systems and Technology,2011,2(3):Article No.27
26 Chen Y,Nasrabadi N M,Tran T D.Simultaneous joint sparsity model for target detection in hyperspectral imagery. IEEE Geoscience and Remote Sensing Letters,2011,8(4): 676?680
27 Mairal J,Bach F,Ponce J.Sparse modeling for image and vision processing.Foundations Trend in Computer Graphics Vision,2014,8(2?3):85?283

耿 杰大連理工大學電子信息與電氣工程學部博士研究生.主要研究方向為SAR圖像處理,模式識別.E-mail:gengjie@mail.dlut.edu.cn
(GENG JiePh.D.candidate at the Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology.His research interest covers SAR image processing and pattern recognition.)

范劍超國家海洋環境監測中心,大連理工大學電子信息與電氣工程學部副研究員.主要研究方向為神經網絡,模式識別和遙感圖像處理.本文通信作者.E-mail:fjchaonmemc@163.com
(FAN Jian-ChaoAssociate professor at National Marine Environment Monitoring Center and Dalian University of Technology.His research interest covers neural network,pattern recognition,and remote sensing image processing.Corresponding author of this paper.)

初佳蘭國家海洋環境監測中心工程師.主要研究方向為海域動態衛星遙感應用.E-mail:jlchu@nmemc.org.cn
(CHUJia-LanEngineer at National Marine Environment Monitoring Center.Her research interest covers sea dynamic surveillance remote sensing application.)

王洪玉大連理工大學電子信息與電氣工程學部教授.主要研究方向為圖像處理,模式識別和無線傳感器網絡.E-mail:whyu@dlut.edu.cn
(WANG Hong-YuProfessor at the Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology.His research interest covers image processing,pattern recognition,and wireless sensor networks.)
Research on Marine Floating Raft Aquaculture SAR Image Target Recognition Based on Deep Collaborative Sparse Coding Network
GENG Jie1FAN Jian-Chao1,2CHU Jia-Lan2WANG Hong-Yu1
Floating raft aquaculture is widely distributed in the offshore ocean of China.Since raft information cannot be obtained accurately in the visible remote sensing image,active imaging images acquired from synthetic aperture radar(SAR)are applied.However,oceanic SAR images are seriously contaminated by speckle noise,and effective features of SAR images are deficient,which make recognition difficult.In order to overcome these problems,a deep collaborative sparse coding network(DCSCN)is proposed to extract features and conduct recognition automatically.The proposed method extracts texture features and contour features from the pre-processed image firstly.Then,it segments the image into patches and learns features of each patch collaboratively through the DCSCN network.The optimized features are used for recognition finally.Experiments on the artificial SAR image and the images of Beidaihe demonstrate that the proposed DCSCN network can accurately obtain the area of floating raft aquaculture.Since the network can learn discriminative features and integrate the correlated neighbor pixels,the DCSCN network improves the recognition accuracy and has better performance in overcoming the contamination of speckle noise.
Synthetic aperture radar(SAR),deep learning,sparse auto-encoders,floating raft aquaculture,target recognition
Manuscript July 6,2015;accepted January 15,2016
10.16383/j.aas.2016.c150425
Geng Jie,Fan Jian-Chao,Chu Jia-Lan,Wang Hong-Yu.Research on marine floating raft aquaculture SAR image target recognition based on deep collaborative sparse coding network.Acta Automatica Sinica,2016,42(4): 593?604
2015-07-06錄用日期2016-01-15
國家自然科學基金(61273307,61301130),中國博士后面上基金(2014M551082),北戴河鄰近海域典型生態災害與污染監控海洋公益專項(201305003),海域使用動態監測和污染監測研究專項資助
Supported by National Natural Science Foundation of China(61273307,61301130),the China Postdoctoral Science Foundation(2014M551082),the Public Welfare Project of Beidaihe Marine Ecological Disasters and Pollution Monitoring(201305003)and the Research of Dynamic Monitoring and Pollution Monitoring of Sea Area
本文責任編委劉躍虎
Recommended by Associate Editor LIU Yue-Hu
1.大連理工大學電子信息與電氣工程學部大連1160242.國家海洋環境監測中心大連116023
1.Faculty of Electronic Information and Electrical Engineering,Dalian University of Technology,Dalian 1160242.Na-tional Marine Environment Monitoring Center,Dalian 116023