孟佳佳 王弢

摘要:論文提出了一種基于深度殘差卷積神經網絡的高光譜遙感數據的分類方法。我們將深度殘差卷積神經網絡作為一種分類器,將待分類的像元及其領域像元一同作為神經網絡的輸入,通過殘差網絡的算法模型實現高光譜遙感數據的分類。我們使用深度學習技術將數據特征提取出來再進行分類,以達到提高分類準確度和效率的目的。本文主要通過改善分類方法來增強遙感數據分類的效率和處理能力。
關鍵詞:卷積神經網絡;高光譜圖像;圖像分類;深度學習
中圖分類號:TP391.41;TP183 文獻標識碼:A 文章編號:1007-9416(2019)01-0099-03
0 引言
過去幾年,由于深度學習在解決很多問題上的出色表現。卷積神經網絡是最早發現和應用的,也是研究重點[1]。雖然基于卷積神經網絡的深度學習應用的越來越廣泛。但在遙感數據的分類領域中使用這項技術還較為少見。遙感數據有很多種分類因素而具有多種分類方法。基于光譜特征的分類方法主要是從地物的光譜特征入手,表現地物特定的光譜區間和特定參數[2]。高光譜遙感圖像中能夠包含的信息比傳統的遙感圖像要多,其接收到的譜線也比傳統的細致和連續,一些不可分的特征會被凸顯,這種方法是通過對比分析并判別地物的光譜信息來進行區分的。基于統計模型的分類方法是對高光譜遙感數據整體樣本的總體特征進行統計分析,從而對得出的不同的分布特征進行分析,可以用來識別地物目標。
目前,高光譜數據處理的自動化及智能化的水平尚不夠高,深度學習和人工智能技術的發展能夠提升地物分類和識別的準確度以及地物特征信息的提取速度和準確度,這還將是高光譜遙感研究的主要目標[3],選用更先進的分類算法和數據處理模型,將高光譜遙感數據更好更多地應用在更廣的學科領域中。
1 深度殘差網絡的高光譜遙感數據分類
1.1 殘差卷積網絡模型
隨著神經網絡的深度的加深,網絡的表達能力隨之加強,但網絡深度會帶來梯度消失的問題,且隨著深度加深,梯度消失問題也越來越嚴峻[4]。如果假設我們將多加入的多層神經網絡全部定義為恒等映射,理論上完全可以認定為性能達到平衡,但是這種方法沒有任何的實際意義。那么如果增加的部分可以近似為恒等映射或攜有小擾動的恒等映射的情況,則很有可能實現網絡性能的不變[5]。因而我們采用了殘差單元。若是可以假設多個非線性層組合可以擬合于一個復雜函數,那么也同樣可以假定隱含層的殘差擬合于某個復雜函數。即將原來的神經網絡的學習函數H(x)轉化為F(x)+x,對于深度神經網絡來說,這兩種表達方式的訓練效果是等同的。但對于深度神經網絡的優化難度上來說是截然不同的。后者可以通過具有“捷徑連接(shortcut)”的前饋神經網絡來實現,而且殘差網絡的單個構建模塊并不復雜。殘差單元的輸出由多個卷積層層疊的輸出和輸入元素間相加,并要求保證其卷積層輸出和輸入元素維度相同,再經過ReLU線性激活后得到。將這種結構層疊起來之后,我們就得到了深度殘差網絡。
1.2 殘差塊
殘差塊是一個兩層神經網絡,如圖1所示。在層進行激活,得到,再次進行激活,兩層之后得到。計算過程是從開始的,首先進行線性激活,根據公式1-1:
通過算出,即乘以權重矩陣,再加上偏差因子。然后通過ReLU非線性激活函數得到,計算得出。接著再次進行線性激活,依據公式1-2:
最后根據這個公式再次進行ReLU非線性激活,即,這里的g是指ReLU非線性函數,得到的結果就是。換句話說,信息流從到需要經過以上所以步驟,即這組網絡層的主路徑。
卷積在殘差網絡中有一點變化,我們將直接向后,拷貝到神經網絡的深層,在ReLU非線性激活函數前加上,這是一條捷徑。的信息直接到達神經網絡的深層,不再沿著主路徑傳遞,這就意味著最后這個等式去掉了,取而代之的是另一個ReLU非線性函數,仍然對進行函數處理,但這次要加上,即:,也就是加上的這個產生了一個殘差塊。
一個普通網絡(Plain network),把它變成 ResNet 的方法是加上所有跳躍連接,每兩層增加一個捷徑,構成一個殘差塊。
2 實驗結果與分析
2.1 實驗數據簡介
本文使用到高光譜數據有:Indianpines和Pavia U。Indianpines數據集:美國印第安納州的松林區域,一共包含地物信息16類。每個圖像規模為145×145,整個數據集的大小為145×145×200。Pavia U數據集:意大利帕爾維亞大學的附近區域,一共包含地物信息10類。每個圖像規模為610×340,整體數據集的大小為610×340×103。
2.2 實驗結果情況分析
2.2.1 Indianpines數據集
我們將實驗環境中訓練樣本的數量設定為整體樣本量的20%,則測試樣本為剩下的80%,為了分析各網絡算法模型對樣本的分類效果情況,我們使用了卷積神經網絡(CNN)、多層感知機(MLP)和殘差網絡(Resnet)三種模型分別進行實驗,得到如下結果:
圖2(a)為正確標記后的高光譜遙感數據,作為結果對比使用;圖2(b)為使用多層神經網絡(MLP)進行高光譜遙感數據分類的分類結果;圖2(c)是采用卷積神經網絡(CNN)進行高光譜遙感數據分類的分類結果;圖2(d)是使用深度殘差網絡(Resnet)進行高光譜遙感數據分類的分類結果。我們從圖2中能夠得到,相較于MLP模型來說,卷積神經網絡已經實現了部分的錯誤率下降,但效果還是差強人意的。但相較于CNN模型,深度殘差網絡對高光譜遙感數據的分類正確率已有明顯的提升,分類效果比多層感知機及卷積神經網絡都要好,這里體現了殘差網絡相較于多層神經網絡及卷積神經網絡的優越性,但仍未達到最優。
2.2.2 Pavia U數據集
為了分析不同數據集上各模型的分析狀況,這次我們采用了同樣的樣本比例,即訓練樣本與測試樣本的比例為2:8,再次分析各神經網絡模型對Pavia U數據集的分類情況,我們再次使用了卷積神經網絡(CNN)、多層神經網絡(MLP)及殘差網絡(Resnet)三種神經網絡模型進行分類,得到的結果如圖3所示。
我們發現,卷積神經網絡比多層感知機的分類效果略好一些,而深度殘差網絡再次表現出了優越性,其分類效果較于前兩種模型為最優。由結果圖我們能看出,不論是塊狀地域還是線性地域的識別,深度殘差網絡都較其他兩種模型的分類準確率高,其能夠較為準確的將九類地域特征分類,邊緣輪廓描繪較為完整,相較于卷積神經網絡明顯降低了誤差,這也表明了深度殘差網絡解決了高光譜遙感數據分類中的一部分困難。
如表1所示,多層感知機對Pavia U數據集的地物分類精度只達到了60%左右,而卷積神經網絡具有很好的分類效果,其對Pavia U數據集的地物分類精度達到了80%。從表中我們還可以發現深度殘差網絡對Pavia U數據集的地物分類精度竟然達到了90%左右,這進一步體現了殘差網絡較另兩種分類模型的優越性和高效性。
3 結語
本文提出了一種基于深度殘差網絡的高光譜遙感數據的分類方法,通過殘差網絡實現了分類正確率和準確度的提升,實驗結果表征了基于該算法模型的分類方法在其他同類型的分類方法中的可行性和優越性。本文以高光譜遙感數據分類為核心,深度殘差網絡算法模型為方法,部分解決了高光譜遙感數據因光譜維度高、數據冗余大且存在非線性特性所帶來的分類困難的問題。
參考文獻
[1] Zeiler M D, Fergus R. Visualizing and Understanding Convolutional Networks[M]// Computer Vision ECCV 2014. Springer International Publishing,2014:818-833.
[2] 袁迎輝,林子瑜.高光譜遙感技術綜述[J].中國水運:學術版,2007,7(8):157-159.
[3] 張兵,王向偉, 鄭蘭芬,等.高光譜圖像地物分類與識別研究[J].2004.
[4] 宋光慧.基于遷移學習與深度卷積特征的圖像標注方法研究[D].浙江大學,2017.
[5] Ballester P, Araujo R M. On the performance of GoogLeNet and AlexNet applied to sketches[C]// Thirtieth AAAI Conference on Artificial Intelligence. AAAI Press,2016:1124-1128.
Abstract:This paper proposes a hyperspectral remote sensing data classification method based on deep residual convolutional neural network. We use the deep residual convolutional neural network as a classifier to classify the pixels to be classified and their domain pixels into the input of the neural network. The algorithm model of the residual network is used to classify the hyperspectral remote sensing data. We use deep learning technology to extract data features and then classify them to achieve the purpose of improving classification accuracy and efficiency. This paper mainly enhances the efficiency and processing ability of remote sensing data classification by improving the classification method.
Key words:convolutional neural networks; hyperspectral images; image classification; deep learning