景嘯



摘要:本文討論了使用航拍圖像的自動目標識別的問題。在這項工作中,提出并應用深度學習架構,以便從航拍圖像中識別車輛。主要在這項工作中提出了基于深度卷積神經網絡(Deep Convolutional Neural Network,DCNN)結構的深度學習算法。為7驗證本文的方法,給出了一些實驗結果并進行了比較。得到的結果表明,所提出的深度學習方法達到了93%的識別精度,較一般深度學習方法有明顯提升。
關鍵詞:目標識別 深度學習 深度卷積神經網絡 航拍圖像
引言
隨著航拍技術和圖像處理技術的日益成熟,在軍事和民用領域運用越來越廣泛,如追蹤軍事目標、地形勘探、快遞運輸等。航拍中由于干擾目標眾多,背景復雜,而且隨著目標和拍攝載具的移動,追蹤目標特征難以描述,因此傳統的方法難以追蹤目標。
1 深度學習
深度神經網絡(Deep Neural Network,DNN)也稱深度學習,是基于數據學習的眾多機器學習方法的一類。而針對圖像處理有多種深度學習的處理方法,如圖像分割、或邊緣查找等。而深度卷積神經網絡(Deep Convolutional Neural Network,DCNN)是一種深度學習算法并已成功應用于圖像處理中。因為DCNN可以獲得比標準神經網絡訓練時間更少的更好結果。首先,DCNN在卷積層中有一大組濾波器內核,可以從原始數據中捕獲代表性的信息和模式。堆疊這些卷積層可以進一步融合信息并構建復雜的圖案;其次,DCNN是一個獨立連接的網絡,每個過濾器共享相同的權重。這種結構可以減少訓練時間和模型的復雜性。此外,DCNN的池化層進一步減少了輸人數據的變化以及訓練時間,并且提高了提取模式的魯棒性。因此本文采用DCNN從航拍圖像中提取特征,以實現識別任務。
典型的DCNN的前幾層通常由兩種類型的卷積層組成,其次是池化層最后一層是完全連接層。接下來,本文將更詳細地描述這三種層。
(1)卷積層由許多具有加權參數的二維(2D)濾波器組成。濾波器用輸人數據卷積并獲得輸出,稱為特征映射。每個濾波器共享輸入的所有補丁的相同加權參數數據來減少訓練時間和模型的復雜性,這與傳統的具有不同加權參數的神經網絡在輸入數據的不同路徑上是不同的。
(2)池化層是一個子采樣層,它通過降低采樣降低卷積層輸出的特征向量,同時改善結果,不易出現過擬合,提高了特征學習的魯棒性。池化層通常遵循具有最大匯集方法的卷積層,并且其僅輸出特征映射的每個子采樣片的最大值以對來自先前卷積層的特征映射進行二次采樣。
(3)全連接層是DCNN模型的最后一層。它遵循卷積層和池化層的幾種組合,并從上一層中對更高級別的信息進行分類。一個全連接層類似于傳統的多層神經網絡的隱層、分類層,通常使用softmax回歸,假設任務是K-lalole問題'該softmax回歸的輸出可由下式表達
2實驗及結果
本文中使用了包含車輛的數據集。航拍圖像的示例如圖2所示。每個圖像的大小約為50乘35.不同的目標圖像可能具有略微不同的大小。圖像已經以0到360度的方向居中。由于缺乏分辨率和背景和航拍數據處理產生的噪聲,航拍圖像看起來像模糊,失焦。該數據集由1434個圖像組成,分解為844個訓練圖像和590個測試基礎圖像。圖2給出了不同目標的航拍圖作為數據集樣本。
如果所有圖像具有相同的尺寸50x35且目標位于圖像的中心,建議采用32x32大小的補丁,其中目標位于補丁的中心。在此步驟之后,從圖像中減去平均值并將其除以圖像的標準偏差,即已經標準化數據。
本研究中提出的深度卷積神經網絡前兩個卷積層之后是最大池化層,池化大小為2x2步長為2個像素在卷積層中不使用空間零填充,并且卷積步幅固定為1個像素。在第一個卷積層中,通過4個大小為5×5的卷積濾波器對32x32輸入圖像進行濾波,得到4個大小為28x28的特征圖。在第一個池化層之后,它們的大小變為14 x14。第一個池化層的輸出被發送到第二個卷積層,其卷積濾波器大小為5X5,導致8個大小為10 x10的特征映射。在第二個池化層之后,它們的大小變為5X5大小為5×5的8個特征圖。最后的每個圖像由25個像素組成,總共我們有25×8-200個像素,這些像素形成我們要在sigmoid層中分類的矢量。
為了驗證所提方法的效率,我們使用了航拍數據庫。比較兩種方法(CNN和DCNN),DCNN識別精度約為93%,CNN識別進度約為84%。因此,DCNN在當前環境下識別能力優于CNN。
3 結論
特征提取在目標自動識別中起著關鍵作用。由于深度卷積神經網絡在計算機視覺和語音識別中取得了巨大成功,本文將這種方法借鑒航拍圖像的目標識別中,通過構建DCNN來自動提取航拍圖像中的特征,從而解決了特征提取的問題,目標識別精度遠高于一般深度學習方法。
參考文獻
[l]Prokaj J,Medioni G.Persistent Tracking for Wide Area AerialSurveillanceECl// IEEE Conference on Computer Vision&PatternRecognition. IEEE Computer Society. 2014.
[2]全小敏.航拍視頻運動目標檢測與跟蹤方法研究[D].
[3]朱海港,基于深度學習的高清航拍圖像目標檢測[D].2015.
[4]Lecun,Y.;Bengio,Y.; Hinton,G.Deep learning[J]. Nature 2015.521, 436 444
[5]劉一宵,牛珊珊,栗春曉.圖像處理方法綜述與案例分析[J],科學家,2017(5):159.