付宏建,白宏陽,郭宏偉,原瑜蔓,秦偉偉
(1 南京理工大學 能源與動力工程學院,南京 210094)
(2 火箭軍工程大學 核工程學院,西安 710025)
光學遙感圖像目標檢測技術是指利用算法對感興趣的遙感圖像目標自動分類與定位的技術[1],在軍事偵察、精準制導、交通管制、災情預測等領域有著廣泛的應用[2]。從發展歷程看,光學遙感圖像目標檢測技術主要可分為傳統目標檢測算法和基于深度學習的目標檢測算法。傳統目標檢測算法是指基于手工設計的特征描述子來提取候選目標并進行驗證的方法[3],手工設計的特征一般為目標紋理、顏色、邊緣等視覺信息[4]。傳統目標檢測算法主要使用支持向量機(Support Vector Machine,SVM)[5]、Adaboost[6]和K-means[7]等方法作為分類器。
相比傳統目標檢測算法,基于深度學習的目標檢測技術可以自動提取目標特征,特征表達更具魯棒性和泛化性[8]。根據有無候選框生成階段作為區分[9],基于深度學習的目標檢測技術主要分為以R-CNN(Region-CNN)系列(R-CNN[10]、Fast R-CNN[11]、Faster R-CNN[12]、Mask R-CNN[13])為代表的雙階段模型和以YOLO(You Only Look Once)系列(YOLOv2[14]、YOLOv3[15])、SSD 系列(SSD[16]、DSSD[17])為代表的單階段模型。現階段,在遙感圖像目標檢測領域應用深度學習目標檢測技術可以達到較好的檢測效果,然而,遙感圖像目標檢測仍有幾類難題亟待解決,如目標尺度差異大、目標分布密集、背景復雜等[18]。
針對上述問題,國內外學者在已有深度神經網絡的基礎上做了大量改進。HOU J Y 等[19]在R-CNN 的基礎上利用多分支的感興趣區域池化層(Regions Of Interest Pooling,ROI Pooling),將特征映射成不同尺度,并采用級聯方式檢測,提高了多尺度遙感目標的檢測精度,但對于密集分布的遙感目標檢測效果不理想。……