石 頡,袁晨翔,丁 飛,孔維相
蘇州科技大學 電子與信息工程學院,江蘇 蘇州 215009
合成孔徑雷達(synthetic aperture radar,SAR)技術(shù)是常見的遙感技術(shù)之一,具有全天候、全天時探測以及相干成像等特點,SAR成像技術(shù)彌補了光學成像技術(shù)在夜間以及惡劣天氣條件下無法對地表建筑進行測繪的缺陷。與光學圖像相比,建筑物在SAR圖像中具有高亮度、同背景易分離、呈現(xiàn)規(guī)律的幾何形狀等特點,如圖1所示,這也是SAR圖像信息提取的優(yōu)勢所在。利用SAR圖像對地表建筑物進行檢測能夠為城市管理部門實時監(jiān)測城市建筑變化,合理規(guī)劃城市布局提供科學的依據(jù)[1]。此外,當發(fā)生自然災(zāi)害,城市建筑受到大面積毀壞時,依靠人工調(diào)查取證無法及時評估災(zāi)害程度,基于SAR圖像的建筑物檢測方法能夠為災(zāi)情部門及時掌握城市建筑的毀壞程度提供技術(shù)支持。不僅如此,SAR圖像建筑物檢測方法在地表建筑識別、地理數(shù)據(jù)庫建設(shè)以及軍事偵察方面也存在著巨大的研究潛力[2]。

圖1 SAR圖像和光學影像建筑區(qū)域?qū)Ρ菷ig.1 SAR image and optical image building area comparison
早期在SAR圖像中進行檢測時需要消除噪聲對算法的影響,故形成了一類基于先驗假設(shè)的建模方法[3]。隨著雷達技術(shù)的不斷發(fā)展,高分SAR圖像中不僅存在著相干斑,而且表現(xiàn)出大量的紋理特征。研究者通過提取圖像紋理特征分析,結(jié)合機器學習分類方法可以實現(xiàn)對SAR圖像建筑物的檢測,但這類方法過于依賴人工設(shè)計的特征提取,魯棒性及泛化能力較差[4]。近幾年,深度學習因其強大的特征學習能力,在計算機視覺領(lǐng)域得到廣泛的應(yīng)用[5]。基于深度學習的目標檢測算法可以通過卷積層的相互結(jié)合[6],在背景模糊、地理環(huán)境復(fù)雜的條件下自動提取、學習SAR圖像中的建筑物特征[7],適用于當前遙感圖像復(fù)雜多變的場景,它克服了傳統(tǒng)SAR圖像建筑物檢測算法中檢測精度低、魯棒性差、檢測時間長等缺點,但對數(shù)據(jù)集的質(zhì)量和數(shù)量要求較高[8]。
本文分別從傳統(tǒng)方法和深度學習兩大方面對SAR圖像建筑物檢測方法進行了梳理和總結(jié),對現(xiàn)有方法的優(yōu)點和不足進行了討論,最后對該課題的研究趨勢做出展望。
結(jié)合成像雷達的發(fā)展歷程,基于傳統(tǒng)方法的建筑物檢測主要可以分為以下兩類:一是建模方法,二是基于紋理特征和機器學習的方法。基于建模方法的建筑物檢測主要是通過對SAR圖像建立一定的統(tǒng)計模型,并結(jié)合相應(yīng)的概率準則構(gòu)建目標函數(shù),對其優(yōu)化得到建筑物檢測結(jié)果,方法流程如圖2(a)所示。基于紋理特征和機器學習的方法,首先提取SAR圖像建筑物紋理特征,再用機器學習方法進行分類檢測。基于紋理特征和機器學習的方法主要流程如圖2(b)所示。

圖2 傳統(tǒng)方法流程圖Fig.2 Traditional method flow chart
由于建筑目標與背景之間存在著灰度差異,有研究者提出采用閾值取優(yōu)的方法對SAR圖像進行處理。趙凌君[9]采用CFAR[10](constant false-alarm rate)檢測和方向相關(guān)分析得到標記圖像,再利用最小強制技術(shù)和標記圖像修改原始圖像的梯度圖,將修改后的梯度圖做分水嶺變換得到建筑物目標的邊界輪廓。蘇娟等人[11]采用視覺注意模型對建筑ROI(region of interest)區(qū)域進行分割,然后提取ROI區(qū)域的高亮線條以及陰影區(qū)域,最后通過D-S證據(jù)理論注意焦點、高亮線條和陰影區(qū)域進行特征融合,實現(xiàn)建筑物目標的檢測。這一方法充分利用了建筑物目標與背景存在較大差異的特點,提高了建筑物目標檢測的精度,克服了特征提取不準確對檢測結(jié)果的影響,在降低虛警率方面存在明顯的優(yōu)勢。呂雁[12]將Fisher分布和Gamma分布相結(jié)合提出了一種SAR圖像分割方法,這種方法利用Fisher分布對具有強散射點的目標建模,Gamma分布對背景目標建模,再結(jié)合水平集分割SAR圖像,相較于其他方法更加適合具有強散射點的SAR圖像。上述利用選取最優(yōu)閾值的方法實現(xiàn)簡單、計算快,但是在面對多閾值分割檢測時,受相干斑噪聲的影響較大[13]。
在探索如何解決SAR圖像自帶的相干斑噪聲這一問題時,研究者們發(fā)現(xiàn)馬爾科夫隨機場(Markov random field,MRF)[14]模型可以利用局部相關(guān)性減小相干斑噪聲帶來的影響[15]。劉靜等人[16]引入自適應(yīng)權(quán)重系數(shù)改善鄰域系統(tǒng)對先驗?zāi)芰康挠绊懀肍isher分布對邊緣分布進行觀測,再根據(jù)MRF對圖像進行分類,最后利用面向?qū)ο蟮姆椒ㄌ崛〗ㄖ铩Gз坏热薣17]提出了一種基于相干系數(shù)-馬爾科夫隨機場的SAR建筑物分割算法,該方法將InSAR的相干系數(shù)引入到傳統(tǒng)MRF模型中,根據(jù)Hammersley-Clifford[18]定理將圖像分割的mAP問題轉(zhuǎn)換為最小似然和鄰域能量之和的問題,最后通過迭代條件模型得到最優(yōu)解。
此外,研究者們發(fā)現(xiàn)建筑物的散射特征區(qū)域與建筑物的幾何模型存在對應(yīng)關(guān)系。進一步研究發(fā)現(xiàn),通過幾何模型方法進行檢測也可以降低SAR圖像噪聲的影響。王國軍等人[19]將建筑物在SAR圖像上的散射特征與三維參數(shù)相對應(yīng),建立定量關(guān)系模型,再引入平行四邊形幾何模型作為約束條件,迭代找出最優(yōu)平行四邊形,最后完成建筑物圖像的提取。徐旭等人[20]利用Gabor特征以及模糊C均值方法對SAR圖像進行分割,再結(jié)合最小外接矩形提取、最小二乘法等技術(shù)提取SAR圖像中建筑物的L型結(jié)構(gòu)中心線,利用所得的中心線獲取建筑圖像的三維信息。
此外,研究者們發(fā)現(xiàn)主動輪廓模型在抑制SAR圖像噪聲方面也有不錯的效果。主動輪廓模型在SAR圖像建筑物檢測中也是常用的幾種模型之一。主動輪廓模型一般分為三類:邊緣模型[21]、區(qū)域模型[22]、兩者混合模型[23]。Chan等人[24]提出了無邊緣主動輪廓模型[25],這一模型雖然提高了輪廓演化的魯棒性,但是容易陷入局部最小值。賀志國等人[26]提出了基于變分法和偏微分方程的短程活動輪廓模型,該方法引入了ROEWA算子,并在新模型的能量泛函中加入了氣球力項,使得模型具有較好的檢測效果。
上述研究中,利用閾值分割的方法在高質(zhì)量圖像中能夠取得較好的檢測結(jié)果,但是在圖像噪聲較大時檢測結(jié)果較差。基于MRF模型的檢測方法多是通過引入鄰域節(jié)點來提高MRF模型對復(fù)雜圖像先驗知識的描述能力,這在一定程度上降低了圖像噪聲的影響,但是并未考慮局部區(qū)域能量的最小化問題,導(dǎo)致圖像分割結(jié)果常出現(xiàn)邊緣模糊,檢測結(jié)果也因此受到影響。而基于幾何模型以及主動輪廓模型的方法雖然也能降低圖像噪聲,但是這種方法無法準確檢測復(fù)雜背景下特征不明顯的建筑,適用范圍有限。雖然在一定程度上MRF模型、幾何模型以及主動輪廓模型算法有效地抑制了相干斑噪聲帶來的影響,但是在背景復(fù)雜、建筑風格差異性大的情況下,存在檢測速度慢、檢測精度低的問題。
總的來說,研究者從建模這一方向?qū)AR圖像建筑物檢測領(lǐng)域進行研究,降低了相干斑噪聲對圖像處理的影響,但是在檢測復(fù)雜背景下的密集建筑物時,檢測效率大大降低。
紋理特征描述了SAR圖像中建筑物的表面特性,利用灰度共生矩陣去進行紋理分析是最為經(jīng)典的特征分析方法之一。韓晶等人[27]利用灰度共生矩陣提取SAR圖像紋理特征,利用對數(shù)比值算子構(gòu)造差異影響,再利用期望最大(EM)算法對高斯混合模型進行參數(shù)估計,最后利用貝葉斯最小錯誤率對變化信息進行提取。徐佳等人[28]提出了一種利用灰度和紋理特征的SAR圖像建筑區(qū)提取方法,該方法通過灰度共生矩陣計算SAR圖像紋理特征,根據(jù)巴氏距離進行特征選擇,通過主成分分析去除紋理特征間的相關(guān)性,再利用K-means算法對圖像進行分類,最后對分類后的圖像提取建筑物。李婷等人[29]將半監(jiān)督鑒別分析算法應(yīng)用在SAR圖像的建筑物檢測中,該方法利用灰度共生矩陣計算SAR圖像中的紋理特征,結(jié)合半監(jiān)督鑒別分析算法進行特征提取,再將新特征作為大津法(Otsu)的輸入提取建筑物,最后對分類結(jié)果進行處理。Li等人[30]提出了利用類別共生矩陣(LCM)提取圖像特征的方法,并通過實驗證明其有效性。李強等人[31]提出了一種基于紋理特征主成分變換的相關(guān)性變化檢測方法,該方法首先提取圖像的多個紋理特征參量,其次采用主成分變換獲取多個紋理特征參量的第一主成分分量,然后計算第一主成分分量的相關(guān)性,最后根據(jù)實地調(diào)查樣本統(tǒng)計分類閾值對圖像中不同程度震害建筑物進行檢測。
以上研究方法的側(cè)重點多是對建筑的紋理特征提取方法進行優(yōu)化,而對機器學習分類器的優(yōu)化研究較少。吳天寶等人[32]利用SVM-SRC級聯(lián)決策融合實現(xiàn)SAR圖像的分類,該方法綜合了SVM及SRC的優(yōu)勢,提高了檢測性能。張肖敏等人[33]提出了基于改進PSO-SVM的SAR圖像分類識別方法,該方法通過調(diào)節(jié)PSO的異步學習因子,加強粒子的學習能力,避免粒子陷入局部最優(yōu),最終提高SAR圖像分類檢測的準確率。田淞等人[34]提出了一種基于原始特征空間的KM-SVM SAR圖像無監(jiān)督變化檢測。首先,在不需要任何先驗信息的條件下,利用K-means聚類方法獲取差異圖像的分類閾值。其次,利用閾值引入偏移量自動選取偽訓(xùn)練集和無標簽集,并用偽訓(xùn)練集定義SVM的初始決策超平面[35]。最后,用基于統(tǒng)計特征的半監(jiān)督學習算法和支持向量機相結(jié)合對圖像進行變化類與非變化類的分類。
基于紋理特征和機器學習的檢測模型的優(yōu)勢在于利用了更多的圖像信息,解決了建模方法在復(fù)雜背景下密集建筑物檢測效率低的問題,能夠保持較好的泛化性和魯棒性。但是這類方法同樣也存在一些問題,如特征提取步驟繁多、分類過程中容易丟失關(guān)鍵信息、缺乏實時性等。并且隨著建筑物紋理特征的差異性越來越大,單種特征提取的方法所獲取的紋理信息不夠全面,無法解決復(fù)雜環(huán)境下的密集建筑物的檢測問題。利用機器學習模型在一定程度上提高了建筑物檢測的精度,但由于這些方法的特征提取大都與分類器的設(shè)計有關(guān),這就使得模型在特征的提取上缺乏深度[36]。
深度學習是機器學習的進一步發(fā)展,因其強大的特征表達能力受到學者們的青睞。近年來,深度學習目標檢測算法發(fā)展迅速,逐漸替代了SAR圖像建筑物檢測的傳統(tǒng)方法,在SAR圖像建筑物檢測領(lǐng)域受到了越來越多的關(guān)注。依據(jù)檢測階段的不同,深度學習的目標檢測算法可以分為兩種,一種是基于候選區(qū)域的目標檢測算法,另一種是基于回歸的目標檢測算法。基于深度學習的目標檢測算法流程主要是利用神經(jīng)網(wǎng)絡(luò)對SAR圖像中的建筑目標進行特征提取進行分類訓(xùn)練,得到檢測模型,最后通過檢測模型完成建筑目標的檢測。
常見的基于候選區(qū)域的代表算法有SPP-Net、Mask RCNN、Fast RCNN、Faster RCNN等。基于候選區(qū)域的方法主要是先由算法生成一系列作為樣本的候選框,再通過卷積神經(jīng)網(wǎng)絡(luò)進行樣本分類[37]。
2.1.1RCNN系列算法介紹
2014年,Girshick等人[38]提出了RCNN算法,相較于傳統(tǒng)的目標檢測算法,RCNN取得了跨越性的進展,但是RCNN也存在模型訓(xùn)練繁瑣,檢測速度慢等一系列問題。2015年,Girshick[39]采納SPP-Net[40]算法的思想改進了RCNN,提出了Fast R-CNN算法,這種算法將SPP-Net算法中的SPP層簡化成ROI Pooling層,并且加入了多任務(wù)損失函數(shù)的思想。雖然Fast RCNN算法簡化了訓(xùn)練過程,提高了檢測速度,但是選擇性搜索(selective search)算法在找出所有的候選框時十分耗時。因此,2015年,Girshick等人[41]又提出了Faster RCNN算法,這一算法在Fast RCNN的基礎(chǔ)上加入了Region Proposal Network替代Selective Search,同時引入anchor box應(yīng)對目標形狀的變化,實現(xiàn)了真正意義上的端到端測試訓(xùn)練,提高了檢測效率。
2.1.2基于RCNN系列算法的建筑檢測
為了解決傳統(tǒng)方法在復(fù)雜場景中檢測效率低的問題,王利忠等人[42]提出了一種基于Faster RCNN的SAR建筑物檢測方法,利用CNN提取特征,利用RPN網(wǎng)絡(luò)提取可能的建筑物,最后通過檢測網(wǎng)絡(luò)對建筑物進行判別和分類。李東子等人[43]利用Faster RCNN模型設(shè)計了一種針對遙感影像的建筑物檢測方法,首先通過共享卷積網(wǎng)絡(luò)獲取原始影像的深層特征圖,再結(jié)合區(qū)域建議網(wǎng)絡(luò)生成初步檢測結(jié)果,最后根據(jù)Fast RCNN檢測網(wǎng)絡(luò)對結(jié)果進行進一步判定。
針對建筑物邊緣的紋理信息在使用原始網(wǎng)絡(luò)進行卷積的過程中存在丟失的問題,Bai等人[44]提出了一種基于改進的Faster RCNN遙感圖像建筑物檢測算法,該算法將DRNet和RoI Align結(jié)合,解決了區(qū)域不匹配的問題。左俊皓等人[45]提出將Faster R-CNN框架下的VGG16的模型與Level-Set算法相結(jié)合的方法,很好地解決了被遮擋建筑物難以檢測的問題。鄧瑞等人[46]利用改進后的Faster R-CNN作為訓(xùn)練模型對城市地標建筑物數(shù)據(jù)進行學習,在數(shù)據(jù)集充足的情況下可以取得較好的識別效果。馮杰婷等人[47]提出了一種基于Cascade RCNN(多階段級聯(lián)卷積神經(jīng)網(wǎng)絡(luò))的建筑物檢測方法,將經(jīng)典的Faster RCNN訓(xùn)練結(jié)果作為基準實驗數(shù)據(jù),充分考慮檢測中正負樣本選取,使用不同交并比導(dǎo)致的分類器和回歸器的表現(xiàn)效果不同,以整體提升遙感圖像建筑物目標檢測的召回率和精度。
隨著RCNN系列算法的發(fā)展,有學者已經(jīng)不滿足于在Faster RCNN算法上做改進優(yōu)化,而是將目光轉(zhuǎn)向更高水平的Mask RCNN架構(gòu)。相較于Faster RCNN,Mask RCNN引入了RoI Align代替Faster RCNN中的RoI Pooling,并且引入了語義分割分支,實現(xiàn)了Mask和Class關(guān)系的解耦。付發(fā)等人[48]將Mask RCNN應(yīng)用到遙感圖像的建筑物檢測中,通過與KNN、SVM等建筑物提取方法進行對比可以看出,使用Mask RCNN[49]算法的建筑物檢測的查全率以及查準率均高于這兩種方法。雖然Mask RCNN算法非常靈活,可以完成目標檢測、目標分類、語義分割等多個任務(wù),但是無法獲取同一目標多角度、多方向的紋理特征。針對這一問題,瑚敏君等人[50]通過對其特征提取及掩膜分支結(jié)構(gòu)的改進降低了路徑中因采樣造成的混疊效應(yīng)的影響,并提高了掩膜預(yù)測的精度。將改進后的網(wǎng)絡(luò)結(jié)構(gòu)在建筑物數(shù)據(jù)集上進行模型訓(xùn)練,并與Mask RCNN網(wǎng)絡(luò)的預(yù)測結(jié)果進行對比分析,發(fā)現(xiàn)其mAP值有一定的提升。Zhang等人[51]提出將ResNet50網(wǎng)絡(luò)作為預(yù)訓(xùn)練模型,采用交叉訓(xùn)練的方法訓(xùn)練模型,再利用訓(xùn)練好的模型進行建筑提取,最后通過對遙感圖像的邊緣特征進行分割,通過分割的結(jié)果對上一步的建筑提取結(jié)果進行優(yōu)化,解決了深層卷積神經(jīng)網(wǎng)絡(luò)在語義分割中的邊緣提取和對象的完整性問題。何代毅等人[52]在Mask RCNN網(wǎng)絡(luò)的設(shè)計中添加了路徑聚合網(wǎng)絡(luò)和特征增強功能,通過監(jiān)督和遷移學習的方式對Inria航空影像標簽數(shù)據(jù)集進行多線程迭代訓(xùn)練與模型優(yōu)化學習,實現(xiàn)了建筑物的自動精確分割和檢測。相較于Faster RCNN算法,Mask RCNN不但可以獲取檢測建筑物目標的定位框,而且能夠獲取建筑物輪廓的二值Mask,為以后進一步獲取建筑物的輪廓邊緣提供了可能,但是當小型建筑物存在疊掩問題時,檢測結(jié)果不佳,需要對算法進一步地優(yōu)化。
針對上述問題,李大軍等人[53]提出了增強訓(xùn)練樣本,利用ResNet+FPN結(jié)構(gòu)提取目標特征的方法,提升了建筑物密集層疊區(qū)域小型建筑物的檢測精度。趙若辰等人[54]對Mask RCNN模型中的特征提取網(wǎng)絡(luò)進行了改進,設(shè)計了一種帶有注意力機制的多尺度組卷積神經(jīng)網(wǎng)絡(luò),有效解決了小目標有用特征較少且易被背景特征和噪聲干擾的問題。
以上研究主要是對基于候選區(qū)域算法的特征提取網(wǎng)絡(luò)以及檢測網(wǎng)絡(luò)進行修改,解決了檢測過程中的信息丟失、多角度特征難提取、小型建筑物難檢測等問題。雖然改進后的算法檢測精度較高,但是由于算法機制的原因,實時性差,在工程上應(yīng)用較少。
基于回歸的目標檢測算法一般主要分為YOLO[55]系列算法和SSD[56]算法。
2.2.1YOLO算法介紹
2015年,YOLO算法的提出,使得輸入圖像只需要一次網(wǎng)絡(luò)計算就可以得到檢測目標的邊界框和分類概率。2017年,YOLOv2[57]的提出解決了YOLO算法中召回率低以及定位精度差等一系列問題,它在YOLO算法的基礎(chǔ)上移除了全連接層,利用卷積層來預(yù)測檢測框的位置偏量和分類信息。2018年,Redmon等人[58]受到殘差網(wǎng)絡(luò)中跳躍連接的啟發(fā),提出了YOLOv3算法,它在YOLOv2的基礎(chǔ)上搭建了DarNet-53網(wǎng)絡(luò)結(jié)構(gòu),并采用3種不同尺度的特征圖來進行目標檢測,同時將YOLOv2中的softmax方法替換為logistic回歸,這樣使得在預(yù)測類別時,每個候選框都能預(yù)測多個類別。相較于YOLOv2,YOLOv3在目標檢測任務(wù)中性能表現(xiàn)最為突出,因此也飽受研究者們的青睞,將其應(yīng)用到SAR圖像建筑物檢測中。
2.2.2 YOLO及SSD算法應(yīng)用
李響等人[36]針對SAR建筑物檢測提出了S-YOLOv3算法,通過K-means算法對SBD數(shù)據(jù)進行重新聚類,如圖3所示,得到適合SAR建筑物數(shù)據(jù)的預(yù)設(shè)錨點框,在原YOLOv3算法的DarNet-53網(wǎng)絡(luò)基礎(chǔ)上增加輪廓信息比重,改進殘差網(wǎng)絡(luò)的結(jié)構(gòu),提高了SAR圖像建筑物檢測識別的精度和召回率。針對回歸算法檢測速度快,但是精確度低的問題,成喆等人[59]將RPN網(wǎng)絡(luò)與SSD算法結(jié)合,并加入特征金字塔結(jié)構(gòu),利用多個卷積層融合低層信息和高層信息,在保持速度的同時,提高了精確度。

圖3 預(yù)設(shè)錨點框?qū)ㄖ锬繕说淖饔梅秶鶩ig.3 Scope of action of preset anchor box on building target
針對小型建筑檢測難的問題,有學者也利用回歸的算法進行了相應(yīng)的研究。董彪等人[60]對YOLOv3進行了以下改進,首先修改了特征圖分辨率,其次調(diào)整了數(shù)據(jù)集先驗框維度,該方法加強了對小型建筑物的檢測精度和速度。謝逸群等人[61]在YOLOv3框架的基礎(chǔ)上提出了一種locally-constrained(LOCO)框架來檢測小型建筑物,這種檢測方法使用約束回歸模型提高了建筑物檢測的魯棒性。張青華等人[62]采用SSD網(wǎng)絡(luò)架構(gòu)的特征提取網(wǎng)絡(luò)層級,使用更多尺度的特征提取層進行檢測,同時使用Adam優(yōu)化算法進行訓(xùn)練,提高對遙感影像小目標的識別精度。蔡燕等人[63]以改進的DCL算法處理遙感影像,實現(xiàn)了區(qū)塊劃分,再對各區(qū)塊的顯著性區(qū)域進行提取。同時利用深度學習SSD網(wǎng)絡(luò),針對密集小目標,進行了目標數(shù)量及間距占比研究,并得出定量關(guān)系,提高了小目標檢測的精度。以上方法解決了YOLO和SSD算法檢測小型建筑物困難的問題。
上述研究對基于回歸算法的特征提取網(wǎng)絡(luò)進行了一定的改進,特別是針對YOLO、SSD算法檢測小型建筑能力弱的問題進行了相應(yīng)的改進,提高了回歸算法檢測小型建筑物的能力。
基于模型方法的檢測算法中,研究者需要抑制SAR圖像自有的相干斑噪聲去進行檢測,在面臨多建筑圖像時檢測效率較慢。
基于紋理特征和機器學習的方法在一定程度上改善了這一問題,該類方法利用灰度矩陣對圖像特征進行分析,再利用機器學習分類器建立模型實現(xiàn)對圖像的檢測,但是這類方法的特征提取大都與分類器的設(shè)計有關(guān),這就使得模型在特征的提取上缺乏深度,無法進一步提高檢測精度。
基于深度學習目標檢測算法主要是依賴于CNN強大的特征表達能力,可以提取建筑物目標更高層次的語義特征,在復(fù)雜背景下的檢測性能優(yōu)異。相較于傳統(tǒng)方法,檢測效果明顯,但是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中加入了大量的參數(shù),并且在進行深度學習模型訓(xùn)練時需要大量數(shù)據(jù),計算過程繁重。此外,數(shù)據(jù)集的質(zhì)量會直接影響深度學習算法的檢測性能。Mask RCNN算法是當前SAR圖像檢測應(yīng)用較為廣泛的二階算法之一,該算法可實現(xiàn)SAR圖像中的建筑物目標的語義分割,并且解決了Faster RCNN、YOLO、SSD等算法在檢測過程中出現(xiàn)的檢測框信息冗余問題,但是受檢測速度的影響,Mask RCNN算法在工程應(yīng)用中并不多見。目前,實際工程應(yīng)用較多的是YOLO算法,由于算法機制的不同,YOLO算法檢測速度較快。針對SAR圖像中的小型建筑物檢測精度低的問題,上述研究主要從數(shù)據(jù)增強、多尺度特征融合、錨框設(shè)計、上下文學習四個方面來提高小型建筑物的檢測精度。表1對上述建筑物檢測的主要方法進行了總結(jié)歸納。表2從四個方面對小型建筑物檢測的優(yōu)缺點進行了歸納總結(jié)。

表1 不同SAR圖像建筑檢測方法比較分析Table 1 Comparison and analysis of building detection methods in different SAR images

表2 小型建筑物檢測方法比較分析Table 2 Comparative analysis of detection methods for small buildings
結(jié)合當前SAR圖像建筑物檢測方法的研究現(xiàn)狀,在未來可以從以下幾方面展開后續(xù)研究:
(1)如何獲取高質(zhì)量的SAR圖像建筑數(shù)據(jù)集。目前,在SAR圖像解譯這一領(lǐng)域缺乏大規(guī)模、高質(zhì)量的數(shù)據(jù)集。當前數(shù)據(jù)集里的許多小目標、模糊目標沒有被標注出來,限制了現(xiàn)有算法的潛力[64]。生成式對抗網(wǎng)絡(luò)作為一種生成模型,具有很強的數(shù)據(jù)擴充能力,研究基于生成式對抗網(wǎng)絡(luò)的數(shù)據(jù)增強方法,能夠提高數(shù)據(jù)集的完備性,使模型具有更好的泛化性[65]。
(2)如何解決小型建筑檢測難的問題。在SAR圖像中由于小型建筑所攜帶的特征少,所以在利用深度學習目標檢測算法進行檢測時難以檢測[66]。現(xiàn)有的方法多是通過融合網(wǎng)絡(luò)中的多尺度特征來提升小目標的特征表達能力,但是并未考慮到融合過程中語義間隔和噪聲干擾的問題[67]。因此,如何消除語義間隔和噪聲干擾問題也是未來研究的趨勢。
(3)如何解決大型目標精細檢測的問題。目標精細化檢測是在目標識別的基礎(chǔ)上,進一步對目標的組成、狀態(tài)、分布等開展解譯分析[68]。目前,SAR圖像建筑物檢測技術(shù)只針對建筑物這一單一目標進行檢測,并未對圖像中的大型建筑進一步解譯。因此,利用深度學習目標檢測算法對大型建筑物的進一步解譯也是未來遙感影像領(lǐng)域研究的趨勢。
隨著SAR圖像建筑目標檢測算法的不斷發(fā)展,深度學習算法將被更廣泛地應(yīng)用于SAR圖像建筑物檢測。本文將SAR圖像建筑目標檢測方法分為傳統(tǒng)方法以及深度學習兩個方向,對這兩個方向使用的方法分別進行了梳理和總結(jié),最后對該領(lǐng)域未來的研究方向進行了討論,希望為之后的研究者提供有益參考。