劉自增 張德政 姚建華 嚴瑾 黃濤
1. 寧夏回族自治區遙感調查院 寧夏 銀川 750000;2. 北京科技大學 北京 100083
基于預處理后合成好的高分影像,對目標像素進行地物分類所用的網絡結構如圖1所示。將目標像素的鄰域尺寸設定為24×24并輸入卷積神經網絡,先后經過兩次卷積、池化對輸入圖像提取特征后,傳入全連接層和Sigmoid分類器,得到目標像素的地物類別。該方法先利用卷積神經網絡進行逐像素地物分類,再對比兩時相影像的地物分類結果,得到地貌變化區域,屬于分類后變化檢測。
圖1 逐像素地物分類的網絡結構示意圖
傳統鄰域矩陣特征存在噪點多、偽檢多的不足,分析原因是鄰域特征尺度單一導致的,由此對特征構造方法做出改進,本章提出基于圖像金字塔的多尺度變化檢測方法。圖像金字塔可對同一影像進行多尺度描述,它的本質是利用高斯模糊平滑數據后,下采樣濃縮數據,所以金字塔上層影像不僅在一定程度上保留原始影像的概貌,并且尺度更高,同一像素的多尺度信息可基于此提取[1-2]。
圖2展示融合多尺度信息的鄰域矩陣特征的構造流程。為簡化表示,將鄰域矩陣展平得到的一維向量用三個像素表示,代表RGB三通道特征。
圖2 融合多尺度特征的鄰域矩陣特征構造示意圖
相較傳統鄰域特征構造方式,本章提出的融合多尺度信息的特征構造方式具有如下優點:
第一,整合目標像素在高斯金字塔不同層上的觀測結果,將其匯總為一個向量,則特征向量中整合了目標像素的多尺度信息;
第二,多尺度信息的融合降低了鄰域矩陣尺寸選取的困難,相當于一個特征向量上整合了不同尺寸鄰域的信息,則不用過度受困于鄰域尺寸的選取問題;
第三,單時相影像提取的多尺度鄰域特征包含9個通道、3個尺度的鄰域信息,更充分利用原始影像的多尺度特征;
第四,多尺度信息幫助模型從低、中、高不同視角觀測目標區域,改善了目標像素屬于不同尺度地類或目標像素為噪點時,單一尺度鄰域特征難以幫助模型有效變化檢測的問題,從多尺度觀測該像素,可對該像素所屬地貌或是否為噪點由更全面、詳盡的把握,可以有效避免偽變化檢測問題。
在變化檢測中,易分類樣本通常有兩種情況:一是前后地貌一致,并且外界成像因素對該地貌影響不大的未變化地域;二是前后地貌差異明顯,所構建特征向量十分不同的變化區域。模型應重點學習難分類樣本,即預測概率接近0.5的樣本,這類樣本的預測結果會因訓練集、模型甚至參數的改變而產生明顯差異,是體現算法和模型性能的關鍵[3]。
為改善變化檢測數據集固有的正負樣本不均衡問題,并幫助模型重點學習難分類樣本,以提升變化檢測效果。本章提出將Focal loss作為SDAE模型的損失函數,有三點好處:
第一,從模型層面而非特征層面改善對變化地貌學習的質量;
第二,模型注重少量變化樣本的學習,將幫助其提高變化發現能力,提升樣本的召回率;
第三,模型注重難分類樣本的學習,樣本的分類精準率應有所提升,使得精準率和召回率之間的效益背反影響盡可能小,以提升SDAE變化檢測的綜合性能。
本節進行兩組實驗,第一組實驗以多尺度紋理變化檢測為基礎方法,以原始影像和三類標簽構成訓練集,利用本章提出的三類標簽配套訓練方法,對模型訓練并預測,將其檢測結果與利用常規標簽訓練模型并檢測的結果對比,評估二者在各項指標和主觀視覺上的差異。第二組實驗分別利用交叉熵與Focal loss作為損失函數訓練模型,對比二者變化檢測效果的差異。
本實驗將標簽修改為三類標簽,訓練方法修改為本章提出的三類標簽配套訓練方法,對融合多尺度光譜和紋理特征的SDAE進行訓練,鄰域尺寸設定為3×3|5×5、5×5|7×7、7×7|9×9三種尺寸對,分別訓練、預測后,對各項檢測指標取平均,以表征算法的綜合效果,將其與常規標簽訓練模型檢測的各項指標對比,結果如表1:
表1 常規標簽與三類標簽訓練模型的效果對比
利用三類標簽訓練模型后,模型變化檢測的精準率提升,作者分析原因是:三類標簽構造法有益于提高標簽的準確率,檢測影像上的噪點顯著減少,精準率提升,房屋和道路的輪廓更加清晰,變化區域的整體性更強,對偽檢的魯棒性提升,檢測結果圖更加純凈,勢必會提升模型變化檢測的能力。但是利用三類標簽訓練模型會讓召回率小幅下降,作者分析原因是:由三類標簽構造的樣本會損失部分地貌,導致用于模型訓練的地類不如常規標簽豐富,召回率降低。綜合而言,利用三類標簽進行訓練,提升了模型的變化檢測精度,F1 score有所上升。
本實驗以融合多尺度光譜和紋理特征的SDAE變化檢測為基礎模型,利用三類標簽法訓練模型,對比常規損失函數與Focal loss損失函數對模型檢測效果的影響。實驗結果如表2所示:
表2 交叉熵與Focal loss作為模型損失函數的效果對比
將損失函數改進為Focal loss后,召回率明顯提升,因為Focal loss用于解決兩類問題:第一,正負樣本不均衡問題,它給予少量樣本更大的權重,當模型對少量樣本分類錯誤時,將受到更大的懲罰,所以不得不注重對少量樣本的學習;第二,難分類樣本學習不足的問題,Focal loss根據模型對樣本預測的類別概率,判斷樣本的難易分類程度,認為概率趨于0.5的是難分類樣本,給予這類樣本更大的損失權重,迫使模型注重難分類樣本的學習。變化檢測中,變化樣本是少量樣本,地貌變化復雜、僅靠基礎特征難以判斷變化與否的樣本是難分類樣本。將損失函數改進為Focal loss后,模型對變化樣本的發現能力提升,召回率提升。召回率和精準率之間存在效益背反,引入新的特征輔助模型判決,保證二者均有提升,正因Focal loss注重難分類樣本的學習,益于模型精準分類,才使精準率沒有大幅下降。F1 score有所提升,說明模型綜合檢測能力增強,損失函數的改進是有效的。
作者將損失函數改進為Focal loss后,模型更注重難分類樣本的學習,在訓練時若該類樣本被頻繁預測錯誤,預測概率趨近0.5,模型將給予其很大的樣本權重,以重視對該類變化的學習,而抵消樣本量少產生的影響。由檢測結果可知,修改損失函數后,模型檢測的變化區域更完整、連通,召回率得以提升。
本文結合圖像金字塔算法,提出一種融合多尺度特征的變化檢測算法。將同一像素在不同尺度上的鄰域特征相融合,構成一個包含低、中、高多尺度特征的向量,輔助模型進行變化檢測。融合高尺度特征后,模型具有更大的視野,由于視野局部而產生的噪點得以減少,檢測影像的視覺效果更加純凈。由此,降低模型對鄰域尺寸選取的依賴,適用于同一鄰域尺寸不同地物類型的變化檢測。本研究具有一定的通用性,研究的技術不僅可以用于土地利用變化的檢測,也可用于土地調查、城市規劃、農業測量、地表水域及和自然環境監測等領域,具有非常重要的意義。