







摘 要: 復雜場景分類是遙感圖像解譯的一項重要內容。本文通過優化ResNet18 深度殘差網絡和隨機森林,實現了遙感圖像復雜場景的高精度分類。首先通過數據擴充將數據庫擴充以緩解因訓練樣本少帶來的過擬合問題,然后采用ResNet18 深度殘差網絡自動提取遙感圖像場景特征,最后使用隨機森林分類器實現復雜場景分類任務并分別在NWPU-RESISC45 和UC Merced Land Use 數據庫上進行了實驗。結果表明,本文模型場景分類準確率分別為98.86%和99.17%,與單獨使用ResNet18 深度殘差網絡相比,本文模型分類準確率分別提高3.36%和1.71%,相比于其他場景分類方法,本文模型分類準確率分別提高5.23%和1.55%。
關鍵詞: 數據擴充;深度殘差網絡;隨機森林;遙感圖像;場景分類
中圖法分類號: TP751.1 文獻標識碼: A 文章編號: 1000-2324(2024)03-0376-09
遙感技術的飛速發展使得遙感圖像向實時、高分辨率、海量方向發展,海量遙感圖像中隱藏著大量的有價值信息。遙感圖像場景分類是解譯遙感圖像以獲取有價值信息的一項重要內容,土地覆蓋類型及遙感圖像富含的有價值信息很大程度上反映出人類生活及生產規律,在自然資源監測監管[1]、土地利用[2]、城鄉規劃[3]等領域有著重要的研究意義和價值。
基于遙感圖像的場景分類方法主要包括傳統機器學習算法和深度學習算法。傳統機器學習方法,如k-means[4]、粒子群優化算法[5]、人工神經網絡[6]、支持向量機[7]、決策樹[8]等方法在場景分類任務上表現出不錯的效果。但這類方法對樣本具有一定的要求,通常需要樣本滿足某些條件,或需要根據場景分類任務人工提取不同方面的特征,特征定義的全面程度直接影響了傳統機器學習算法分類識別效果。為克服傳統機器學習方法需手動提取特征的瓶頸,以卷積神經網絡(Convolutional Neural Network,CNN)為代表的深度學習算法應運而生并被廣泛應用到遙感圖像處理的各個領域,如變化檢測[9]、場景分類[10]、語義分割[11]、病蟲害識別[12,13]等。CNN通過前向傳播提取圖像“由淺及深”的特征并計算學習誤差,結合反向傳播更新網絡參數。如此迭代學習,使得CNN 在大數據量、背景情況復雜及類間差異小的條件下也無需事先設定描述場景的特征和分類器即可實現自動識別任務。2017 年,Cheng 等[14]驗證了CNN 比傳統機器學習算法在NWPU-RESISC45 數據庫下45 類場景分類的效果更優,同時驗證了ResNet 網絡在經典CNN網絡中的遙感場景分類任務上表現更為出色。Wei 等[15]通過數據擴充手段將數據庫擴充并利用改進GhostNet 網絡在NWPURESISC45[14]和UC Merced Land Use[16]兩組數據庫下實現了45 類場景和21 類場景的分類任務。張艷月等[17]提出一種基于雙通道密集特征的遙感影像場景分類方法,通過提高特征的有效利用率實現場景圖像的高精度分類。張康等[10]在淺層網絡AlexNet 基礎上進行改進,對比了Softmax 和SVM兩種分類器在UC Merced LandUse數據庫下場景分類的效果,但因樣本少導致兩種分類器的場景分類效果仍有待提升。龔希等[18]通過詞袋模型充分融合UC Merced Land Use 數據庫場景圖像局部信息特征和全局信息特征,通過支持向量機實現了97.62%的場景分類準確率。張曉男等[19]提出一種基于集成卷積神經網絡場景分類方法,通過集成多個CNN網絡實現了較優的分類效果,但集成模型的訓練需要更多的時間和計算資源。章晨等[20]在深度殘差網絡的基礎上引入1×1 卷積進行特征整合,實驗表明在NWPU-RESISC45 數據庫下分類準確率達到93.63%,較集成卷積網絡得到了一定程度的提高。
復雜場景高精度自動分類任務的核心在于樣本數量、樣本特征提取和分類器選擇的有效組合。樣本數量決定了模型學習的全面程度,圖像樣本有效特征的提取和分類器的組合直接決定分類效果。本文搭建了基于ResNet18[21]和隨機森林[22]的遙感圖像復雜場景分類模型。針對現有數據庫存在的樣本少的問題,利用數據擴充手段將樣本數量擴充至原數據庫的12 倍,以提升模型學習的能力;在樣本特征提取上,針對傳統機器學習方法人工提取特征問題,本文引入ResNet18 深度殘差網絡自動提取場景圖像不同層次特征。ResNet18 深度殘差網絡不但能夠提取顏色、紋理、邊緣等淺層特征,同時也能夠在淺層特征的基礎上提取到更為抽象的高層語義特征,充分挖掘圖像的有價值信息;在分類器選擇上,選取適用于處理大數據量和高維數據的隨機森林進行場景分類。與SVM相比,隨機森林在訓練速度,擬合能力和計算成本方面更強大[23]。實驗結果證明,本文方法在NWPU-RESISC45 和UC Merced Land Use 兩組數據庫能夠實現45 類場景和21類復雜場景高精度自動分類。
1 遙感圖像復雜場景分類方法的建立
遙感圖像復雜場景分類流程如圖1 所示,具體流程包括主要數據擴充、特征提取和場景分類。基于NWPU-RESISC45 和UC Merced LandUse 兩數據庫進行數據庫擴充,將擴充后的數據庫按8∶1∶1 的比例劃分為訓練集、驗證集、測試集。訓練集和驗證集輸入到ResNet18 深度殘差網絡迭代泛化訓練出優化的ResNet18 模型。將優化的ResNet18 模型全連接層截斷,作為場景分類的特征提取器。將訓練集、測試集輸入到特征提取器提取特征并進行歸一化處理,最后放入隨機森林進行訓練學習并實現分類任務,統計分類結果。