基于UNet網絡的高分辨率遙感影像建筑物提取

2023-07-10 14:33:19屠冉

計算機應用文摘 2023年11期

關鍵詞：高分辨率遙感影像；深度學習；建筑物提取；UNet網絡

中圖法分類號：P237 文獻標識碼：A

高分辨率遙感影像覆蓋范圍大、信息量大、更新速度快，對于地面信息的獲取十分重要。目前對高分辨率遙感影像建筑物的有效提取是城市遙感影像的主要研究方向，一方面，對建筑物的精確提取有利于城市變化監測、三維建模、智慧城市建設等領域的深入應用和擴展，以及在城市空間數據庫的建設方面都具有重要價值；另一方面，對高分辨率遙感影像建筑物的提取可以為其他圖像的語義分割和目標檢測方面提供借鑒，具有重要意義和價值。

利用遙感影像進行建筑物提取根據自動化程度分為人工提取、半自動化提取和自動化提取3個階段。文獻[5]針對高分辨率遙感影像自動化解譯技術難度大、適用性差等問題，提出人工目視解譯為遙感影像解譯的主要方法，但目視解譯需耗費大量時間和精力，且精度難以達到要求。此后引入半自動化提取方法，如SVM算法、K-means聚類算法等。如今，深度學習成為圖像識別、提取中效果最好的方法。本文以高分辨率遙感影像為數據源，提出基于UNet網絡模型進行建筑物提取，此模型延續了CNN卷積網絡的特征，能夠有效把握局部特征信息。采用公開建筑物數據集——馬薩諸塞州建筑物數據集進行實驗驗證本文方法的適用性。

1方法

1.1 UNet網絡

UNet網絡如圖1所示，UNet網絡結構由編碼器和解碼器2部分組成。編碼器部分采用CNN卷積神經網絡，用于圖像的下采樣過程，采用5個池化層，在不斷的下采樣過程中不斷地降低分辨率，以獲得不同尺度的圖像信息，完成特征提取。解碼器部分對應的是特征圖上采樣過程，進行目標對象的定位，上采樣過程先進行一次反卷積操作，使特征圖的維數變為原來的1/2，然后通過跳躍連接將下采樣過程中得到的特征圖進行拼接，重新組成新的特征圖，新特征圖是原來的2倍，最后再采用2個卷積層進行對特征圖進行特征提取。

CNN因為受感受野的影響，不能很好地利用全局信息，需要很多層后才能得到抽象的全局信息。因此，將UNet網絡應用于背景復雜的高分辨率的遙感影像建筑物提取任務中，可以有效對全局信息和局部的細節信息進行提取。本文提出把UNet方法用于高分辨率的遙感影像建筑物提取。

2實驗數據

2.1數據介紹

本文選取的數據集為馬薩諸塞州建筑物數據集，地面分辨率降采樣為0.3 m，選取的馬薩諸塞州地區大約有2.2萬棟獨立建筑物。

2.2數據處理

對獲取的數據集進行數據擴充處理，以便提高樣本質量，使訓練出來的模型效果更好。把擴充后的數據集按精度高低篩選最優的數據集，共4 000幅影像，并劃分為訓練集（2800幅）、驗證集（600幅）和測試集（600幅）3個部分。

3實驗與算法評價

3.1硬件配置和參數設置

本文UNet模型的建筑物提取實驗基于Pytorch框架進行，硬件配置采用NVIDIA Geforce RTX2060，網絡優化器采用Adam，學習率設為0.0001，每個網絡模型訓練50次迭代，batch size值設為16。UNet模型的損失收斂函數與精度曲線變化如圖2所示。可看出在模型訓練過程中，訓練精度和測試精度隨著迭代次數的增加在逐步上升，約在第15次以后ACC趨于穩定，維持在96. 85%左右；Loss值也在不斷下降，最終穩定在0.016左右。

3.2評價指標

本文選擇總體精度（OA），Fl-score，m，loU，Recall作為分割效果的評估標準。OA在文中為圖像中預測正確的建筑物和背景像元占所有像元的比例：Fl-score是精確率：mloU在文中計算的是真實建筑物標簽與模型提取的建筑物之間的交并比：Recall計算的是真實建筑物標簽與模型提取的建筑物之間的交并比。各評估標準公式為：

其中，T_TP為輸入圖像中含有標簽信息的部分被正確識別為相對應的標簽信息，本文指提取到實際建筑物的個數；T_TN為輸入圖像中含有背景信息的部分被正確識別為相對應的背景信息；F_FP為輸入圖像中含有背景信息的部分被錯誤識別為標簽信息；FFN為輸入圖像中含有標簽信息的部分被錯誤識別為背景信息。

4實驗結果與分析

4.1可視化結果分析

幾種提取方法在2種建筑物數據集上的邊緣提取效果對比如圖3所示。對于SVM算法，其在2種建筑物數據集上的提取表現均不理想，提取結果存在大量噪聲，細碎斑點較多，且對于一些復雜的地物劃分不明確等問題。FCN和CNN方法在2棟相連建筑物的邊緣部分提取上邊緣未分離，出現了連接，圖3的邊緣提取不夠清晰。而本文方法在圖3中較好地識別了連接部分，對相鄰2棟建筑物較好地完成了分離。圖3中傳統方法在建筑物提取上出現漏檢的問題，而本文方法在小型建筑物提取上表現更出色。

總體來說，UNet方法與傳統提取方法相比，在影像邊緣細節的分類效果上更優，對建筑物的邊緣把控得更好，輪廓更清晰。

4.2精度分析

以O_OA，M_mIoU，R_Recall和F_F1值作為評估標準對馬薩諸塞州數據集建筑物提取結果進行定量化分析，結果如表1所列。結果表明，SVM決策樹算法在高空間分辨率遙感影像建筑物的提取方面總體精度較低，提取效果不理想。與SVM決策樹算法相比，深度學習方法——FCN和CNN方法的各個指標值遠優于SVM決策樹算法，但仍存在部分細微建筑物被忽略的問題。本文方法相較于SVM決策樹算法和FCN，CNN方法在各項指標上均有所提高，其表現在對建筑物邊緣及細小建筑物提取方面的改進，對細小建筑物的提取以及對邊緣細節處理更加完善。

5結束語

本文提出一種基于UNet網絡模型的高分辨率遙感影像建筑自動提取方法，使用數據集為馬薩諸塞州建筑物數據集，完成數據集的擴充和篩選、UNet模型訓練、建筑物提取以及精度評估，通過實驗證明了本文方法可以有效地實現高分辨率遙感影像建筑物提取。

本文提出的UNet方法以及FCN和CNN三種分類算法對高分辨率遙感影像進行建筑物分類提取的結果中，總體準確率超過90%，相比之下本文方法提取的結果在邊緣細節的把控上效果更優，漏檢的小型建筑物也大幅減少。綜上所述，通過對以上4種分類算法所得到的結果進行定性和定量分析，基于UNet網絡對建筑物的提取效果更好、精度更高，具有一定的可行性和有效性。目前，基于UNet網絡建筑物提取方法有時在面對遙感影像建筑物提取時魯棒性不夠強，且模型訓練時間較長，后續研究中將對該處理步驟進行進一步的研究和優化。

作者簡介：

屠冉（1981—），碩士，研究方向：電子信息工程。