● 黃麗虹,何 晶
(廣西自然資源調查監測院,廣西 南寧 530200)
隨著遙感對地觀測技術的快速發展和無人機的普及,亞米級、厘米級的高分辨率遙感影像不斷被獲取,這為地表信息變化的快速發現提供了精確的數據來源。隨之而來的是高分辨率遙感影像以每日TB 級的數據量持續增加,已經遠超傳統人工處理的能力。但高分辨率遙感影像分類中存在特征選擇困難和空間信息缺乏等問題,傳統依靠光譜信息的遙感解譯方法很難滿足當前的分類需求,使得面向高分辨率遙感影像的快速解譯方法的研發日益緊迫。
近年來,以深度學習為代表的土地利用快速分類提取成為研究者的關注方向,在高分辨率影像分類的應用中取得了一定的成果[1]。但是,傳統的卷積神經網絡具有存儲開銷大、計算效率低等不足,通常只能提取一些局部的特征,分類性能受到一定限制[2]。
U-Net 模型是在FCN 基礎上進行的延伸,相較于CNN、FCN、SegNet 等網絡層數更深,有利于獲得更多、更深層次的影像特征,加上其具有反復卷積以及融合低層次與高層次特征圖的跳躍連接結構,可以更好地保持影像特征在經過多次卷積和池化后的原有特征[3]。隨著遙感技術和地球觀測技術的不斷發展,航空和衛星圖像數據急劇增加,影像分辨率不斷提升,超高分辨率遙感影像占比越來越大,數據處理的數量和難度也逐漸增大[4]。高分辨率遙感影像在提高質量的同時,其類內差異大、光譜信息相對欠缺的特點也對高效、準確地進行遙感影像分類提出新的挑戰[5]。目前U-Net 模型在遙感影像分類、醫學等方面具有突出的表現,研究小組使用GF-2 號衛星遙感影像,基于U-Net 模型對廣西南寧市隆安縣那桐鎮進行地表覆蓋自動提取與分類實驗。研究區地處桂西南巖溶山地,兩面高山環繞,中部沿右江河谷較低,呈北西至南東方向弧峰殘丘帶狀平原,同時兼具廣西典型的丘陵地和喀斯特地貌。
研究小組基于U-Net 模型對高分辨率遙感影像分類方法進行試驗,具體作業流程如圖1 所示。

圖1 土地利用快速分類檢測作業流程圖
研究小組采用1 m 分辨率高分二號衛星(GF-2)遙感影像進行實驗。GF-2 是我國自主研制的首顆空間分辨率優于1 m 的民用光學遙感衛星,搭載有2 臺高分辨率1 m 全色、4 m 多光譜相機,具有亞米級空間分辨率、高定位精度和快速姿態機動能力等特點。使用GF-2 衛星影像,經過融合、裁剪等操作后,得到一景待分類影像。
深度學習遙感影像解譯的基礎是訓練樣本庫,深度學習的含義實質上就是讓深度神經網絡對大量樣本的深層特征進行學習后,使其掌握泛化能力強的語義特征,從而具備影像語義分割能力。因此,構建包含大量、高精度的樣本數據的樣本庫是取得理想分類結果的基礎。
(1)建立土地利用分類矢量及柵格圖層。研究小組根據土地調查的常用分類,將土地利用類型分為水系、林地、居民地、耕地等4 類,以這個分類為基礎,對處理好的GF-2 影像進行矢量數據采集,共采集了覆蓋面積為4 km×4 km 的矢量數據(見圖2)。

圖2 影像及土地利用分類矢量圖層圖
(2)制作標簽。利用ArcGIS 的轉換工具將土地利用分類矢量圖層轉換成柵格,按照水系、林地、居民地、耕地等不同類型給柵格屬性賦予不同的數值(見圖3)。

圖3 標簽數據圖
(3)滑動窗口裁剪影像。采用滑動窗口選取按照從左到右、從上到下的順序以固定間隔對影像及對應的標簽進行裁剪,裁剪出尺寸為256×256像素的影像塊和標簽柵格文件,作為訓練樣本輸入U-Net 模型中。
(4)數據增強。深度學習算法中參與的樣本數據越多,算法越有效。數據增強是一種增加樣本庫數量的方式,可通過旋轉變換、仿射變換、色彩變換、尺度變換等方法對分割切片影像樣本和標簽樣本進行樣本擴充與數據增強。研究小組基于OpenCV 庫二次開發,實現樣本圖片水平翻轉、垂直翻轉和扭曲翻轉,經過數據增強后,樣本數量達到1 204 個。
訓練模型部署在Windows10 操作系統下,顯卡為NVIDIA GeForce RTX 2060。模型相關參數設置如下:批大小(Batch_Size)=4,初始學習率(Learning_Rate )=1e-4,訓練模型的迭代總輪數(Epochs)=300,分類數目(ClassNum)=5(背景值作為一個類型)。
研究小組根據訓練得到的模型對另一影像進行分類測試(見圖4),測試結果顯示,基于U-Net網絡訓練得出的模型可以較好地從影像上區分出水體、耕地、林地和居民地。

圖4 土地利用分類結果圖
研究小組采用地面真實感興趣區進行混淆矩陣分析,輸入數據為分類結果、驗證樣本,其中,水系驗證樣本10 個、林地驗證樣本11 個、居民地驗證樣本9 個、耕地驗證樣本20 個。經過驗證后,土地利用數據分類精度達到85.70%。
遙感影像分類是利用計算機對遙感影像中各類地物光譜信息(灰度值)和空間信息進行分析,選擇特征,將圖像中每個像元按照某種規則或算法劃分為不同的類別,然后獲得遙感影像中與實際地物的對應信息,從而實現遙感影像的分類。
目前,在傳統的高分辨率遙感影像分類方法中,最常用的是面向對象分類法和機器學習算法。面向對象分類方法常見的有基于ENVI 軟件進行監督分類,但是此方法需要人工參與分割參數選擇和對象特征選取,過程耗時、耗力;采用機器學習方法不需要人工介入,但是機器學習中的淺層結構模型難以得到更好的分類結果。深度學習(如U-Net 模型)是近幾年圖像識別領域的一門新興技術,它能夠進行深層次自主學習并進行準確的分類。
鑒于可比性,此次研究使用ENVI 進行同一個區域測試數據,新建耕地、居民地和林地3 個圖層作為感興趣區并進行分類。從實驗結果看,ENVI 結果精度分析后,土地利用數據分類精度達到83.63%,而基于U-Net 的深度學習的土地利用數據分類精度達到85.70%。由此可知,相較于使用ENVI 分類方法,深度學習的土地利用數據分類準確率更高。
基于U-Net 模型的土地利用快速分類提取方法具有以下幾個優勢:一是作業流程中應用協調,保障數據操作合理;二是采用合理樣本庫,數據使用快捷方便;三是操作簡單易懂,容易理解;四是數據之間無縫轉換,損失較小;五是無需授權,即可對平臺進行操作;六是與保密制度相結合,保證數據安全,提高管理效率。
技術難點:一是分類結果仍存在細小的錯分區域,且地物的邊界經過U-Net 模型上下采樣后較平滑,需要通過圖像后處理的方式,如全連接CRFs 等,對圖斑分割的邊界進行優化,進一步提高分類精度;二是訓練模型采用了波段數有限的高分辨率遙感影像,但是U-Net 模型能夠學習到的光譜信息特征有限,因此有必要考慮添加多源數據;三是需要采集大量的樣本數據,且精度達到一定的標準,便于進行分類。
高分辨率遙感影像包含高質量地表覆蓋信息,如何高效準確地實現高分辨率遙感影像的地表覆蓋分類是急需解決的問題。研究小組提出了利用U-Net 模型對高分辨率遙感影像進行快速分類的初步設想,經過實驗驗證,U-Net 模型能夠較為準確地提取出耕地、水體、居民地和林地等重點地物,可以實現較準確的土地利用分類識別,可大大提高影像判讀和數據采集的作業效率。這一方法對解決廣西地區由于地物復雜、圖斑破碎等因素導致的自然資源要素自動提取困難有很好的借鑒意義。