牛全福,傅鍵愷,陸 銘,馬亞娜,張 曼
(1. 蘭州理工大學土木工程學院,甘肅 蘭州 730050;2. 甘肅省應急測繪工程研究中心,甘肅 蘭州 730050)
土地覆蓋是人們依據土地的特性,對土地進行間段性的管理和經營。同時土地覆蓋也是全球變化的熱點問題之一[1]。遙感數據則因其具有大范圍、時效性強和成本低的優勢成為土地覆蓋獲取的主要數據源。如何精確地獲知土地覆蓋的情況,這就應該在中高分辨率遙感影像的支持下,對土地覆蓋的變化情況進行高效、準確、及時的管理[2-10]。本研究以山西省渾源縣為研究對象,運用隨機森林分類方法對GF-6 WFV與Landsat8 OLI 影像數據進行土地覆蓋分類,并對分類結果進行對比分析。
渾源縣隸屬于山西省大同市,地理坐標為113.72°~113.92°E,39.67°~39.83°N,氣候類型為中溫帶大陸性季風氣候,距離大同市中心約82 km。研究區域內主要土地覆蓋類型包括耕地、林地、草地和灌木、裸地、水域、礦區、城鎮與農村用地7 種土地類型。由于中部地區的居民地分布比較分散,對比較不同分辨率影像中零碎分布地物的分類效果較為明顯。
(研究區位置如圖1所示。)

圖1 研究區位置(審圖號為GS(2019)3333號)
本研究所選用的GF-6 WFV和Landsat8 OLI2種衛星的實驗數據源信息見表1,波段信息對比見表2。

表1 數據源信息

表2 GF-6和Landsat8 2種衛星的波段信息的對比
GF-6 WFV和Landsat8 OLI數據預處理在ENVI5.3平臺上完成。Landsat8 OLI 的預處理包括輻射定標、大氣校正、影像拼接和裁剪,GF-6 WFV 的預處理流程有輻射定標、大氣校正、輻射校正、幾何校正、影像裁剪,其中幾何精校正用到的輔助數據為30 m 的DEM數據和Landsat8 OLI的全色波段,GF-6 WFV影像的絕對定標系數從中國資源衛星應用中心(http://www.cresda.com/CN/Downloads/dbcs/)獲取,Landsat8 OLI和GF-6 WFV 大氣校正選用FLAASH 大氣校正模塊下的MODTRAN 輻射傳輸模型,GF-6 WFV 影像的光譜響應波譜使用從中國資源衛星應用中心下載的光譜響應數據制作。
當前遙感影像分類應用到的方法主要有監督分類、非監督分類、CART 決策樹分類、面向對象的分類等,本研究選擇隨機森林分類法執行土地利用分類。隨機森林是由Breiman 引出的一種基于決策樹組合的方法,是在樣本空間、特征空間同時進行的集成學習算法。隨機森林中的每一顆決策樹依賴于一個由訓練確定的參數組成的隨機向量,每棵樹通過Bagging 算法形成獨立分布的訓練樣本集,并利用這些訓練樣本集進行訓練,同時在特征集中選擇部分特征進行決策樹的構造。在當前的算法里,隨機森林具有以下優點:①隨機性的選擇訓練樣本和分裂屬性,使得隨機森林對噪聲數據不太敏感,且不輕易導致過擬合問題;②隨機森林的參數少且設置簡單,只有森林規模大小和每次節點分裂時所選屬性個數2 個參數;③隨機森林算法可以有效解決樣本中的類不平衡問題,并且特別適用于一些常規機器學習算法難以處理的高維小樣本數據,對于分類數據存在缺失值的情況也有較好的結果[13]。
隨機森林算法實現步驟如下:
步驟1:在每一個循環t=1,…,T,執行步驟2和步驟3。
步驟2:從訓練樣本集中通過Bagging算法得到新的訓練樣本集。
步驟3:對新的訓練樣本集,得到相應的新分類模型ht。其生長過程如下:在樹的每個內部節點處從D個特征中隨機挑選m個特征作為候選特征(m<D),按照節點不純度最小的原則從這m個候選特征中選擇一個最優特征對節點進行分裂生長。讓每一顆分類數充分生長到每個葉子節點的不純度達到最小,并不對樹進行剪枝。
結合其他數據資料與遙感影像地物特征,在本區域遙感影像上分別對耕地、林地、草地和灌木、裸地、水域、礦區、城鎮與農村用地7 種地類的樣本進行了選取。選取的訓練樣本應具有代表性、全局性。本研究選擇的訓練樣本中耕地87 個、林地68 個、草地和灌木76 個、裸地64 個、水域20 個、礦區69 個、城鎮與農村用地69個。
選取的訓練區樣本通過樣本可分離度來檢驗各地類之間的可分性,分離度取值范圍通常為0~2。當分離度為1.9~2.0時,說明各樣本之間可分性好,屬于合格樣本;當分離度為1.0~1.9時,各樣本之間的分離效果中等;當分離度小于1.0 時,則需將兩類樣本進行合并。本研究區Landsat8 OLI 和GF-6 WFV 遙感影像各樣本間的可分離度值如表3、4所示。

表3 Landsat8 OLI遙感影像中各地物類別的可分離度

表4 GF-6 WFV遙感影像中各地物類別的可分離度
由表3、4可知:GF-6 WFV對耕地、林地、草地和灌木的可分性都高于同期影像Landsat8 OLI,除了城鎮與農村用地和礦區間的樣本可分離度小于1.7 以外,其余地類之間的樣本可分離度較高。
3.2.1 GF-6 WFV與Landsat8 OLI對應波譜分析
由圖2 可知,GF-6 WFV 紅光傳感器的光敏范圍(620~700 nm)比Landsat8 OLl(630~680 nm)大,GF-6 WFV 紅光傳感器光敏范圍進入了680~700 nm,而Landsat8 OLI 沒有進入這一區域,該范圍處于對植被反應敏感的紅邊區域,同時紅邊也是植被的反射率在近紅外波段接近與紅光波段交界處快速變化的區域,再加上GF-6 WFV 新增的2 個紅邊波段(GF-6 WFV B5 光敏范圍為680~730 nm,GF-6 WFV B6 光敏范圍為720~780 nm),使得GF-6 WFV 對耕地、林地、草地和灌木的反射率更加敏感。

圖2 波普響應函數
3.2.2 GF-6 WFV與Landsat8 OLI各地物光譜分析
分析GF-6 WFV 與Landsat8 OLI 影像各地類光譜曲線(圖3、4)可知:

圖3 GF-6 WFV各地物光譜特征曲線圖
相同之處:①7 種地物的光譜均值在藍(B)、綠(G)、紅(R)波段差異不大,其中礦區和城鎮與農村用地亮度值重疊度較高;②除了水域外,其他6種地類的亮度均值在紅(R)波段后均呈上升趨勢,其中耕地、林地、草地和灌木的光譜均值上升最明顯;③7 種地類在近紅外(NIR)波段上的光譜均值差別明顯、可分性較高。

圖4 Landsat8 OLI 各地物光譜特征曲線圖
不同之處:GF-6 WFV 在近紅外(NIR)波段和紅邊1(RE1)波段之間,耕地、林地、草地和灌木的亮度值下降較快,其中耕地的亮度均值下降幅度最大,在紅邊1(RE1)波段處耕地的亮度均值下降到最低;在紅邊1(RE1)波段和紅邊2(RE2)波段之間,除了水域外,其他地物的亮度均值都呈現上升趨勢,其中耕地的亮度均值上升幅度最明顯,其次是林地、草地和灌木;在紅邊2(RE2)波段處,耕地的亮度均值達到最高,林地次之,光譜差異僅次于近紅外(NIR)波段;在紫(P)波段以及黃(Y)波段中,7 種地物的亮度均值變化趨勢相同,差異不明顯。Landsat8 OLI在熱紅外1(SWIR1)波段和熱紅外2(SWIR2)波段處,除了水域外,其他地類的光譜均值變化差異較小,可分性較低。
綜合可知,各地物在GF-6 WFV 和Landsat8 OLI的近紅外波段處都可以區分出來,而GF-6 WFV新增了2 個紅邊波段,在耕地、林地、草地和灌木這3 種地物的可分性方面GF-6 WFV要優于Landsat8 OLI。
根據隨機森林分類方法及原理,對渾源縣Landsat8 OLI 遙感影像和GF-6 WFV 遙感影像以及缺少紅邊波段的GF-6 WFV影像數據進行分類,并對渾源縣原始影像分類后的各地類面積占比進行統計,結果如圖5、表5所示。

圖5 分類結果

表5 主要地類面積占比
從表5 可以看出,GF-6 WFV 分類出來的耕地面積占比(22.85%)高于Landsat8 OLI(18.23%),據統計2019 年渾源縣的耕地覆蓋率為21.92%,因此GF-6 WFV對耕地的分類更接近于真實值。從分類后的結果(圖5)來看,林地主要分布于渾源縣中南部和中西部,礦區主要以中部的青瓷窯、大瓷窯煤礦為主,耕地幾乎都分布在中部,比較集中,由于研究區水域較少,分類結果面積占比最小。根據目視解譯和實地考察后的結果可知:渾源縣中南部和中西部、中東部大部分為恒山林場,少量為草地和灌木以及部分礦區;再結合分類結果圖可知,Landsat8 OLI 錯將少部分林地分為草地和灌木,因此GF-6 WFV 在耕地、林地、草地與灌木的分類結果上要優于Landsat8 OLI,主要是由于GF-6 WFV 新增了對作物比較敏感的2 個紅邊波段,使得GF-6 WFV對于耕地、林地、草地和灌木的可分性更加明顯。GF-6 WFV 分類出來的城鎮與農村用地、礦區和裸地面積占比都比Landsat8 OLI 更加真實,說明在紋理特征明顯、地類零碎分布的區域GF-6 WFV的分類效果優于Landsat8 OLI。
基于ENVI5.3 軟件隨機產生抽樣點,通過實地驗證方法,結合2019 年渾源縣的Google earth 影像對選取的抽樣點進行地物類型確定。在研究區中隨機抽樣了283個點,其中耕地62個,林地57個,草地和灌木51個,裸地35個,水域16個,礦區38個,城鎮與建筑用地24個,通過混淆矩陣和Kappa系數得的精度評價結果,如表6所示。

表6 Landsat8 OLI和GF-6 WFV土地利用分類評價
由表6可知GF-6 WFV的總體分類精度為91.11%,比Landsat8 OLI的總體分類精度(87.87%)高3.24%;GF-6 WFV 的Kappa 系 數為0.89,比Landsat8 OLI 的kappa 系數(0.85)高0.04。兩者的Kappa 系數都大于0.8,說明分類效果比較理想,數據可靠性較高。GF-6 WFV 衛星對于耕地、林地、草地和灌木、裸地、水域、礦區、城鎮與農村建用地的分類精度都高于Landsat8 OLI 衛星。由于GF-6 WFV 新增了對作物比較敏感的2 個紅邊波段,使得GF-6 WFV 對于耕地、林地、草地和灌木的分類精度要高于Landsat8 OLI 衛星;GF-6 WFV 衛星的分辨率比Landsat8 OLI高,混合像元少,所以GF-6 WFV 對于裸地、水域、礦區、城鎮與農村用地這些地物類型破碎、細節與紋理特征明顯的區域,分類效果更好。綜合所知,高空間分辨率的國產GF-6 WFV遙感影像在土地利用分類中體現出了一定的優勢,具有較好的分類效果。
本研究利用同一地區同期GF-6 WFV和Landsat8-OLI 遙感數據,基于隨機森林分類法,對比典型樣本光譜差異、類別可分性、分類結果及分類精度差異,得出以下結論:①在兩幅影像的藍、綠、紅、近紅外波段處典型地物光譜趨勢一致性良好,各地物在近紅外波段區分最明顯。在耕地、林地、草地和灌木可分離性方面,GF-6 WFV高于Landsat8 OLI,其他的地物類型可分離性較為接近;②國產GF-6 WFV在土地利用分類中的分類效果要優于同時期影像Landsat8 OLI 的分類效果。GF-6 WFV 分類結果則更加接近于真實值,尤其是對耕地、林地、草地和灌木效果較好,這也體現了高分六號衛星新增的2 個紅邊波段對農業、林業的監測能力。GF-6 WFV 具有較高分辨率優勢,對零碎分布的地物分類結果好于
Landsat8 OLI。
該研究也有不足之處:由于林地中陰影的存在,可能會把陰影錯分為林地,需在后續研究中利用DEM、紋理特征、多時相數據進行后處理,進一步提高分類精度。同時本文對于土地利用類型分配的原因以及土地利用類型的變化趨勢沒有進行研究,有待下一步深入研究。