劉斌 任俊儒 韓健 董加旺
(華北地質勘查局五一四地質大隊,河北承德 067000)
土地資源是自然資源管理和規劃的重要組成部分[1],了解土地資源及利用情況對人類生產活動具有重要意義[2]。隨著生產生活不斷發展,及時掌握環境變化及土地利用分布,利用信息化提升國家治理體系和治理能力現代化,是踐行自然資源部發布《自然資源部信息化建設總體方案》的具體體現[3]。當前,隨著經濟建設及社會各項事業的快速發展,城市化、工業化的快速發展,使得土地利用變化加快[4]。及時掌握土地利用情況,是實現土地資源規劃的重要基礎,對指導自然資源管理與保護、土地資源的合理利用、可持續發展和提高土地資源管理的現代化水平有著重要的現實意義[5-6]。承德市建設國家可持續發展議程創新示范區需要掌握及時、準確的土地利用情況,服務承德創新發展、綠色發展、高質量發展。
傳統的土地分類信息采取實地測量與統計相結合的方法,效率低下,數據的更新能力較差[7-8]。不同的土地類型、自然背景中的建筑、植被和道路,可以通過它們的反射率來區分。遙感具備周期性、宏觀性優勢,可用于土地利用分類[9-10]。本研究基于高分辨率陸地衛星圖像數據,獲取土地利用情況并進行進度評價,可為區域土地利用變化調查提供參考。
研究區域位于承德市高新區,地處承德市主城區南部,1992 年6 月,經省政府批準成立,初始規劃面積6.2 平方公里。2012 年8 月,經國務院批準,升級為國家級高新區。規劃建設用地面積55 平方公里,建成區面積15 平方公里。承德市高新區交通便利,連接京承、承唐、承朝、承秦、承赤高速公路,京沈高鐵承德南站位于高新核心區[11]。本研究基于高分二號衛星影像數據對承德市高新區土地利用情況進行分析、統計。2014年8月19日,高分二號影像衛星(GF-2)成功發射,空間分辨率可達0.8 米,標志著我國遙感衛星進入了亞米級“高分時代”[12]。
選用覆蓋研究區2021年8月29日與2022年4月23 日GF-2 影像共兩景,質量良好,無云。GF-2 多光譜影像主要參數如表1所示。經過輻射定標、大氣校正、正射融合和裁剪等處理,得到待分類影像。

表1 GF-2傳感器主要參數
在大量實地調查基礎上,并參考同時期Google Earth 影像,利用ArcGIS 10.7 在GF-2 影像上選擇和生成樣本。考慮到樣本均衡性,樣本數量按照各類型地物所占比例進行設置,由于建筑的混淆程度較大,適當增加了其樣本數。最終2021 年8 月29 日影像共選擇了8870 個像元作為樣本數據(裸地1390個、建筑3100 個、植被1505 個、道路1410 個、水體1465 個),2022 年4 月23 日影像共選擇了10958 個像元作為樣本數據(裸地2112 個、建筑3197 個、植被1880個、道路1804個、水體1965個)。
對影像完成各項預處理后,首先構建分類特征,包括歸一化水體指數技術、歸一化差異植被指數計算,灰度共生矩陣計算等,得到分類所用的各類特征集;然后分別利用最大似然法(Maximum likelihood classification,MLC)、支持向量機(Support Vector Machine,SVM)和隨機森林(Random Forest)方法進行分類,比較不同方法對不同時期影像的分類效果;最后利用實測數據、原始影像和分類后影像比較研究區土地覆蓋類型變化情況。圖1 為研究思路的具體技術流程。

圖1 技術流程
本文選取了光譜信息、遙感指數和紋理特征等共14 個變量。光譜特征為GF-2 影像輸出的4 個波段,基于波段運算得到歸一化水體指數和歸一化差異植被指數。
研究表明紋理信息可以在一定程度上提高分類精度。在ENVI5.3 中,選用3×3 窗口,利用灰度共生矩陣(Grey Level Co-occurrence Matrix,GLCM)計算影像的8 種紋理特征(均值、方差、對比度、熵、相關性、差異性、同質性和二階矩),得到4 個波段的32 個紋理特征變量。由于這些紋理特征變量間存在較高的相關性,利用主成分(PCA)分析進行降維,最終選擇前8個主成分(PCA1-PCA8)作為紋理特征變量。
城市自然系統是以建筑為主體,同時兼具植被、水體和土壤特征的復雜環境。本文依據城市地區的土地覆蓋類型分布特點,構建了光譜、遙感指數和紋理特征共3種類型的分類特征。各特征變量的名稱、計算方式和描述如表2所示。

表2 分類特征變量
1)最大似然法分類。最大似然法是一種監督分類算法,在分類過程中,用統計方法根據最大似然比貝葉斯判決準則法建立非線性判別函數集,假定各類分布函數為正態分布,并選擇訓練區,計算各待分類樣區的歸屬概率,而進行分類的一種遙感圖像分類方法[13]。
2)支持向量機分類。支持向量機是一種二分類模型,它的基本模型是利用定義在特征空間上的間隔最大的線性分類器,其實現的基本想法是求解能夠正確劃分訓練數據集并且最大間隔的超平面[14]。
3)隨機森林分類。隨機森林算法是利用多顆分類與回歸樹(Classification and regression tree,CART)構成的非參數機器學習算法。該算法具有優良的抗過擬合特性,并能夠高效計算大量數據集,處理數千個變量。具有較高的準確率,可評估各個特征在分類問題上的重要性[15]。
4.1.1 光譜特征
通過對研究區內獲取的樣本進行藍、綠、紅和近紅外4 個波段進行均值和方差分析得到其光譜曲線(圖2和圖3,左縱坐標軸為2022年4月23號影像,右縱坐標軸為2021年8月29日影像)。

圖2 光譜均值

圖3 光譜均值
由圖2 和圖3 可知建筑和植被、水體在紅、綠、藍三個波段的光譜均值和方差差異性較大,植被在近紅外波段有明顯的紅邊現象,為分離出植被與其余4類提供了強有力的特征。建筑的方差明顯高于其余類,裸地與建筑、道路之間光譜趨勢區域一致,通過對光譜差異性的分析,利用方差可將地物分為建筑類和非建筑類。
4.1.2 遙感指數與紋理特征
歸一化差異植被指數(NDVI)能夠最大程度突出植被信息,抑制其他信息,可以區分植被與水體、建筑、裸地和道路。歸一化水體指數(NDWI)能夠抑制植被,凸顯水體,可以用于區分水體與植被的邊界區域。
對樣本的紋理特征進行分析,將獲取的前8個主成分進行均值和方差分析得到主成分曲線(圖4,圖5)。由圖4、圖5 可知PCA1~PCA8 能夠為分類提供不同程度的差異性,排序靠前的紋理特征的差異性較大,排序靠后的紋理特征差異性較小,原因可能是經過主成分分析之后,排序靠后的紋理特征分量包含較少的原始信息。

圖4 PCA均值

圖5 PCA方差
利用4.1 中分析的變量特征建立分類特征庫,利用最大似然法(MLC)、SVM 和RF 三種方法分別對2022 年4 月23 日和2021 年8 月29 日兩景影像進行分類,利用生產者精度(PA)、用戶精度(UA)、總體精度和kappa系數進行精度評價,結果見表3。
由表3 可知,相同特征下的3 類分類方法中,RF分類結果精度最高,2022年4月23日影像OA和Kappa 系數分別為93%和0.911,比MLC 和SVM 方法分別高出1.87、3.22 個百分點和0.0243、0.0406;2021 年8 月29 日影像OA 和Kappa 分別為87.76%和0.8429,比MLC 和SVM 方法分別高出1.88、6.02 個百分點和0.0201、0.0757。說明RF 方法比MLC 和SVM 方法更能有效的提取城市土地覆蓋類型信息,具有很好的適用性。
通過直觀的目視解譯并對比原始影像可發現,RF方法分類制圖結果整體效果較好(圖6)。圖6中,a、c 分別為2022 年4 月23 日和2021 年8 月29 日原始遙感影像,b、d 分別為RF 分類結果。由圖6 可知研究區內河流湖泊、道路和城市建筑分布連續;裸地、植被的提取較為完整。
利用4.2 中不同時期RF 分類結果同時結合原始影像目視解譯,比較城市發展過程中土地利用變化情況,主要是新增建筑、拆毀建筑和水體面積變化較大的區域(圖7)。

圖7
由圖7 可知,水體面積變寬、新增方艙醫院和拆毀重新規劃建筑能夠利用不同時期的分類圖像很好的識別出來,地面土地覆蓋類型發生變化區域的提取相對完整,分布連續。
通過研究主要有以下結論:
(1)針對城市地區土地覆蓋類型分類問題,使用建立的分類特征比較了MLC、SVM 和RF 等分類方法的性能,結果表明:RF方法優于MLC和SVM方法,是適合城市地區比較合適的分類方法。
(2)建立一種結合GF-2 影像光譜信息、紋理特征和遙感指數的RF 分類方法,實現了對城市地區土地覆蓋信息的分類,OA 達到了91.13%,Kappa 系數為0.8867。
(3)比較了不同時期分類結果對城市水體、新增建筑和拆毀建筑的提取能力,RF 方法能夠有效提取城市用地的變化情況,提取結果相對完整。
利用高分二號衛星進行承德市土地利用監測應用研究表明,高分二號衛星對于監測城市發展、城市用地變更等方面具有良好作用,可為城市監測提供數據支撐、技術支持。