孟 健 熊文豪 周 寒 張曉倩 劉天琦 高賢君
(1.中國礦業大學(北京)地球科學與測繪工程學院 北京 100083)(2.長江大學地球科學學院 武漢 430100)(3.內蒙古自治區測繪地理信息中心 呼和浩特 010050)(4.新疆大學地質與礦業工程學院 烏魯木齊 830047)
一直以來,沙漠治理和土地荒漠化治理都是環境治理關注的重點。為了更好地開展沙漠和土地荒漠化治理工程,需要對沙漠地區或荒漠化較為嚴重的地區進行必要的信息提取[1]。地表植被作為人類自然生態系統的一個重要組成部分,其生長狀態常常受某一地區的許多自然環境因素的影響,另外植被的變化情況也常被人們用來當作準確評價當地生態環境氣候變化的一個重要科學指標。近年來,隨著遙感技術的不斷發展,其已經能夠實時提供大量的多時相數據,在植被信息提取方面被廣泛的應用,目前已有研究探索沙漠地區的遙感植被提取方法,這對監測沙漠區域的植被動態變化具有重要意義[2~3]。
為了更好地改善沙漠植被治理,需要對其植被生長信息進行精確分類提取[4]。在提取靠近沙漠或者其他荒漠化地區土地的生物植被狀態信息時,常用的分類方法主要包括目視信息解譯、監督信息分類、非人工監督信息分類、決策樹層和分層信息分類、神經網絡自動信息提取等多種方法[5~6]。在當前的研究和實際應用中,通常采用其中的一種或多種方法結合進行分類提取[7]。呂利利等采用基于分類與回歸樹(Classification And Regression Tree,CART)決策樹分類的方法對民勤縣沙漠化信息進行提取[8]。魏艷輝等采用迭加替代自定義組織模式數據的采集分析算法(Iterative Selforganizing Data Analysis Techniques Algorithm,ISODATA)方法提取烏蘭布和沙漠白刺沙丘邊緣的地物信息[9]。劉勇采用決策樹分類對烏蘭布沙漠進行信息提取并輔以紋理分析[10]。王讓會等建立線性光譜混合分析模型,并計算歸一化植被指數(Normalized Differential Vegetation Index,NDVI)以提取古爾班通古特沙漠西緣的植被遙感信息[11]。目前利用遙感技術進行沙漠植被信息提取,多利用NDVI植被指數來區分研究區的地表狀態是否為植被[12]。但遙感影像中時常出現同譜異物或者異物同譜的現象,且分類過程中易受到人為主觀因素的影響,導致沙漠信息提取精度不高[13]。而且僅使用NDVI植被指數識別和檢測植被,精度有所限制,誤差也相對較大。針對此類問題,本文以榆林市毛烏素沙漠地區為例,將NDVI 指數和眾多監督分類方法組合來提取研究區多個年份的植被生長變化狀況,通過對遙感圖像中的地物類別進行識別,將植被的譜識別問題轉變為圖識別問題,并輔以多個年份實現研究區域植被信息的動態監測。
監督分類方法主要是通過劃分類別樣本,并對這些已知樣本進行訓練,根據已知樣本對其它未知類進行分類的過程。分類時,在確定了類別定義和特征判別后,需要對訓練區進行樣本確認,然后選擇合適的分類方法進行分類[14]。
ENVI 軟件提供了眾多監督分類方法,包括最大似然法、神經網絡法在內的12 種[15]。其中,最大似然法利用了正態分布假設的基本原理,對每個像素所屬的似然估計值進行分類,從而得到最有可能的分類。平行六面體方法根據訓練樣本的亮度值形成n 維數據空間,并根據像元的光譜參數值,動態地劃分到相應的類別中。最小距離法主要原理是通過計算待分類像元與各個已知訓練樣本特征類空間中心的距離,選擇距離最小的樣本,將待分類像元進行歸類。馬氏距離分類是基于計算機在輸入速度圖像時得到各速度訓練樣本的馬氏距離,最終比較馬氏速度距離最小的,即為此值的類別。神經網絡方法泛指現代計算機已經模擬出了人腦的網絡結構,使用很多小的信息處理單元來模擬人腦神經元,能夠基本模擬出人腦的信息識別、記憶、思考的整個過程,然后對像元進行影像分類[16]。支持向量機分類是一種建立在分類統計學基礎理論上的一種機器學習的方法,為了將不同類之間的信息間隔距離最大化,并同時保持較高的支分類識別準確率,SVM可自動的準確識別類并尋找對不同類具有較大信息區別處理能力的各種支持分類向量,自動構造分類器,對像元進行圖像分類。
基于以上監督分類方法的了解,本文以榆林市毛烏素沙漠為研究對象,將多種監督分類方法應用在該地并進行精度分析,以探索出提取沙漠植被表現最優的精度指標方法。
反向傳播(BP)是一種神經網絡分析方法,利用最大誤差反向信息傳播算法。它采用最大誤差逆向傳播算法,通過采集仿真過程中的系統誤差,將其反饋給輸出,然后利用該誤差對神經元權值進行調節,使其“偏差”盡量減小,從而使神經網絡模型與數據集達到最好的擬合效果[17]。前向傳輸和后向傳輸是BP神經網絡的兩部分。神經網絡結構包括輸入層、隱含層、輸出第一層。在正向樣本傳播的整個過程中,輸入層首先傳入一個輸入層的樣本,由一個隱含層進行處理后,再將其傳向一個輸出樣本層。若信號輸出處理層的實際信號輸出與系統期望值輸出不符,則信號會自動轉向具有誤差的反向信號傳播下一階段。在反向快遞傳播的運行過程中,反向快遞傳播把預期誤差大的信號按原來正向快遞傳播的信號通路反向廣播傳回,進行多次預期修改,通過迭級換代的重復過程,對比各傳播節點的預期權重和誤差閾值,逐漸增大減小預期誤差,直到節點達到新的預期誤差要求。當輸入誤差參數小于某一參數相當小的輸入正數或迭代輸出誤差不再繼續減少時,即已經完成了基于BP 模型網絡的誤差訓練、輸入與迭代輸出的誤差映射的基本確定。在誤差計算過程中,為使得誤差值達到最小,采用梯度下降法。
用戶在ENVI的用戶中可以采用一個優化訓練函數(例如對數(Logistic)和雙曲線(Hyperbolic))以及針對輸入端的訓練函數貢獻一個閾定的值(0-1),用于對每個節點內部權重的大小變化進行調節。訓練中的算法交互式地通過調整兩個節點間的響應權重和誤差閾值,從而可以讓節點輸出響應層和輸入響應層的誤差可以達到最小。還可以輸入所用隱藏層數來進行訓練調整。在迭代過程中,直至誤差達到最小,即可輸出正確分類(如圖1所示)。

圖1 神經網絡原理圖
本文主要使用ENVI5.1 軟件進行圖像監督分類(Classification),該模塊下的監督圖像分類(Supervised Classification)工具可完成研究區的分類。監督分類一般可以大致分為4 個基本過程:集中選取分類訓練樣本、執行訓練分類、分類后處理和綜合評價分類結果。
分類前首先在研究區域的遙感影像上對3 種主要的類型土地資源選取每套訓練樣本中最感興趣的小區域(Region of Interest,ROI),進行訓練樣本的分類選取時,要選擇兩套訓練樣本,一套用于監督分類的初始訓練樣本,另一套用作監督分類后結果的樣本精度評價。選取觀測出一些具有最大典型性和最具代表性的規定訓練樣本,不僅能對其進行準確的分類,也能在一定量的程度上準確反映觀測出其與同類相對地物體的光譜物理特性的長期波動變化情況,訓練樣區的樣本數量也必須滿足一定的訓練要求,以確保能夠代表該類別的光譜特征。
樣本分離度評價:樣本分離度的大小可用來檢測選取的不同類別樣本之間是否具有一定的可區分性。該評價工具主要是通過ROI 可分工具條來計算,各樣本之間的分離度情況可以判斷各類別之間的差別程度,參數在1.8~2.0 之間說明樣本之間的分離性良好。通過分離度評價也可以繪制出樣本類別的平均光譜響應曲線。
執行監督分類:監督分類方法眾多,本文選取了神經網絡、最大似然、平行六面體、最小距離、馬氏距離和支持向量機在內的6 種分類方法,通過這6 種方法的評價分類結果比較,選出精度最高的監督分類方法。
評價分類結果:由于在前面實驗選取訓練樣本時,我們制作了了兩套訓練樣本,將另一套樣本采用混淆矩陣(Confusion Matrix)的方式對識別結果進行精度監測,實現分類結果與實際樣本信息的對比。對這6 種結果進行精度評估,選擇在總體分類準確率、Kappa 系數等維度上表現最好的分類方法。
分類后處理:分類后處理是必要的步驟,因為監督分類得到的初步結果往往難以滿足最終的應用需求。為了獲得符合要求的最終分類結果,需要對初始分類結果進行一系列的處理,包括更改分類顏色、合并類別、主次要分析和聚類分析等常見操作。
本文以陜西省榆林市定邊縣、靖邊縣、橫山區三地所代表毛烏素沙漠為研究區域。榆林市總面積43578 km2,界于東經107°28′~111°15′,北緯36°57′~934′之間,接壤于陜甘寧蒙晉五省(區)交界地帶[18]。
榆林市范圍內的毛烏素沙漠海拔高度大約在1200m~1500m,其總面積18424.42km2,占榆林市總面積的五分之二。受其地理位置影響,該地區具有獨特的自然地理景觀、豐富的生物多樣性和典型的高原生態環境[19~20]。毛烏素沙漠不只有沙漠,草原地區分布有開闊草原、黃土地和丘陵,甚至有外水灌溉系統和內陸大運河。除此之外,毛烏素沙漠中還分布有許多大型湖泊和天然濕地,這在中國的主要草原沙漠中可說是獨一無二的。榆林市由于毛烏素沙漠的存在,曾史上分布著最高達800 多個海子,還因此擁有一片大面積的天然綠洲、濕地、草原、牧場、農田和魚塘。毛烏素沙漠地區是榆林市主要的農、林、牧、漁業綜合發展示范基地,同時也認為是榆林市最重要的自然生態環境屏障[21~24]。
隨著全球氣候的不斷變暖,氣候災害的頻率和強度增加,以及人類活動的不斷增強,毛烏素沙漠的生態環境遭到了破壞和惡化,湖泊、濕地面積大幅減少,由此引起生物多樣性也急劇下降,嚴重影響了沙漠當地農、林、牧、漁業和可持續發展戰略的實施。
為了監測毛烏素沙漠近些年來的植被變化情況,本文選取2013 年~2020 年長時間序列上的Landsat8 OLI遙感圖像進行研究。由于研究區四季變化情況明顯,不同季節植被覆蓋狀況可能有所不同,為了在長時間序列上來對比研究區的植被變化情況,本文僅選取2013年9月13日和2020年9月7日的遙感影像進行實驗。
針對不同年份年的遙感影像分別采用多種不同的監督分類方法進行結果分類,并將分類處理得到的不同年份的結果與毛烏素沙漠原始真彩色影像進行對比,目視判斷植被信息提取效果最好的六類監督分類方法展示如下。
觀察圖2、圖3 的分類結果,可以知道,自2013年~2020 年的變化過程中,不同的分類方法均表現出地表植被范圍增加的趨勢。只有最小距離法可能識別的沙漠區域較多,看起來存在一定誤差,經調研發現,最小距離法在進行監督分類時存在一定的缺陷,該方法不會考慮不同類別內部方差的差異,導致一些類別在邊界上出現過度檢測,從而引發分類誤差,沙漠地區的植被覆蓋情況較草原綠地本就略顯稀疏,因此利用該方法進行沙漠地區的植被信息提取會進一步放大分類誤差;另外圖中平行六面體方法和馬氏距離方法的分類結果又過于顯著,與實際情況可能會有些偏差,這是由于馬氏距離會夸大了小變量的影響,并且受到協方差矩陣不穩定性的顯著影響。而平行六面體法考慮到n 維影響,對于很多沙漠地區像元本身都無法識別。

圖2 2013年不同監督分類方法結果圖

圖4 監督分類精度對比分析圖
單純從目視解譯來分析不同分類方法的優劣存在一些不確定性,因此接下來對6 種監督分類方法進行精度評價的對比分析。
通過精度評定對比分析表(如表1 所示)可以看出,神經網絡方法在應用植被提取方面的精度非常高,其2013年總體精度約為90.48%,2020年總體精度更是達到了99.66%。

表1 監督分類精度對比分析表
通過6 種分類方法的精度對比,神經網絡方法在長時間序列上表現的分類精度較其他方法更高,這是因為該方法具備一定的非線性映射能力、自學習和自適應能力,在應用沙漠地區植被信息提取方面具有很大的優勢。另外結合分類后的圖像效果以及其他像元內部結構或人為因素的影響,選擇神經網絡方法作為毛烏素沙漠地區的植被提取方法是更加具有參考價值的。
本文以毛烏素沙漠為研究對象,在大量野外數據的基礎上,采用多種監督分類方法方法對毛烏素沙漠的植被和非植被信息進行提取。經目視解譯和精度評價,發現神經網絡方法是毛烏素沙漠地區長時間序列植被信息提取表現效果最好的方法,它能夠對圖像進行深層特征的自動提取和分類,實現了機器的自動提取特征,對植被信息提取的時空變化研究,以及進一步實現植被遙感信息的高精度提取具有重要意義。
據中國林業局等相關報道,在經過長時間的治理之后,毛烏素沙漠植被覆蓋率已經達到了33%,治理率達到93.24%,境內860萬畝流沙已經全部實現了固定或者半固定的狀態。因此在長時間序列上表現的植被變化狀況是向好趨勢發展的,這也與本文研究結果相一致。故在后續監測沙漠地區植被變化情況時,可借鑒本文神經網絡方法來實現植被信息的遙感動態提取。