王景發 毛德華 杜會石 王宗明
(1 吉林師范大學旅游與地理科學學院,吉林 四平 136000;2 中國科學院東北地理與農業生態研究所濕地生態與環境重點實驗室,吉林 長春 130102;3 國家地球系統科學數據中心,北京 100012)
濕地是最重要的陸地生態系統類型之一,在維持物質循環平衡、保護生物物種多樣性和維持生態安全等方面發揮著極其重要的作用(路春燕等,2019)。森林沼澤是指以超過6 m的木本植物作為優勢物種的沼澤濕地,碳儲量極其豐富,對全球氣候變化響應顯著(張馳等, 2020)。面對人類活動與氣候變化的雙重嚴峻挑戰,森林沼澤遙感監測能及時明確森林沼澤的分布界限,反映森林沼澤濕地景觀類型現狀與轉化趨勢,對有效保護森林沼澤生態系統健康與維護區域生態系統穩定具有重要意義(Song et al, 2021)。
多源遙感數據整合能最大程度地融合不同類型的傳感器遙感數據,有效提高地物類型識別與提取精度,多源遙感數據融合被廣泛應用于濕地覆被信息的提取研究中(常文濤等, 2020; Xulu et al,2020; Dong et al, 2020)。隨著衛星遙感技術的高速發展,遙感數據源類型不斷豐富。Sentinel-1合成孔徑雷達(Synthetic Aperture Radar, SAR)區別于被動光學遙感,能有效避免云雨霧和夜晚無光的影響,具有高分辨、雙極化、短周期、強穿透、多模式、全天候、全天時和產品生產迅速的優勢,可精確確定衛星位置與姿態角,實現全球陸地、海岸帶、航線等高分辨率監測與全球海洋的大面積覆蓋監測(Mohammadi et al, 2020)。Sentinel-2 A、B衛星系統搭載多光譜傳感器(Multispectral Instrument, MSI),可開展可見光、近紅外、短波紅外、紅邊等13個波段以5 d為周期的對地監測,特別是紅邊范圍三波段對植被長勢與健康狀況監測具有巨大優勢,較高的時空分辨率與較寬的光譜分辨率使得Sentinel-2遙感影像普遍應用于陸地生態環境演變監測、濕地景觀制圖、植被作物長勢監測與災害預警繪圖制作當中(張磊等, 2019)。由于森林沼澤透視性差、物種類型復雜且交叉難辨、目視解譯與實地考察困難,使得對于森林沼澤濕地景觀分布與信息識別提取的應用相對較少。森林沼澤景觀信息提取方法包括傳統的監督非監督分類和深度機器學習等,隨機森林分類方法作為機器學習方法的重要分支,是一種利用多棵決策樹對遙感影像樣本進行提前訓練并在此基礎上進行精準分類賦值預測的分類方法,隨機森林是目前森林沼澤濕地景觀信息識別與提取中較為廣泛、準確、高效的方法(Yang et al, 2020)。
哈尼濕地是吉林省第3塊國際重要濕地,淡水、森林沼澤等濕地資源極其豐富,擁有中國東北最大的泥炭沼澤礦床,在涵養和提供水源、調節氣候及泥炭沼澤濕地科學研究等方面具有重要意義。本研究以吉林省哈尼濕地為研究對象,集成應用Sentinel-1雷達和Sentinel-2多光譜影像,充分挖掘Sentinel-1多極化波段特征和Sentinel-2紅邊指數對森林沼澤遙感識別的潛力,應用隨機森林方法實現哈尼濕地森林沼澤分布信息的提取,森林沼澤提取方法可為其他地區森林沼澤制圖提供案例指導,并為哈尼濕地的可持續管理提供數據支持。
吉 林 省 哈 尼 濕 地(42°4′12″~42°14′30″ N,126°4′9″~126°33′30″ E)位于吉林省通化市柳河縣東南部,南與通化縣相鄰,東部與白山市區、靖宇縣相接,大致呈“東北-西南”條帶狀走向分布,包括核心區、緩沖區和試驗區3部分(圖1)。研究區地處溫帶濕潤、半濕潤季風氣候區,四季分明,夏季高溫濕潤,冬季寒冷干燥,雨熱同期,年平均氣溫5.01℃,年平均降水量755.52 mm,全年無霜期125~145 d。地貌類型以玄武熔巖山地為主,地勢東高西低,平均海拔884.50 m,具有中國典型的高山森林沼澤濕地群,泥炭層儲量較為豐富,是哈泥河主要的河水補給庫。保護區野生動植物資源豐富,包括東方白鸛(Ciconia boyciana)、紫貂(Martes zibellina)、大天鵝(Cygnus cygnus)等35種國家級重點保護野生動物和東北紅豆杉(Taxus xuspidata)、紅松(Pinus koraiensis)、紫椴(Tilia amurensis)等7種國家級重點保護野生植物。保護區于1991年建立,于2002年、2009年分別晉升為省級、國家級自然保護區,2018年2月入選國際重要濕地名錄(宋雪婷等, 2019)。
圖1 研究區示意圖Fig.1 Geographic location of the study area
1.2.1 Sentinel數據本研究應用2020年7月13日的Sentinel-1地距(Ground Range Detected,GRD)極化雷達影像數據下載自ESA Opernicus(https://scihub.copernicus.eu),影像采集儀器為SAR-C,收集模式為IW,數據大小約為1.64 G,數據質量較高。利用ESA SNAP Desktop 8.0官方預處理軟件對保護區Sentinel-1雷達影像進行軌道校正、熱噪聲去除、輻射定標、多視處理、相干斑濾波處理、地形校正、分貝化校正以及重采樣等處理(楊丹等, 2020)。
Sentinel-2遙感影像以其豐富的光譜分辨率被廣泛應用于陸地植被、土壤、水體等監測和糧食估產、濕地景觀制圖研究等領域,本研究應用的Sentinel-2A多光譜高分辨率遙感影像數據下載自歐空局數據共享網站(https://glovis.usgs.gov/),圖幅軌道號為46,投影為UTM 51N。對Sentinel-2 level-1C級產品進行大氣校正與輻射定標,利用超分辨率合成工具對各個波段進行超分辨率合成并重采樣為10 m(劉海秋等, 2021)。
1.2.2 訓練樣本與驗證點本研究通過目視解譯與野外實地GPS考察獲取訓練樣本1 942個,其中林地訓練樣本數量最多,共502個,水田訓練樣本數量最少,共105個,訓練樣本總體符合“空間分布均勻、數量充足”的條件,滿足實驗分類要求。在訓練樣本集合選取數量的基礎上,選取訓練樣本數量的50%作為驗證點集合,用于檢驗濕地分類結果的最終精度,驗證點共971個,其中森林沼澤驗證點數量共91個,訓練樣本與驗證點集合數量分布見表1。
表1 訓練樣本與驗證點數量Table 1 The number of training samples and verification point sets
1.2.3 濕地遙感分類系統參照《濕地公約》對濕地的定義、《全國濕地資源調查與監測技術規程(試行)(林濕發[2008]265號)》和相關文獻,建立符合吉林哈尼國家級自然保護區森林沼澤濕地的分類體系(表2)。哈尼國家級自然保護區地物類型一級分類包括天然濕地和人工濕地2類:其中天然濕地主要包括河流、湖泊、森林沼澤和草本沼澤;人工濕地主要為水田。另外,將研究區大面積旱地、林地、草地和建設用地統一劃分為非濕地類別。
表2 哈尼國家級自然保護區森林沼澤濕地分類體系Table 2 Classification system of swamp in the Hani Ramsar site
研究過程總體分為數據獲取與處理、提取波段與特征組合、隨機森林分類與精度評價3部分。數據獲取與處理,即對Sentinel-1雷達與Sentinel-2多光譜等數據的獲取與地形校正、輻射定標等一系列處理;提取波段與特征組合是指依據不同的特征波段組合形成3種特征組合;最后利用隨機森林分類算法對3種組合方案分別提取研究區森林沼澤濕地覆被信息,并對濕地信息提取精度進行綜合評價。技術路線見圖2。
圖2 哈尼濕地森林沼澤技術路線圖Fig.2 The flowchart for mapping swamp in the Hani wetland
隨機森林(Random Forest, RF)分類算法是一種新興起、靈活度高、預測準確程度強的計算器機器學習分類算法,普遍應用于地學遙感影像濕地信息的提取。隨機森林分類算法適用于處理大數據集合的未知特征,可直接處理高維特征樣本并自主估算最優地物特征集合,具有低擬合性、高抗造性與易理解性等優點(Yahiaoui et al, 2021)。
基于Sentinel-1雷達與Sentinel-2多光譜遙感影像,提取Sentinel-1VV、VH極化后向散射系數,通過Band maths波段計算獲取Sentinel-2光譜特征、紅邊指數特征、植被指數特征、水體指數特征和紋理特征等波段特征(表3)。組合成“光譜波段特征+植被指數特征+水體指數特征+紋理特征”“光譜波段特征+植被指數特征+水體指數特征+紋理特征+紅邊特征”“光譜波段特征+植被指數特征+水體指數特征+紋理特征+紅邊特征+雷達特征”3種特征組合方案。
表3 特征變量說明Table 3 Description of characteristic variables
利用野外實測獲取的971個驗證點數據與分類結果建立哈尼保護區2020年濕地信息提取混淆矩陣,計算濕地分類總體精度(OA)、Kappa系數、生產者精度(PA)與用戶精度(UA)4項評價指標來對本次森林沼澤信息提取精度進行合理評價。
對訓練樣本點對應的不同地物類型Sentinel-1 VV、VH極化后向散射系數像元值進行統計分析(表4),結果表明:研究區典型地物類型Sentinel-1 VV、VH極化后向散射系數差異顯著,森林沼澤極化后向散射系數介于林地與河流之間,與旱地最為接近,森林沼澤VH后向散射系數均值與林地、河流的差距分別為0.4、3.8;VH后向散射系數均值與林地、河流的差距分別為1.0、3.9,可充分利用Sentinel-1極化波段對森林沼澤濕地信息進行有效提取。
表4 典型地類后向散射系數均值Table 4 Mean value of backscattering coefficient of typical terrain
利用ENVI 5.3隨機森林分類(Random Forest Classification)功能模塊對哈尼保護區森林沼澤濕地3種組合方案分別采取不同級別分類樹地物覆被信息提取,獲取不同級別分類樹森林沼澤信息提取總體精度與Kappa系數(圖3),結果表明:哈尼保護區森林濕地覆被信息隨機森林提取總體精度與Kappa系數均呈現出先在10~100分類樹階段增加后趨于波動穩定趨勢,組合1、2、3在10~100分類樹階段保護區濕地信息提取總體精度分別增加2.6%、5.5%、3.2%,Kappa系數分別增加0.03、0.06、0.03,隨著分類樹數目的增加,保護區濕地信息的提取時間也在相應增加。3種組合保護區森林沼澤信息提取最優隨機森林分類樹數目不同,組合1、2、3最優隨機森林分類樹分別為100、400、1 200。
圖3 不同特征組合下不同分類樹數量的隨機森林分類精度Fig.3 Varied classification accuracies among the different numbers of classification trees for different feature combinations
對保護區森林沼澤3種組合方案中信息提取最優總體精度、Kappa系數、生產者精度與用戶精度進行對比分析(表5),結果表明:融合Sentinel-1雷達VV、VH后向散射系數波段與Sentinel-2紅邊波段的組合3森林沼澤信息提取精度最高,總體精度、Kappa系數分別高達88.9%、0.85,其中,林地、森林沼澤、旱地、草地的生產者精度分別高達97.9%、93.8%、90.6%、90.1%,林地、水田、森林沼澤、草地的用戶精度分別高達96.6%、89.5%、89.4%、86.9%,森林沼澤提取質量相對較高,其次為僅融合Sentine l-2紅邊波段的組合2,組合1濕地信息提取總體精度與Kappa系數最小。
表5 分類精度對比 %Table 5 Comparison of classification accuracy %
對哈尼濕地森林沼澤的信息提取最優精度方案的提取結果進行分析(表6,圖4),結果表明:哈尼保護區總面積約242.5 km2,其中,天然濕地面積30.6 km2,天然濕地類型中森林沼澤面積最大,為27.1 km2,占天然濕地面積的88.6%,占保護區總面積的11.2%,主要分布于保護區東北部海拔相對較高地區;河流面積最小,為0.7 km2,僅占天然濕地面積的2.2%,占保護區總面積的0.3%,由東北向西南貫穿整個保護區;湖泊與草本沼澤面積分別為1.3 km2、1.5 km2,分別占天然濕地面積的4.4%、4.9%,分別占保護區總面積的0.6%、0.6%。人工濕地水田面積為0.9 km2,占保護區總面積的0.4%,主要分布于河流兩側地勢平緩地帶。保護區內非濕地類型面積相對較大,林地面積最大,高達192.3 km2,占保護區總面積的79.3%;建設用地面積最小,為3.6 km2,占保護區總面積的1.5%;旱地與草地的面積為5.2 km2、9.9 km2,分別占保護區總面積的2.2%、4.1%。
圖4 哈尼保護區不同土地覆蓋分布格局Fig.4 Land cover distribution patterns in the Hani Ramsar wetland site
表6 分類面積匯總 km2Table 6 Classification area summary km2
森林沼澤生態系統具有強大的服務功能,在全球濕地類型中具有不可替代的作用(楊一等,2017),然而,由于森林沼澤地物類型復雜且枝葉重疊,與森林等其他地物類型之間在傳統光譜遙感探測視角上具有高度一致性,且各濕地類型在傳統遙感影像數據光譜波長位置、波段數目與寬幅范圍內差異性不夠顯著,使得森林沼澤濕地景觀信息的識別與提取成為濕地信息遙感探測領域的難點(生農等, 2021)。Sentinel-2多光譜影像包含中心波長介于703.9~782.5 nm之間的紅邊波段,是目前唯一的在紅邊探測范圍內含有3個波段的衛星遙感影像數據,可有效監測植被健康生長狀態信息且提高森林沼澤信息的提取精度,較高的光譜、空間分辨率與較寬的光譜涵蓋范圍使得Sentinel-2遙感影像數據成為森林沼澤濕地景觀信息識別提取最重要的數據源之一(Bonansea et al, 2019)。傳統的光譜遙感影像與Sentinel-2等多光譜影像數據具有較全面的光譜信息,但受研究區晝夜交替、天氣與近地表地物景觀覆被復雜重疊遮蔽等因素影響,使得森林沼澤濕地景觀信息識別與提取精度不夠精細(夏曉瑞等, 2014)。Sentinel-1雙極化主動遙感雷達數據不受光線和云霧雨的干擾,脈沖能穿透一系列地物到達地面及以下一定厚度的范圍內,反饋森林沼澤濕地景觀近地表復雜的基本信息,在數據獲取、處理及森林沼澤景觀精準識別方面具有顯著優勢(Clauss et al, 2018)。
高光譜遙感影像與極化雷達影像數據被廣泛應用于地理景觀信息識別提取的研究中,但單一的數據來源不足以明顯提升濕地景觀信息識別的提取精度,多源數據融合方法能有效結合各單一類別遙感探測數據集合的優勢,吸取不同數據源的特點,豐富影像數據信息,明顯提高森林沼澤濕地景觀制圖繪圖精度(馬瑞峰等, 2020)。嚴婷婷等(2014)對森林沼澤信息遙感提取方法現狀進行了較為全面的解釋,研究結果認為隨機森林決策樹方法是當下森林沼澤遙感信息提取較為高效準確的方法。多源數據融合與隨機森林算法相結合成為提高森林沼澤信息提取精度的保障,濕地信息提取算法與遙感數據源分辨率仍有待不斷改進與提升,這也成為遏制森林沼澤信息識別提取精度的絆腳石。隨著無人機技術的不斷發展與成熟,小范圍、高精度、長時間序列森林沼澤遙感信息監測與提取成為可能(聞馨等,2020)。下一步將結合無人機高光譜、高精度的拼接影像,對保護區森林沼澤濕地景觀信息開展小范圍、高精度、長時序變化的識別、監測與分析。
本研究集成應用Sentinel-1雷達和Sentinel-2多光譜影像,充分挖掘Sentinel-1多極化波段特征和Sentinel-2紅邊指數對于森林沼澤遙感識別的潛力,應用隨機森林方法實現哈尼濕地森林沼澤分布信息的提取,并對其信息精度進行綜合評估。結論如下:
(1)隨機森林方法對森林沼澤濕地的景觀信息提取精度受研究區域類型、分類樹數目、訓練與驗證樣本選取等多方面因素的制約,哈尼濕地森林沼澤景觀信息提取最優隨機森林分類樹為1 200。
(2)融合Sentinel-1 VV、VH后向散射極化與Sentinel-2紅邊特征波段能顯著提高森林沼澤景觀信息的提取精度,哈尼濕地景觀信息提取總體精度為88.9%,Kappa系數為0.85,森林沼澤提取生產者精度與用戶精度分別高達93.8%、89.4%。
(3)保護區濕地景觀類型多樣,天然濕地、人工濕地與非濕地景觀類型并存,在天然濕地類型中,森林沼澤面積最大,為27.1 km2,占保護區總面積的11.2%,主要分布于保護區東北部海拔相對較高地區,河流面積最小。