孫濱峰 趙 紅 陳立才 舒時富 葉 春 李艷大
(1.江西省農業科學院農業工程研究所, 南昌 330200; 2.江西省農業信息化工程技術研究中心, 南昌 330200;3.江西省交通科學研究院, 南昌 330200)
區域生態系統的結構及其變化的識別不僅是全球變化研究關注的重要內容[1],也是資源可持續管理[2]和區域農業規劃制定的重要依據[3-4]。開展區域生態系統類型的遙感監測,建立實時、快速的監測方法,獲取區域生態系統變化的相關知識,對于開展區域土地資源管理具有重要的戰略意義[5]。
植被指數是一種數據增強的方法,有助于增強遙感影像的解譯能力,廣泛應用于土地利用類型識別[6]、植被覆蓋度評價[7]、作物類型識別[8]和作物長勢監測與預報[9-10]等方面。植被指數能夠反映不同生態系統類型的光譜特征,基于植被指數的土地利用類型識別研究一直是國內外學者研究的熱點[11]。然而,受到大氣、遙感器定標、遙感器觀測條件、太陽入射角度、土壤濕度、顏色和亮度等因素的影響和制約[12],導致植被指數在不同環境下的效果不同,至今尚無研究明確各植被指數的適用范圍[13]。對于植被指數的選擇主要依據其物理意義或者借鑒相關研究結果,少有研究關注植被指數對研究區域的適應性,導致研究結果常存在爭議[14]。因此,在研究生態系統類型時需要結合環境特征選擇植被指數。常見的植被指數選擇方法根據是否使用樣本信息分為監督和非監督的方法[14]。基于樣本的監督植被指數選擇方法能夠反映區域環境特征,較之基于統計特征的非監督的選擇方法,如最佳指數(OIF)等,更易獲取最能區分研究區內生態系統類型特征的植被指數。
馬氏距離是由印度統計學家馬哈拉諾比斯提出的,表示數據的協方差距離,是一種能夠有效衡量樣本數據間相似度的算法,具有既消除變量間相關性干擾且不受量綱影響的優點[15]。本文結合許明明等[16]提出的基于類別可分的高光譜圖像波段選擇算法(Endmember separability based band selection,ESBB),將相關系數引入植被指數選擇算法中,利用馬氏距離選擇最適宜的植被指數集合,構建決策樹模型,以江西省吉安市永豐縣為研究對象,對生態系統進行自動識別。
永豐縣地處江西省中部,隸屬吉安市,區域范圍在北緯26°38′~27°32′,東經115°17′~115°56′。東西窄,南北長,呈啞鈴狀,面積約2 710 km2(圖1)。永豐全縣人口約48萬,下轄8個鎮,13個鄉,縣政府駐恩江鎮。全縣地勢由東南向西北傾斜,整個地貌山脊線形成四周高,中間低的趨勢。屬亞熱帶季風氣候,四季分明,雨量充沛,年均溫度18℃,年平均降水量1 627 mm。永豐縣是“林業百佳縣”,森林覆蓋率超過70%,自然資源豐富,生態環境良好。

圖1 研究區域Fig.1 Research area
1.2.1數據來源與預處理
采用的主要數據為Landsat 8 OLI遙感影像,來源于地理空間數據云(http:∥www.gscloud.cn/),成像時間為2016年9月27日,太陽高度角54°,方位角143°,空間分辨率為30 m,研究區范圍內無云,原始圖像共有9個波段。采用ENVI軟件進行輻射定標,FLAASH大氣校正模型進行大氣校正,C模型進行地形校正[17],得到地表反射率。采用IDL計算主要的植被指數。影像投影為UTM(Zone50N),基準面為WGS-84;后期對影像做了不規則裁剪、波段重組等預處理。輔助數據包括2016年的《永豐統計年鑒》,用于對分類結果進行對照;Planet 3 m分辨率的遙感影像,用于目視解譯、分類后精度評價。
1.2.2生態系統的植被指數選擇
本文計算了包括歸一化植被指數(Normalized difference vegetation index,NDVI)、改進歸一化水體指數(Modified normalized difference water index,MNDWI)、增強植被指數(Enhanced vegetation index,EVI)、歸一化建筑指數(Normalized difference build-up index,NDBI)以及基于通用光譜模式分解算法的植被指數(Vegetation index based on the universal pattern decomposition method,VIUPD)[18]等41種[19]常用植被指數。部分植被指數間的相關性較高,信息冗余量大(圖2)。本研究將相關系數和馬氏距離相結合,構建植被指數集識別生態系統的類型。

圖2 植被指數相關性分析Fig.2 Correlation analysis among vegetation indices
馬氏距離是一種能夠有效衡量樣本數據間相似度的算法[20]。假設2組樣本數據i、j組成的列向量為xi、xj,則兩向量間的馬氏距離定義為
(1)
式中S——向量xi與xj的協方差矩陣
植被指數選擇算法的描述如下:
(1)計算各植被指數間的Pearson相關系數
(2)
式中Pij——植被指數fi與fj的相關系數
COV(xi,xj)——xi與xj的協方差
D(xi)——xi的方差
D(xj)——xj的方差
(2)初始化C,計算各生態系統類型在植被指數上的馬氏距離均值集合D,將D中最大值對應的植被指數fi賦給C。
fmax=fi(Di=max(D))
(3)
C=C∪{fmax}
(4)
S=S-fmax
(5)
式中C——被選擇植被指數集合
S——植被指數集合
fmax——馬氏距離最大的植被指數
(3)將滿足|Pij| Ii=C∪fi(fi∈C,|Pij| (6) C=C∪{fi} (fi=max(D)) (7) S=S-fi (8) (4)重復步驟(3),直到未選擇的植被指數與C中植被指數間相關系數的絕對值大于0.34。 C=C∪fi(fi∈S,|Pij| (9) 1.2.3基于決策樹規則的生態系統信息提取方法 采用本文提出的植被指數選擇方法,利用ENVI和CART算法,構建決策樹分類模型,識別典型生態系統類型及其分布。首先采用1.2.2節中的算法確定生態系統提取的順序,再根據CART算法設置模型閾值,提取生態系統類型信息。 根據本文提出的植被指數選擇算法,首先識別濕地生態系統和非濕地生態系統,然后區分植被和非植被。生態系統信息識別順序和所建立的決策樹模型詳見圖3。 圖3 基于決策樹的生態系統識別Fig.3 Ecosystem information extraction based on decision tree (1)濕地生態系統和非濕地生態系統信息提取 根據本文提出的植被指數選擇算法,采用MNDWI和轉換差值植被指數(Transformed difference vegetation index,TDVI),通過設定閾值提取濕地生態系統和非濕地信息。優先識別濕地和非濕地生態系統,可獲得較高的分類精度。由圖4可知,濕地生態系統的MNDWI明顯高于其他生態系統類型,而其TDVI顯著低于其他生態系統類型,植被指數MNDWI與TDVI相結合能夠有效提取濕地信息。 (2)植被與非植被信息提取 根據植被選擇算法,植被與非植被在土壤調整植被指數(Soil adjusted vegetation index,SAVI)上的馬氏距離最大。裸地和城鎮等非植被生態系統的SAVI值都小于0.310,植被與非植被區分明顯(圖4)。 (3)森林、草地與農田信息提取 森林、草地與農田在綠度總和指數(Sum green index,SGI)上的馬氏距離最大,草地的含水率明顯低于農田(圖4)。設置SGI為4.610提取森林生態系統,將MNDWI的閾值設置為0.517,可區分草地和農田。 圖4 不同生態系統植被指數對比Fig.4 Comparisons of vegetation indices of different ecosystems (4)裸地、城鎮與已收割農田信息提取 已收割農田和城鎮、裸地在植被指數SAVI上馬氏距離最大,城鎮和裸地在植被指數氧化鐵比率(Iron oxide ratio,IO)、燃燒面積指數(Burn area index,BAI)上馬氏距離最大,SAVI大于0.204可以提取農田信息,IO大于0.753、BAI小于0.025可以有效地分離裸地和城鎮。 根據圖3建立的決策樹模型識別生態系統類型,并對識別精度進行評價(表1)。總體精度為89.11%,Kappa系數為0.90,較好地區分了生態系統類型。其中,森林、濕地和裸地的用戶精度、制圖精度較高,錯分誤差、漏分誤差較低;草地、城鎮、農田錯分、漏分現象相對較多,這和遙感影像的分辨率、研究區地形密切相關,但結果可滿足制圖需求。 永豐縣生態系統空間分布格局詳見圖5。森林生態系統是永豐縣最主要的生態系統類型,約占全縣面積的76.93%;其次是農田生態系統,面積約占全縣面積的16.27%,主要分布在研究區域的北部和中部平原地區;裸地、城鎮、濕地和草地生態系統分別占全縣面積的3.65%、1.90%、0.81%和0.44%。 表1 決策樹分類精度Tab.1 Extraction precision of decision tree 圖5 永豐縣生態系統類型圖Fig.5 Ecosystem types map of Yongfeng County 將植被指數間的相關系數與馬氏距離相結合構建植被指數選擇算法,減少了數據冗余,提高了生態系統識別的精度。ESBB算法通過馬氏距離最大化圖像中各類地物的可分性來確定最優的波段組合,較之其他波段選擇算法,該方法具有不需要大量訓練樣本等優點[16]。但ESBB算法沒有考慮波段間的相關性,只以馬氏距離作為波段選擇的唯一標準,易造成分類波段相關性較高、有效信息不足等問題,導致分類精度不高。本研究所采用的41種植被指數間存在顯著的相關性(圖2)。以濕地生態系統提取為例,由ESBB算法得到的植被指數為MNDWI和MNLI(Modified non-linear index),本研究提出的植被指數選擇算法所選植被指數為MNDWI和TDVI,濕地生態系統提取研究中常用的植被指數為MNDWI和NDVI[21-22](表2),識別精度詳見表3。結果顯示,MNDWI和TDVI的分類精度最高,為91.62%,MNDWI和TDVI的分類精度次之,MNDWI和NDVI的分類精度最低,為87.60%。MNDWI和NDVI的相關系數最小,但樣本的馬氏距離也最小,樣本分離度最低,其分類精度最低。MNLI是非線性指數的改進指數,其結合了土壤調整植被指數(SAVI)消除了土壤的影響[23]。樣本在MNDWI和MNLI上的馬氏距離最大,但MNDWI和MNLI相關性最大,MNDWI和MNLI所表達的信息具有一定的重疊,信息冗余度最大,導致其分類精度略低。MNDWI和TDVI較之MNDWI和MNLI,相關系數小,信息冗余度低。TDVI的飽和度較之于NDVI較低[24],有利于識別濕地生態系統。樣本在TDVI上的馬氏距離大于在NDVI上的馬氏距離,說明TDVI較之NDVI更適應研究區環境。 表2 植被指數公式Tab.2 Formula of vegetation indexes 注:N為近紅外波段,R為可見光紅波段,L為冠層背景調整因子,取0.5。 表3 不同植被指數濕地生態系統識別精度Tab.3 Accuracy of ecosystem identifications by different vegetation indexes 植被指數和決策樹是土地利用類型識別的常規方法[25],當前研究普遍采用的植被指數包括NDVI[26]、EVI[27]、NDBI[27-28]和MNDWI[29-30]等植被指數來識別土地利用類型。然而植被指數在不同環境下反映生態系統類型光譜特征的效果存在爭議,至今尚無研究明確各植被指數的適用范圍,因此在使用植被指數提取生態系統類型時,需要充分考慮區域的環境特征。馬氏距離能夠度量兩種類型在一組數據上的可分性,基于馬氏距離的植被指數選擇方法可獲取區域最適宜植被指數,以提高生態系統的識別精度。本文將植被指數間的相關系數引入植被指數選擇算法中,避免了信息冗余而導致分類精度的降低。 (1)將相關系數引入植被指數選擇算法中,構建的基于馬氏距離的植被指數選擇方法具有很好的適用性。 (2)通過植被指數選擇方法提出決策樹信息提取模型,對生態系統信息層層提取,識別生態系統類型與范圍的方案合理可行。 (3)基于上述的模型和方法,建立生態系統類型自動識別方案,在永豐縣的結果表明,相比傳統的方法本方案精度有了顯著提高, 同時也證明該方法有效可行。2 結果與分析
2.1 決策樹模型


2.2 生態系統類型識別及其精度


3 討論


4 結論