












關鍵詞:椰子林;面向對象分類;分割尺度;Gaofen-2 影像
中圖分類號:TP79 文獻標志碼:A
椰子是熱帶地區非常重要的木本油料經濟作物[1],具有極高的營養、藥用和經濟價值。椰子樹對溫度、溫差、光照時長、降雨等氣候條件有特殊要求,適宜生長在高溫多雨的低海拔濕熱地區[2]。亞洲是世界椰子的主產區,中國椰子種植區主要分布在海南、云南、廣西、臺灣,其中海南椰子種植面積占全國的90%以上[3]。椰子作為海南“三棵樹”產業(橡膠、檳榔、椰子)之一,是海南的代表性產業[4]。椰子等熱帶特色產業的發展對海南經濟發展、鄉村振興具有十分重要的作用[5]。椰子種植面積及空間分布信息對熱帶農業產業布局優化和政策調整非常重要。傳統的椰子林面積獲取主要采用統計報表和抽樣調查的方式,該方法獲取的數據耗時、耗力、誤差大。遙感具有快速、實時、宏觀等特點,為農作物的空間分布提供了強有力的手段。
遙感技術在農作物遙感分類中已得到廣泛應用。傳統的基于像元分類方法僅利用作物光譜信息,而忽視了鄰近像元信息的重要性[6-7]。面向對象分類方法將相似像元聚合成對象,充分應用影像的光譜特征、幾何特征和結構特征,能極大地避免“椒鹽”現象的產生,提高地物分類提取精度[8],該方法已經在水稻[9]、油菜[10]、玉米[11]等作物分類中得到了很好的應用。然而,熱帶作物種植分散、面積小、種植結構復雜;且作物生長物候期不明顯,基于遙感手段進行熱帶作物的精準識別更具挑戰性。目前,針對熱帶作物的面向對象分類,已有學者開展了相關研究,如馬洋洋等[12]在面向對象分割中引入歸一化植被指數(Normalized Difference Vegetation Index, NDVI)和數字高程模型(Digital Elevation" Model, DEM)輔助數據進行了廣西武鳴區的木薯遙感分類,總體分類精度為85%;任傳帥等[13]結合植被覆蓋度和坡度的面向對象分類提取了三亞芒果林空間分布信息,制圖精度達到92.81%;王久玲等[14]采用光譜均值、NDVI 和同質性(homogeneity)紋理特征對廣西貴港市甘蔗進行面向對象分類識別,分類精度達到91.30%。然而,針對椰子林面向對象分類提取的研究鮮有報道。
本研究以文昌市東郊鎮為研究區, 基于Gaofen-2影像和面向對象分類方法開展椰子林分類提取研究,具體包括:影像最優分割尺度分析,利用光譜特征、紋理特征和植被指數3 種類型的輔助特征參量構建不同的分類組合,對比分析不同分類組合的椰子林分類精度,探尋適宜Gaofen-2衛星影像的椰子林空間分布提取方法,為多云多雨地區熱帶作物的遙感分類識別提供參考。
1 材料與方法
1.1 研究區概況
文昌市位于海南島的東北部,東、南、北三面臨海,屬海洋季風氣候濕潤區[15],地勢低平,年降雨量為1800~2500 mm[16],年均氣溫為23.9 ℃。文昌市以種植椰子為主,據文昌市統計年鑒(2020)顯示,2019 年全市椰子種植面積達14 967.4 hm2,其中東郊鎮的椰子種植面積達3271.4 hm2,是文昌市椰子種植面積最大的鄉(鎮)。本文選取的研究區(圖1)位于東郊鎮(110°51′07″~110°52′24″E,19°31′52″~19°32′44″N),野外調研發現該區主要土地利用類型為椰子林、耕地(水田和旱地)、其他林地(木麻黃林等)、水體、建筑地(包括居民地和道路)5 種。盡管選用的研究區域范圍較小,但能代表文昌市椰子種植區的典型土地利用特征。
1.2 數據來源及處理
本研究選取Gaofen-2 影像,數據獲取時間為2015年6月30日,數據來源于中國資源衛星應用中心(http://www.cresda.com/CN/)。Gaofen-2數據包括4 m 的多光譜影像和1 m 的全色影像,具體波段參數信息見表1。數據預處理包括輻射定標、大氣校正、幾何校正、圖像融合、圖像裁剪,最終獲得研究區1 m 的Gaofen-2 融合影像。所有的影像預處理操作均在ENVI 5.3軟件中進行,其中大氣校正采用FLAASH 模型,多光譜和全色影像的融合采用NNDiffuse Pan Sharpening 融合算法,該方法能同時保留較好的高空間細節和光譜保真效果[17]。為掌握研究區椰子林的分布情況,本研究的樣本點數據主要采用手持全球定位系統(Global Positioning System, GPS)野外采集及Google Earth。采用分層隨機抽樣方法,將地類類型分為5 層(椰子林、耕地、其他林地、水體、建筑地),在每一層中獨立按照隨機抽樣方法抽取樣本;共采集樣本點數為2723 個(其中椰子林985個,耕地708 個,其他林地220 個,建筑地518個,水體292 個),并將樣本點按照6∶4的比例分為訓練樣本點和驗證樣本點2 種數據集。為了保證分類精度評價結果的可對比性,本研究中使用相同的訓練樣本點數據集進行椰子林遙感分類提取,然后基于相同驗證樣本點數據集評估分類結果。
1.3 研究方法
1.3.1 最優分割尺度選擇 影像分割是面向對象分類非常重要的步驟,主要是將具有類似空間和光譜特征的像元劃分為一個對象,最終形成多個同質性強的影像對象,以此減少同類地物的特征差異性,增加不同地物類型的可分性。本研究采用分形網絡演化算法(fractal net evolution approach,FNEA)進行Gaofen-2 影像分割,該方法自下而上(bottom-up)地將像元合并為具有同質性且能與周圍對象區分開的影像對象,較好克服了傳統分割算法對象邊界破碎的問題[18]。具體的公式如下[19]:
多尺度分割中,分割尺度的大小是影響分類結果的重要因素之一。分割尺度太大會產生影像欠分割現象,分割而成的對象中包含多種地物類型,分割尺度太小會產生過分割現象,導致分割對象過于破碎[17-18, 20]。因此,在綜合考慮分割對象類內同質性及類間異質性情況下,選擇合適的分割尺度參數對地物分類尤為重要。本研究使用尺度參數估計(estimation of scale parameter, ESP)進行椰子林面向對象分類的最優分割尺度評估。其原理為:采用迭代方法自動分割影像,計算每一個分割尺度下的局部方差(local variance, LV),進而分析不同對象LV 的變化率(rate of change,ROC),以此判定最優分割尺度[21]。ROC 曲線突然出現的峰值代表不同地物類型的可能最優分割尺度。ROC 的計算公式如下:
式中,LV 表示目前分割尺度計算得到的局部方差,LV-1 表示下一個更低分割尺度計算得到的局部方差。
1.3.2 特征變量選擇圖 2 為研究區5 種不同地物類型樣本點的光譜反射率箱線圖,可以看出耕地在藍和近紅外波段與其他地物有部分光譜重疊區,椰子林和其他林地兩類地物的箱線圖在4 個波段的反射率均有重疊。在光譜特征分析的基礎上,本研究選用了3 種類型特征變量:光譜波段、紋理特征和植被指數。紋理是地物在圖像中的典型特征,不同作物葉子的形狀和色調不同,從而導致遙感影像灰度值在空間位置上分布不同。計算紋理特征的方法有很多,其中常用的是灰度共生矩陣(gray level co-occurrence matrix, GLCM)。盡管GLCM 提供了影像灰度的方向、變化幅度和間隔信息,但并不能提供區別紋理的特征,需要基于GLCM 來提取描述紋理特征的統計屬性。均值、方差、同質性、對比度、差異性、相關性、熵和二階矩是常用來描述紋理特征信息的統計量[22],本研究中計算藍波(Blue)、綠波(Green)、紅波(Red)、近紅外(NIR)4 個波段的紋理特征統計量,共計32 個紋理特征量。植被指數體現不同作物在可見光及近紅外的光譜反射特性[23],能增加遙感影像的解譯能力,本研究選擇常用的5 種植被指數:歸一化植被指數、綠度植被指數、綠色指數、綠度歸一化植被指數、比值植被指數。紋理特征[24]和植被指數的具體計算公式見表2。
1.3.3 研究方案 本研究選用的研究方案如圖3所示,機器學習分類算法選擇隨機森林(random"forest)分類。對研究區影像進行最優尺度分割之后,根據輸入特征參量的類型形成不同的分類組合:OC1為僅使用光譜特征(4個特征變量)的面向對象分類,OC2為光譜特征和紋理特征組合36 個特征變量的分類,OC3為光譜特征和植被指數組合9 個特征變量的分類方法,OC4為光譜特征、紋理特征和植被指數組合的41 個特征變量的分類方法,采用不同組合開展椰子林分類提取,并結合野外驗證樣本點進行分類結果精度評估。此外,為了與面向對象分類結果進行對比研究,還采用了基于像元分類方法(記為PC1)對椰子林進行分類提取。
2 結果與分析
2.1 最優分割尺度
在研究區的Gaofen-2 遙感影像中,耕地在椰子林中呈帶狀分布;通過預分割試驗,分別將緊致因子和形狀因子設置為0.5 和0.2。根據1.3.1所述原理,計算得到不同分割尺度ROC 曲線圖(圖4)。從圖4 可以看出,有多個ROC 曲線波峰。綜合試錯法(trial-and-error)及人工目視判別結果,充分考慮分割對象內部同質性和對象間異質性,本研究采用的最優分割尺度為99(圖5)。
2.2 不同組合分類精度對比
基于野外采集的樣本點構建椰子林分類結果混淆矩陣,計算總體分類精度(overall accuracy,OA)、Kappa 系數、椰子林的制圖精度(producer’saccuracy, PA)、用戶精度(user’s accuracy, UA)和F1-score 作為精度評價指標來綜合評價Gaofen-2 衛星影像的椰子林分類提取效果。不同組合的分類精度如表3所示。
從總體分類精度來看(表3),基于像元的分類方法OA 達到87.05%(kappa=0.83)。面向對象分類方法(OC1~OC4)使椰子林識別精度有不同程度的提高,OC1 的OA 值提高幅度最小,為92.56%,相比基于像元分類方法(PC1)提高了5.51%,kappa 系數提高了0.07。引入紋理特征參數后,OC2 的OA 值得到大幅度提高,達到95.77%,相比PC1 提高了8.72%,kappa 系數提高了0.11,表明在面向對象分類方法中引入紋理特征對椰子林分類精度的提高起到了很大作用。引入植被指數參與遙感分類后,OC3 的OA 值為94.88%(kappa=0.93),相對于PC1,精度提高了7.83%,增幅略小于引入紋理特征分類的OC2。將植被指數和紋理特征參量全部參與椰子林分類識別,OC4 的OA 值為94.67%,低于單獨使用紋理特征或植被指數進行椰子林分類識別的OA值。盡管多特征參量參與分類計算更有利于地物分類識別,但特征參量的個數并不是越多越好。本研究中,OC4 參與椰子林分類的特征參量數最多(41 個),但其分類得到的OA 卻低于OC2(36個)和OC3(9 個)。可能是因為過多的特征會使特征維數變高,造成數據冗余,影響了總體分類精度。詹國旗等[25]的研究中同樣指出了特征參量冗余對分類會產生影響。
基于像元的PC1 分類的PA 和UA 值分別為86.29%和85.21%(表3)。采用面向對象分類方法后,OC1 椰子林的PA 值和UA 值分別提高到92.38%和89.88%.。相對于僅采用光譜特征,植被指數參與影像分類有效提高了椰子林提取的精度,OC3 的PA 值和UA 值分別達到94.41%和94.42%,與OC1 相比,其PA 值和UA 值分別增加了2.03%和4.54%。植被光譜特征在可見光和近紅外波段表現出雙峰和雙谷特征,通常在紅光波段吸收而在近紅外波段呈現出高反射和高透射特征[26],運用這些波段計算得到的植被指數一定程度地提高了椰子林的分類精度。OC2 不論是PA值還是UA 值均為5 種組合模式中最高,其PA 值和UA 值分別為95.18%和97.15%。,可以看出紋理特征的引入極大地提高了椰子林分類精度。椰子樹種植的株距為6~7 m,行距為8~9 m,樹干高達15~25 m,其葉片呈傘型羽毛狀從樹梢伸出(圖6A),單片長約4~6 m[2]。由于椰子的生長特點,椰子林在Gaofen-2 影像中呈現出獨特的色調變化和紋理特征。GLCM 能夠充分運用圖像的紋理特征,具有較強的魯棒性和自適應能力[27],對提高椰子林分類精度產生了重要的作用。
2.3 最優組合分類結果分析
綜合OA、Kappa、PA、UA 和F1-score 五個評價指標來看,OC2 組合對椰子林的提取效果最好,得到的分類精度最高。為了詳細分析影響椰子林錯分、漏分的主要因素,選擇分類精度最高的OC2 組合建立混淆矩陣(表4)。從表4 可以看出,有375 個椰子林像元被正確分類,圖像中有2.85%的椰子林像元被漏分為其他林地;從椰子林生產者精度來看,有4 個椰子林像元被錯分為耕地,有15 個椰子林像元被錯分為其他林地。通過以上分析可以發現,其他林地是降低椰子林提取精度的主要因素。值得注意的是,圖像中有5.10%的耕地像元被漏分為椰子林、其他林地和建筑地,其中漏分為建筑地的像元數為9 個,占總漏分像元的60.00%;從建筑地的生產者精度來看,耕地也是降低建筑地分類精度的主要因素。
從分類結果中可以看出,研究區面積較大的地物類型主要是椰子林和耕地,其中椰子林地塊較大,呈帶狀的耕地分布在椰子林中(圖7)。此外,研究區內還有少量的其他林地,椰子林與其他林地之間存在錯分漏分現象。盡管引入特征參量后椰子林的分類精度有所提高,但完全區分兩類地物仍存在難度。通過野外實地調研發現,椰子林與其他林地(主要為木麻黃林)交錯分布,地塊破碎度高,形狀不規則。木麻黃林一般造林株行距為2m×2m,平均樹干高度為9~24m[28-29],樹冠狹長呈圓錐形,與椰子林存在相似的光譜紋理特征(圖6A,圖6B)。在進行影像分割時,椰子林與其他林地分割得到的對象邊界不明顯,容易在兩類地物的邊界處出現分類結果混淆。
3 討論
利用遙感技術從破碎度高、多云多雨的熱帶區域提取單一熱帶作物仍較為困難。本研究基于國產Gaofen-2 高分辨率影像,采用最優分割尺度的面向對象分類方法,引入紋理特征和植被指數作為輔助特征參量開展椰子林分類提取研究,對比幾種特征參量組合的椰子林分類精度。研究表明,Gaofen-2 高分辨率遙感影像具有豐富的光譜特征信息,在椰子林分類提取中具有極大潛力,僅采用基于像元分類方法,椰子林的OA 值達87.05%。相比基于像元分類方法,將紋理特征和植被指數應用于椰子林識別得到了較好的分類效果,不同組合的面向對象分類方法OA值提高了5.51%~8.90%,表明引入輔助特征參量信息一定程度上可以提高椰子林識別精度。其中光譜特征和紋理特征組合分類結果最優,椰子林分類PA 和UA 值達到了95.18%和97.15%,紋理特征在作物識別中的重要性在許多研究中也得到了證實[30-32]。由光譜特征、紋理特征和植被指數組成的特征參量在椰子林分類提取中,無論是總體分類精度還是生產者精度均低于光譜特征和紋理特征組合、光譜特征和植被指數組合,表明特征參量的冗余對椰子林分類識別產生了較大的影響。WANG 等[33]、STEFANOS 等[34]也發現大量的特征參量會導致分類精度的降低,這與本研究結果一致。
考慮到特征冗余對作物分類精度的影響,下一步研究工作需綜合應用多種特征優化算法,篩選最優特征參量,進一步提高椰子林識別精度。此外,隨著Google Earth Engine(GEE)等遙感云計算服務平臺的廣泛使用,有效解決了海量遙感數據處理繁瑣、計算機配置要求高等問題[35],能大幅度縮短數據處理時間,為大范圍作物遙感監測提供了新的途徑和方法,未來將結合GEE 云平臺開展典型熱帶作物遙感分類研究。另外值得注意的是,本研究中光譜特征和紋理特征組合進行椰子林分類耗時為126.782s,而光譜特征和植被指數組合進行分類耗時僅為0.625s,雖然光譜特征和紋理特征組合所獲得的分類精度僅比光譜特征和植被指數組合提高了1.1%,但分類所需時間卻成倍增加,本研究僅選用2077×1581像元的小區域,若進行大面積椰子林分類識別時還需綜合權衡分類精度和耗用時間。