盛 輝, 韋靖靖, 胡耀東, 許明明, 崔建勇, 鄭紅霞
基于多時相Sentinel-2影像多特征優選的濕地信息提取
盛 輝1, 韋靖靖1, 胡耀東2, 許明明1, 崔建勇1, 鄭紅霞1
(1. 中國石油大學(華東)海洋與空間信息學院, 山東 青島 266580; 2. 青島市勘察測繪研究院, 山東 青島 266033)
本文提出了一種隨機森林(random forest, RF)模型和Pearson相關系數相結合的RF-Pearson模型特征優選方法。以多時相Sentinel-2影像為數據源, 提取多時相多特征; 利用RF-Pearson模型進行特征選擇, 篩選出特征重要性得分較高且相關性較小的特征作為優選特征, 參與黃河三角洲濕地信息提取; 最后將分類結果與多時相全特征和隨機森林模型優選特征進行比較。實驗表明: 特征優選能夠提高濕地信息的提取效果, 基于RF-Pearson模型特征優選方法的分類精度最高, 表明了特征優選方法的有效性以及特征優選在濕地分類方面的優勢。
黃河三角洲; 多時相; 特征優選; Pearson
黃河流域在中國生態安全、經濟發展和文化繁榮等方面具有十分重要的地位, 黃河三角洲自然資源豐富, 是帶動東部沿海地區產業結構調整和發展方式的重大引擎, 因此統籌各項任務、科學謀劃、明確用力方向, 對推進區域經濟跨越發展具有重要意義。濕地是地球上生產力最高的生態系統, 然而, 由于經濟快速度發展、人口不斷增加, 工農業較為發達, 人類活動越來越劇烈, 黃河三角洲地區在過去幾十年經歷了快速的土地覆蓋變化[1-2]。為了保護黃河三角洲區域的生態環境, 協調區域生態多樣性, 制定了各項生態環境保護條例, 統籌規劃了該區域今后的發展方向, 堅持以生態的方式治理生態。因此, 需要采用快速科學的方法, 對黃河三角洲濕地信息進行準確提取, 濕地信息的準確提取為黃河三角洲區域生態環境保護條例的科學制定奠定了基礎。
隨著遙感技術和圖像處理技能的快速發展, 利用遙感影像進行土地覆蓋研究成為主流。目前, 有眾多學者利用遙感數據的單一時相, 對濕地信息提取進行了研究[3-5]。但是, 濕地信息具有季相特點且濕地地物分布錯綜復雜, 僅靠單一時期數據對濕地信息進行分類, 缺乏季節性相關的濕地特征, 容易造成地物的混淆, 所以, 近幾年利用多時相遙感數據進行濕地信息提取的研究得到了發展[6-7]。還有一部分學者, 利用提取濕地地物的特征信息(如, 相植被、水體和紋理特征等)來改善濕地分類效果, 通過特征提取增加了地物間的差異特征, 對濕地信息提取精度有一定的提高[8-10]。充分利用特征信息, 可以提取多種類型的特征, 但多種特征會帶來“維數”災難, 造成數據冗余, 不僅分類的執行效率大打折扣, 而且影響濕地信息提取的效果, 勢必要對特征進行優選, 基于傳統的特征優選方法[11-13], 只考慮了特征之間的單一關系, 隨機森林模型特征優選只考慮特征在分類中的貢獻值, 缺乏特征之間的相關性分析, 使得篩選出的特征重要性得分高, 但特征之間的相關性較大, 導致數據冗余, 影響分類效果, 所以, 特征優選既要充分利用重要性高的濕地特征, 又要減小特征之間的數據冗余, 保證濕地信息的提取效果。
本文以黃河三角洲濕地作為研究區域, 以多時相Sentinel-2影像為數據源, 挖掘多種時相特征, 提出一種隨機森林模型和Pearson系數相結合的特征優選方法, 獲得最優特征組合; 分析多時相優選特征對黃河三角洲濕地信息提取的優劣, 為濕地信息的準確提取提供依據。
隨機森林分類器在每次建立隨機森林決策樹抽樣的過程中, 約有1/3的樣本數據未被抽取, 未被抽取的數據被稱為袋外數據(out of bag, OOB)。通過袋外數據產生的袋外誤差, 能夠計算參與分類特征的重要性得分, 選擇重要性得分高的特征, 從而達到特征優選的目的[14]。假設隨機森林中有棵樹, 對每一顆決策樹, 選擇相應的袋外數據計算袋外誤差E, 隨機對袋外數據OOB所有樣本的特征加入噪聲干擾, 再次計算袋外數據誤差2, 特征x的重要性記為, 則的計算公式為:

傳統的RF模型選擇的特征, 只考慮了特征對分類的相對重要性, 通過獲取重要性得分高的特征達到特征優選的目的, 但重要性得分高的特征之間也存在數據冗余, 所以, 傳統的RF模型缺乏特征之間的相關性運算。
本文采用隨機森林模型和皮爾遜相關系數相結合的RF-Pearson模型進行特征優選, 既能獲得貢獻值高的特征, 又能減少特征之間的相關性。
皮爾遜(Pearson)相關系數描述一種線性關系, 包括是否相關、正相關、負相關和相關的緊密程度。可以通過相關系數值來判斷兩個變量和之間的相關關系, 數值介于?1和1之間, 數值的絕對值大小與相關強度成正比。變量和的相關系數的計算公式為:


首先, 通過傳統的隨機森林模型評估每個特征在分類中的重要性, 再利用Pearson相關系數計算特征之間的相關性, 篩選出特征重要性得分較高且相關性較小的特征作為優選特征, 既能獲得貢獻值高的特征, 又能減數據冗余, 進而提高濕地信息提取效果。
黃河三角洲位于山東省東北部, 地處渤海之濱, 主要分布于東營市和濱州市境內, 面積廣闊。黃河三角洲是典型的河口濕地生態系統, 是保護物種多樣性的天然基因庫, 因此選擇該區域進行地物覆蓋類型研究, 研究區域如圖1所示。

圖1 研究區
Sentinel-2擁有多光譜成像設備, 能夠檢測到土地覆蓋信息, 包括植被覆蓋、生長狀況、土地環境和河流環境等信息, 這對監測土地環境具有重要意義, 特別是Sentinel-2紅邊指數更適于作物生物量的監測[15], 對植被監測十分有效。Sentinel-2進入運行狀態后, 地球赤道區域的完整測繪需要5 d, 而緯度較高的區域, 完整測繪一次僅需要3 d。
本文選用2018年黃河三角洲的Sentinel-2影像。首先, 對影像質量和云量條件初步篩選, 再選出具有季節代表的2幅影像, 使得選取的遙感影像能夠獲得更多的時相信息。選取對信息提取有用的10個波段, 去除無用波段, 減少數據冗余, 影像具體信息和選取的波段信息如表1、表2所示。
從歐洲航空航天局可以直接獲得L1C級的Sentinel-2數據, L1C級的數據已經經過歐洲航空航天局初步處理, 再對獲得的數據進行輻射定標和大氣校正, 該數據的大氣校正需要在ESA提供的SNAP軟件中完成, 對L1C級數據處理后獲得的是L2A級產品。

表1 Sentinel-2數據信息

表2 Sentinel-2波段參數
考慮到Sentinel-2數據波段較多且空間分辨率相差較大, 選用波段的空間分辨率大部分是20 m, 小部分是10 m, 如表2所示, 所以要對空間分辨率進行灰度值重采樣, 使波段空間分辨率統一到10 m。在重采樣方法中, 雙線性插值法雖然計算過程復雜且消耗大量的計算時間, 但能解決灰度值不連續的缺點, 效果較好, 并且圖像質量高。
為了科學、準確地對實驗區域進行分類研究, 本文根據實地勘測解譯資料和中國濱海濕地分類系統以及相關文獻資料[16], 制定的類別體系見表3。本研究區域中有10種土地覆蓋類型: 河流、潮灘、鹽地堿蓬、互花米草、蘆葦、天然柳林、檉柳林、互花米草、耕地和坑塘。

表3 研究區分類體系
本文的樣本數據從收集的資料、現場實地踏勘數據和影像目視解譯三個方面獲得。收集的資料主要是2019年的地面實測數據; 2020年, 實驗組對黃河三角洲自然保護區進行了詳細的調研, 對不同濕地分布及其植被類型進行定位、記錄并拍照; 依據2020年Google Earth影像進行目視解譯, 本文研究區域位于黃河口自然保護區內, 人為活動稀少且土地受國家法律法規保護, 土地利用情況人為干預程度低, 地物類型在一定周期內變化較小。根據確定的土地覆蓋類型, 在實驗區域中均勻選取了10類地物樣本, 分別是河流、潮灘、鹽地堿蓬、互花米草、蘆葦、天然柳林、檉柳林、互花米草、耕地和坑塘, 訓練樣本與驗證樣本之比約為7∶3, 樣本如圖2所示。

圖2 研究區樣本點的空間位置
為了充分利用濕地地物的特征信息, 以多時相光譜數據為基礎, 提取多種類型的特征, 主要包括植被、水體、土壤、紅邊和紋理特征[17-18], 相關特征集的描述見表4, 每幅影像共提取21個特征。
實驗選擇Sentinel-2影像的原始波段作為光譜特征; 提取的植被特征有歸一化植被指數(normalized difference vegetation Index, NDVI)、比值植被指數(ratio vegetation index, RVI)和差值植被指數(differe-nce ve-ge-tation index, DVI)、增強型植被指數(enha-nced vegetation index, EVI); 水體特征包括歸一化水體指數(normalized difference water index, NDWI)、修改型歸一化水體指數(modified normalized difference water index, MNDWI)和地表水體指數(land surface water index, LSWI); 土壤特征為土壤調節植被指數(soil adjusted vegetation index, SAVI); 紅邊波段是特別針對Sentinel-2而設計的, 利于植被信息提取, 通過紅邊波段生成的紅邊光譜特征指數包括4.5 μm波段歸一化差異指數(normalized difference index for the 4.5 μm band, NDI45)、反射率修正型葉綠素吸收指數(modified chlorophyll absorption in reflectance index, MCARI)、植物衰老反射率指數(plant senescence reflectance index, PSSRI)、歸一化紅邊差異指數1 (normalized difference red edge index 1, NDre1)和歸一化紅邊差異指數2 (normalized difference red edge index 2, NDre2), 它們的計算見表4。
圖像紋理特性的獲取方法有很多種, 灰度共生矩陣(gray-level co-occurrence matrix, GLCM)是目前最常用的方法。灰度共生矩陣用二方位像素的共同概率密度系數來描述, 它不但反應了對比度的分配特性, 而且反應有同樣明亮或相似明亮的像素間的分配特征, 是有關圖形對比度變化的二階統計特征。基于土地覆蓋類型在圖像空間上的紋理屬性, 提取紋理特征, 反映感興趣地物在圖像空間上的相互作用關系。
主成分分析(PCA)是一種常用的波譜降維方法[19], 用主成分分析法實現遙感紋理特征的降維, 取主成分分后的第一主成分, 利用灰度共生矩陣法提取影像的8個特征: 角二階矩(GLCM_A)、對比度(GLCM_Con)、相關性(GLCM_Cor)、差異性(GLCM_D)、熵(GLCM_E)、同質性(GLCM_H)、均值(GLCM_M)和方差(GLCM_V)。
本文采用2種分類器, 隨機森林(random forest, RF)和支持向量機(support vector machin, SVM)。比較不同分類器的實驗結果, 可以消除分類器本身的局限性產生的影響, 保證信息提取結果更具有科學性。
隨機森林算法[20]是由Breiman等人于2001年提出的一種非參數的集成算法, 將分類回歸樹(CART)作為基礎分類器構建而成的集成分類器。在原始訓練集中隨機有放回的選擇訓練子集, 每個大小等于原始數據, 由多棵決策樹對數據集進行預測, 形成隨機森林預測, 對得到的預測分類結果進行投票決策確定類。實驗結果證明, 如果假設決策樹的數量是100, 則其信息提取結果最穩定, 因此將決策樹的數目設置為100。

表4 光譜指數描述
支持向量機算法是一種二分類模型, 將實例的特征向量(以二維為例)映射為空間中的一些點, SVM本質是利用“一條線”將空間中的點劃分為兩類, 兩類點有各自的特征屬性, “線”可以有很多條, 關鍵在于區分類的效果, 多條“線”可以將空間中的點劃分為多類, 這些“線”還可用于回歸或其他任務。
為了證明所用方法的有效性, 本文采用視覺評估和分類性能進行評價。視覺評估用于檢查明顯的分類錯誤, 而從測試樣本導出的混淆矩陣用于通過以下指標定量評估分類性能: 生產者精度(PA)、用戶精度(UA)、總體精度(OA)和Kappa系數。
本文的多時相原始光譜信息中包含較多的濕地季相差異特征, 保留差異特征更能充分利用時相信息, 因此, 只對提取的42個多時相特征進行優選。采用隨機森林模型原始光譜信息和提取的特征進行重要性評估, 獲得每個特征在分類中的重要性得分, 為了更直觀地展示每個特征的重要性, 繪制了特征的重要性排序圖, 如圖3所示。

圖3 特征重要性排序
注:2_12表示為12月份波段2, 以此類推
在特征重要性得分的基礎上, 利用Pearson相關系數計算提取特征之間相關系數值, 找到Pearson相關系數值大于0.9的特征, 通過比較特征的重要性得分, 移除重要性得分較低的特征, 實現對提取的植被、水體、土壤、紅邊和紋理特征的降維, 42個特征經過RF-Pearson優選方法運算后, 獲得23個特征作為優選特征, 獲得的優選特征及其相關性如圖4所示。同時, 獲取僅用傳統RF模型獲取重要性得分高的前23個特征, 作為對比實驗。

圖4 優選特征及Pearson相關系數圖
注: DVI_9表示為9月份提取DVI植被指數, 以此類推
本研究區域中有10種地物類型, 它們在不同特征上有不同的反射值, 為了更直觀地描述地物在多時相優選特征上的可分性, 繪制地物在不同特征上的響應值。由于不同地物在同一特征上的反射值差異較大, 需要對地物反射值進行線性歸一化處理, 然后繪制地物的特征曲線, 如圖5和圖6所示。
從圖5可以看出, 養殖池塘、坑塘、耕地和河流的可分性較高, 植被的可分性較低; 9月份, 蘆葦、互花米草、天然柳林的特征曲線接近, 12月份, 潮灘和鹽地堿蓬的特征曲線幾乎重合, 蘆葦、檉柳林和天然柳林的特征曲線變化一致且接近。從圖6可以看出, 利用紋理特征可以將互花米草分離; 鹽地堿蓬在優選特征上的整體曲線差異大, 可分性較好; 蘆葦、檉柳林和天然柳林的總體特征曲線接近, 在部分特征上表現出可分性。總體來看, 多時相原始光譜和優選特征能夠形成優勢互補, 在濕地的識別上有很大的優勢。
為了準確科學地評價分類結果, 圖7展示了分類結果圖, 表5統計了各地物類型的分類精度, 可以得出:

圖5 多時相特征曲線
注:2_9表示為9月份波段2, 以此類推

圖6 優選特征曲線
注: DVI_9表示為9月份提取的DVI植被指數, 以此類推

注: RF表示隨機森林方法, RF-Pearson表示隨機森林和皮爾遜相關系數相結合的方法, SVM表示支持向量機方法。

表5 地物分類精度統計
注: RF表示隨機森林方法, RF-Pearson表示隨機森林和皮爾遜相關系數相結合的方法, SVM表示支持向量機方法。
1)通過對圖7目視解譯發現, 所有分類結果都存在一定的“椒鹽”現象, 并且, 在所有的分類方案中都存在錯分與漏分現象, 如散落在潮灘的鹽地堿蓬和檉柳林被分為潮灘, 部分潮灘被分為檉柳林, 天然柳林與蘆葦之間混分嚴重, 互花米草與蘆葦之間的混分, 在水陸交界處, 部分河流被分為坑塘, 部分河流被分為養殖池塘。
2)從生產者精度(PA)和用戶精度(UA)來看, 檉柳林和天然柳林的分類精度較低, 這主要是受到它們空間分布的影響, 容易受到周圍地物拓撲關聯的影響, 但是天然柳林和檉柳林在整個區域中所占比重較小,所以對總體信息提取精度的影響不大。其他地物的提取效果相對較好, 其中, 河流和耕地的提取精度較高, 在所有分類方案下的精度普遍達到90%以上, 主要是耕地和河流的特征明顯, 易與周圍地物分離。
3)在基于不同數據的分類方案中, RF分類器的分類精度都高于SVM分類器, RF分類器的平均總體精度為90.61%, 比SVM分類器的平均總體精度高出2.83%; 在多時相原始光譜數據中, 加入各類特征后, RF分類器受到特征的影響較大, 分類精度曲線變化明顯, SVM分類器受到特征的影響較小; 但僅憑精度難以區分2種分類算法的優劣, 因為分類算法受到算法參數的影響, 改變參數, 分類精度也會發生變化。
4)基于RF-Pearson模型的特征優選方法, 在兩種分類器的分類結果中, 分類精度都高于傳統的RF模型的特征優選方法, 驗證了RF-Pearson模型在特征優選方面的有效性。與不進行特征優選的多時相全特征相比, RF-Pearson特征優選對鹽地堿蓬和天然柳林的生產者精度影響較大, 在RF分類器下, 鹽地堿蓬的生產者精度提高7.62%, 天然柳林的生產者精度提高11.06%。
5)從表5的分類精度來看, 在多時相的基礎上增加提取的特征, 能夠提高濕地信息的分類效果, 但多特征容易產生“維度”災難, 進行特征優選后精度提高。本文基于RF-Pearson模型特征優選的分類精度在兩種分類器中都達到了最高, 其中, 采用RF分類器的信息提取精度較高, 總體精度為91.55%, Kappa系數為0.895, 表明了特征優選在濕地分類方面的優勢。
本文利用多時相Sentinel-2影像, 提取多時相特征并進行特征優選, 提出一種基于RF-Pearson模型的特征優選方法, 采用了隨機森林和支持向量機2種分類器, 實現了黃河三角洲區域的濕地信息提取。優選特征利用較小的特征維數保留了較多的地物重要信息, 分類精度得到改善, 驗證了RF-Pearson模型的特征優選方法的有效性, 也表明了特征優選在濕地分類方面的優勢。
本文后續研究將考慮利用不同種類的衛星遙感數據源進行濕地協同分類, 并結合長時間序列遙感數據, 進行更細致的濕地信息提取研究。
[1] 宮寧, 牛振國, 齊偉, 等. 中國濕地變化的驅動力分析[J]. 遙感學報, 2016, 20(2): 172-183.
GONG Ning, NIU Zhenguo, QI Wei, et al. Analysis on the driving forces of wetland change in China[J]. Journal of Remote Sensing, 2016, 20(2): 172-183.
[2] 宋百媛, 侯西勇, 劉玉斌. 黃河三角洲—萊州灣海岸帶土地利用變化特征及多情景分析[J]. 海洋科學, 2019, 43(10): 24-34.
SONG Baiyuan, HOU Xiyong, LIU Yubin. Land use change characteristics and multi scenario analysis in the coastal zone of the Yellow River Delta Laizhou Bay[J]. Marine Sciences, 2019, 43(10): 24-34.
[3] HU Y B, ZHANG J, MA Y, et al. Hyperspectral coastal wetland classification based on a multiobject convolutional neural network model and decision fusion[J]. IEEE Geoscience and Remote Sensing Letters, 2019, 16(7): 1110-1114.
[4] DU B J, MAO D H, WANG Z M, et al. Mapping wetland plant communities using unmanned aerial vehicle hyperspectral Imagery by comparing object/pixel-based classifications combining multiple machine-learning algorithms[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14(10): 8249-8258.
[5] REZAEE M, MASOUD M, ZHANG Y, et al. Deep convolutional neural network for complex wetland classification using optical remote sensing imagery[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2018, 11(9): 3030-3039.
[6] 高瑞, 王志勇, 周曉東, 等. 利用多時相遙感監測與分析黃河三角洲濕地變化動態[J]. 測繪通報, 2021, 19(4): 22-27.
GAO Rui, WANG Zhiyong, ZHOU Xiaodong, et al. Monitoring and analysis of wetland change in the Yellow River Delta by multi temporal remote sensing[J]. Bulletin of Surveying and Mapping, 2021, 19(4): 22-27.
[7] 魏鵬飛, 徐新剛, 楊貴軍, 等. 基于多時相影像植被指數變化特征的作物遙感分類[J]. 中國農業科技導報, 2019, 21(2): 54-61.
WEI Pengfei, XU Xingang, YANG Guijun, et al. Crop remote sensing classification based on vegetation index change characteristics of multi temporal images[J]. China Agricultural Science and Technology Guide, 2019, 21(2): 54-61.
[8] GUO H J, CAI Y P, YANG ZF, et al. Dynamic simulation of coastal wetlands for Guangdong-Hong Kong- Macao Greater Bay area based on multi-temporal Landsat images and FLUS model[J]. Ecological Indicators, 2021, 4(125): 107559-107559.
[9] 張磊, 宮兆寧, 王啟為, 等. Sentinel-2影像多特征優選的黃河三角洲濕地信息提取[J]. 遙感學報, 2019, 23(2): 313-326.
ZHANG Lei, GONG Zhaoning, WANG Qiwei, et al. Wetland information extraction in the Yellow River Delta Based on multi feature optimization of Sentinel-2 image[J]. Journal of Remote Sensing, 2019, 23(2): 313-326.
[10] 梁爽, 宮兆寧, 趙文吉, 等. 基于多季相Sentinel-2影像的白洋淀濕地信息提取[J]. 遙感技術與應用, 2021, 36(4): 777-790.
LIANG Shuang, GONG Zhaoning, ZHAO Wenji, et al. Baiyangdian wetland information extraction based on multi seasonal Sentinel-2 image[J]. Remote Sensing Technology and Applicatio, 2021, 36(4): 777-790.
[11] 郝玉峰, 滿衛東, 汪金花, 等. Relief-F算法及決策樹方法下的濕地信息提取[J]. 遼寧工程技術大學學報(自然科學版), 2021, 40(3): 225-233.
HAO Yufeng, MAN Weidong, WANG Jinhua, et al. Wetland information extraction based on Relief-F algorithm and decision tree method[J]. Journal of Liaoning University of engineering and Technology (Natural Science Edition), 2021, 40(3): 225-233.
[12] 劉家福, 李林峰, 任春穎, 等. 基于特征優選的隨機森林模型的黃河口濱海濕地信息提取研究[J]. 濕地科學, 2018, 16(2): 97-105.
LiU Jiafu, LI Linfeng, REN Chunying, et al. Study on information extraction of coastal wetland in the Yellow River Estuary based on random forest model with feature optimization[J]. Wetland Science, 2018, 16(2): 97-105.
[13] 夏盈, 厲恩華, 王學雷, 等. 基于特征優選的隨機森林算法在濕地信息提取中的應用——以湖北洪湖濕地自然保護區為例[J]. 華中師范大學學報(自然科學版), 2021, 55(4): 639-648.
XIA Ying, LI Enhua, WANG Xuelei, et al. Application of random forest algorithm based on teature optimization in wetland information extraction -- a case study of Honghu wetland nature reserve in Hubei Province[J]. Journal of Central China Normal University (Natural Science Edition), 2021, 55(4): 639-648.
[14] GENUER R, POGGI J M, CHRISTINE T M. Variable selection using random forests[J]. Pattern Recognition Letters, 2010, 31(14): 2225-2236.
[15] 鄭陽, 吳炳方, 張淼. Sentinel-2數據的冬小麥地上干生物量估算及評價[J]. 遙感學報, 2017, 21(2): 318-328.
ZHENG Yang, WU Bingfang, ZHANG Miao. Estimation and evaluation of aboveground dry biomass of winter wheat based on Sentinel-2 data[J]. Journal of Remote Sensing, 2017, 21(2): 318-328.
[16] 牟曉杰, 劉興土, 閻百興, 等. 中國濱海濕地分類系統[J]. 濕地科學, 2015, 13(1): 19-26.
MOU Xiaojie, LIU Xingtu, YAN Baixing, et al. Classification system of coastal wetlands in China[J]. Wetland Science, 2015, 13(1): 19-26.
[17] ALFONSO F M, OSCAR F M, CARMEN Q. Sentinel-2A red-edge spectral indices suitability for discriminating burn severity[J]. International Journal of Applied Earth Observation and Geoinformation, 2016, 50(2): 170-175.
[18] FORKUOR G, DIMOBE K, IDRISS S, et al. Landsat 8 vs Sentinel 2 examining the added value of sentinel 2 s red edge bands to land use and land cover mapping in Burkina Faso[J]. GIScience & Remote Sensing, 2018, 3(55): 331-354.
[19] 李曉敏, 張杰, 馬毅, 等. 基于主成分分析和決策級融合的高光譜圖像分類方法研究[J]. 海洋科學, 2015, 39(2): 25-34.
LI Xiaomin, ZHANG Jie, MA Yi, et al. Hyperspectral image classification based on principal component analysis and decision level fusion[J]. Marine Sciences, 2015, 39(2): 25-34.
[20] 詹國旗, 楊國東, 王鳳艷, 等. 基于特征空間優化的隨機森林算法在GF-2影像濕地分類中的研究[J]. 地球信息科學學報, 2018, 20(10): 1520-1528.
ZHAN Guoqi, YANG Guodong, WANG Fengyan, et al. Research on the random forest algorithm based on feature space optimization in wetland classification of GF-2 image[J]. Journal of Geo Information Science, 2018, 20(10): 1520-1528.
Wetland information extraction based on multifeature optimization of multitemporal Sentinel-2 images
SHENG Hui1, WEI Jing-jing1, HU Yao-dong2, XU Ming-ming1, CUI Jian-yong1, ZHENG Hong-xia1
(1. College of Oceanography and Space Information, China University of Petroleum (East China), Qingdao 266580, China; 2. Qingdao Municipal Institute of Surveying and Mapping, Qingdao 266033, China)
This paper presents a method for feature optimization of the RF-Pearson model based on the combination of the random forest model and Pearson correlation coefficient. The multitemporal Sentinel-2 image was used as the data source for extracting multitemporal features. Furthermore, the RF-Pearson model for feature selection was employed to select the features with a high importance score and low correlation of feature variables as the preferred features, participating in the wetland information extraction in the Yellow River Delta. Finally, the classification results were compared with multitemporal full and random forest model optimization features. Experiments revealed that feature optimization can enhance the extraction effect of wetland information, and the feature optimization method based on the RF-Pearson model had the highest classification accuracy, indicating the efficacy of the feature optimization method and the benefits of feature optimization in wetland classification.
Yellow River Delta; multitemporal; feature optimization; Pearson
Jun. 26, 2022
TP79
A
1000-3096(2023)5-0102-11
10.11759/hykx20220626001
2022-06-26;
2022-08-03
中央高校基本科研業務費專項資金資助(22CX01004A-8); 國家自然科學基金面上項目(62071492)
[Special Fund for Basic Scientific Research Business Expenses of Central Universities, No. 22CX01004A-8; General program of National Natural Science Foundation of China, No. 62071492]
盛輝(1972—), 男, 漢族, 山東定陶人, 副教授, 主要從事海洋遙感、傾斜攝影測量、土地利用和土地覆蓋變化監測, E-mail: sheng@upc.edu.cn; 崔建勇,通信作者(1976—), 男, 漢族, 講師, 主要從事遙感圖像處理與分析、時間序列遙感數據重建和海洋水色要素定量反演, E-mail: cui_jianyong@upc.edu.cn
(本文編輯: 楊 悅)