孔圓圓
(哈爾濱師范大學,黑龍江哈爾濱 150025)
濕地通常是指表面非常潮濕或經常被水飽和的區域,通常由植物、動物、微生物和環境組成。濕地內部結構的空間分布格局對濕地生態系統的穩定性十分重要。近年來,東北地區的濕地存在退化現象,準確獲得濕地中各種組成部分的生長和分布情況,對調節氣候、維持生態系統的平衡等發揮重要作用。
濕地包含多種多樣的地物,相鄰地物之間具有高度的光譜相似性。準確區分復雜地物類型成為濕地土地覆蓋分類的難題。相較于傳統的光譜影像,高光譜圖像可以同時獲得地面的光譜信息和二維空間信息,具有高光譜分辨率,含有豐富的光譜信息,具有圖譜合一、數據量大和隱含特征信息豐富等特點,增強了對地物目標的探測能力,能為濕地分類提供很好的數據源。隨著高光譜數據的發展,高光譜圖像已經成為遙感技術領域的熱點研究方向,其中高光譜數據的分析和處理方法也在不斷改進,可以細分為端元解混、異常檢測、圖像增強和圖像分類等[1-3]。其中一個重要的方面是高光譜圖像的分類,即根據高光譜圖像中的信息為圖像中每一個像元賦予類別標簽,分類的精度和分類效果的準確度與后續的實際應用聯系更為密切。傳統的圖像分類可以分為基于光譜特征的、基于空間特征的和基于空譜聯合特征的3種分類方法。基于光譜特征的遙感圖像分類方法,主要有主成分分析(Principal Component Analysis,PCA)、最小噪聲分離(Minimum Noise Fraction Rotation,MNF)、獨立主成分分析(Independent Component Analysis,ICA)等,這種利用特征提取的方法簡單直觀,且最大限度地保留了原始光譜數據的光譜信息,同時重要信息的丟失與畸變現象也存在。經過相關學者的算法改進,目前較好的分類器主要有邏輯回歸(Logistic Regreesion)、支持向量機(Support vector machines,SVM)、隨機森林(Randomm Forest,RF)、稀疏表達和K近鄰等。基于空間特征的遙感圖像分類,主要是利用中心像素與其上下文之間的關系,并綜合應用到高光譜圖像分類中,常見的空間特征提取方法有灰度共生矩陣、小波變化和局部二值模式等。該方法能有效獲取地物類型的位置、結構等空間信息,但缺點是忽略了高光譜圖像的光譜維度信息,分類效果并不理想。基于統計特性的傳統分類方法有監督分類和非監督分類2種,兩者的區別在于是否有已知類別的訓練樣本。其中監督分類有最大似然法(Maximum Likelihood,ML)、決策樹(Decision Tree)、隨機森林和支持向量機等,要先選取適當的已知地物類別的訓練樣本,讓分類系統對其特征進行學習,受方法或數據精度的制約,在具體的分類應用中提高高光譜數據的精度仍有很大的挑戰。非監督方法如k-均值分類是典型的聚類方法。在高光譜遙感影像下,應用這些淺層的機器學習分類模型進行濕地遙感的分類難以挖掘出高光譜圖像深層的信息,而采用深層結構的深度學習模型能夠充分利用光譜間的空間信息,如目前圖像識別中主流的技術深度學習能更好地分析和處理光譜間和空間分布的復雜的高光譜圖像[4]。國內外已有學者將深度學習應用在遙感圖像的分類和識別中[5-6],但是很少有人研究深度學習方法在沼澤濕地分類中的性能和效果。基于深度學習的高光譜圖像分類方法眾多,但是仍面臨著眾多挑戰:異物同譜、同物異譜、波段間信息的冗余和維數災難等,這些都影響高光譜圖像分類的精度。
鑒于此,本文以OHS 高光譜遙感影像洪河國家級自然保護區為研究對象,選擇深度學習的SegNet網絡模型和隨機森林算法對高光譜遙感影像進行分類,并對比分析分類結果和分類精度,為沼澤濕地遙感的植被監測和生態保護提供參考。
洪河國家級自然保護區位于黑龍江省三江平原東北部的撫遠縣與同江市的交界地帶,是一塊能夠全面反映三江平原濕地全貌的內陸濕地和水域濕地生態系統類型的自然保護區。保護區面積250.9 km2,地理坐標(47°42'~47°52')N,(133°42'~133°46')E。屬于溫帶大陸性季風氣候,年平均氣溫1.6~1.9 ℃,年均降水量為500~700 mm,年蒸發量為542~580 mm。全長25.7 km 的濃江河從保護區北部穿過,構成洪河國家自然保護區北側的自然邊界;此外還有從南向北匯入濃江河的沃綠藍河,總長7 km,是該保護區的核心水源。該地地貌單一,地勢平坦,平均海拔高度58 m,相對高差約3 m,由西南向東北傾斜,使得區內河汊、泡沼、蝶形及線性洼地遍布,各類低洼濕地沼澤遍布,構成了豐富多變的北方水生、陸生和濕生生態系統[7-8]。
ENVI Deep Learning Module 是基于深度學習框架(TensorFlow)開發的遙感圖像分類工具,基于圖像的空間和光譜特性識別圖像中的特征,通過一組標記的像素數據作為樣本對深度學習的Seg-Net 網絡模型進行訓練,用訓練好的模型在其他圖像中找到更多具有相同特征的像素,以進行特定目標的分類[9]。深度學習模型的基本流程如圖1所示。

圖1 深度學習模型的基本流程
由于研究區較大,選取子區域進行標簽的制作,子區域應包含待分類圖像中的所有樣本,訓練樣本應盡可能選取全面覆蓋多種地物類型,保證訓練樣本純度的同時,盡可能多地選取樣本。深度學習模型的訓練是重要流程,經過多次訓練調整參數,最終選取模糊距離(Blur Distance)最大值為2,最小值為1,類別的權重(Class Weight)最大值為0.70,最小值為0.25以及訓練的權重(Loss Weight)大小為0.6。選取泛化能力最強的訓練模型作為深度學習分類提取的模型。
隨機森林算法是由多棵決策樹組成的一種快速準確的集成學習算法。主要分類過程:從訓練數據集中隨機抽取部分數據作為子訓練集,每棵決策樹通過學習子訓練集中不同地類的特征,預測當前數據的類別,綜合所有的預測結果,輸出票數最多的結果作為當前數據最終預測結果。隨機森林模型示意如圖2所示。

圖2 隨機森林模型示意
選擇混淆矩陣的評價方法對分類結果進行精度計算。將每個預測像元的位置和分類與原始圖像中的訓練樣本進行精度對比,選取總體精度(OA)、Kappa 系數、制圖精度(PA)和用戶精度(UA),作為定量化試驗結果的評價指標,評估確保所選分類方法結果的可靠性和準確性。
本研究在Windonws10(Intel/AMD64 位)操作系統內完成,NVIDIAGPU 驅動程序版本:Windows461.33 版本,具有高級矢量拓展(AVX)指令集的CPU,具有CUDAComputeCapabitlity 版本5-8.6 的NVIDIA顯卡具體環境為硬盤。
珠海一號衛星是由珠海歐比特宇航科技股份有限公司發射并運營的商業衛星,由34顆遙感微納衛星組成整個星座,包括10顆OHS高光譜衛星、2顆OUS高分光學衛星、10顆OVS視頻衛星、2顆SAR雷達衛星和8顆OIS紅外衛星。其中OHS衛星均采用堆掃成像的方式,單次成像范圍在150 km×400(km/min),空間分辨率為10 m,光譜分辨率為2.5 nm,軌道高度500 km,信噪比25~40 Db,波段范圍在400~1 000 nm,共有32個波段。
本文選取2021 年9 月份(植物成熟期)成像的OHS 高光譜影像L1B 級數據(下載地址為歐比特遙感數據服務平臺https://www.obtdata.com),為了保持時間一致性并減少分類結果中土地覆蓋類型變化的負面影響,盡可能選擇接近的采集時間影像進行拼接,并結合精度較高的Landsat8 遙感影像進行精度分析。
獲取的L1B 級標準數據,是經過輻射校正后的標準產品。在執行所提出的方法之前,一些數據預處理步驟是必不可少的,包括波段組合、輻射定標、大氣校正、正射校正、圖像鑲嵌及裁剪。首先,對影像進行波段組合,增加定標系數等字段信息,識別RPC 信息。其次,用ENVI5.6 輻射定標將遙感影像的DN值轉化為有物理意義的大氣表觀輻射亮度值,消除遙感影像中由大氣散射所造成的輻射誤差;用FLASH 模塊對輻射定標后的影像進行加光譜響應函數大氣校正,反演地物真實的反射率;與同時期的Landsat8OLI影像進行正射校正,改善明顯的幾何畸變,糾正誤差在0.5 個像元以內。最后,將三景影像進行鑲嵌拼接,將洪河濕地矢量邊界作為ROI 對影像進行裁剪。
綜合考慮高光譜影像的光譜特征和研究區野外實地調查的結果,并參考《濕地公約》中的濕地分類準則,將研究區劃分為7 種地物類型,分別為水稻田、旱地、水域、林地、灌草、淺水草本沼澤和深水草本沼澤。洪河保護區沼澤濕地土地利用分類體系及影像特征如表1所示。

表1 洪河保護區沼澤濕地土地利用分類體系及影像特征
根據表1的分類體系選取合適的訓練樣本進行濕地分類,為了確保濕地植被分類的準確性,選取的訓練樣本的質量要有一定的標準,應盡可能地選取代表性強的純凈像元。通過對谷歌地球目視解譯和實地考察調研,在OHS高光譜數據上選取感興趣區提取訓練樣本?;贠HS 影像提取的洪河保護區典型地物分類光譜曲線如圖3 所示,建立的洪河保護區典型地物的端元光譜曲線,以此標準進行濕地分類訓練。

圖3 基于OHS影像的洪河保護區典型地物分類光譜曲線
通過對比隨機森林分類算法和深度學習模型進行高光譜洪河自然保護區沼澤濕地分類研究結果,發現基于深度學習的分類中的深水沼澤、喬木植被、水稻田的分類結果更接近濕地考察的真實地物情況,針對高光譜影像的同物異譜現象也得到了明顯改善,挖掘了高光譜里更多的光譜信息,實現了濕地的有效真實分類。
基于隨機森林和深度學習模型算法的分類精度如表2所示。由表2可知,基于深度學習的SegNet網絡分類總體精度比傳統的隨機森林機器學習算法的總體精度提高了約0.066;深度學習的分類kappa系數(0.873)明顯優于傳統的隨機森林機器學習算法(0.787)。因此,深度學習的SegNet 網絡分類降低了基于像素分類過程中的錯選概率,有效改善了分類效果,提高了濕地的分類精度,更適合濕地的分類研究。

表2 2種分類方法的分類精度
本文基于深度學習的SegNet網絡模型應用于高光譜的沼澤濕地分類,將分類結果與傳統的機器學習算法RF的分類結果進行精度對比,定量化地驗證了深度學習的SegNet網絡模型在高光譜沼澤濕地遙感信息提取分類中的可行性。研究得出以下結論。
(1)基于深度學習的SegNet 網絡模型高光譜淡水沼澤濕地分類。該方法能夠挖掘出高光譜影像深層次的信息,充分利用光譜信息,有效區分淺水沼澤和深水沼澤。
(2)與傳統的機器學習算法RF 相比,基于深度學習的SegNet 網絡模型分類結果的制圖效果更好,水稻田、旱地和喬木植被等制圖精度和用戶精度均在90%以上,總體精度達到0.903,其分類精度明顯優于隨機森林算法。