魏丹丹 趙世湖 肖晨超 崔航 劉書含
(自然資源部國土衛星遙感應用中心,北京 100048)
葉面積指數(Leaf Area Index,LAI)指單位面積上單面綠葉面積的總和[1]。葉面積指數反應了生態系統中的葉子數量,由于葉面積指數可以表征植被冠層中的物質和能量交換,它也被認為是植被狀況、生產力和光合能力的重要指標[2]。葉面積指數測量方法有直接法和間接法,直接法采用地面測量方式,這種方法在植被監測中起著重要作用,不僅可以保證測量的精度,還可作為真實值用于間接方法的驗證。當樣本足夠具有代表性時,直接方法被認為比間接方法更準確,因此通常用于驗證間接方法。然而,直接方法通常耗時、勞動強度大,并且通常對植被具有破壞性,這限制了它們的應用,并且使得它們不適用于高時間和空間頻率測量[3]。如何迅速、準確且無損地獲取局部及區域尺度植被生化參數含量及其分布狀況地信息尤為重要。空間遙感技術作為快速大面積獲取對地觀測的技術,在LAI定量反演方面得到了廣泛應用。資源一號02D衛星(又稱為5米光學業務衛星)于2019年9月12日成功發射,由自然資源部主持建造,是資源一號02C星的接續星,屬于中等分辨率遙感業務衛星。該星主推光譜分辨率,定位于中等分辨率、大幅寬觀測和定量化遙感任務,可提供豐富的地物光譜信息。
本文以資源一號02D衛星的高光譜數據為數據源,采用輻射傳輸模型與機器學習相結合的方法開展植被葉面積指數的估算。首先應用輻射傳輸模型生成不同條件下的植被反射光譜,并通過特征選擇減少數據冗余,篩選與葉面積指數相關的吸收反射信息,應用機器學習方法構建葉面積指數的反演模型,并應用于高光譜數據進行葉面積指數估算。
本文以影像所覆蓋的懷來縣部分區域為研究區,懷來縣位于河北省西北部,地處燕山山脈北側,永定河上游,地理坐標為東經115°、北緯40°。東南部與北京市延慶、昌平及門頭溝區接壤,西北部與宣化、下花園區相連,西南部與涿鹿縣毗鄰,北部與赤城縣交界。懷來縣地貌形態主要有河川平原、丘陵和山地等類型,地處中溫帶半干旱區,屬溫帶大陸性季風氣候,具有四季分明,光照充足,雨熱同季,晝夜溫差大等氣候特點(見圖1)。

圖1 研究區位置Fig.1 Location of the study area
本研究選取資源一號02D衛星于2020年8月13日成像的高光譜數據(AHSI傳感器),成像參數見表1。通過ENVI5.3軟件的FLAASH大氣校正功能,對高光譜數據進行大氣校正,得到地表反射率數據。

表1 資源一號02D衛星成像參數Table 1 Imaging parameters of ZY-1-02D satellite
冠層輻射傳輸模型定量描述了植被覆蓋度與冠層光譜反射率之間的物理依賴關系。PROSAIL模型[4]因其高精度和計算效率[5-6]而被廣泛用于生物物理參數估計。在PROSAIL模型中,PROSPECT模型用于模擬400~2500 nm之間的葉片反射率和透射率。然后,葉片的光譜信息作為SAIL模型的輸入參量[5]。由于參數設置會影響計算速度和輸出的冗余度,已有研究結果表明:PROSAIL輻射傳輸模型的輸入參數在一定的合理誤差范圍內是允許的,并且不會明顯降低參數反演的精度。因此根據之前的研究[7-9],設置PROSAIL耦合輻射傳輸模型的輸入參數(見表2)。
在模擬400~2500 nm冠層反射率之后,根據資源一號02D衛星AHSI高光譜數據的光譜響應函數,經光譜重采樣獲得與傳感器波段及帶寬相一致的模擬數據,訓練數據集和驗證數據集分別生成。

表2 PROSAIL模型參數設置Table 2 Parameter settings of the PROSAIL model
土壤反射率作為PROSAIL模型的重要輸入參量,本文選取中心構建的波譜庫中的地面實測的18種類型土壤光譜數據作為輸入,用來代表不同類型土壤的反射率(見圖2)。

圖2 不同土壤類型的反射光譜Fig.2 Reflectance spectra of different soil types
隨機森林(Random Forest, RF)算法具有諸多優勢,如計算速度快、經驗關系好,對噪聲不敏感以及不會產生過擬合等,被廣泛用于處理變量選擇、分類和回歸問題。在遙感技術中,隨機森林算法常用來處理高維數據,如高光譜數據,隨機森林算法也經常被用于遙感影像分類和遙感參數反演等研究,因此,在生態重點區域的監測中具有巨大的應用潛力。
隨機森林回歸(RFR)是眾多回歸樹的集合,這些回歸樹通常是二叉決策樹[10],每棵樹的預測值的平均值作為隨機森林的預測結果。隨機森林回歸的主要優勢是隨著森林中樹的數量增加,它不會過擬合,而且生成一個泛化誤差的極限值,同時,隨機森林對噪聲數據有很強的魯棒性[10]。對于數據維度和樣本量大致相等或大于樣本量的情況,隨機森林回歸仍然能取得很好的表現。隨機森林使用一些衡量變量重要性的指標來對變量進行排序,然后進行變量選擇以降低數據維度。資源一號02D衛星AHSI高光譜數據,由于波段之間的相關性較大,需要進行降維處理,隨機森林算法根據計算得到的輸入變量的重要性,篩選出波段15、19、23、28、35、39、42、49和53,用于模型的構建。
通過隨機森林方法構建預測模型用于資源一號02D衛星高光譜數據葉面積指數的估算。基于模擬數據的模型驗證精度見圖3,相關系數R2為0.77。高光譜數據真彩色合成圖和葉面積指數反演結果見圖4(a)和(b)。

圖3 基于模擬數據的精度驗證Fig.3 Validation based on simulated data


圖4 資源一號02D衛星AHSI數據及LAI估算結果Fig.4 AHSI data and LAI estimations of ZY-1-02D satellite
通過對比圖4(a)、(b)可知,從空間上來看,高光譜影像LAI估算值的高低與真彩色合成的影像圖(見圖4(a))可見的植被低覆蓋區、裸土地、居民用地等地區分布范圍基本吻合,而且對應不同地表覆蓋類型估算結果表現出較為明顯的空間差異。圖4(b)高光譜數據葉面積指數估算結果,因為受到云及其陰影的影響,產生異常。其中,云有較高的反射率和異于植被的吸收反射特征,在算法中首先通過植被指數的閾值判別,進行植被與非植被區的區分,將完全沒有植被特征的云覆蓋區域LAI賦值為0。通過對陰影區像元光譜進行分析,陰影區地物光譜的吸收反射特征由于所接收到太陽輻射減少,雖譜形特征變化較小,但反射率整體降低。隨機森林算法所篩選出的特征波段,主要集中在綠光、紅光、紅邊及近紅外波段,在此波譜范圍內,陰影區像元與臨近正常光照區域像元光譜特征相比較存在差異,這可能導致陰影區估算結果的異常。
本文以資源一號02D衛星的高光譜數據為數據源,采用輻射傳輸模型與機器學習相結合的方法開展植被葉面積指數的估算。通過對結果分析可以得到:資源一號02D衛星的高光譜數據可以通過輻射傳輸模型與機器學習的方法實現對植被葉面積指數的估算,并且得到較為理想的估算結果。高光譜數據166個譜段,為植被生物物理參量的估算提供了更多的波段選擇和精細化的波譜信息,可提高估算結果的準確性,豐富刻畫地表、地物之間差異性。