賈艷才
(河北省塞罕壩機械林場,河北 承德 067000)
葉面積指數(Leaf area index,LAI)是一種關鍵性的參數,可清楚表明植被的生理狀態。在遙感反演中,通常認為LAI是單位地面上冠層葉片垂直投影到水平面上的面積總和[1]。LAI在植物的光合作用和蒸騰作用等生理生化活動中起著至關重要的作用[2-4]。因此,快速準確地獲取大尺度的LAI具有重要意義。
LAI的傳統測量方法包括破壞性取樣法、異速生長方程法和凋落物收集法[5-8]。但這些傳統的方法不僅耗時耗力,而且很難得到大尺度的LAI數據。隨著遙感技術的不斷發展,空間分辨率的傳感器逐步推新,使用遙感技術進行反演成為獲得大尺度下森林LAI的有力手段。孫華[9]等利用偏最小二乘回歸法對攸縣黃豐橋林場的LAI進行了反演。陳艷華[10]等通過引入土壤反射指數,研究出PROSAIL可以實現LAI的反演工作。Campos-Taberner[11]等將PROSAIL模型與人工神經網絡法結合對地中海區域內水稻的不同時相和空間分辨率進行了LAI的反演。PROSAIL模型相比于經驗關系法明確了物理意義,適用于更多種植被類型以及更廣的空間范圍,但此模型還存在一定弊端,如需要參數眾多,并且部分參數難以獲得。當前研究中利用單個植被指數反演LAI時通常會受到飽和性、包含的波段信息不足等而影響反演精度[12],并且研究對象多是純林,對于樹種差異性是否對LAI的反演精度有影響沒有深入研究[13]。
目前在研究中若要分樹種建立LAI的反演模型,則要測得足夠的樣本量,費時費力,而當研究區域樹種類型較多時,分樹種建立反演模型就很難繼續下去。因此,引入啞變量體現了不同樹種對LAI反演的作用,相當于將不同類型的樣本合并,擴大了樣本容量,提高了模型精度。
本文以塞罕壩機械林場中的千層板林場、北曼甸林場和二道口林場部分區域為研究區域。塞罕壩位于河北省承德市圍場滿族蒙古族自治縣境內,坐標為E116°32′~118°14′,N41°35′~42°40′。極端最高氣溫33.4℃,最低氣溫-43.3℃,年均氣溫-1.3℃,年均降水量460.3mm,是典型的半干旱半濕潤寒溫性大陸季風氣候。塞罕壩處于典型的森林—草原交錯帶,地形以山地、高原、丘陵、曼甸為主。土壤類型大多為山地棕壤、森林土和風沙土。林場的樹種以落葉松、樟子松、白樺、云杉等為主,森林覆蓋率達80%,林木年平均生長率為9.7%,總蓄積達到1012×104m3。
在承德塞罕壩機械林場中的千層板林場、北曼甸林場和二道口林場部分區域范圍內以“隨機采樣”為原則設置樣地共178個(白樺40個,落葉松56個,樟子松48個,云杉34個),同時盡量使樣地在研究區域內均勻分布(見圖1)。在樣地的2條對角線各均勻取3個點進行測量,其中2條對角線中點重合,即1個樣地內LAI測量點為5個。使用光學儀器LAI-2200C在每個測量點進行4個不同方向的測量,每個方向測量3次。將1個樣地內測量的LAI所有數據的平均值作為該樣地的LAI值。

圖1 樣地分布圖
1.2.1 遙感影像的處理
利用Snap和Sen2Cor軟件對獲得的2019年8月8日的哨兵2號遙感影像(http://blog.sina.com.cn/s/blog_764b1e9d0102wek0.html)進行幾何校正、正射校正、輻射校正、大氣校正、拼接裁剪處理,最終得到研究區域的遙感影像。
1.2.2 植被指數與地形因子的獲取
植被指數是反映綠色植被的相對豐度和活性的輻射量值,通過計算遙感影像不同光譜波段間的線性和非線性組合來實現[14]。本研究采用了以下幾種植被指數,具體表達式如表1所示。
植被指數的獲取主要通過ENVI中的波段運算獲得。地形因子主要為DEM。

表1 植被指數表
綠色植物由于光合作用,對可見光,特別是紅光會強烈吸收,而在近紅外波段則吸收率非常低。由于這些獨特的光譜特性,使得遙感波段中包含了很多植物冠層葉片的信息。本文通過對遙感影像的原始波段以及相關的植被指數和地形因子來構建LAI的反演模型。
1.3.1 基本模型
線性模型在LAI反演中已得到廣泛應用[9],以線性模型作為LAI反演模型的基礎模型:
LAI=a0+a1X1+…+anXn+ε
式中,LAI為葉面積指數,a0、a1…an為參數,X1、X2…X3為各變量因子,ε為誤差項。
各因子與LAI的關系并不完全符合線性關系,利用R語言中的spreadLevelPlot函數檢查各變量的方差齊性,通過推薦的冪轉換參數,對原始數據進行冪轉換。除此之外,還對原始數據進行對數變換,增加線性擬合的準確度。
1.3.2 啞變量模型
基于基礎模型的啞變量模型的基本形式為:
LAI=b0+∑aizi+b1X1+b2X2…bnXn+ε
式中,LAI為因變量,b0、b1…bn為參數,X1、X2…X3為各變量因子,zi為啞變量,ai為相應的啞變量參數,ε為誤差項。
依據模型的需要對類別特征進行編碼處理,為了避免引起多重共線性,一般類別為k的特征需要編碼為一組k-1個衍生啞變量,以表示特征內部的所有類別。將樹種作為啞變量,由于樹種有4個水平,因此得到3個衍生啞變量。
當樹種為落葉松時,樹種落葉松取值為1,樹種樟子松取值為0,樹種云杉取值為0。
當樹種為樟子松時,樹種落葉松取值為0,樹種樟子松取值為1,樹種云杉取值為0。
當樹種為云杉時,樹種落葉松取值為0,樹種樟子松取值為0,樹種云杉取值為1。
當樹種為白樺時,樹種落葉松取值為0,樹種樟子松取值為0,樹種云杉取值為0。
1.3.3 模型評價
模型結果采用確定系數R2、均方根誤差RMSE、平均相對誤差ME、赤池信息準則AIC。
AIC=2p-2ln(L)=Nln(SSE)-Nln(N)+2p

對所有的變量因子進行全局擇優,選擇使R2最大的變量因子作為模型的自變量。由圖2可以看出,B5、B6、B9、B10、B11、B12、B13以及B19對R2貢獻比較大。

圖2 變量因子篩選圖
變量的詳細信息如表2所示,對比植物的光譜曲線發現,各變量的中心波長都處于植被光譜曲線的反射波峰,表明這些變量蘊含了很多植物冠層葉片信息,可以通過這些變量來反演LAI。而DEM則反映了同一樹種在不同海拔的情況下葉面積指數也會發生變化[15,16]。

表2 變量信息表
將8個變量因子進行線性擬合,利用R中的model.matrix函數將樹種轉化為3個虛擬變量,構建啞變量模型。模型構建如下。
線性模型:
啞變量模型:

使用R2、RMSE、ME、AIC值對模型進行檢驗與評價。R2介于0~1,R2越大說明模型精度越高;RMSE、ME、AIC值越小越好,說明模型擬合誤差低。通過表3可知,雖然模型的平均相對誤差都為0,但啞變量的R2略高于線性模型,RMSE和AIC值都低于

表3 模型評價表
線性模型,表示將樹種作為啞變量有助于提高LAI的反演精度。從圖3中可以看出,啞變量模型的殘差分布范圍更加均勻。用已構建好的啞變量模型結合研究區域的遙感影像和DEM,反演得到研究區域的LAI分布圖(圖4)。

圖3 模型殘差分布圖

圖4 研究區域LAI分布圖
本文以塞罕壩地區落葉松、樟子松、白樺及云杉為例,選用線性模型來對構建LAI的反演模型。利用全局則優來挑選適合的模型自變量,最終選擇的變量為:B5:vegetation red edge(中心波長:0.740um)、B6:vegetation red edge(中心波長:0.705um)、B9:blue(中心波長:0.490um)、B10:SWIR(中心波長:1.610um)、B11:SWIR(中心波長:2.190um)、B12:coastal aerosol(中心波長:0.443um)、B13:NDVI、B19:DEM。其中,前7個變量主要是不同光譜信息對LAI的影響,DEM則主要是LAI對地形因子的響應。通過對模型指標的評價,啞變量模型提高了LAI反演的預測精度以及適用性,為大尺度區域LAI的反演提供一定參考。