王亞卿,于穎
(東北林業大學 林學院,哈爾濱 150040)
三種葉綠素含量遙感估算模型比較
王亞卿,于穎*
(東北林業大學 林學院,哈爾濱 150040)
葉綠素是植物光合作用的主要參與者,是分析和評估森林生產力、森林健康和研究森林生態系統固碳能力的基礎,準確的估算森林葉綠素含量極為重要。本研究利用實測葉片光譜和對應的葉綠素含量,分別使用多元統計、神經網絡和支持向量機方法建立葉綠素含量估算模型,并比較和分析不同估算模型的優缺點,為開展相關研究提供參考。研究結果表明:三種建模方法中以Erf-BP神經網絡模型最優,擬合精度達到了94.46%,RMSE為3.321 μg/cm2;支持向量機方法次之,擬合精度在92.41%,RMSE為5.705 μg/cm2;以多元逐步回歸方程精度最低,為88.74%,且RMSE偏大,達到了13.354 μg/cm2。通過擬合精度和均方根誤差2個指標可以明顯地比較出Erf-BP神經網絡具有最好的擬合精度和穩定性。
葉綠素含量;多元統計回歸;神經網絡;支持向量機
植被光合作用的主要參與者是葉綠素,它是表征植被生產力的重要因子,控制著植被氧氣的釋放以及有機物的合成,而森林生態系統是碳在地表的重要載體之一,準確的估算出森林的葉綠素含量對分析、評價森林生產力以及研究森林的固碳能力至關重要[1-2]。研究表明植被的健康狀況不同,會引起其反射光譜在“綠峰”和“紅邊”反射特征的變化,而這種光譜特征可用來探測植被的形態和生長狀況,以及估算植被的生化參數[3-5]。國內外學者在葉綠素含量反演模型方面做了大量的深入的工作。最初學者是通過建立地面實測數據與像元反射率之間的回歸方程估算葉綠素含量[6-8]。Penuelas等的研究結果表明利用窄波段反射指數可以估算葉片的葉綠素和類胡蘿卜素的濃度[9]。Blackburn利用從高光譜數據上提取的PSND(Pigment Specific Normalized Difference)指數及PSSR(Pigment Specific Simple Ratio)指數估算葉綠素含量[10]。Lam等利用TCARI/OSAVI指數來消除LAI對葉綠素測定的影響[11],均得到了很好的葉綠素反演結果。還有一些學者致力于通過葉片與光能之間相互作用過程,利用輻射傳輸模型定量反演葉片葉綠素含量[12-16]。無論是統計模型還是利用機理模型都可以建立葉綠素濃度的反演模型,實現利用光譜分析技術估算葉綠素濃度的目的。然而不同建模所得到的結果各有不同,本研究以實測葉片光譜和對應葉片的葉綠素含量為數據源,從統計方法的角度入手,討論了多元回歸方法、神經網絡方法以及支持向量機方法估算葉綠素含量的能力。
研究區域設在黑龍江省塔河縣,在研究區域內設置32個0.06 hm2的樣地,根據樹高,將樹冠分三層,逐層取樣,每層取5~10片葉子,進行室內光譜測量,并將樣品放置0°的保溫箱中,帶回實驗室進行葉綠素含量的測量,測量方法參考文獻[17]。
2.1 模型自變量的選擇
葉綠素遙感估算模型變量主要由遙感變量和通過計算相關系數篩選的變量兩部分組成。遙感變量包括與葉綠素含量有關的光譜特征變量,選取與葉綠素含量高度相關的植被指數,如NDVI、MCARI、CARI、PSSR、GNDVI等。以及實驗室測量葉綠素含量的3個波段663、645、652 nm做為葉綠素含量估算模型的候選波段(見表1)。此外,還通過計算葉綠素含量與葉片光譜的相關性,選取與葉綠素含量相關性高的波段Log(R425)、Log(R466)、Log(R677)、R445、R657、Diff(R516)、Diff(R521)、Diff(R631)、Diff(R700)、Diff(R735)、Diff(R749)、Diff(R819)一并做為模型的候選變量。

表1 高光譜遙感變量的定義及描述
2.2 多元統計模型
將外業采集的樣本數據通過異常值和異方差檢驗,剔除異常值后,隨機選取其中75%作為建模樣本,并利用剩下的25%作為檢驗樣本對模型精度進行評價。將變量輸入SPSS統計軟件,采用逐步回歸的方法,建立多元回歸模型。
2.3 神經網絡模型
誤差反向傳播算法(Back Propagation,BP)是遙感應用研究中使用廣泛的一種人工神經網絡模型。是用于多層神經網絡訓練的,由輸入層、中間層以及輸出層組成。隨著研究的深入,學者們發現BP神經網絡存在著諸多問題,如收斂速度慢;訓練過程發生震蕩,易陷入局部極小;難以確定其網絡結構;學習樣本數量和質量易影響網絡的學習效率和速度等[18],從而限制了BP神經網絡的進一步發展。本研究以高斯誤差函數作為隱含層激活函數,建立了BP前饋神經網絡(Erf-BP)[19]。
Erf-BP神經網絡模型采用的是包含一個隱含層的三層式結構,隱含層和輸出層傳遞函數分別為高斯誤差函數和logsig函數,隱含層節點數由公式(1)確定[18]。

(1)
式中:m為隱含層神經元個數;n為輸入層的節點數;l為輸出層的節點數;δ為0~10之間的常數。
2.4 支持向量機模型
支持向量機(SupportVectorMachines,SVM)的研究始于20世紀90年代,最初是由Vapnik等人根據統計學習中的結構風險最小化原則提出的[20-22]。支持向量機是在SRM(StructuralRiskMinimization,SRM)原則上設計具有最大間隔的最優超平面,利用核函數的技巧得到輸入空間中的非線性學習算法。通過不同的核函數如q次多項式函數、徑向基函數、Sigmoid函數可以得到不同的支持向量機。
2.5 精度驗證
利用spss20.0軟件對模型及系數進行顯著性檢驗,最后利用除建模樣本以外的其余樣本進行精度驗證。計算預測值和真實值之間的精度公式(2)和均方根誤差公式(3),作為評價模型的指標。

(2)

(3)
3.1 多元統計模型
通過查閱文獻和計算相關系數,初步確定了葉綠素估算模型的候選參數為27個。利用逐步回歸的方法剔除了其中23個變量,剩余的四個變量分別是PSSR、RVp、Diff(R749)與Log(R466)。在顯著性水平為95%的指標下,最終得到的葉綠素反演模型為:
Chl(μg/cm2)=31.911-0.88×PSSR+66.293×Diff(R749)-6.136×Log(R466)-0.242×Rvp。
(4)
模型擬合的決定系數R2=0.812,均方根誤差RMSE=13.354 μg/cm2,模型精度為88.74%。
3.2 Erf-BP神經網絡模型
Erf-BP神經網絡建模過程除確定的輸入和輸出之外,還需要進行一些必要的設置。Erf-BP神經網絡的輸入設置包括以下幾部分:隱含層節點浮動范圍為[5,16];誤差函數采用誤差平方和,范圍為[1.0,0.1],按步長0.01遞減;學習速率為0.3;動量因子為0.9;坡度因子為1。將樣本數據的75%作為訓練網絡組,剩余25%用來進行網絡性能的檢驗。自變量和因變量經歸一化處理后,輸入網絡,通過多次訓練網絡,得到包含不同隱含層的訓練網絡,見表2。

表2 Erf-BP神經網絡模型結果
綜合表2,當隱含層神經元個數為13時,Erf-BP神經網絡的精度達到最高,其中擬合精度為95.28%,檢驗精度為94.46%,均方根誤差RMSE=3.321 μg/cm2。
3.3 支持向量機模型
本研究通過使用不同的核函數構建支持向量機模型,并對模型結果和精度進行評價。將27個變量分別輸入到線性核函數支持向量機、多項式核函數支持向量機,徑向基核函數支持向量機,并計算了實測數據和支持向量機模擬結果的相對誤差、均方根誤差,以評價不同核函數模擬結果的準確性。計算結果見表3。

表3 不同核函數支持向量機模型模擬結果
從表3中可以看出,不同核函數支持向量機模型中以修正的葉綠素吸收指數MCARI建立的模型精度最高,線性核函數、多項式核函數、徑向基核函數精度分別為90.07%、90.94%、92.41%,均方根誤差為7.197、6.669、5.705 μg/cm2,并以徑向基核函數建立的支持向量機模型精度最高,擬合效果最好。
3.4 模型比較
本研究分別使用了多元回歸分析、神經網絡和支持向量機三種模型建立了葉片尺度葉綠素遙感估算模型。表4列出幾種模型估算精度的比較。

表4 不同建模方法精度比較
從表4中可以看出,三種建模方法中以Erf-BP神經網絡模型最優,擬合精度達到了94.46%,RMSE為3.321 μg/cm2;支持向量機次之,擬合精度在92.41%,RMSE為5.705 μg/cm2;以多元逐步回歸方程精度最低,為88.74%,且RMSE偏大,達到了13.354 μg/cm2。通過擬合精度和均方根誤差兩個指標可以明顯的比較出修改后的神經網絡模型Erf-BP神經網絡具有最好的擬合精度和穩定性。
本研究以地面實測葉片光譜和對應葉綠素含量為數據源,分別使用多元回歸分析方法、神經網絡方法和支持向量機三種不同方法建立葉綠素含量的估算模型,并對模型精度進行比較分析。結果表明,多元逐步回歸方程相比較其他兩種方法,它的模型穩定性和預測精度相對比較低。支持向量機模型是20世紀90年代末出現的一種基于統計學習原理的數據分析方法,本文將其引入到葉綠素含量遙感估算模型的研究中,證明了支持向量機在遙感技術與應用領域的應用前景和空間。Erf-BP神經網絡是對現有BP神經網絡的一種改進算法,本研究的結果表明了Erf-BP神經網絡具有較好的擬合和預測能力,并且預測結果的穩定性較高。
然而,模型的精度不能單純的通過精度和均方根誤差兩項來評定,它還受到其他因素的影響。如建模樣本的測量誤差,樣本本身的代表性等等。并且,本研究僅僅分析了葉片光譜與葉綠素含量的估算模型,如應用到遙感影像中還要考慮,葉片尺度和冠層尺度轉化等問題,這些都有待進一步研究。
[1]Belanger M J,Miller J R,Boyer M G.Comparative relationships between some red edge parameters and seasonal leaf chlorophyll concentrations[J].Canadian Journal of Remote Sensing,1995,21(1):16-21.
[2]Gitelson A A,Merzlyak M N,Lichtenthaler H K.Detection of red edge position and chlorophyll content by reflectance measurements near 700 nm[J].Journal of Plant Physiology,1996,148(3-4):501-508.
[3]Miller J R,Hare E W,Wu J.Quantitative characterization of the vegetation red edge reflectance 1.An inverted-Gaussian reflectance model[J].International Journal of Remote Sensing,1990,11(10):1755-1773.
[4]Miller J R,Wu J,Boyer M G,et al.Seasonal patterns in leaf reflectance red-edge characteristics[J].International Journal of Remote Sensing,1991,12(7):1509-1523.
[5]Sampson P H,Zarcotejada P J,Mohammed G H,et al.Hyperspectral remote sensing of forest condition:estimating chlorophyll content in tolerant hardwoods.[J].Forest Science,2002,49(3):381-391.
[6]Curran P J,Kupiec J A,Smith G M.Remote sensing the biochemical composition of a slash pine canopy[J].IEEE Transactions on Geoscience & Remote Sensing,1997,35(2):415-420.
[7]Johnson L F,Hlavka C A,Peterson D L.Multivariate analysis of AVIRIS data for canopy biochemical estimation along the Oregon transect.[J].Remote Sensing of Environment,1994,47(2):216-230.
[8]Datt B.Remote sensing of chlorophyll a,chlorophyll b,chlorophyll a+b,and total carotenoid content in eucalyptus Leaves[J].Remote Sensing of Environment,1998,66(2):111-121.
[9]Penuelas J,Baret F,Filella I.Semiempirical indexes to assess carotenoids chlorophyll-a ratio from leaf spectral reflectance[J].Photosynthetica,1995,31(2):221-230.
[10]Blackburn G A.Quantifying chlorophylls and caroteniods at leaf and canopy scales:An evaluation of some hyperspectral approaches[J].Remote Sensing of Environment,1998,66(3):273-285.
[11]Lam H K,Ling S H,Leung F H F,et al.Integrated narrow-band vegetation indices for prediction of crop chlorophyll content for application to precision agriculture[J].Remote Sensing of Environment,2002,81(2):416-426.
[12]Demarez V,Gastellu-Etchegorry J P,Mougin E,et al.Seasonal variation of leaf chlorophyll content of a temperate forest.Inversion of the PROSPECT model[J].International Journal of Remote Sensing,1999,20(5):879-894.
[13]Ganapol B D,Johnson L F,Hammer P D,et al.LEAFMOD:a new within-leaf radiative transfer model[J].Remote Sensing of Environment,1998,63(2):182-193.
[14]Jacquemoud S,Baret F.PROSPECT:A model of leaf optical properties spectra.[J].Remote Sensing of Environment,1990,34(2):75-91.
[15]Renzullo L J,Blanchfield A L,Guillermin R,et al.Comparison of PROSPECT and HPLC estimates of leaf chlorophyll contents in a grapevine stress study[J].International Journal of Remote Sensing,2006,27(4):817-823.
[16]楊博,王亞東,蘇小紅.一種基于誤差放大的快速BP學習算法[J].計算機研究與發展,2004,41(5):774-779.
[17]Yang X,Yu Y,Fan W.Chlorophyll content retrieval from hyperspectral remote sensing imagery[J].Environmental Monitoring & Assessment,2015,187(7):1-13.
[18]吳昌友.神經網絡的研究及應用[D].哈爾濱:東北農業大學,2007.
[19]楊曦光.高光譜數據提取森林冠層葉綠素及氮含量的研究[D].哈爾濱:東北林業大學,2010.
[20]Vapnik V N.The nature of statistical learning theory[J].Neural Networks IEEE Transactions on,1995,10(5):988 -999.
[21]Cortes C,Vapnik V.Support-vector networks[J].Machine Learning,1995,20(3):273-297.
[22]孫存舉,梁楠.遙感光譜混合模型在成都城區植被信息提取中的應用[J].四川林業科技,2014,35(5):84-87.
Comparisons of Three Remote sensing Models for Estimating Chlorophgll Content
Wang Yaqing,Yu Ying*
(College of Forestry,Northeast Forestry University,Harbin 150040)
Chlorophyll is an important participant in the photosynthetic process.Chlorophyll has been used to study and evaluate the forest productivity and forest health and is the basis of study forest ecosystem carbon sequestration ability.Therefore,it is very important to accurately estimate the chlorophyll content.Multiple linear regression models,neural network and support vector machine methods were used to establish the chlorophyll content estimating model based on the measured leaf chlorophyll content and corresponding reflectance spectrum in this study.The advantages and disadvantages of those models was compared and analyzed to provide a theoretical basis for estimating chlorophyll content based on remote sensing technology.The result showed that estimating model established using Erf-BP neural network method was the best one with the accuracy of up to 94.46%,the root mean square error(RMSE) of which was 3.321μg/cm2.The model established using support vector machine method was better with the accuracy of 88.74%,RMSE of which was 5.705μg/cm2.The model established using multiple stepwise regression method was restively poor with the accuracy and RMSE of 92.41% and 13.354μg/cm2respectively.Erf-BP neural network was concluded to be the best method with high fitting precision and good stability by the comparison.
chlorophyll content;multiple linear regression;neural network;support vector machine
2016-11-04
國家自然科學基金項目(31500518,31500519)
王亞卿,碩士研究生。研究方向:遙感與地理信息系統。
*通信作者:于穎,博士,副教授。研究方向:遙感與地理信息系統。E-mail:yuying4458@163.com。
王亞卿,于穎.三種葉綠素含量遙感估算模型比較[J].森林工程,2017,33(2):28-32.
S 758
A
1001-005X(2017)02-0028-05