傅 煜,雷淵才,*,曾偉生
1 中國林業科學研究院資源信息研究所,北京 100091 2 國家林業局調查規劃設計院 北京 100714
單木生物量模型估計區域尺度生物量的不確定性
傅 煜1,雷淵才1,*,曾偉生2
1 中國林業科學研究院資源信息研究所,北京 100091 2 國家林業局調查規劃設計院 北京 100714
采用系統抽樣體系江西省固定樣地杉木連續觀測數據和生物量數據,通過Monte Carlo法反復模擬由單木生物量模型推算區域尺度地上生物量的過程,估計了江西省杉木地上總生物量。基于不同水平建模樣本量n及不同決定系數R2的設計,分別研究了單木生物量模型參數變異性及模型殘差變異性對區域尺度生物量估計不確定性的影響。研究結果表明:2009年江西省杉木地上生物量估計值為(19.84±1.27) t/hm2,不確定性占生物量估計值約6.41%。生物量估計值和不確定性值達到平穩狀態所需的運算時間隨建模樣本量及決定系數R2的增大而減小;相對于模型參數變異性,殘差變異性對不確定性的影響更小。
杉木生物量;Monte Carlo模擬法;模型不確定性度量;模型參數變異性;模型殘差變異性
隨著聯合國政府間氣候變化專門委員會(IPCC)指南明確強調所有締約國有義務按照可監測、可匯報、可核查的“三可”原則(MRV)報告本國森林生物量、碳儲量和碳匯能力估計及其不確定性的度量結果和降低措施[1-2],基于森林資源清查數據的區域尺度森林生物量、碳儲量估算成為近年來國內外研究熱點[3-7]。森林資源清查的樣地布設通常采用系統抽樣方法,基于清查數據估計區域或更大尺度的森林生物量,首先采用單木生物量模型估計每個樹種的單株木生物量,然后合計推算樣地水平生物量,再通過加權平均等方法估計林分及更大尺度的森林生物量。在整個推算過程中普遍存在著大量不確定性,尤其是單木模型的不確定性會隨著尺度的擴大而不斷傳遞累積,最終導致區域尺度森林生物量的估測結果偏離實際情況[8],但是針對該部分不確定性的度量還沒有引起足夠的重視[4]。
導致單木生物量模型不確定性的來源主要有4個:模型的函數形式定義不當、建模數據的測量誤差、模型殘差變異性和模型參數變異性。關于函數形式定義不當和測量誤差方面已有廣泛研究[9-11],在此不予以討論。本文基于森林資源連續清查系統抽樣體系江西省杉木調查數據和杉木生物量數據,采用Monte Carlo法模擬由單木生物量模型推算區域尺度地上生物量的過程,估計2009年江西省杉木地上總生物量,并以均方根誤差和相對均方根誤差為度量指標對生物量估計中的不確定性進行估測。基于不同單木生物量建模樣本量及決定系數R2,通過Monte Carlo模擬法分別研究單木生物量模型的參數變異性及殘差變異性對區域尺度生物量估計及其不確定性度量的影響,為國家溫室氣體排放報告提供方法學和實踐上的支持。
1.1 調查數據集
本文研究區為江西省全域(113°34′—118°29 ′E,24°29—30°05′N),數據源于第七次全國森林資源連續清查系統抽樣體系江西省固定樣地,總面積固定樣地數為2610個,各樣地面積為0.067hm2,其中有林樣地1673個。全省包括29個樹種139783株樹,杉木(Cunninghamialanceolata)為最主要樹種,共57351株,約占全樹種的40.7%。樣地進行每株木檢測,起測直徑為5cm,杉木調查數據的單木胸徑統計如表1所示。

表1 研究區調查數據統計特征Table 1 Statistical characteristics of data sets in study area
1.2 建模數據集
建立杉木地上生物量模型所用數據來自我國江西省70株杉木樣木的立木地上生物量實測數據,采集時間為2009年6月至9月份。樣木數按2、4、6、8、12、16、20、26、32、38cm 以上共10個徑階均勻分配,每個徑階的樣木數按樹高級從低到高盡量均勻分配,在大尺度范圍內具有廣泛的代表性。全部樣木都實測胸徑、地徑和冠幅,將樣木伐倒后,測量其樹干長度(樹高)和活樹冠長度(冠長),分干材、干皮、樹枝、樹葉稱鮮重,并分別抽取樣品帶回實驗室,在85℃恒溫下烘干至恒重,根據樣品鮮重和干重分別推算出樣木各部分干重并匯總得到地上部分干重。由于江西省森林資源連續清查數據中沒有提供樹高實測數據,本文僅采用胸徑為唯一自變量建立一元單木生物量估測模型,建模數據統計見表2。為方便理解,后文將以S1、S2分別表示調查數據集和建模數據集。

表2 研究區建模數據統計特征Table 2 Statistical characteristics of data sets for modeling in study area
蒙特卡洛(Monte Carlo)模擬法的基本思想是通過反復模擬某隨機事件的發生過程,以這個隨機事件出現的頻率來估計它的概率特征。應用復雜模型進行區域尺度生物量估計時所產生的不確定性來源復雜且較難度量,而Monte Carlo模擬法在解決這一問題上有顯著的優勢。本文將采用Monte Carlo模擬法對江西省杉木進行區域尺度地上生物量估計及其不確定性度量,并研究單木生物量模型的參數變異性和殘差變異性對區域尺度生物量估計中不確定性的影響。
2.1 基于Monte Carlo模擬法的區域尺度生物量估計及其不確定性度量
2.1.1 區域尺度生物量模型的確定
基于回歸模型法的單木生物量估計通常采用的單木生物量模型形式為:
Y=β0·X1β1…Xpβp+ε
(1)

gi=β0·dbhiβ1+εi
(2)
式中,β0、β1為模型估計參數,εi為模型殘差:
(3)

2.1.2 Monte Carlo法模擬步驟
步驟一

(ii)通常假設殘差εi服從均值為零的正態分布εi=N(0,σ2),其中殘差標準差σ滿足下式,
(4)
(5)
式中,α0、α1為新的模型估計參數。
步驟二
(i)調查數據中的單木地上生物量估計。將S1調查數據中的單木dbh代入公式(5)估測江西省杉木單木地上生物量,
(6)
式中,i為S1中單木號,j為樣地號。
(ii)調查數據的樣地生物量估計。合計樣地內單木生物,得到S1每個樣地的生物量:
(7)
式中,nj為第j個樣地內的樣木株數。
(iii)區域尺度生物量估計。合計樣地生物量推算區域尺度生物量均值并推算誤差:
(8)
(9)
式中,nplot為S1樣地個數,k表示第k次模擬。
步驟三
重復實施步驟一和二,直至預測結果趨于平穩,并推算S1數據中區域尺度地上生物量及誤差,
(10)
(11)

生物量估測中不確定性的度量指標通常采用標準誤或均方根誤差(RMSE)和相對均方根誤差(Relative RMSE)表示[9,12],公式如下:
(12)
2.2 建模樣本量對區域尺度生物量估計中不確定性的影響
單木生物量方程作為較復雜的非線性模型,導致不確定性的因素也較為復雜多樣,為研究區域尺度森林地上生物量估計中建模樣本量差異對模型不確定性的影響,本文采用4種不同樣本量水平的建模數據集,即樣本大小分別為n=30,n=40,n=50和n=60,分別進行Monte Carlo模擬,將各水平下區域尺度生物量估計及不確定性度量結果進行比較分析。
步驟一
(i)從S2數據集中隨機抽取n株杉木數據作為新的建模數據集S2’。
(ii)基于公式(1)形式,以單木地上生物量(g)為因變量、胸徑(dbh)為自變量,采用普通最小二乘法建立單木生物量模型
(13)
由于n始終小于最大樣本量70株,因此每次隨機抽取的杉木數據會有所不同,那么建立的單木生物量模型參數φ0、φ1存在差異,這個差異形成了不同建模樣本量水平對區域尺度生物量估計不確定性的影響。
步驟二

(ii)采用公式(7)估計江西省樣地水平杉木生物量。
(iii)采用公式(8)、(9)估計江西省尺度第k次模擬地上生物量均值和誤差。
步驟三
基于n=30,n=40,n=50和n=60分別反復模擬步驟一和二,采用公式(10)、(11)、(12)估計不同建模樣本量水平下的江西省區域尺度地上生物量、誤差、不確定性和相對不確定性,當μnk值和Var(μnk)值趨于平穩時,模擬過程可以終止。
2.3 殘差變異性對區域尺度生物量估計中不確定性的影響
殘差對生物量估計的影響主要體現在決定系數R2,本文設定了4個水平的R2,即R2=0.99、R2=0.95、R2=0.90和R2=85,在各水平下分別進行Monte Carlo模擬以研究殘差變異性對區域尺度生物量估計和不確定性度量的影響。
步驟一:
(i)基于建模數據集S2中杉木全部數據,即70株,以地上生物量g為因變量、胸徑dbh為自變量,采用普通最小二乘法建立單木生物量模型,即公式(2)。

(iii)單木生物量模型確定,公式如下:
(14)
式中,i為樣木號,β0、β1為單木生物量模型參數,ε為滿足ε-N(0,exp(γ1+γ2·ln(dbh)))的正態分布數組,λ是為構建決定系數R2=0.99、R2=0.95、R2=0.90和R2=85的修正因子。
步驟二

(ii)采用公式(7)估計江西省樣地水平杉木生物量。
(iii)采用公式(8)、(9)估計第k次模擬的江西省區域尺度地上生物量均值和誤差。
步驟三
基于決定系數R2=0.99、R2=0.95、R2=0.90和R2=85分別重復模擬步驟一和二,采用公式(10)、(11)、(12)估計不同建模樣本量水平下的江西省區域尺度地上生物量、誤差、不確定性和相對不確定性,μnk值和Var(μnk)值趨于平穩時,模擬過程可以終止。
文中單木生物量模型參數估計和Monte Carlo模擬的全過程采用R軟件實現。模擬過程中,單木地上生物量估測模型調用R軟件nls()函數進行非線性回歸,擬合β、α等模型參數;調用lm()函數建立殘差(ε)與胸徑(dbh)的函數關系,估計單位面積生物量(μnk),并以RMSE和Relative RMSE為度量指標推算不確定性。
3.1 區域尺度生物量估計
3.1.1 單木生物量模型擬合效果
表3為公式(2)的參數估計結果,結合圖1和表3的決定系數(R2=0.9716)可知,依據公式(2)建立的生物量估測模型對樣本點的回歸效果較好,圖1數據點較為均勻地分布在直線y=x附近,說明模型預測值能較好地描述實測值。

表3 單木地上生物量模型參數估計值Table 3 Parameter estimates of allometric models of above ground biomass

圖1 單木生物量估計模型的擬合效果Fig.1 The quality of fit of the model for AGB estimation
3.1.2 區域尺度生物量和不確定性
經對數化處理后,模型(1)殘差與樹干胸徑呈現明顯的線性關系,且滿足ε—N(0,exp(-3.75+2.048·ln(dbh)))的正態分布。
圖2表示依據公式(10)、(12),采用Monte Carlo法對2009年江西省杉木地上生物量和不確定性進行1000次模擬的情況。如圖2所示,模擬200次后,區域尺度生物量估計值和不確定性度量值趨于穩定。圖3為1000次Monte Carlo法模擬結果的變異系數(均方根誤差/生物量均值)的頻率直方圖,由圖3可知:變異系數范圍主要集中在0.0398至0.0402之間,變異系數越小說明模型的估計精度越高,因此本文方法在提升模型預測精度方面取得了較好的效果。

圖2 生物量和不確定性的模擬趨勢Fig.2 Above ground biomass and uncertainty

圖3 變異系數的頻率直方圖Fig.3 Histogram of coefficeients of variation
表4為1000次Monte Carlo法模擬計算江西省2009年杉木地上生物量和不確定性的預測值。由表4可知:2009年江西省杉木地上生物量為(19.84±1.27) t/hm2,不確定性占生物量估計值為6.41%。

表4 江西省杉木地上生物量和不確定性統計表Table 4 Estimates of mean AGB in the study area, and their uncertainty during each simulation
3.2 建模樣本量對不確定性的影響
圖4表示基于n=30,n=40,n=50和n=604種水平的建模樣本量和公式(10)、(12),經過Monte Carlo法1000次的模擬計算的江西省2009年杉木地上生物量和不確定性的模擬變化趨勢。由圖4可知,區域尺度生物量估計值和不確定性由劇烈波動狀態到趨于平穩所需的運算時間隨建模樣本量的增大而明顯縮短,不確定性也隨建模樣本量n的增大而逐漸減小。

圖4 基于不同建模樣本量n的Monte Carlo模擬趨勢Fig.4 Monte Carlo simulations based on various modeling sample size (n)

圖5 基于不同R2的Monte Carlo模擬趨勢Fig.5 Monte Carlo simulations based on various determination coefficient (R2)
表5是在建模樣本量n=30,n=40,n=50和n=60的4種情況下,經1000次Monte Carlo法模擬運算所估計的2009年江西省杉木的地上生物量、不確定性(RMSE)和相對不確定性(Relative RMSE)的結果。由表5可知,2009年江西省杉木的地上生物量隨建模樣本量n的增大而略有增加,從19.44 t/hm2上升到19.71 t/hm2。而不確定性則由n=30時的2.89 t/hm2下降到n=60時的1.94 t/hm2,不確定性相對估計值的占有率從14.86%下降至9.85%,說明建模樣本量可能是導致低估生物量和高估不確定性的原因之一。導致該現象的原因可能是單木生物量模型的協方差和標準誤隨著建模數據量的減少而增大,從而增加了因單木生物量模型參數的變異性導致的區域尺度生物量估計中的不確定性,該結果與McRoberts等人[13]、Zianis等人[14]的研究結果一致。

表5 不同建模樣本量n的杉木地上生物量和不確定性統計表Table 5 Estimates of mean AGB and uncertainty under different modeling sample size
3.3 殘差變異性對不確定性的影響
圖5表示基于決定系數R2=0.99、R2=0.95、R2=0.90和R2=0.85的4種情況和公式(10)、(12),2000次的Monte Carlo模擬變化趨勢。由于4種R2水平下的模擬運算均基于相同的單木生物量模型參數,影響生物量估計值穩定性的主要因素就是模型的殘差。由圖5可知,隨著R2的提高,生物量均值和不確定性值曲線波動的劇烈程度逐漸減弱,模擬結果達到穩定狀態所需的運算時間也逐漸縮短。
表6為基于建模樣本量為n=70株時,R2=0.99、R2=0.95、R2=0.90和R2=0.85的4種情況下,經2000次Monte Carlo法模擬運算所估計的2009年江西省杉木的地上生物量、不確定性(RMSE)和相對不確定性(Relative RMSE)的結果。由表6可知,2009年江西省杉木的地上生物量和不確定性基本平穩地分別保持在19.79 t/hm2和0.79 t/hm2,不確定性相對于生物量估計值約4%,不確定性隨R2的增大而略有降低。殘差的變異會影響模型預測結果的波動范圍,從而影響估計值的方差,因此殘差值的增大會導致模型R2的降低,模型的預測精度受到限制,不確定性隨之增加,與McRoberts等人[13]在研究森林蓄積的結果一致。但不確定性隨R2升高而降低的幅度非常小,僅0.0012 t/hm2,而不同建模樣本量的不確定性變化幅度為0.95 t/hm2,說明建模樣本量對區域尺度生物量估計不確定性的影響更大。

表6 不同R2的杉木地上生物量和不確定性統計表Table 6 Estimates of mean AGB and uncertainty under different modeling sample size
(1)Monte Carlo模擬法通過大量反復模擬生物量建模和估測過程,能提供穩定可靠的區域尺度生物量估計和不確定性度量值,是一種估計區域尺度生物量及度量不確定性的適用方法,具有很高的應用價值。
(2)建模樣本量導致的單木生物量模型參數變異性對區域尺度生物量估計不確定性的影響比較大。采用Monte Carlo模擬法進行區域尺度生物量估計和不確定性度量時,生物量估計值隨建模樣本量水平的提高逐漸增加,不確定性隨之降低,Monte Carlo模擬結果達到穩定所需要的運算時間逐漸縮短。說明建模數據量可能是引起低估生物量和不確定性增大的主要問題。因此,增加建模數據量能有效提高生物量模型的估計精度、準確度以及工作效率,并降低不確定性。
(3)不同決定系數R2所反應的模型殘差變異性對生物量估計,尤其是大尺度生物量估計的影響較小,但較高的R2能有效縮短Monte Carlo模擬的運算時間。
(4)由于Monte Carlo模擬法的可靠性和可行性均非常高,本文方法同樣適用于森林地上單木各組分生物量(樹干、樹枝、樹皮、樹葉等)、地下部分生物量、碳儲量、蓄積量的估計和不確定性度量,該部分研究還有待進一步展開。
致謝:感謝姜俊等同學在R軟件實現中給予的幫助。
[1] Penman J D, Kruger I, Galbally T, Hiraishi B, Nyenzi S. Emmanuel, L. Buendia, R. Hoppaus, T. Martinsen, and J. Meijer. Good practice guidance and uncertainty management in national greenhouse gas inventories. IPCC National Greenhouse Cost Inventories programme, Technical Support Unit, 2000
[2] IPCC. Guidelines for national greenhouse gas inventories. Institute for Global Environmental Strategies, Japan, 2006
[3] Lehtonen A, Cienciala E, Tatarinov F, M?kip?? R. Uncertainty estimation of biomass expansion factors for Norway spruce in the Czech Republic. Annals of forest science, 2007, 64(2):133- 140.
[4] McRoberts R E, Westfall J A. Effects of uncertainty in model predictions of individual tree volume on large area volume estimates. Forest Science, 2014, 60(1):34- 42.
[5] 李海奎, 雷淵才. 中國森林植被生物量和碳儲量評估. 北京:中國林業出版社, 2010.
[6] Quentin M M, Alfred N, Nestor L E O, Judica?l L, Hugues G, Géraud S M, Jo?l L, Donald M I, Franck K D, Roland Z K, Karl H B B, Nicaise L, Bertrand M, Nicolas P. How to improve allometric equations to estimate forest biomass stocks? Some hints from a central African forest. Canadian Journal of Forest Research, 2014, 44(7):685- 691.
[7] Li H K, Zhao P X. Improving the accuracy of tree-level aboveground biomass equations with height classification at a large regional scale. Forest Ecology and Management, 2013, 289:153- 163.
[8] Dietze M C, Wolosin M S, Clark J S. Capturing diversity and interspecific variability in allometries:a hierarchical approach. Forest Ecology and Management, 2008, 256(11):1939- 1948.
[9] Chave J, Condit R, Aguilar S, Aguilar S, Hernandez A, Lao S, Perez R. Error propagation and scaling for tropical forest biomass estimates. Philosophical Transactions of the Royal Society of London. Series B:Biological Sciences, 2004, 359(1443):409- 420.
[10] McRoberts R E, Lessard V C. Estimating the uncertainty in diameter growth model predictions and its effects on the uncertainty of annual inventory estimates // Reams G A, McRoberts R E, Van Deusen P C, eds. Proceedings of the Second Annual Forest Inventory and Analysis Symposium. Asheville, NC:U.S. Department of Agriculture, Forest Service, Southern Research Station, 2001.
[11] Cohen R, Kaino J, Okello J A, Bosire J O, Kairo J G, Mencuccini M. Propagating uncertainty to estimates of above- ground biomass for Kenyan mangroves:A scaling procedure from tree to landscape level. Forest Ecology and Management, 2013, 310:968- 982.
[12] Ahmed R, Siqueira P, Hensley S, Bergen K. Uncertainty of forest biomass estimates in north temperate forests due to allometry:implications for remote sensing. Remote Sensing, 2013, 5(6):3007- 3036.
[13] McRoberts R E, Nsset E, Gobakken T. Inference for lidar-assisted estimation of forest growing stock volume. Remote Sensing of Environment, 2013, 128:268- 275.
[14] Zianis D, Muukkonen P, M?kip?? R, Mencuccin M. Biomass and stem volume equations for tree species in Europe. The Finnish Society of Forest Science, The Finnish Forest Research Institute, 2005.
Uncertainty analysis for regional-level above-ground biomass estimates based on individual tree biomass model
FU Yu1, LEI Yuancai1,*, ZENG Weisheng2
1InstituteofForestResourcesInformationTechniques,ChineseAcademyofForestry,Beijing100091,China;2AcademyofForestInventoryandPlanning,StateForestryAdministration,Beijing100714,China
Above-ground forest biomass at regional-level is typically estimated by adding model predictions of biomass from individual trees in a plot, and subsequently aggregating predictions from plots to large areas. There are multiple sources of uncertainties in model predictions during this aggregated process. These uncertainties always affect the precision of large area biomass estimates, and the effects are generally overlooked; however, failure to account for these uncertainties will cause erroneously optimistic precision estimates. Monte Carlo simulation is an effective method for estimating large-scale biomass and assessing the uncertainty associated with multiple sources of errors and complex models. In this paper, we applied the Monte Carlo approach to simulate regional-level above-ground biomass and to assess uncertainties related to the variability from model residuals and parameters separately. A nonlinear model form was used. Data were obtained from permanent sample plots and biomass observation ofCunninghamialanceolatain JiangXi Province, China. Overall, 70individual trees were destructively sampled for biomass estimation from June to September, 2009. Based on the commonly used allometric model, we conducted Monte Carlo simulations 1000times for the biomass model fitting with the biomass data, from which we estimated the biomass of the plot data, and conducted an uncertainty assessment from the model residual variability and parameter variability. Estimates of above-ground biomass in JiangXi Province were obtained by aggregating model predictions of biomass for individual trees within plots, and then calculating the mean of the plots. Four modeling options with different sample sizes andR2were designed separately, from which Monte Carlo simulations were performed 1000times and 2000times, respectively, to study the effects of the model parameter and residual variability on the uncertainty in large-scale biomass estimates. The results revealed that the estimates of above-ground biomass and its uncertainty forC.lanceolatain JiangXi Province in 2009 achieved stability after 500Monte Carlo simulations, and that the average biomass estimate was 19.84 t/hm2, with additional uncertainty of 1.27 t/hm2, representing 6.41%of the average biomass. With increasing modeling sample size from 30to 60, the relative uncertainty of biomass estimates decreased from 14.86%to 9.85%, but the uncertainty variations for different levels ofR2values minimally changed. We concluded that:1) the Monte Carlo approach works well for regional-level estimations of biomass and its uncertainty based on forest inventory data; 2) the uncertainty of biomass estimation in large areas should not be overlooked because of the large number of errors when extrapolating from the individual tree to the plot level in forest inventory data; 3) with gradually larger modeling sample size, the average biomass increased while the uncertainty values decreased, and the operation times required for achieving the stability of average biomass and corresponding uncertainty in Monte Carlo simulations also were reduced, indicating that increasing modeling sample size is an effective way to reduce uncertainty in regional-level biomass estimations; and 4) model residual variability associated withR2was less important in model uncertainty of biomass estimates; however, higherR2does reduce the operation times for achieving stability of Monte Carlo simulations. This study is the first to apply the Monte Carlo simulation approach to estimating regional-level biomass and its uncertainty based on continuous observation data from permanent sample plots. This study is also the first to quantify the effects of uncertainty related to model parameters and residual variability in model predictions of extrapolating individual tree biomass to large area biomass estimates.
above-ground biomass ofC.lanceolata; Monte Carlo simulation; model uncertainty assessment; model parameter variability; model residual variability
國家863重點項目(2012AA12A306); 國家自然科學基金項目(31170588)
2014- 05- 13; < class="emphasis_bold">網絡出版日期:
日期:2015- 05- 19
10.5846/stxb201405130980
*通訊作者Corresponding author.E-mail:yclei@caf.ac.cn
傅煜,雷淵才,曾偉生.單木生物量模型估計區域尺度生物量的不確定性.生態學報,2015,35(23):7738- 7747.
Fu Y, Lei Y C, Zeng W S.Uncertainty analysis for regional-level above-ground biomass estimates based on individual tree biomass model.Acta Ecologica Sinica,2015,35(23):7738- 7747.