何 瀟,徐奇剛,雷相東*
(1.中國林業科學研究院資源信息研究所,北京 100091;2.國家林業和草原局森林經營與生長模擬實驗室,北京 100091)
森林生態系統中存儲的生物量-碳儲量是全球碳循環的基礎。研究表明,全球森林生態系統大約含有861±66Gt碳儲量[1],這對于全球氣候調節服務至關重要[2]。生物量估計的常用方法是建立回歸模型,目前,國內外研建了大量的單木生物量模型[3-7],這些單木模型是林分生物量計算的基礎。由于森林資源調查數據中可能沒有單木數據,僅記錄了林分因子,導致單木生物量模型的應用受限。而在大尺度上更直接有效的方法是建立林分生物量模型,利用林分因子估計生物量,但是林分層次的生物量模型并不多見[8-10]。此外,為了制定應對氣候變化的適應性經營策略,迫切需要了解氣候對生物量估算的影響。Rudgers 等[11]發現林木生物量及其分配會受到氣候的影響,使得生物量模型的參數變化,進而影響生物量估計結果。Fu 等[12]和Zeng 等[13]建立了氣候敏感的單木生物量異速生長方程,發現氣候與生物量之間存在顯著關系。Usoltsev 等[14]將氣候變量引入可加性林分生物量方程中以確定氣候對林分生物量的影響。因此,在生物量估計模型中應考慮氣候變量,以減少模型的不確定性。
常見的模型參數估計方法是最小二乘法,然而森林生長受到立地質量[15]和外界干擾[16]的影響,可能導致調查數據存在較多的離群點,加上生物量數據的異方差性[17],如果使用最小二乘方法求解參數可能會導致模型參數的有效性降低,引起模型的不確定性增加[18]。因此,有學者提出了用穩健回歸來盡可能降低離群點對參數估計的影響[19],郭清文等[18]的實驗結果證明:基于穩健回歸的生物量模型不僅能有效降低建模數據中離群點帶來的影響,還使得參數估計在理論上接近最優。
本研究利用東北和華北地區的落葉松(Larixspp.)人工林生物量數據,比較穩健回歸方法和普通最小二乘方法求解林分生物量模型的差異,并在模型中考慮氣候因子,量化分析林分因子和氣候因子對林分生物量(包括林分地上生物量AGB和林分總生物量TGB)的解釋率,以期為大尺度生物量精準估計提供基礎模型和方法。
數據來源于黑龍江、吉林、遼寧、北京、河北、山西和內蒙古等7 個省份(34°34′~53°33′N,97°12′~135°05′E)第8次森林資源連續清查(2009—2013)中的落葉松人工純林固定樣地。經邏輯檢查后共得到445 塊有效樣地數據。樣地調查因子包括平均年齡、平均胸徑以及平均高等,其中平均高是在樣地中測量3~ 5 株平均木的樹高取平均值得到。考慮到劃分訓練集和驗證集可能會導致氣候因子對林分生物量的解釋率量化受到抽樣的影響,因此本研究沒有進行樣本劃分,各因子統計量見表1。氣候因子來自ClimateAP[20],根據每個樣地的地理坐標和海拔下載,氣候因子變量名及其描述見表2,樣地氣候因子為1981 — 2010 期間的平均值。

表1 林分因子和林分生物量統計量Table 1 Summary statistics of stand variables and biomass

表2 氣候因子變量名稱及其含義Table 2 The name of climatic variables and its description
林分生物量使用單木生物量模型計算,然后累加得到。我國林業行業標準《LY/T 2654—2016:立木生物量模型及碳計量參數—落葉松》[4]中就提供了落葉松的單木生物量模型,對于有行業標準的伴生樹種也采用行業標準中給出單木生物量模型進行計算,剩余樹種則使用文獻[3]和[5]中給出的單木生物量模型進行計算。
最小二乘是回歸模型參數求解的常用方法,但如果建模數據中存在離群點且排除是數據錄入錯誤等原因所導致的,則使用最小二乘回歸可能得到的不是最優估計。而穩健回歸是在剔除離群點和保留離群點之間的一個折中,根據觀測值的穩健情況對每個樣本點進行賦權,對應的優化目標為式(1)。

式中,wi是第i個樣本對應的權重,yi為第i個樣本的因變量實測值;為第i個樣本的模型估計值。
本研究使用Huber 提出的穩健回歸方法(式2)[19],可以看出權重估計依賴于殘差分布,而殘差估計又反過來需要權重。因此,穩健回歸是一個迭代重復加權最小二乘直到結果收斂,獲得穩健的參數估計結果的過程。

式中,wj表示第j次迭代的權函數;uj表示第j次迭代的標準化殘差。
董利虎等[9]指出落葉松林分生物量模型的誤差結構是相乘的,本研究以式(3)~(6)作為基礎林分生物量模型,分別采用最小二乘法和穩健回歸法求解模型參數。因為使用對數回歸來消除生物量數據的異方差,在預測時會產生偏差,曾偉生等[21]詳細討論了非線性模型對數回歸的偏差矯正原理與方法,本研究采用Baskerville[22]提出的校正因子CF,對模型進行矯正。

式中,B為林分生物量,包括AGB和TGB;Dg為林分平均胸徑;N為株數密度;H為林分平均高;βi(i=1~4)為模型參數;ε為誤差項。
向最優基礎林分生物量模型中添加氣候變量,為了降低氣候變量的共線性,本研究采用主成分分析和相關分析方法篩選氣候變量,步驟如下:(1)對所有氣候變量進行主成分分析;(2)選擇因子載荷較大的氣候變量;(3)通過相關分析篩選出氣候變量之間相關性較低但和林分生物量相關性較高的氣候變量。最后利用篩選出來的氣候變量建立氣候敏感的林分生物量模型。
模型評價包括兩方面:首先確保模型參數在0.05 水平下顯著;其次使用決定系數(R2)、均方根誤差(RMSE)、相對均方根誤差(rRMSE)等指標對模型進行評價,公式見文獻[23]。
林分生物量的總解釋率可被劃分為:(1)獨立解釋的部分(a:林分因子的獨立解釋率,c:氣候因子的獨立解釋率);(2)共變的部分(b),即無法確定是由哪個因子所解釋的部分;(3)模型不可解釋的部分(d)。計算方法如下:含林分因子和氣候因子的全模型的R2即為總解釋率a+b+c,且存在a+b+c=1?d的關系,最優基礎林分生物量模型的R2為a+b,僅以氣候因子為自變量的林分生物量模型的R2為b+c。由上述關系可計算a、b、c和d。
所有模型參數在0.05 水平下顯著(表3、表4)。對于同一形式的模型,2 種方法的參數估計值略有差異,從參數符號可以看出AGB和TGB均隨Dg、N和H的增加而增加,但CF沒有明顯的區別。從基礎模型的評價指標發現,AGB模型優于TGB模型。對于AGB而言,采用直接引入變量的模型比變量組合形式的模型擬合效果要好,除5 號和6 號模型的評價指標顯示出普通最小二乘回歸略優于穩健回歸外,其余模型均顯示出穩健回歸略優于普通最小二乘回歸,其中模型8 的R2最高,可達0.967,穩健回歸的RMSE和rRMSE要比普通最小二乘回歸分別低0.046 t?hm?2和0.085%,二者差異不大。對于TGB而言,其規律和AGB相似,所有TGB模型中,15 號和16 號模型的R2可達0.953,穩健回歸的誤差統計量略好一些,但比AGB模型低0.014。由于建模數據的質量較好,兩種方法建立的模型沒有太大差異,穩健回歸的優越性沒有得到充分體現,甚至普通最小二乘回歸略優于穩健回歸。不論是AGB還是TGB,最優基礎模型形式相同,采用穩健回歸的方法求得的參數略優。因此,本研究分別以模型8 和模型16 作為AGB和TGB的最優基礎林分生物量模型,用于解釋率的量化分解。

表3 基礎林分地上生物量模型擬合與評價結果Table 3 Fitting and evaluation results of basic stand aboveground biomass model

表4 基礎林分總生物量模型擬合與評價結果Table 4 Fitting and evaluation results of basic stand total biomass model
主成分分析表明,前3 個主成分的貢獻率分別為56.0%、22.9%、16.7%,其中第一主成分中載荷大于0.3 的氣候變量有:MAT,NFFD,EMT,主要是和溫度有關的氣候變量;第二主成分中載荷大于0.3 的氣候變量有:CMD,AHM,主要是和濕熱特征有關的氣候變量;第三主成分中載荷大于0.33 的氣候變量有:TD,EXT,MWMT,主要是和極端天氣有關的氣候變量。從相關分析(表5)的結果看出:AGB和TGB的結果相似,都與AHM和CMD的相關系數較高,而與其他氣候因子的較低。由于AHM和CMD之間的相關系數為0.856,而AHM和林分生物量的關系更密切,因此將AHM添加到最優基礎林分生物量模型中,得到氣候敏感的林分生物量模型。

表5 林分生物量與部分氣候變量的相關系數矩陣 Table 5 Correlation coefficient matrix between stand biomass and some climatic variables
從表6 看出,氣候敏感的林分生物量模型(模型17~ 20)的參數均顯著,2 種算法的參數估計結果略有差異,AGB和TGB均隨AHM增加而降低,但矯正因子CF基本沒有差異。根據評價指標,穩健回歸稍優于普通最小二乘回歸,而氣候敏感的模型明顯優于最優基礎模型:對于AGB,模型18 與4 相比,R2提高了0.41%,而RMSE和rRMSE降低了6.85%;對于TGB,模型20 與16 相比,R2提高了0.63%,而RMSE和rRMSE降低了6.79%。這說明建立氣候敏感的林分生物量在統計上是合理的,氣候因子對林分生物量有顯著影響,加入AHM后,模型的擬合優度提升。本研究分別以模型18 和模型20 作為AGB和TGB的最優氣候敏感的林分生物量模型,用于解釋率的量化分解。

表6 氣候敏感的林分生物量模型擬合與評價結果 Table 6 Fitting and evaluation results of climate sensitive stand biomass basic model
分別以AGB和TGB為對象,量化氣候因子和林分因子對林分生物量的貢獻,結果如圖1 所示。對于AGB:氣候因子的總解釋率(b+c)為9.73%,其中獨立解釋部分(c)為0.40%,而林分因子的總解釋率(a+b)為96.70%,獨立解釋部分(a)為87.37%,共變部分(b)為9.33%,二者的總解釋率(a+b+c)為97.10%。對于TGB:氣候因子的總解釋率(b+c)為10.58%,其中獨立解釋部分(c)為0.60%,而林分因子的總解釋率(a+b)為95.30%,獨立解釋部分(a)為85.32%,共變部分(b)為9.98%,二者共同解釋率為95.90%。總的來看,林分因子對林分生物量的解釋率很高,加入氣候因子后模型解釋率明顯提升,但其中共變部分較大,氣候因子的獨立解釋率不到1%。氣候因子對AGB的獨立解釋率小于對TGB的獨立解釋率,說明不同組分的生物量對于氣候的響應程度有所不同。

圖1 林分因子和氣候因子對林分生物量的解釋率分解Fig.1 Explanation rate decomposition of stand and factors to stand biomass
本研究采用普通最小二乘法和穩健回歸方法建立落葉松人工林林分生物量模型。從模型形式上看,不論是AGB還是TGB,最優基礎模型的自變量均為Dg、H和N同時直接引入的方式,而采用組合變量的形式,模型精度略低,這與單木層次類似[24]。其原因是組合變量相當于對參數進行了限制,使得自變量的作用減弱。洪奕豐等[25]指出建立林分生物量模型需要多維度的自變量,而在本研究中,Dg、H和N較好的描述了林分生物量,R2在0.95以上,該結果和徐奇剛等[26]的結果一致。從生物量組分上看,林分地上生物量優于總生物量,主要是樹根生物量的分布不均勻、變異性較大所導致的[27]。從方法上看,對數轉換雖然是消除生物量模型異方差的有效手段[21],但沒有解決離群點對模型參數估計的影響,穩健回歸則對殘差值較大的樣本進行了多次限制,使得參數估計更加有效,但這與建模數據的質量有很大關系,如果建模數據中基本不存在離群點,穩健回歸則會把每一個樣本點賦予接近1 的權重,那么穩健回歸和普通最小二乘回歸的差異不大,對于本研究而言,由于建模數據的質量較高,雖然基于穩健回歸的模型的誤差統計量略小,但這種差異還不到1%,穩健回歸的優勢就難以發揮。另外,當前僅開發了基于線性形式的穩健回歸方法,本研究沒有對加性誤差進行實驗,更有效的手段是基于非線性形式開發穩健回歸方法,對生物量模型的誤差結構進行深入分析。
了解林分生物量與氣候變量之間的關系才能量化氣候因子對林分生物量的影響,同時有必要在大尺度范圍內進行研究,才能獲得較為可信的模擬結果,如果尺度太小,則氣候變量的變異較小,生物量對氣候的響應不能完全表達。為了避免這種不確定性,本研究以我國北方地區7 個省份的落葉松人工林作為研究對象,在大尺度上對林分生物量和氣候因子之間的關系進行了探索。為了降低共線性的風險,結合主成分分析和相關分析,即能篩選出具有統計學意義的氣候變量加入到林分生物量模型中,是一套合理、方便的方法。從理論上講,氣候敏感的林分生物量模型比傳統的模型更好,而本研究的實驗結果也證明:不論是AGB還是TGB,考慮氣候影響的模型性能優于最優基礎模型,這和以前的研究結果一致[12-14]。AHM是將氣溫和降水量相結合的一個綜合指標,可用來比較溫度和降水量均不同的環境下的氣候對林分生物量的影響程度。本研究發現單獨使用溫度或降水量模擬氣候對生物量的影響并不合適,溫度和降水存在共同變化,從圖2 可以看出生物量與氣候因子之間的復雜作用關系,比如溫度較高而降水量過低時,AHM比較大,此時林分生物量比較小,但是當溫度和降水量同時變高或變低時,AHM可能增加也可能會降低,此時林分生物量的變化波動就比較厲害,無法用單一氣候變量說明林分生物量的變化趨勢,這也印證了與利用主成分分析和相關分析篩選出具有統計學意義的氣候變量的重要性。氣候因子的變化將會影響林木的生理過程(如光合和呼吸作用),導致生物量的積累和分配發生變化[28]。通過解釋率的分解,本研究發現林分因子對林分生物量的獨立解釋率在87%以上,氣候因子對林分生物量的獨立解釋率不超過0.6%,有大約10%的解釋率無法確定是由哪一類因子所解釋的,雖然氣候因子對林分生物量的解釋率不高,但對林分生物量有顯著影響。同時,不同生物量組分對于氣候的響應程度有所差異,說明氣候等非生物因子對于生物量的影響不能被忽視,應該深入探究林分生物量多元驅動機制。

圖2 林分生物量與氣候因子的綜合作用Fig.2 Comprehensive effect between stand biomass and climatic factors
在建模數據質量高的情況下,穩健回歸方法和普通最小二乘方法的差異不大,均可用來估計林分生物量的參數。最優基礎林分地上生物量和總生物量的模型R2分別為0.967、0.953,可以對林分生物量進行很好的估計,而通過相關方法篩選氣候變量,建立氣候敏感的林分生物量模型能夠進一步提升模型性能,模型R2分別達到0.971、0.959,可用于林分生物量精準估計。進一步分析發現:林分因子對林分生物量的獨立解釋率大于88%,氣候因子對林分生物量的獨立解釋率不超過0.6%,但是二者共同解釋率大于95%,因此建立林分生物量模型時不能忽視氣候因子的影響,應在大尺度范圍內建立氣候敏感的生物量模型,以減少生物量模型的不確定性。