李 輝
(湖南省東安縣林業局,湖南 東安 425900)
馬尾松Pinus massoniana是我國南方重要的鄉土樹種,適應能力強,面積廣。目前,濫伐馬尾松林案件時有發生,由于林木采伐后原木被拉走,能測定的因子只有地徑,且現在采伐林木都用電鋸,鋸口離地面都不會超過5 cm,一般離地面2 cm。目前,多數地區沒有本地的地徑材積表,只能通過地徑推算采伐木胸徑,然后通過二元材積表查出采伐木蓄積。為此,許多學者根據不同地區馬尾松地徑與胸徑數據進行了回歸方程擬合分析研究,分別認為擬合最好的是一元線性方程模型[1-3]、二項式方程模型[4-6]、三項式方程模型[7]、冪函數方程模型[8-10]。本研究根據東安縣馬尾松地徑與胸徑調查數據,對其進行了相關性研究和分析,為有關采伐馬尾松林的林業案件技術鑒定及編制本地區馬尾松地徑材積表提供參考。
東安縣位于湖南省西南邊陲,湘江上游,地處南嶺山系向湘中丘陵過渡地帶,地理坐標范圍在110°34′10″~110°59′33″E,26°07′04″~ 26°52′29″N之間。年均氣溫為17.6℃,年均降水量為1 338 mm,年均相對濕度為80%,平均風力在2~ 3級,年均無霜期為298 d。林業用地面積達144 606.2 hm2,占土地總面積的65.54%,森林覆蓋率為58.1%,林木綠化率為63.0%,馬尾松林面積達19 454.3 hm2,占有林地面積的25.49%。屬于中亞熱帶常綠闊葉林區,森林植物資源豐富,典型地帶性植被為常綠闊葉林,兼有以杉木Cunninghamia lanceolata,馬尾松為主要成分的針葉林、竹林和經濟林。
2019年12月,在東安縣不同地點的馬尾松林內隨機設立4塊調查樣地。樣地距離林緣10 m以上,大小為20 m×25 m。4塊樣地均為天然的近熟林,土壤類型為紅壤,調查樣地基本情況見表1。調查方法為用圍尺繞測樣地內馬尾松的帶皮地徑及對應的帶皮胸徑,地徑為距上坡地面2 cm處的樹木直徑,胸徑為距上坡地面1.3 m處的樹木直徑,測量樣地內所有樣株。本研究共測量馬尾松207株,測量所得數據地徑在7.1~ 48.2 cm,胸徑在5.0~ 38.0 cm,馬尾松樣木株數、胸徑徑階分布情況見表2,其中樣地1~ 3共計177株用于擬合建模,樣地4共計30株用于驗模。

表1 調查樣地基本情況Table 1 Information of sample plots

表2 馬尾松樣木株數及其胸徑徑階分布情況Table 2 Distribution of diameter class of sample trees
1.3.1 異常數據處理 將207株馬尾松的地徑及對應的胸徑數據輸入Excel表格中,并以地徑為x坐標,胸徑為y坐標顯示散點圖,觀察是否有樣本偏離其它絕大多數樣本。如沒有,說明該樣本無異常數據,樣本有效。如有,剔除該異常樣本,剩余的樣本作研究樣本。
1.3.2 模型方程初選 采用SPSS曲線回歸分析,通過選取線性、二次、三次、指數、冪、對數、S(S形曲線)、增長、復合、倒數、Logistic(邏輯斯蒂)共11個函數模型,分別擬合馬尾松地徑與胸徑的相關關系進行初選,選出幾個相關系數R2高的模型。采用SPSS軟件曲線估計回歸分析中曲線模型是用曲線函數轉換成直線方程后的新數據進行擬合的,即曲線直線化[11]擬合,得到的相關系數R2為轉換成的直線方程相關系數,非原曲線函數的相關系數。此模型的最佳參數應用高斯-牛頓迭代法求出[12-13]。
1.3.3 模型方程選取
1.3.3.1 模型方程選取 SPSS非線性回歸分析是采用高斯-牛頓迭代法進行曲線函數參數估計的,選定模型按此分析進行擬合,并以模型方程最后一次線性化的F統計量判斷模型參數的顯著性。按模型評價指標選出擬合度最好和精度最高的模型方程作為馬尾松地徑與胸徑最優擬合模型。
1.3.3.2 模型評價指標 相關系數R2衡量的是回歸方程整體的擬合度,但由于R2有當變量數目增加而增大的缺點,特別是多項式,當添加更多項時,會增加決定系數R2,雖可獲得更接近數據的擬合,但代價是模型更為復雜,R2無法解釋,而調整后的相關系數()包括了一項對模型中項數的懲罰,是扣除了回歸方程中所受到的包含項數影響的相關系數,更適合比較不同的模型對同一數據的擬合程度,可更準確地反映模型的好壞,因此以作擬合優度評價。馬尾松地徑與胸徑關系模型主要評價指標有:、均方根誤差(RMSE)、平均絕對誤差(MAE)、絕對平均百分比誤差(MAPE)4個指標,其相應公式如下:

1.3.3.3 模型的適應性檢驗 檢驗數據為獨立采集的檢驗樣方樣本,當檢驗樣方樣本-5% <總相對差(RS)< 5%,MAPE<10%,同時通過F檢驗(F≤F0.05),則所建立并選擇的地徑與胸徑數學模型適用。否則,應重新建模或者選擇其它模型檢驗[15]。相關公式如下:


式中,a,b為回歸直線的參數;n為樣木數;xi為第i株樣木的胸徑估計值;yi為第i株樣木的胸徑實測值。
將207株馬尾松的地徑及對應的胸徑數據輸入Excel表格中,顯示散點圖,沒有發現樣本數據顯著偏離其它樣本,說明該批樣本無異常數據,建模樣本和驗模樣本都有效。
在SPSS軟件中,以地徑為自變量x,胸徑為因變量y,將測量用于建模的177株馬尾松地徑及對應的胸徑數據錄入SPSS“數據視圖”中,在11種函數模型方程進行擬合,結果見表3。線性(R2=0.960)、二次(R2=0.961)、三次(R2=0.960)、冪(R2=0.969)4種函數模型的R2都較高,說明這4種函數模型是極度正相關,擬合度都較好。表3中除線性模型外,其它模型R2都為變換成直線方程的相關系數。在原始數據相關系數R2的計算中,必須用未經變量代換的原始數據計算[16]。經各模型方程變換化為直線得到的參數代入原方程后推算,線性模型R2=0.960 466、二次原模型方程R2=0.961 109、三次原模型方程R2=0.961 162、冪原模型方程R2=0.960 788。經過曲線估計回歸分析擬合,初選出了4個擬合較好的模型方程,公式如下:
線性方程:

二次曲線方程:

三次曲線方程:

冪函數方程:

上述公式中,a,b1,b2,b3均為方程參數。

表3 初選模型數據和參數估計值Table 3 Primary model data and parameter estimate
非線性回歸分析采用高斯-牛頓迭代法進行曲線函數參數的估計,這種估計方法是對曲線函數作泰勒級數展開,以達到線性近似的目的,并反復迭代求解。用SPSS軟件中“分析-回歸-非線性”分別擬合初選方程(8)、(9)、(10)、(11),用模型初選的參數估計值作模型非線性回歸分析的參數初值,分析得各模型參數,并用參數推算出模型的評價指標值,結果見表4。對于非線性回歸模型的回歸系數和回歸方程顯著性檢驗是對最后一次線性近似作F檢驗,這種檢驗也是合理的。由表4可知,4個模型Sig.值均為0,小于0.05,都通過了0.05水平檢驗,具有顯著性,都有統計學意義。

表4 馬尾松地徑與胸徑相關關系模型方程參數和評價指標值Table 4 Model equation parameters and evaluation index value of correlation between ground diameter and DBH of P.massoniana
各模型方程指標RMSE的大小順序為,三次曲線(RMSE=1.512 184)< 二次曲線(RMSE=1.513 216)< 冪函數(RMSE=1.514 739)< 線性(RMSE=1.525 664),說明三次曲線的RMSE最小,偏差少,冪函數RMSE與其相差細微。指標MAE的大小順序為,線性(MAE=1.110 774)< 冪函數(MAE=1.112 453)< 二次曲線(MAE=1.117 052)< 三次曲線(MAE=1.120 674),說明線性的MAE最小,精確度高,冪函數的精確度也比較高。4個模型的MAPE均小于10%,表明根據地徑都可以利用這些模型精確地估計林木的胸徑,冪函數(MAPE=6.652 8%)< 二次曲線(MAPE=6.676%)< 線性(MAPE=6.692 6%)< 三次曲線(MAPE=6.731 8%),冪函數的MAPE最小,說明冪函數方程對胸徑估計的誤差最小,估計精度最高。綜合4個模型各評價指標值,各模型指標值差異不是很明顯,其中冪函數模型方程的擬合優度最好,精度相對較高,東安縣馬尾松地徑與胸徑關系的最優數學模型公式為:

用測量驗模4號樣地的30株樣木作最優數學模型的適用性檢驗,以地徑為x,用最優模型y=0.599 484x1.078469求出對應的檢驗樣本胸徑估計值。
經計算求得,RS=-1.34%,-5%<RS<5%,表明RS在合理范圍內;MAPE=7.6%,MAPE< 10%,表明MAPE在合理范圍內。

在95%的可靠性下對回歸參數與理想直線參數a=0,b=1進行F檢驗。經計算求得,F=0.243 6,按自由度df1=2,df2=29,查F分布表,單側界限值為F0.05=3.33。很明顯,F=0.243 6 <F0.05=3.33。
以上適用性檢驗,說明該模型實用性是很強的。
(1)利用馬尾松地徑與胸徑調查數據,采用SPSS曲線回歸分析中11種數學模型進行擬合初判,其中,線性(R2=0.960 466)、二次(R2=0.961 109)、三次(R2=0.961 162)、冪(R2=0.960 788)4種函數模型的R2都較高,說明這4種函數模型擬合度都較好,但由于曲線回歸分析是采用曲線直線化法對變換后的數據進行的,所得結果僅對變換后的數據來說是最佳擬合,當再變換回原數據坐標時,所得的回歸曲線并不一定是最佳擬合。因此,我們用SPSS非線性回歸分析,采用高斯-牛頓迭代法對初選的4種函數模型進行分析,其中,冪函數曲線方程y=0.599 484x1.078469為最優擬合模型,其調整相關系數(=0.960 808)最大,擬合度最好,精度相對較高。該結論與楊曉毅、秦鵬飛、劉健等[8-10]研究選定的最優模型方程一致,但選定的冪函數模型參數不同,且所用研究方法和擬合優度評價指標不一樣。與趙浩彥、盧昌泰、黎良財等[1-7]研究選定的最優模型則完全不同,這可能是地徑所測量的離上坡地面距離不同引起的,更可能是研究地區不同,所在氣候類型和立地條件不同,導致馬尾松生長出現差異,從而使得不同地區馬尾松地徑與胸徑關系模型的擬合效果出現差異[1]。用曲線回歸分析的冪原模型方程R2=0.960 788,小于用非線性回歸分析的冪原模型方程R2=0.961 03,說明采用高斯-牛頓迭代法推算出的冪函數模型方程要優于采用曲線直線化的原冪函數模型方程的擬合效果。地徑與胸徑的最優擬合模型經檢驗精度較高,具有較強的適用性。
(2)利用馬尾松最優擬合模型方程y=0.599 484x1.078469,通過測量馬尾松地徑就可以推算出其胸徑,再化成徑階數,用立木材積表查算出被伐木的材積,為林政資源管理及林業執法提供理論依據。