牛思圓 劉鵬舉 雷相東等
關鍵詞:連清樣地數據;杉木;樹高.胸徑模型
中圖分類號:S757 文獻標志碼:A 文章編號:1001-1498(2023)01-0117-07
杉木(Cunninghamia lanceolata(Lamb.)Hook.)是我國主要造林樹種之一,關于杉木樹高·胸徑模型,很多學者都開展過研究,但多為小區域建模。沈子奕等以江西省青原山杉木人工林為研究區,在基礎模型上構建了混合效應模型,結果表明,加入地形因子的混合效應模型能夠更好的擬合該地區樹高·胸徑關系。魏曉慧等利用福建省三明市將樂縣國有林場的杉樹人工林調查數據,對Richards方程進行擬合,得出Richards模型能夠提高擬合精度的結果。黃其城選擇4個常用的相對樹高曲線模型對福州市8個國有林場60片伐區的樹高·胸徑調查數據進行擬合,最終確定Richards函數變形固定參數模型作為杉木相對樹高曲線的最優模型。近年來,在樹高-胸徑模型的構建中逐漸加入了如海拔、林分密度、土壤條件、立地條件等隨機效應,用混合模型的方法來提高模型的擬合精度,但是這些模型大多都基于林場等小區域建模,在實際應用時需要重新求解隨機效應參數,限制了模型的應用。在某一地區建立的模型,難以推廣到其他地區,并且仍有杉木非核心分布區樹高-胸徑模型缺失,因此建立大區域乃至全國大尺度杉木樹高·胸徑模型顯得尤其重要。目前,大區域的杉木樹高一胸徑模型在我國的研究還較少,如覃陽平等選用Richards等15種樹高-胸徑模型作為候選模型,建立了云南省5個針葉樹種的樹高-胸徑模型,其中杉木的最優模型為Hossfeld方程。李海奎等分別采用樹高分級和未分級的方法,建立了杉木等6個我國主要樹種的樹高曲線模型,結果表明分級建模方法的精度顯著優于未分級建模。
因此,為推進我國杉木大尺度區域建模方面的研究,本研究基于第六次、第七次全國森林資源連續清查固定樣地數據,以全國15個省份的杉木人工林為研究對象,選用18種常見的生長模型作為候選模型,分別擬合杉木樹高胸徑的關系,分省區建立杉木人工林最優平均木樹高·胸徑模型。
1數據來源與處理
1.1研究區概況
杉木人工林主要分布于我國的15個省區,分別為江蘇、安徽、河南、浙江、福建、江西、湖北、湖南、廣東、廣西、重慶、四川、陜西、貴州和云南,為了便于應用,本研究分省區建立杉木樹高·胸徑模型,但由于一些省份杉木樣地數據過少,參考張英凱等杉木分布區分組的結果,對低于100個觀測數據的省份進行合并處理。江蘇省和安徽省均位于長江中下游平原,河南省的杉木樣地分布于該省東南部,緊鄰安徽省杉木分布區,且3省的杉木分布區氣候都屬亞熱帶季風氣候,因此將江蘇、安徽和河南3省數據合并處理(以下簡稱蘇徽豫),一同建模。陜西省杉木樣地主要分布在該省秦嶺南部地區,緊鄰重慶市北部的杉木樣地,因此將陜西省數據與重慶市數據合并處理(以下簡稱渝陜),其余各省區單獨處理。
1.2數據來源
所用數據來自于第六次、第七次一類清查杉木人工林固定樣地數據的樹高調查表,每個固定樣地選取3~5株胸徑接近樣地平均胸徑的樹木測定其樹高,剔除不完整的樣本,最終總樣本數為23239個平均木單株樹高一胸徑數據。詳細的數據統計量如表1所示。
2研究方法
2.1建模方法
根據前人的研究經驗,采用常見的18個線性和非線性模型作為候選模型來擬合杉木的樹高·胸徑關系,探討杉木各省區最適宜的樹高曲線形式,候選樹高·胸徑模型的具體表達式如表2所示。
2.2模型評價及檢驗
模型的評價主要利用決定系數(R2)、平均絕對誤差(MAE)、平均相對誤差(MRE)、均方根誤差(RMSE)和平均預估誤差(MPE)5種評價指標,分析殘差分布圖,并考慮模型各參數的生物學意義以及參數的取值范圍是否合理,以此來確定各省區擬合效果最優的模型。R2的值越接近1,MAE、MRE、RMSE和MPE的值越小,說明該模型擬合精度越高。
在確定各省區最優模型后,模型驗證部分采用5折交叉驗證法,具體步驟為:首先將全部數據平均分成5份,每次從5份數據中拿出4份用來建模,剩下的1份作為驗證數據,重復進行5次,共建模5次得到5個子模型,應用5個子模型的交叉檢驗估計值計算各誤差指標,依據MAE、MRE、RMSE和MPE越小越好的原則,來評價選擇的各省區最優模型的預測能力。
3結果與分析
3.1最優模型的篩選
最優模型的選取遵循模型擬合精度最高同時誤差最小的規則,綜合權衡R2,MAE,MRE、RMSE和MPE 5個指標,以及模型參數的取值是否符合生物學規律,得出各省區最優樹高·胸徑模型。各省區最優平均木樹高·胸徑模型建模結果和誤差分析見表3。可以看出,各省區最優模型并不相同,最優模型以模型16(Mitscherlich方程)為主,各省區的擬合結果均具有較高的精度,每個省區最優模型的R2介于0.602~0.807之間,MAE介于0.94~1.53 m之間,MRE介于-2.93%~-4.72%之間,RMSE介于1.23~2.00 m之間,MPE介于0.50%~2.77%之間。江蘇省、安徽省和河南省的MAE最小,各省的MRE均小于±5%,RMSE均小于2.00 m,MPE均小于3%。其中湖北省最優模型擬合結果精度最高,最優模型為模型11(Logistic方程),R2達到0.807,MAE,MRE,RMSE和MPE分別為1.53 m,-3.33%,1.89 m,2.49%;廣東省最優模型的擬合結果精度最低,R2為0.602,MAE,MRE,RMSE和MPE分別為1.29 m,-4.38%,1.66m,1.13%.
15個省區最優模型的樹高預測值-殘差的分布如圖1所示,殘差點較為平均地落在殘差值為0的標準線的上下兩端,大部分都分布在±4的殘差值之內,也有少數殘差值較大的樣本,但并無明顯的異質性,表明模型的擬合效果較好,能夠應用于實際的擬合預測。
3.2模型的評價與驗證結果
為檢驗模型的適用性,采用5折交叉驗證法對各省區5次建模的最優模型預測能力進行檢驗,用5個子模型的交叉檢驗估計值計算相關誤差指標,得到各省區的誤差精度指標以及建模結果見表4。從表4可以看出,MAE在0.94~1.57 m之間,MRE在-2.93%~-4.65%之間,RMSE在1.23~2.00 m之間,MPE在0.41%~2.77%之間,各省區最優模型的檢驗結果大體與建模數據的分析結果一致,同時所有模型的MRE在±5%以內,滿足精度要求,MAE均在2.00 m以內,RMSE均小于或等于2.00 m,MPE均小于3%,說明模型預測效果好,所有模型的誤差較小,得出的15個省區的最優樹高·胸徑模型有較強的適用性,可以在實際中應用。
4討論
樹高·胸徑模型是立地質量評價和反演復雜模型的基礎。不同于以往的杉木小區域建模,本研究建立了杉木人工林分布的各省區的大尺度的樹高生長模型。小區域建模的研究范圍一般為林場或區縣,數據量較少,受環境差異影響較小,雖然適用范圍有限,但模型精度相對較高,R2通常在0.8以上。大尺度建模研究區域一般在整個省乃至全國范圍內,所用數據量較大,適用范圍廣泛,但省內或全國范圍內各地環境存在差異,因此建模精度相對較低,R2通常分布在0.6~0.8之間。本研究建立的各省區模型R2在0.610~0.834之間,平均值為0.679,建模精度在上述有關學者的大區域杉木建模精度范圍內,因此本研究建立的各省區的杉木樹高一胸徑生長模型可以預測不同徑階杉木的樹高情況。本研究評價指標中,平均相對誤差(MRE)沒有絕對值,因此是存在正負的,正值表示實測值大于預測值,負值表示實測值小于預測值,本研究MRE均為負數,表明擬合模型的預測結果大部分都大于實測值,但MRE整體均分布在±5%之間,結果符合精度要求。
交叉驗證在模型檢驗中應用廣泛,操作簡便,本研究驗證,部分采用了5折交叉驗證法,充分利用樣本數據,能夠更準確地檢驗選出的最優模型的預測能力,但是交叉驗證的折數是可以改變的,不同折數不僅決定著建模和檢驗樣本的多少,還影響著誤差指標的結果和計算的復雜程度,本研究為便于計算,選用了5折交叉驗證法,在未來的研究中,可嘗試10折交叉驗證或其他驗證方法進行驗證。
本研究只考慮了杉木樹高與胸徑的關系,只有胸徑一個自變量,應用范圍較廣泛。同時,杉木樹高的生長情況還受多種因素影響,如海拔高度、林分密度、氣象條件、立地條件、經營目標、撫育間伐等,未來可以嘗試建立包含多種林分因子(包括因子間的相互作用)的廣義樹高,胸徑模型,也許可以進一步提高模型的精度。由于本研究采用了兩期數據,存在相關性,未采用混合效應模型,因為混合效應模型需要進行新的隨機參數估計,會限制其在實際中的應用。另外,本研究為便于模型的實際應用,按行政區劃進行建模,未比較不同省份之間回歸模型的差異顯著性,將來可在差異比較的基礎上,將差異不顯著的省份合并建模,嘗試利用杉木產區劃分進行建模。
5結論
本研究基于第六次、第七次全國森林一類清查固定樣地數據,以杉木人工林分布的15個省區為研究區,利用18種基礎生長方程,分別對各省區杉木平均木樹高.胸徑數據進行擬合,然后根據模型的決定系數(R2)、平均絕對誤差(MAE)、平均相對誤差(MRE)、均方根誤差(RMSE)和平均預估誤差(MPE)這5個評價指標,并參考樹高預測值·殘差分布圖,最終決定各省區適宜的模型,建立了全國杉木各省區平均木樹高-胸徑關系模型。結果表明:各省區的最優平均木樹高-胸徑模型不盡相同,模型的決定系數R2在0.602~0.807之間,MAE在0.94~1.53m之間,MRE在-2.93%~-4.72%之間,RMSE在1.23~2.00 m之間,MPE在0.50%~2.77%之間。經檢驗,模型擬合效果較好,參數取值范圍合理,對于杉木樹高一胸徑的擬合效果較好,可以作為全國各省區基本的最優杉木人工林平均木樹高-胸徑模型。