趙鑫


摘要:森林地上生物量(Above Ground Biomass,AGB)是衡量生態系統生產力的重要標志,也是研究森林生態系統物質循環的基礎。本文以佩諾布斯科特森林為研究對象,選取森林的百分位密度和百分位高度作為估測森林地上生物量的特征,使用隨機森林回歸模型對樣地的森林地上生物量進行預測。結果表明:(1)森林的生物量與高度特征相關性較強,與密度特征相關性較弱。(2)使用隨機森林回歸模型預測精度最高為0.83,對應的均方根誤差為26.4t/ha。使用機載激光雷達數據結合隨機森林回歸模型對于森林生物量有較好的預測精度。
關 鍵 詞:森林地上生物量;激光雷達;特征選擇;隨機森林
0引言
森林是陸地生態系統的重要組成部分,覆蓋面積大約占全球陸地面積的30%;森林在陸地總初級生產量中占比75%[1]。研究表明:森林在吸收二氧化碳、調節動植物群落、水文和鞏固水土方面具有顯著功能。因此,如何快速、大范圍的獲取森林的相關指標是林業研究中的關鍵問題。
遙感技術自上世紀60年代興起后,就不斷被應用到各行各業中。遙感由于其數據獲取方便、覆蓋地理范圍廣、數據更新快的特點,在森林調查方面具有十分明顯的優勢。由其工作方式可以看出激光雷達技術能克服光學遙感存在的問題,可以獲取與森林垂直結構(樹高、密度等)相關的信息,并且不易受外界環境干擾[2-4]。因此,近年來學者的研究多集中在使用LiDAR數據反演森林地上生物量。
1 實驗區域概況
本次研究區域為佩諾布斯科特(Penobscot)實驗森林,如圖1所示。在森林中,有46個用于研究的森林服務站。該地區的氣候陰冷潮濕,年平均溫度低于10℃,2月份是該地區最冷的季節,平均每日溫度為-7.1℃,7月份是最溫暖的季節,平均溫度為20℃。降水量為1060mm,近一半的降水主要集中在每年的5月份到10月份之間。年降雪量為2390mm,平均年生長天數的456天。森林中的樹種主要以混合針葉林為主。從1950年以來,緬因州的佩諾布斯科特森林一直是美國農業部、林業部的研究站,是北部針葉林的森林學和生態學研究基地。
2 數據與方法
2.1 實測數據介紹
(1)佩諾布斯科特實驗森林的范圍:
(2)樣地設置介紹:
在佩諾布斯科特森林,設置了12組50m*200m的樣地,每個樣地又被劃分成16個25m*25m的子樣地。單個樣地劃分如圖2.2示。
2.2 激光雷達數據介紹
激光雷達數據是由美國國家航空航天局戈達德飛行中心進行航飛和處理。數據采集時間為2012年6月19-21日,飛行的重疊度為30%,飛行高度為300m。部分森林區域激光雷達點云如圖2.3示,依據不同的高度渲染不同的顏色,紅色為地面,黃色為樹木。
由圖3可以看出,點云數據顯然不利于處理,因此利用Fusion軟件對激光雷達點云進行處理,得到百分位高度、百分位密度的森林指標信息,并以tif形式保存相應的數據。使用ArcGIS軟件結合樣地坐標文件和百分位高度和百分位密度數據將樣地對應信息進行提取。提取結果如表2示,其中d0代表0%密度,p10代表10%高度,以此類推,stdev代表高度標準差,mean代表高度平均值。
2.3.2 隨機森林回歸模型介紹
隨機森林屬于集成學習一種方法,集成學習的思路是將多個弱模型組成一個強模型,強模型的性能要好于單個弱模型[7,8]。隨機森林回歸模型中使用的CART算法構建決策樹。
3 實驗結果與分析
Spearman相關系數篩選的變量為P80、P90、P50、P60、P70、P100、Pmean、d7、d8。利用其進行支持向量回歸,數據分組與上述小節處理方式相同,分為數量不同的數據進行回歸分析。結果如圖4所示。
依據統計學相關性等級劃分:相關系數的絕對值越大,說明解釋變量和響應變量之間的相關性就越強,相關系數越接近1,表明兩者存在正相關性,相關系數越接近-1,表明兩者存在負相關性,相關系數在0.8-1.0范圍之間表示相關性極強,在0.6-0.8范圍之間表示具有強相關性,在0.4-0.6范圍之間表示中等程度相關性,在0.2-0.4范圍之間表示相關性較弱,在0-0.2范圍之間表示相關性極弱或無相關性。故依據上述等級劃分可以看出百分位高度與森林AGB都具有中等程度以上的相關性,其中P80與P90與森林AGB的的相關性最強達到0.88,其次是P50、P60、P70、P100、Pmean都與森林AGB有強相關性,相關系數均在0.8以上,P10與森林AGB的相關性相較于其他高度特征較弱。基于上述分析結果,故采取相關系數均在0.8以上的高度特征作為生物量預測模型的特征變量。密度特征整體與森林AGB相關性較低,有些特征與森林AGB甚至是負相關性,與森林AGB具有強相關性的密度特征為d7、d8,d1、d2、d3、d4、d9都與森林AGB呈現負相關性。故選取d7、d8作為生物量預測模型的特征變量。
(2)隨機森林模型預測結果
由圖5可以看出:(1)本次使用隨機森林回歸模型預測的最高精度為0.83,均方根誤差最小為26.40t/ha。(2)訓練集的增加有助于提升模型的預測精度,同時降低模型預測誤差,但并非訓練集數量越多越好,在本次實驗中,訓練集的大小在總訓練集的65%為宜。
4結論與不足
本次實驗利用激光雷達數據結合隨機森林回歸模型對佩諾布斯科特森林的生物量進行預測表明生物量與森林的高度特征先慣性較強,與森林的密度特征相關性弱,其次隨機森林回歸模型對于生物量的預測有較好的精度。
本次使用了森林的高度和密度特征,后續可以結合更多森林相關特征和機器學習方法預測生物量,不斷提高生物量的預測精度。
參考文獻
[1] 趙同謙, 歐陽志云, 鄭華, 等. 中國森林生態系統服務功能及其價值評價[D]. , 2004.
[2] 歐光龍, 胥輝. 森林生物量模型研究綜述[J]. 西南林業大學學報: 自然科學, 2020, 40(1): 1-10.
[3] 羅云建, 張小全, 王效科, 等. 森林生物量的估算方法及其研究進展[J]. 林業[4] 科學, 2009, 45(8): 129-134.
巨文珍, 農勝奇. 森林生物量研究進展[J]. 西南林學院學報, 2011, 31(2): 78-83.
Chen Q. Modeling aboveground tree woody biomass using national-scale allometric methods and airborne lidar[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 106: 95-106.
易東, 陳軍, 劉嶺, 等. 相關系數的正確理解和表達[J]. 重慶醫學, 2011, 40(34): 3518-3519.
閆云鳳. 基于決策森林的回歸模型方法研究及應用[D]. 浙江大學, 2019.
鄭林濤. 基于機器學習方法的珠三角地區商場空調全年負荷預測研究[D]. 華南理工大學, 2019.