999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度學習和傳統方法模擬杉木樹高-胸徑模型比較

2022-01-05 11:01:34梁瑞婷孫玉軍李蕓
林業科學研究 2021年6期
關鍵詞:深度模型研究

梁瑞婷,孫玉軍,李蕓

(北京林業大學森林資源和環境管理國家林業和草原局重點開放性實驗室,北京 100083)

樹高是估測森林生長與收獲、預測地位指數和研究森林垂直結構的重要特征因子之一[1]。胸徑和樹高之間有很強的相關性,而胸徑簡單易測且測量準確,所以建立樹高-胸徑模型,利用胸徑預測樹高方便且實用[2]。樹高生長還受到立地條件和林分年齡等多種因素的影響[3],研究表明加入林分斷面積、立地指數、林分平均高或林分年齡等林分特征因子,建立的廣義胸徑-樹高模型能夠用于不同林分的樹高預測[4-5]。過去的研究多是依據前人經驗選擇若干個不同形式的基礎模型,然后通過非線性回歸擬合求參,選出精度最高的模型用于研究區樹高的預測[6]。但是,研究者需要嘗試各種模型形式,經過大量的分析比較才能得到精度較高的模型,耗時且低效[7]。而且不同的研究者選擇基礎模型的數量和種類有所不同,會導致研究結果產生較大差異[8]。另一種應用廣泛的基于非線性混合效應建立樹高-胸徑模型,該類模型具有良好的預測能力[9],但是由于隨機參數的引入,使模型結構變得更加復雜,增加了建模難度,會出現模型難以收斂的情況[10]。此外,傳統的建模方法都受到統計學假設的局限,如:胸徑-樹高數據通常是來自同一林分的多個樣地,或者是相同樣地的連續測量,導致數據結構違背了獨立分布的假設條件[11]。

隨著計算機技術的發展與更新,人工智能為模型構建提供了先進的思路和手段,能夠在一定程度上克服上述問題。人工神經網絡是人工智能的一個分支,它對數據分布沒有假設要求,能很好地處理非線性、非高斯分布和包含噪聲的低質量數據[12],而且建模前不需要明確模型具體形式,非常適宜處理復雜的多變量、非線性問題,已經在預測林木胸徑、材積和林分蓄積、生物量[12-14]方面有所研究。特別是BP-ANN,應用更為廣泛,卯光憲用以建立馬尾松樹高-胸徑模型[8],劉鑫用以建立云冷杉混交林中不同樹種的樹高-胸徑模型[7],均表明ANN 模型的精度高于傳統模型,具有泛化能力強、高效低偏的優點。

但是這些研究都是基于單層神經網絡,而樹高生長具有連續性和相關性,樹高-胸徑的關系受到各種相關因素影響,單層的網絡結構不足以模擬這種復雜的非線性結構[15]。深度學習(DLA)模型是人工神經網絡的一個分支,興起于2010 年,是近年來研究的熱點,DLA 模型包含3 層及以上的隱藏層和更多的神經元,其復雜的結構更接近人腦,具有自學習和自決策的能力,被認為是比單層神經網絡更為合適的建模方法[15-16]。目前在語音、圖像識別、生物醫學和人工智能等領域開始有所應用[17],在林業領域也有采用深度學習預測森林火災,或對遙感影像進行單木冠幅分割的研究[18-19]。迄今為止,國內基于深度學習構建森林模型、預測單木或林分參數的研究尚不多見,也未有基于深度學習建立樹高-胸徑模型的文獻。

本研究以福建省將樂國有林場的杉木為對象,基于H2O 平臺的深度學習算法,建立多個胸徑-樹高DLA 模型,探討深度學習在林業建模方面的可行性。同時基于傳統非線性回歸建立10 個廣義樹高-胸徑模型,篩選精度最高者作為對照。以期探索一種更高效低偏的樹高預測方法,同時確定最優的樹高-胸徑DLA 模型形式,為研究區森林資源監測和評價提供參考。

1 研究地概況

研究區位于福建省將樂國有林場(117°05′~117°40′ E,26°26′~27°04′ N),地處福建省西北部的三明市將樂縣。屬于亞熱帶季風氣候,溫暖濕潤,四季分明。年平均溫度18.6 ℃,年平均降水1 721.6 mm。地形以中低山為主,海拔約為400~800 m,土層深厚,土壤肥沃。分布主要喬木有杉木(Cunninghamia lanceolata(Lamb.) Hook.)、毛竹(Phyllostachys heterocyclaCarr.)和馬尾松(Pinus massonianaLamb.)等。

2 數據與方法

2.1 數據來源

在研究區內選擇不同林齡的杉木人工林,共設置34 塊標準地,進行每木檢尺,起測徑階為4 cm,測量樹高(H)和胸徑(D),并計算平均胸徑(Dg)。然后在每塊標準地內選取3~5 株優勢木,以其平均胸徑和平均樹高分別作為優勢樹高(Ht)和優勢胸徑(Dt)。最后,剔除枯死木和缺失值,共得到2 989組杉木的胸徑-樹高數據,選取其中的25 塊樣地(2 253組)作為建模數據集,剩余9 塊(645組)為檢驗數據集。統計因子見表1。

表1 建模數據和見證數據統計Table 1 Summary statistics of modeling set and validation set

2.2 廣義胸徑-樹高模型

根據以往研究,選擇10 個已經被廣泛使用且精度較高的廣義樹高-胸徑模型[6,20-21],這些模型不僅能夠模擬樹高-胸徑間的關系,而且在生物學上具有可解釋性(表2)。采用R 4.00 軟件進行數據處理和傳統模型擬合。

表2 廣義樹高-胸徑模型表達式 Table 2 Expression of referenced generalized height-diameter models

2.3 深度學習

深度學習通常的模型結構為輸入層、多層隱藏層與輸出層,包含多層隱藏層和更多的神經元個數,能夠擬合更復雜模型和處理更高維特征的數據。自輸入層開始,一層一層地前饋訓練,隱藏層的權重為雙向的,分別是向上的“認知”權重和向下的“生成”權重,通過一定的方法(例如通過正則化對權重進行懲罰)使誤差逐層傳輸,并不斷對網絡結構進行調整,最大限度地讓認知和生成達成一致。每一個神經元都是一個激活函數,彼此通過權重連接。其大致的學習過程如圖1 表示,在圖中,每個節點表示一個計算過程及結果,父節點計算的結果通過權重鏈接傳遞給子節點處,再次進行計算……直到尋找到成本函數的最小值。

圖1 DLA 模型結構Fig.1 Structure of DLA model

2.4 DLA 模型構建

研究基于H2O 平臺構建DLA 模型,H2O 是一個開源、可擴展的分析預測平臺,用于建立大數據模型,實現高精度預測。采用Python(Python 3.8)軟件的h2o.estimators.deeplearning 模塊構建多層前饋神經網絡模型。根據各變量的重要值排序結果(圖2)可以看出,優勢胸徑的重要值很小,所以不考慮該變量。模型的輸入變量為胸徑、優勢樹高和林分平均胸徑,輸出變量為樹高。此外,DLA模型同其他AI 模型一樣,需要確定隱藏層數量、激活函數類型和神經元個數等參數。通過前期比較分析,發現“Rectifier”作為傳遞函數的擬合結果優于其他函數,所以選擇“RectifierWithDropout”作為DLA 模型的激活函數。選擇均方根誤差(RMSE)作為梯度下降目標,H2O 在訓練DLA模型過程中采用自學習率算法,所以為了避免過擬合,將迭代次數設置為1 000,訓練誤差為0.001。

圖2 影響因子重要值Fig.2 Importance value graph of each factor

隱藏層數量和神經元個數是訓練模型最基本的參數,決定了模型結構。本研究參考Ercanl 的研究方法[29],為了確定神經元個數范圍,首先將神經元個數從100~500,步長設置為50,發現在200~400 之間,模型的結果表現較好,且各項指標較穩定。然后將每個隱藏層的神經元個數設置為200~400 之間,間隔為20,同時采用H2OGridSearch包中的隨機搜索(“RandomDiscrete”)方法以提高收斂速度,當模型結果的范圍縮小時,則結合H2OGridSearch 包中網格搜索的方式確定最優模型結構。同時為了減少誤差提高精度,采用K 折交叉驗證訓練DLA 模型(nfold=5)。

通過深度學習,計算出輸入因子的重要值和相對重要值比例,根據結果繪制圖2,可以直觀地看出各輸入因子的對樹高的重要程度。

2.5 模型評價

采用調整后決定系數(R2),均方根誤差(RMSE),平均絕對誤差(MAE)和均方差(MSE)對模型的擬合精度和預測精度進行評價。R2越接近1,其余指標越接近0,模型的精度越高。結合殘差圖和擬合圖評價,預測值越接近觀測值,殘差范圍越小,分布越集中在Y=0 兩側,模型越好。

3 結果與分析

傳統模型的擬合統計結果如表3,包括各模型的參數估計值、調整后決定系數(R2)、均方根誤差(RMSE)和平均誤差(MAE)。可以看出,參數的估計結果大多具有可靠性(p<0.001),這10 個備選的基礎模型的R2都在0.7 以上,能夠反映樹高-胸徑間的關系。不同模型對杉木胸徑-樹高關系的擬合精度不同,精度較低的3 個模型分別是M5、M7 和M10,其R2約為0.72,剩余模型的R2均在0.80 以上。M6 模型的精度明顯高于其他模型,是對杉木樹高-胸徑關系擬合效果最好的模型,其R2最大,為0.84,RMSE和MAE分別是2.142和1.678,小于其他模型。所以選擇M6 作為DLA模型的對照。

表3 模型參數估計及統計檢驗 Table 3 Parameter estimations and goodness-of-fit statistics of models

從70 個DLA 模型中,根據隱藏層的不同數量,選擇擬合精度最優(R2最大,而RMSE、MAE、MSE最小)的模型列于表4。可以看出,表中所有DLA 模型的R2均在0.85 及以上,大于最優的傳統模型,RMSE和MAE分別在2.1 和1.6 左右,均小于傳統模型。說明DLA 模型的擬合結果優于廣義胸徑-樹高模型。其中,隱藏層數量為3 和6,神經元個數分別為300 和340 的DLA 模型精度高于其他結構,R2能達到0.85,RMSE和MAE也較其他模型更小。如果只考慮模型的精度,那么最優模型的結構為6 個隱藏層,每個隱藏層有340 個神經元。如果同時考慮建模效率,即考慮模型的收斂時間,那么最優模型的結構為3 個隱藏層,每個隱藏層有300 個神經元。

表4 不同隱藏層的最優DLA 模型統計Table 4 Performance of best DLA models with different hidden layers

DLA 模型也是類似“黑箱”結構,缺乏可解釋性。為了進一步分析DLA 模型,比較傳統模型和DLA 模型的擬合精度,繪制圖3,該圖展示了觀測值和預測值的分布關系,也展示了優勢高、胸徑對單木樹高的影響。可以看出,預測值均勻分布在真實值之間,說明模型能較準確地模擬杉木的樹高、胸徑和優勢高之間的關系。當胸徑一定時,樹高隨著林分優勢高的增加而增加,當優勢高一定時,樹高隨著胸徑的增加而增加,說明DLA 模型符合樹高生長的生物學規律。比較兩個模型的擬合結果,可以看出,對于較高的林木,DLA 模型比傳統模型的擬合效果更好。

圖3 最優傳統模型與最優DLA 模型的擬合結果比較Fig.3 Comparition fitting results of best traditional model and best DLA model

分別選取最優的傳統回歸模型和DLA 模型,采用未建模的數據進行獨立性檢驗,以確定DLA模型是否存在過擬合問題,同時比較兩種模型對杉木樹高的預測能力。由表5 可以看出,DLA 模型獨立性檢驗的R2為0.838,與訓練集相差很小,RMSE和MAE值也與訓練集相當,說明DLA 模型不存在過擬合的問題。而且,可以看出DLA 模型的預測精度高于傳統模型,R2大于傳統模型,RMSE和MAE也分別減小了9.62%和14.64%。圖4 描述了兩種模型預測值和對應殘差的分布關系,由殘差圖可以看出,DLA 模型的殘差更為集中,尤其在樹高H>18 m 時,殘差大多在?3~5 m的范圍內,小于傳統回歸。說明DLA 模型預測精度高于傳統回歸模型,并且當預測較高的林木時,這種優勢愈明顯。

圖4 最優傳統模型與最優DLA 模型獨立性檢驗殘差Fig.4 The graphe of independence test residual based on best traditional model and best DLA model

表5 模型檢驗結果Table 5 Validation of models

4 討論

本研究基于H20 數據分析平臺的深度學習算法,采用Python 軟件構建杉木的胸徑-樹高DLA模型,這些平臺與軟件均是開源免費,容易獲得,成本低、實用性強。與傳統的建模方法相比,深度學習對數據分布結構沒有要求,建模前不需要確定模型的具體形式,而且更易收斂,能最大限度地逼近現實關系[30]。Ercanli 等人構建了80 個DLA 模型結構預測杜克松的樹高,隱藏層數為3~10,每層神經元個數是10~100,步長為10,發現每層100 個神經元的結構精度最高[29]。考慮到本研究的樣本量更大,神經元個數從100 開始,同時為了防止過擬合,神經元個數不能太大。還發現當隱藏層為3~8 時,隨著神經元個數的增加,模型的整體表現有所提升。而7、9、10 層的DLA 模型表現不如層數更少的,認為是由于層數太多,結構過復雜而使相關參數值不能滿足。所以本研究的隱藏層數量設置為2~8 層,在建立DLA 模型過程中也發現,隨著隱藏層數的增加,收斂速度變得越來越慢,且精度并沒有明顯提升,說明復雜的結構不一定能使模型表現更好,應該根據輸入變量結構選擇合適的隱藏層數。

結果表明,不同結構的DLA 模型均能較好地描述樹高與胸徑間的關系。無論在建模數據集還是檢驗數據集上,DLA 模型的R2均大于廣義樹高-胸徑模型,RMSE和MAE均小于廣義樹高-胸徑模型,說明DLA 模型的精度高于傳統回歸模型,與前人的研究結論一致。Ercanli 等人基于深度學習對土耳其西北部地區的杜克松建立了樹高-胸徑DLA 模型[30],Shen 等人采用以廣東地區的毛白楊為對象,建立包含多隱藏層的樹高-胸徑BP-ANN模型[15],都表明多隱藏層模型能更逼近胸徑-樹高的真實關系。盡管研究的樹種和地區都不相同,但都有類似結果,這說明多隱藏層的神經網絡模型,也可能適用于其他地區、其他樹種的樹高預測。在訓練DLA 模型時,與人工神經網絡模型一樣,需要注意過擬合問題,本研究得到精度最高的DLA模型包含6 個隱藏層,每個隱藏層有340 個神經元,如果同時考慮模型的收斂速度,則最優的模型結構為3 個隱藏層,每個隱藏層各有300 個神經元,其獨立性檢驗結果與訓練結果相差不大,說明沒有出現過擬合。該模型還可以用于預測其他單木參數(冠幅、材積、生長量)或林分特征(斷面積、蓄積、碳儲量)。

本研究證明深度學習算法預測杉木樹高的適用性,能夠作為傳統回歸的補充,盡管目前深度學習模型還存在可解釋差、技術門檻高,但隨著計算機技術和人工智能的飛速發展,相信這些問題很快能得到解決,深度學習在林業領域的應用前景值得期待。當模型只需考慮精度,或數據分布不滿足統計學假設時,可以采用深度學習算法,代替傳統統計學方法。但是深度學習與其他人工智能算法一樣,存在“黑箱”問題,由于不能明確表達內部結構,所以缺少可解釋性[17],這也是由于對這一技術的不熟悉,應該投入研究挖掘建模的原理,以便被更廣泛地理解和應用。本次研究中,只有胸徑、林分優勢高、林分優勢胸徑和林分平均高4 個輸入變量,而樹高生長還會受到更多因素的影響,如氣象因子(年均溫、年降水量)和其他林分因子(年齡、密度、大樹斷面積),未來的模型中可以加入這些因子,也許能進一步提高模型精度。盡管在本研究中,建立的DLA 模型精度高于傳統回歸模型,但還沒有比較其他的模型形式,也未與混合效應方法進行比較,而且深度學習預測樹高仍然是一個較新的方法,少有其他的研究結論,所以其精度是否均高于傳統模型還不能確定,需要更深入的探究,在未來的研究中,可以探究更多的樹高-胸徑模型形式,或比較其他的傳統建模方法。此外,基于大數據的多變量或相當復雜的非線性問題上,深度學習技術的優勢更加突出,所以當對大尺度的森林資源進行監測時,該方法可能更為適用。

5 結論

本研究采用福建省將樂國有林場的34 塊杉木標準地調查數據,基于H2O 平臺的深度學習算法,建立了多個杉木樹高-胸徑的DLA 模型。同時采用傳統非線性回歸建立10 個廣義樹高-胸徑模型用以比較。研究結果表明:(1)不同隱藏層數量的DLA 模型均能較好地描述杉木的樹高-胸徑間關系,其R2約為0.84~0.85,大于最優傳統模型的0.84,RMSE和MAE也更小。而且,DLA 模型的預測泛化能力也高于傳統模型。在采用相同建模數據的情況下,DLA 模型可以提高杉木樹高預測的精度,且當預測較高的杉木時,這種優勢更為明顯。(2)精度最高的DLA 模型,其模型結構為6 個隱藏層,每個隱藏層各有340 個神經元,可用于研究區杉木樹高的估測。(3)與傳統建模方法相比,深度學習不受統計學假設的限制,建模前不需要確定模型具體形式,更容易收斂。在預測森林參數、構建森林模型方面具有可行性,某些情況下能夠作為傳統模型的替代方法。

猜你喜歡
深度模型研究
一半模型
FMS與YBT相關性的實證研究
遼代千人邑研究述論
深度理解一元一次方程
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
深度觀察
深度觀察
主站蜘蛛池模板: 国产最新无码专区在线| 国产无码精品在线| 成人精品午夜福利在线播放| 国产人成在线观看| 色爽网免费视频| 五月天久久综合| 亚洲二区视频| 欧美日韩亚洲国产| 一本久道久综合久久鬼色| 日韩大乳视频中文字幕| 精品99在线观看| 黄色在线网| 亚洲欧美综合另类图片小说区| 亚洲天堂高清| 国产欧美视频在线| 首页亚洲国产丝袜长腿综合| 国产高潮流白浆视频| 久久无码av三级| 亚洲日韩高清在线亚洲专区| 欧美α片免费观看| 亚洲大尺度在线| 亚洲精品第一页不卡| 中文字幕在线欧美| 国产真实二区一区在线亚洲| 国产精品黑色丝袜的老师| 国产色婷婷| 在线国产资源| 欧美国产菊爆免费观看| 国模粉嫩小泬视频在线观看 | 97一区二区在线播放| 亚洲男人的天堂在线观看| 人妻21p大胆| 亚洲综合极品香蕉久久网| 亚洲视频二| 伊人91在线| 午夜啪啪福利| 一级不卡毛片| 亚洲永久色| 欧美精品二区| 亚洲一区二区三区在线视频| 亚洲成年人片| 亚洲最猛黑人xxxx黑人猛交 | 97国产精品视频人人做人人爱| 欧美亚洲香蕉| 国产在线观看成人91| 91系列在线观看| 国产一级α片| 午夜福利在线观看入口| 91在线视频福利| 国产综合日韩另类一区二区| 国产午夜精品一区二区三| 少妇精品久久久一区二区三区| 亚洲国产天堂久久综合| 亚洲天堂在线免费| 国产毛片高清一级国语 | 久久婷婷五月综合色一区二区| 中国一级特黄视频| 日韩天堂在线观看| 久久久亚洲国产美女国产盗摄| 午夜啪啪网| 欧美成人二区| 久久精品女人天堂aaa| 国内精品伊人久久久久7777人| 欧美成人综合视频| 2021最新国产精品网站| 色哟哟国产精品| 香蕉久久永久视频| 99视频在线观看免费| 粗大猛烈进出高潮视频无码| 亚洲日韩精品欧美中文字幕| 狼友av永久网站免费观看| 在线观看无码a∨| 亚洲色偷偷偷鲁综合| 精品伊人久久久大香线蕉欧美| 青青操视频在线| 国产 在线视频无码| 久久久久久久久18禁秘| 亚洲欧洲一区二区三区| 71pao成人国产永久免费视频| 国产成人高清精品免费软件| 亚洲人人视频| 秋霞午夜国产精品成人片|