999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林和支持向量機的森林健康情況分析

2023-05-30 12:21:30岳麗婭鄧潔瑩梁霄
計算機應用文摘 2023年1期
關鍵詞:數據挖掘

岳麗婭 鄧潔瑩 梁霄

關鍵詞:數據挖掘;患病樹木檢測;隨機森林;支持向量機

1引言

如今,林木健康問題已得到社會各界前所未有的關注,而中國傳統的樣地檢測和受控實驗等方法需要耗費大量人力物力,且得出具體結論所需時間往往較長,使林業健康檢測喪失時效性。故傳統手段具有一定局限性。而遙感是避免接觸,目標距離較遠的一種探測技術,其能夠為研究人員提供更高緯度的視野,可以有效收集并且處理復雜時空維度下的海量信息。本項目基于高分辨率遙感數據,結合統計學相關理論知識以及新興的數據挖掘技術,對健康樹木和患病樹木的遙感圖像數據進行分析研究和區別分類,旨在實現樹木患病的檢測與預防,且有效提升森林蟲害防治的研究效率[1]。

2研究意義

理論意義:引人數據挖掘技術,豐富森林健康管理研究方法。

目前,關于林木健康的研究雖已取得豐碩成果,但森林健康相關的數據挖掘作為現實問題研究還較少。因此,本項目引入數據挖掘技術,構建科學有效的模型和算法,從而豐富森林健康管理的研究方法,為其提供一種新的研究視角。

現實意義:為相關部門對樹木健康的檢測監控提供參考。

基于高分辨率遙感數據,利用統計學相關理論知識以及數據挖掘技術,對健康樹木和患病樹木的遙感圖像數據進行分析研究和區別分類,在對森林健康的保護方面有著極其重要的現實意義。

3數據導入與預處理

3.1數據集加載

本文所使用的原數來源于機器學習的加州大學數據庫UCI,本文使用的則是其中一組病樹研究數據。該數據集是來自Johnson等遙感研究的一些訓練和測試數據的集合。該數據集由Quickbird衛星遙感圖像分割組成,這些分割是通過分割全銳化圖像生成的,這些數據中含有快鳥衛星遙感數據中的紋理信息以及數據的光譜信息,其數據屬性信息如表1所列。

該數據集來自Quickbird衛星遙感圖像。數據集中的原數據為計算過后的R,G和NIR波段的平均光譜值以及兩個常用的紋理度量,標準差和灰度共生矩陣(GLCM)表示所有方向上的信息。而B波段再次被排除在分析外,因為它與綠色波段中信息高度相關,而全色波段被用作兩種紋理計算,因為它包含最詳細的空間信息。實驗區域為約為3.0kmx2.5km,主要由落葉闊葉林和常綠針葉林組成,有較小面積的砍伐林、住宅和農業用地。又因為這個位置有許多患病的松樹和一些其他樹種,而且該地區有許多其他類型的土地利用和土地覆蓋,從而有利于我們實驗的對比分析。

3.2本文進行的數據預處理

數據處理指的是在提取數據、模型、研究和分析原始數據集的其他活動前需要進行的一些處理過程。我們獲得的數據源一般都是不適合用來挖掘的。所以需要通過數據預處理使數據集變成進行數據挖掘合適的數據[2]。

原數據集劃分為95%的訓練集以及5%測試集,按照習慣總數據集將按照比例6:2:2劃分為三類,分別是訓練集、測試集、驗證集。但在一些情況下,驗證集并不是必要的,所以本文將原數據集合并后按照比例劃分為75%的訓練集以及25%測試集,用于病樹檢測模型的擬合和評估檢測。

4病樹檢測模型的建立與求解

4.1隨機森林分類方法

4.1.1隨機森林基本原理

隨機森林是用于回歸與分類的一種主流集成學習方法,也是一種常見的機器學習模型。它的實質是建立在決策樹基礎上的分類器集成算法,屬于Bagging類型[3]。隨機森林中單棵樹的信息增益率公式如下:

4.1.2基于隨機森林的病樹分類

首先,對數據集進行一下處理,將類別變量轉換為因子型,以便接下來的分類建模工作。然后,查看自變量的重要性程度。如圖1所示。

兩種測算方式下分別代表換掉變量后準確率的降低程度和換掉變量后信息增益率的降低程度。而這兩個的數值大小,決定了變量的重要性,值越大,則表示變量越重要[4]。從圖2可以看出,Mean_Red對分類結果影響最大,是所有變量中對分類問題最重要的變量。

在使用函數randimForest()時,函數會存在默認mtry(單棵樹的特征數量)與ntree(森林中樹的棵數)。但是,現實中這個默認值一般情況下都不是分類效果最好的,所以我們在構建模型時,應該想辦法去確定最優的參數值。

基于逐一增加變量的方法,從輸出結果可以觀察到,當mtry為5時,模型的誤判率均值是最低的。

在確定了最優的mtry后,還需要進一步確定模型中的最優ntree。在確定該參數時,我們將應用模型的可視化分析。在之前的分析中發現,mtry為5時模型最佳,所以接下來將建立相應的模型,并對其進行可視化分析。具體結果如圖3所示。

從圖3可以得出,當ntree大概大于450后,模型誤差便會趨于穩定,所以我們可以將模型中的ntree大致確定為450,以此來達到最優模型。

綜上,在建立模型時,本文嘗試了當mtry=5,ntree=500; mtry=5,ntree=450; mtry=3,ntree=450,三種不同情況下模型建立效果。發現這兩個參數對分類結果影響較小。這里展示其中效果最好的mtry=5,ntree=450時的模型結果。

如表2所列,其中預測錯誤的僅有12個實例個數,而針對患病樹木檢測正確的卻有52個,正確率為99 .Ogo-/o,預測結果良好,適合作為病樹檢測分類的建模方法。接下來繪制用于評價模型優劣的ROC曲線圖[5],如圖4所示,圖中的AUC值為0.946。

其余兩個模型的AUC值為0.945和0.937,相對來說,模型效果區別并不大。

4.2支持向量機分類方法

4.2.1支持向量機基本原理

支持向量機通常用來進行分類,回歸分析及模式識別。自支持向量機算法大概原理提出后,20世紀90年代Vapnik等的研究成果又使得該法快速發展。由于其較高的正確率已成為解決多維數據預測的一種較受歡迎的工具,支持向量機種類不同可解決不同類型的問題。其基本原理是將分類點正確區分,使分隔的距離最大化,可以轉化為凸二次規劃問題來求解[6]。

4.2.2基于支持向量機的病樹分類

在使用R語言對支持向量機算法建模的過程中,參數type是指建立模型的類別,它可以取的值有五種,分別為:C-classification,nu-classification,one-classification,eps-regression和nu-regression。其中,前3個針對的分類方式都是字符型結果變量,而且第3種方式同時還是邏輯判別:后兩種則是針對數量型結果變量的分類方式。故根據用途的差異,我們選擇type的取值為C-classification。

為了選擇模型最優的核函數,采用了逐一實驗不同核函數的建模效果的方法,并進行了比較結果,最后看預測結果最好的模型,它用什么核函數,我們就用它所使用的核函數。

觀察各種分類方式的模型預測結果,所得齊次多項式核函數的建模正確率為0.9669,非齊次多項式核函數的建模正確率為0.9521,高斯核函數的建模正確率為0.9901,雙曲正切核函數的正確率為0.9083。由此,故選擇高斯核函數作為建模核函數。最終,我們將利用C-classification與高斯核函數結合的模型作為最優模型。并根據該模型預測,得到混淆矩陣如表3所列。

由表3可知,其中預測錯誤的僅有12個實例個數,而針對患病樹木檢測正確的卻有48個,正確率為99.01%,預測結果良好,十分適合作為病樹檢測分類的建模方法。接下來繪制用于評價模型優劣的ROC曲線圖,結果如圖5所示,AUC值為0.913。

5病樹檢測方法結果分析對比

將本文所研究的兩種模型算法進行結果對比,繪制算法結果對比表如表4所列。

由表4可以看出,兩種算法模型結果均較好,但隨機森林算法比支持向量機算法的結果更好一點,正確率和作為模型的評價標準的AUC值均是更優秀的。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 色婷婷色丁香| 亚洲国产日韩一区| 欧美一级在线播放| 欧美一级专区免费大片| 在线精品亚洲国产| 亚洲国产欧美目韩成人综合| 激情乱人伦| 国产精品久久久精品三级| 亚洲精品成人福利在线电影| 综合人妻久久一区二区精品| a毛片免费观看| 久久国产成人精品国产成人亚洲| yjizz国产在线视频网| 午夜高清国产拍精品| 国产精品女人呻吟在线观看| a天堂视频| 免费AV在线播放观看18禁强制| 欧美成人午夜在线全部免费| 伊人激情综合网| 亚洲三级电影在线播放| 亚洲欧美综合另类图片小说区| 五月婷婷综合色| 色悠久久综合| 欧洲成人在线观看| 日本高清在线看免费观看| 在线不卡免费视频| 99视频在线精品免费观看6| 亚洲精品天堂自在久久77| 国产丝袜精品| 福利姬国产精品一区在线| 久久国产V一级毛多内射| 国模私拍一区二区三区| 91精品国产91久久久久久三级| 国产在线一区视频| 超薄丝袜足j国产在线视频| 精品三级在线| 国产爽爽视频| 国产欧美日韩va另类在线播放| 国产福利免费观看| 亚洲欧美国产五月天综合| 国产91熟女高潮一区二区| 亚洲一区二区视频在线观看| 91久久精品国产| 亚洲欧美一区在线| 伊人激情综合网| 精品国产一二三区| 亚洲天堂首页| 人妻中文字幕无码久久一区| 亚洲成人www| 欧美激情视频二区三区| 亚洲最新地址| 国产尤物视频在线| 亚洲精品大秀视频| 欧美日韩国产在线人| 国产精欧美一区二区三区| 久久永久视频| 青青久在线视频免费观看| 国产理论精品| 四虎影视无码永久免费观看| 露脸国产精品自产在线播| 中文成人在线视频| 久久人午夜亚洲精品无码区| 人人爽人人爽人人片| 色网站免费在线观看| 亚洲欧美另类专区| 国产手机在线小视频免费观看| 亚洲高清无在码在线无弹窗| 久久久久免费精品国产| 国产白浆在线| 亚洲中文字幕97久久精品少妇| 成人午夜久久| 亚洲第一视频网站| 亚洲无线一二三四区男男| 欧美日韩资源| 国产精品无码一区二区桃花视频| 久久综合丝袜长腿丝袜| 成人中文字幕在线| 鲁鲁鲁爽爽爽在线视频观看| 狠狠色成人综合首页| 午夜福利亚洲精品| 久热这里只有精品6| 日韩二区三区|