999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進的隨機森林分類方法及其應用

2016-12-31 00:00:00張艷翠
科技創新與應用 2016年29期

摘 要:隨機森林算法(RF)是一種將決策分類樹綜合起來的預測及分類的算法,RF首先將眾多分類樹匯總起來,進而提高模型精度,由于隨機森林利用的是Bootstrap方法進行抽樣,進而產生許多個Bootstrap樣本,建立新的分類模型,但是Bootstrap抽樣方法也有它自身的缺點,降低了隨機森林模型的效率和精確度。文章提出將改進的Bootstrap方法(BLB)運用到隨機森林模型中,減少評估估計質量的計算成本,提高其分類預測的效率。

關鍵詞:隨機森林;機器學習;BLB重抽樣;數據挖掘

引言

在數據和信息急劇膨脹的今天,人們可以很容易的獲取數據和信息,如何對這些數據做有效處理,從中挖掘出有價值的信息,在原有統計分析和數據挖掘工具的基礎上,進行進一步優化研究是大數據處理領域的熱點問題之一。分類分析一直是數據挖掘中的熱點問題之一,但是由于單分類器自身的限制,有學者開始提出將眾多分類器的分類結果通過某種方式整合在一起, 產生隨機森林算法。 在大數據的背景之下,Ishwaran等人[1]之前驗證過隨機森林的一致性及收斂性,并認為隨機森林在高維數據等方面[2]明顯優于其余分類方法。Breiman將Bagging集成學習理論[3]和Kam的隨機子空間方法[4]結合起來,并且對隨機森林方法從原理及應用等方面進行了詳細的論述。

1 改進的隨機森林分類方法

1.1 BLB算法

BLB抽樣方法[5]是在Bootstrap的基礎上進行改進的重抽樣方

1.2 改進的隨機森林的算法步驟

(1)采用BLB重抽樣方法重復抽取n個樣本,將其作為一個訓練集;(2)建立決n棵決策樹,使用基尼指數作為進行評估,形成不需要剪枝的完整樹;(3)將測試集的測試結果采用多數投票法(Majo

rity Voting),得票最多的類別就是分類結果。

2 改進的隨機森林算法的應用

自然界中,探險者發現了三種肉眼分不太清的形態相似的植物,首先我們找到四個量度指標(W1,W2,W3,W4),然后通過運行改進的隨機森林算法的程序進行種類識別。表1給出了具體數據。

具體代碼運行過程如下,得到改進的隨機森林的結果。

In stall. packages(\"Im-random Forest\") #安裝改進的隨機森林程序包

Library(Im-random Forest)#調用改進的隨機森林程序包

Plant<- read.txt(\"c:/data/plant.txt\")#往Plant中輸入數據

IRF1

Plant[‘kinds’],Importance=RIGHT, ntree=20000)#運行改進的隨機森林模型

IRF1#顯示出模型運算結果

最后輸出由該量度判斷出的植物類別。

表2中顯示模型對A的判別失誤率為20%,對B、C的錯誤判斷率均為0,比經典的隨機森林模型高出8%。

運行改進的隨機森林算法的程序產生的結果內部會含有一組判別函數,通過運行下列代碼判定植物的種類。

New. data<-data. frame(W1=10,W2=40,W3=20,W4=10)#一個新植物的量度

Predict(IRF,new.data,Type=\"prob\")#判別此量度的植物歸類為三種植物的概率

Predict(IRF,new.data,Type=\"Frequency Response\")#判別此量度的植物的類別。

判別的結果為A,B,C的概率分別為90.3%,9.3%,6.4%。因此將其判別為A種植物。

3 結束語

近年來,隨機森林在理論及方法上有了很大提升,眾多學者也對其進行各種改進。文章中所提出的改進的隨機森林算法雖然能在處理很大數據時,提高運算速度,但是改進的隨機森林在預測分類等方面仍然有一些不足之處。大數據已經滲透到我們的生活中,隨機森林算法也應該與時俱進,對其進行改進已成為眾學者不可推卸的任務。

參考文獻

[1]Ishwaran H, Kogalur U B, Blackstone E H, Lauer M S. Random Survival Forests [J]. The Annals of Applied Statistics,2008,2(3):18-28.

[2]Ishwaran H, Udaya B, Kogalur. Consistency of Random Survival Forests[J]. Statistics and Probability Letters, 2010,80(9):13 -14.

[3]L.Breiman. Bagging Predicators[J].Machine Learning,1996,24(2):123-140.

[4]T. K. Ho,he Random Subspace Method for Constructing Decision Forests[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1998,20(8):832-844.

[5]L. Breiman,Random Forests [J].Machine Learning,2001,45(1):5-32.

主站蜘蛛池模板: 欧美成人精品一级在线观看| 亚洲一级色| 国产精品成人免费视频99| 日韩精品高清自在线| 国产69精品久久久久妇女| 97超碰精品成人国产| 欧美精品一区二区三区中文字幕| 日本午夜精品一本在线观看| 99伊人精品| 99热这里只有精品5| 特级毛片免费视频| 中文字幕无码制服中字| 国产经典在线观看一区| 欧美黄色网站在线看| 欧美日本在线一区二区三区| 亚洲成人精品在线| 久久99国产精品成人欧美| 亚洲欧洲日本在线| 国产清纯在线一区二区WWW| 最新日韩AV网址在线观看| 天堂成人在线视频| 手机精品视频在线观看免费| 国产Av无码精品色午夜| 手机在线看片不卡中文字幕| 亚洲综合色婷婷| 无码aaa视频| 67194在线午夜亚洲| 美女啪啪无遮挡| 精品人妻系列无码专区久久| 色婷婷综合激情视频免费看| AV无码无在线观看免费| 99热亚洲精品6码| 99久久99视频| 精品久久高清| 72种姿势欧美久久久大黄蕉| 亚洲一区二区成人| 日韩人妻少妇一区二区| 国产丝袜丝视频在线观看| 久久久波多野结衣av一区二区| 在线观看精品自拍视频| 人妻丰满熟妇AV无码区| 日韩天堂在线观看| 99这里只有精品在线| 2048国产精品原创综合在线| 日本在线免费网站| 欧美中文字幕在线视频| 国产美女精品人人做人人爽| 区国产精品搜索视频| 一区二区欧美日韩高清免费| 国产亚洲精品yxsp| 操美女免费网站| 视频一区视频二区日韩专区| 午夜福利无码一区二区| 特级毛片免费视频| 中日无码在线观看| 97在线国产视频| 波多野结衣一区二区三视频| 午夜国产小视频| 亚洲三级色| 国产一区二区三区视频| 国产特级毛片| 免费国产高清精品一区在线| 这里只有精品国产| 欧美一级黄色影院| 亚洲欧美成aⅴ人在线观看| 国产亚洲精品精品精品| www.亚洲一区| 四虎成人免费毛片| 四虎永久免费网站| 99这里精品| 久久一级电影| 国产精品粉嫩| 国产日韩AV高潮在线| julia中文字幕久久亚洲| 日韩区欧美区| 就去吻亚洲精品国产欧美| 久久美女精品| 国内老司机精品视频在线播出| 97久久精品人人| 国产爽歪歪免费视频在线观看| 亚洲AV一二三区无码AV蜜桃| 在线观看91精品国产剧情免费|