999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

決策樹的構造

2020-07-18 14:12:26智巖
讀天下 2020年15期

摘 要:本文分析了決策樹的幾個模塊之間的關系,并用代碼展示了decision tree的部分模塊的構造過程。

關鍵詞:ID3算法;信息熵;決策樹;數據集

一、 背景介紹

ID3算法[1,2,3]由J. Ross Quinlan于1975年在悉尼大學提出用作分類預測,該算法的基礎是“信息熵”。通過計算每個屬性的增益信息,ID3算法以每次劃分選取信息增益最高的屬性為劃分標準,完成數據集劃分,直至生成一個能完美分類訓練樣例的decision tree。

二、 構造模塊之間的關系

決策樹包含信息熵增計算模塊,數據集劃分模塊,以及ID3貪心算法構建樹的模塊。

該決策樹方法先根據訓練集數據形成決策樹,如果該樹不能對所有對象給出正確的分類,則加入一些其他屬性到訓練集數據中,重復該過程可形成正確的決策集。構建決策樹,除了ID3算法構造決策樹,還有C4.5和CART等算法。這里只是以ID3為例進行說明。

三、 決策樹的構造

構造決策樹的第一步是計算香濃熵。以下給出了計算香濃熵計算的描述:

def cal_shannon_entropy(dataSet):

n=len(dataSet)

label_counts={}

# 統計每個類別出現的次數

for feature in dataSet:

label=feature[-1]

if label not in label_counts:

label_counts[label]=0 ?# 創建該元素并清零

label_counts[label]+=1

entropy=0

for key in label_counts:

prob=float(label_counts[key])/n

entropy-=prob * log(p,2)

return entropy

完成了熵的計算,下一步就是處理數據集的劃分

#對dataSet進行劃分

def split_dataSet(dataSet,axis,value):

split_dset=[]

for f in dataSet: # f是特征向量

if f[axis]==value:

reduce_fv=f[:axis]

reduce_fv.extend(f[axis+1:])

split_dset.append(reduce_fv)

return split_dset

嘗試使用每一個特征向量計算對應的信息增益,選擇最大的那一個特征來劃分dataSet。特別強調的是,這里使用的分類方法并不是二分法,而是ID3的貪心法。

最后一步,遞歸構建決策樹。

def create_tree(dataSet,__labels):

labels=__labels.copy()

classlist=[f[-1]for f in dataSet]

if classlist.count(classlist[0])==len(classlist):

return classlist[0]

if len(dataset[0])==1:

return majority_cnt(classlist)

bestfeature=min_entropy_split_feature(dataset)[0]

bestf_label=labels[bestfeature]

newtree={bestf_label:{}}

del labels[bestfeature]

f_values=[f[bestfeature]for f in dataset] ?unique_f_values=set(f_values)

for v in unique_f_values:

sublabels=labels[:]

_splitedtree=splite_dataset(dataset,bestfeature,v)

newtree[bestf_label][v]=create_tree(_splitedtree.copy(),sublabels)

return newtree

四、 總結

在本文中,我們給出了決策樹的構造過程。注意,dataSet是我們待處理的數據集。由于決策樹的特性,我們這里的數據集dataSet中的數據類型只能是數值型,或者標稱型。本文給出了大致的算法過程描述。構造決策樹是一個費時的事務,對于一個不大的dataSet,也需要花費很多的機時,因此,如果在數據集很大的情況下,自然的需要花費更多的時間。故優化的辦法是,每次調用易構造好的決策樹。

參考文獻:

[1]黃愛輝,陳湘濤.決策樹ID3算法的改進[J].計算機工程與科學,2009,31(6):109-111.

[2]孫愛東,朱梅階,涂淑琴,等.基于屬性值的ID3算法改進[J].計算機工程與設計,2008,29(12):3011-3012.

[3]BENNETT C H. Quantum information and computation[J]. Nature,2000,404.

作者簡介:

智巖,廣東省廣州市,廣州工商學院。

主站蜘蛛池模板: 日韩欧美高清视频| 日韩中文字幕亚洲无线码| 国产精品开放后亚洲| 92午夜福利影院一区二区三区| 亚洲人成影院午夜网站| 91小视频在线| 99这里只有精品在线| 最新国产成人剧情在线播放| a毛片在线| 69视频国产| 免费jjzz在在线播放国产| 中文字幕乱码中文乱码51精品| 精品欧美一区二区三区在线| 本亚洲精品网站| 成年人福利视频| 欧美成人午夜视频免看| 国产杨幂丝袜av在线播放| 制服丝袜一区| 精品人妻无码区在线视频| 欧美福利在线| 亚洲精品动漫在线观看| 国产精品99在线观看| 香蕉视频在线观看www| 在线中文字幕网| 国产成人无码久久久久毛片| 国产综合另类小说色区色噜噜| 亚洲—日韩aV在线| 亚洲国产日韩在线观看| 一级毛片不卡片免费观看| 亚洲视频在线网| 国产欧美在线视频免费| 国产在线观看99| 毛片手机在线看| 国产福利一区在线| 美女无遮挡免费视频网站| 国产手机在线小视频免费观看| 中文字幕伦视频| 特级毛片8级毛片免费观看| 国产69精品久久久久妇女| 亚洲成av人无码综合在线观看| 国产精品成人观看视频国产| 九九热视频精品在线| 国产精品极品美女自在线网站| 亚洲成a人片77777在线播放| 精品视频免费在线| 亚洲国产日韩在线成人蜜芽| 另类综合视频| 日韩不卡高清视频| 久久中文无码精品| 亚洲男人的天堂久久香蕉网 | 成人午夜亚洲影视在线观看| 国产精品视频导航| 久久久久无码精品| 自慰高潮喷白浆在线观看| 亚洲国产欧美中日韩成人综合视频| 午夜精品一区二区蜜桃| 成年A级毛片| 日本色综合网| 日本人真淫视频一区二区三区| 国产精品亚洲а∨天堂免下载| 国产精品男人的天堂| 久热99这里只有精品视频6| 成人国产精品网站在线看| 2020久久国产综合精品swag| 亚洲成人在线网| 丰满人妻中出白浆| 色悠久久综合| 国产不卡一级毛片视频| 亚洲国产av无码综合原创国产| 欧美精品H在线播放| 乱人伦视频中文字幕在线| 成人一区专区在线观看| V一区无码内射国产| 欧美精品1区2区| 久久青青草原亚洲av无码| 一级香蕉视频在线观看| 久久99蜜桃精品久久久久小说| 亚洲无码高清视频在线观看| 久久伊人操| 国产爽爽视频| 亚洲无码高清一区二区| 久久久久青草大香线综合精品|