999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

DecisionTree的原理

2020-07-18 15:22:22智巖
讀天下 2020年14期

摘 要:本文探討了decision treee的設計原理,分析了Decision tree的核心分類思想,并給出了決策樹的分值構建的偽碼。

關鍵詞:決策樹;分類算法;信息熵;信息增益

一、 研究背景

給定A一個問題Q1,我們列出其諸多答案選項B。比如,B={B1,B2,…,Bn}。其中,n標示共有n個子選項,每個選項都是潛在的答案。然后,我們讓A根據我們的提供的答案B,告訴我們B中的哪個答案是正確的,比如Bi是A給我們的反饋。若答案Bi并非問題的最終解,我們更進一步的根據B的特點提問,設問題是Q2,根據Q2,我們設定答案選項C。同樣,不是一般性,我們假定C={C1,C2,…,Cp}。其中,p表示C中共有p個答案選項。如果A告訴我們Ci是正確答案,那么,我們就得到了更進一步地對問題的收斂解。以此類推,我們可以一直以這種操作延續下去,則最終肯定能夠得到一組滿足要求的解。這個過程就是普通樹的生成過程,同時,也是決策樹的研究背景。

二、 信息論基礎

n分之一份信息量(定義1):若存在n個相同概率的消息,則每個消息的概率p是1/n,一個消息傳遞的信息量為-log2(1/n)。

熵(定義2):熵是體系混亂程度的度量,即信息的信息量大小和它的不確定性有直接的關系。對于任意一個隨機變量X,若有n個消息,其給定概率分布為P=(p1,p2,…,pn),則由該分布傳遞的信息量稱為P的熵,它的熵定義為:

H(X)=-∑xP(x)log2[P(x)]

由圖可見,離散信源的信息熵具有:

①非負性:即收到一個信源符號所獲得的信息量應為正值,H(X)≥0

②對稱性:即P=0.5

③確定性:H(1,0)=0,即P=0或P=1已是確定狀態,所得信息量為零

④極值性:因H(U)是P上是凸的,且一階導數在P=0.5 時等于0,所以當P=0.5時,H(U)最大。

信息增益(定義):設關于變量X的劃分P,在做劃分之前的信息為H(Xi),做劃分之后的信息為H(Xi),則系統的增益為△=H(Xi)-H(Xi+δ)。其中δ表示相對Xi的該變量。

注意,這里的Xi是向量。我們稱Xi為特征向量。顯然信息的增益指的是變化前后系統中信息的變化量。若某個Xi,使得△最大,則這樣的Xi是最好的,因為使用這個特征向量引起的操作增益是系統敏感的。

三、 基于ID3分類的Decision tree

決策樹由node、branch和leaf組成。和普通的樹一樣,決策樹的最上面的結點為根結點,遞歸地,每個branch是一個新的決策node,或者是樹的leaf。每個決策結點代表一個問題或決策,通常對應于待分類對象的屬性。每一個葉子結點代表一種可能的分類結果。決策樹的分類的思想是:沿決策樹從上到下遍歷的過程中,在每個結點處都會生成一次詢問測試,對每個checking node上的不同問題對應的不同的詢問測試結果產生不同的后續分支,以此類推,直到最后到達某個葉子結點。前述增益的特性時,已經明確了,ID3算法計算每個屬性的信息增益,對于關于使用某個特征值后系統的增益,越大越好。故使用作為具有最高增益的屬性作為給定checking node的詢問(query)測試屬性。且以此詢問測試屬性構作一個node,并以該節點的屬性標記,對該屬性的每個值創建一個分支據此partition樣本。

下面給出遞歸調用如下的CreateBranch函數創建決策樹分支的方法創建決策樹的偽代碼,以結束本文的討論:

CreateBrach(…){

檢測數據集中的每個子項是否屬于同一類:

If yes

Return label of class

Else

通過計算信息熵獲得的信息增益尋找劃分數據集的最好特征

Partition data set

創建分支節點

For 每個劃分的subset

Call CreateBranch(…),并增加返回結果到分支節點中

Return 分支結點

}

參考文獻:

[1]周志華,王玨.機器學習及其應用2009[M].北京:清華大學出版社,2009.

[2]周志華.機器學習[J].航空港,2018(2):94.

[3]崔偉東,周志華,李星,等.支持向量機研究[J].計算機工程與應用,2001(1).

[4]姜遠,黎銘,周志華.一種基于半監督學習的多模態Web查詢精化方法[J].計算機學報,2009(10):217-224.

[5]李楠,姜遠,周志華.基于模型似然的超1-依賴貝葉斯分類器集成方法[J].模式識別與人工智能,2016,20(6).

[6]曲開社,成文麗,王俊紅.ID3算法的一種改進算法[J].計算機工程與應用,2003,39(25):104-107.

作者簡介:

智巖,廣東省廣州市,廣州工商學院。

主站蜘蛛池模板: 久久香蕉国产线看精品| 欧美日韩国产精品综合| 日韩精品资源| 亚洲欧美不卡中文字幕| 日韩人妻无码制服丝袜视频| 亚洲人成网站日本片| 国产一区二区精品福利| 四虎精品免费久久| 久久国产V一级毛多内射| 99精品一区二区免费视频| 亚洲三级成人| 日韩a在线观看免费观看| 99久久精品视香蕉蕉| 最新加勒比隔壁人妻| 亚洲综合18p| 精品成人一区二区三区电影| 中日韩一区二区三区中文免费视频 | 成人午夜网址| 在线国产欧美| 狠狠色香婷婷久久亚洲精品| 中文字幕色站| 午夜激情婷婷| 欧美a在线| 国产精品视频系列专区| 亚洲色图在线观看| 欧美在线网| 欧美午夜理伦三级在线观看| 99热这里只有精品免费| 国产成人a在线观看视频| 最新精品国偷自产在线| 青青草国产一区二区三区| 九色视频线上播放| 漂亮人妻被中出中文字幕久久| 国产香蕉在线| 国产精品成| 久久情精品国产品免费| 深夜福利视频一区二区| 欧美人在线一区二区三区| 久久精品免费看一| 女人爽到高潮免费视频大全| 久久久久国产一区二区| 一级毛片在线播放| 亚洲码一区二区三区| 91久久偷偷做嫩草影院免费看| 欧美亚洲另类在线观看| 亚洲va视频| 一本一本大道香蕉久在线播放| 91欧洲国产日韩在线人成| 中文字幕无码制服中字| 国产成人1024精品下载| 手机看片1024久久精品你懂的| 国产精品一区在线观看你懂的| 精品少妇人妻一区二区| 午夜天堂视频| 欧美成人手机在线观看网址| 91精品国产自产91精品资源| 中文字幕久久亚洲一区| 蜜臀AVWWW国产天堂| 秋霞一区二区三区| 日本三级黄在线观看| 久久99国产综合精品1| 国产成人无码AV在线播放动漫| 亚洲国产精品一区二区高清无码久久| 日本人真淫视频一区二区三区| 国产精品一区不卡| 黄片在线永久| 欧美一级高清视频在线播放| 欧美成人午夜在线全部免费| 久久人人97超碰人人澡爱香蕉 | 91久久青青草原精品国产| 秘书高跟黑色丝袜国产91在线| 久久性视频| 国产一区二区三区精品久久呦| 亚洲国产精品久久久久秋霞影院| 欧美日韩中文国产| 国产午夜精品一区二区三| 久久久久久国产精品mv| 高清乱码精品福利在线视频| 久久久国产精品无码专区| 欧美精品亚洲日韩a| 国产手机在线ΑⅤ片无码观看| 为你提供最新久久精品久久综合|