999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

決策樹算法及其改進

2014-11-10 14:37:32蔡星
科技創新導報 2014年12期
關鍵詞:數據挖掘

蔡星

摘 要:該文對傳統的C4.5決策樹數據挖掘算法進行了改進,提出了一種雙重熵平均決策樹算法。傳統的C4.5決策樹算法易出現無意義分枝,過度擬合等問題,針對該類問題,基于雙重熵平均決策樹算法,通過兩次對樣本子集熵平均值的計算、排序、合并處理,得到修正后的屬性信息增益,并以此作為屬性選擇的依據,從而解決了傳統C4.5決策樹算法可解釋性差、易產生碎片等問題。

關鍵詞:C4.5決策樹 算法 熵 平衡因子

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2014)04(c)-0040-02

數據聯機分析功能是通過對數據的處理發現已知要素與分析度量值之間的關系,而數據挖掘則是從大量的數據中發現隱藏的規律。數據挖掘包括多種挖掘算法,為了研究畢業生不同屬性與其就業狀況之間的潛在知識和規律,該文采用決策樹方法對高校畢業生數據進行分析,主要選用的是C4.5決策樹算法。

1 C4.5算法思想

決策樹的優點在于原理簡單,發現知識較快;計算較為簡單,運算速度較快,對于訓練數據的處理和待決策數據的處理效率相對較高;適用于大量數據的綜合處理,有利于挖掘數據中的重要屬性;最終得到的挖掘結果是有意見的規則,有利于用戶的理解。決策樹的主要缺點包括:對數據的時間屬性較為敏感,需要大量的預處理工作;對于非離散的連續性數據值處理效率和準確率不佳;易出現過度擬合的情況,產生大量的決策分支,導致決策規則過于龐大。

C4.5決策樹算法是決策樹算法的主流,它繼承于傳統的ID3算法,繼承了其優勢,改進了其缺點。但C4.5決策樹算法依然存在著較多的問題,其中最為突出的是過度擬合情況,以及決策準確性方面的問題。針對上述問題,本課題提出了一種改進的C4.5決策樹算法,在算法構建過程中,以樹分枝的信息熵為研究對象,將熵值較高的部分和熵值較低的部分進行合并和平衡處理,從而達到減少決策樹分支數量的目的;與此同時,考慮到C4.5算法在決策分支的確定過程中采用的是局部最優的方法,在準確性方面從整體上看有所欠缺,所以引入了了平衡因子控制算法的整體最優化性。

C4.5決策樹算法設研究對象數據集為,該數據集中包括個類別,每一個類別表示為,選取該數據集中的一個屬性數據,則可以被劃分為多個子集,設有個取值,則被劃分的子集可表示為。設為的例子總數,而為的例子數,為的例子總數,是的所有例子中所包括的的例子數,基于上述的設定,則可以得到如下定義:

(1)類別在出現的概率如式(1)所示:

(1)endprint

摘 要:該文對傳統的C4.5決策樹數據挖掘算法進行了改進,提出了一種雙重熵平均決策樹算法。傳統的C4.5決策樹算法易出現無意義分枝,過度擬合等問題,針對該類問題,基于雙重熵平均決策樹算法,通過兩次對樣本子集熵平均值的計算、排序、合并處理,得到修正后的屬性信息增益,并以此作為屬性選擇的依據,從而解決了傳統C4.5決策樹算法可解釋性差、易產生碎片等問題。

關鍵詞:C4.5決策樹 算法 熵 平衡因子

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2014)04(c)-0040-02

數據聯機分析功能是通過對數據的處理發現已知要素與分析度量值之間的關系,而數據挖掘則是從大量的數據中發現隱藏的規律。數據挖掘包括多種挖掘算法,為了研究畢業生不同屬性與其就業狀況之間的潛在知識和規律,該文采用決策樹方法對高校畢業生數據進行分析,主要選用的是C4.5決策樹算法。

1 C4.5算法思想

決策樹的優點在于原理簡單,發現知識較快;計算較為簡單,運算速度較快,對于訓練數據的處理和待決策數據的處理效率相對較高;適用于大量數據的綜合處理,有利于挖掘數據中的重要屬性;最終得到的挖掘結果是有意見的規則,有利于用戶的理解。決策樹的主要缺點包括:對數據的時間屬性較為敏感,需要大量的預處理工作;對于非離散的連續性數據值處理效率和準確率不佳;易出現過度擬合的情況,產生大量的決策分支,導致決策規則過于龐大。

C4.5決策樹算法是決策樹算法的主流,它繼承于傳統的ID3算法,繼承了其優勢,改進了其缺點。但C4.5決策樹算法依然存在著較多的問題,其中最為突出的是過度擬合情況,以及決策準確性方面的問題。針對上述問題,本課題提出了一種改進的C4.5決策樹算法,在算法構建過程中,以樹分枝的信息熵為研究對象,將熵值較高的部分和熵值較低的部分進行合并和平衡處理,從而達到減少決策樹分支數量的目的;與此同時,考慮到C4.5算法在決策分支的確定過程中采用的是局部最優的方法,在準確性方面從整體上看有所欠缺,所以引入了了平衡因子控制算法的整體最優化性。

C4.5決策樹算法設研究對象數據集為,該數據集中包括個類別,每一個類別表示為,選取該數據集中的一個屬性數據,則可以被劃分為多個子集,設有個取值,則被劃分的子集可表示為。設為的例子總數,而為的例子數,為的例子總數,是的所有例子中所包括的的例子數,基于上述的設定,則可以得到如下定義:

(1)類別在出現的概率如式(1)所示:

(1)endprint

摘 要:該文對傳統的C4.5決策樹數據挖掘算法進行了改進,提出了一種雙重熵平均決策樹算法。傳統的C4.5決策樹算法易出現無意義分枝,過度擬合等問題,針對該類問題,基于雙重熵平均決策樹算法,通過兩次對樣本子集熵平均值的計算、排序、合并處理,得到修正后的屬性信息增益,并以此作為屬性選擇的依據,從而解決了傳統C4.5決策樹算法可解釋性差、易產生碎片等問題。

關鍵詞:C4.5決策樹 算法 熵 平衡因子

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2014)04(c)-0040-02

數據聯機分析功能是通過對數據的處理發現已知要素與分析度量值之間的關系,而數據挖掘則是從大量的數據中發現隱藏的規律。數據挖掘包括多種挖掘算法,為了研究畢業生不同屬性與其就業狀況之間的潛在知識和規律,該文采用決策樹方法對高校畢業生數據進行分析,主要選用的是C4.5決策樹算法。

1 C4.5算法思想

決策樹的優點在于原理簡單,發現知識較快;計算較為簡單,運算速度較快,對于訓練數據的處理和待決策數據的處理效率相對較高;適用于大量數據的綜合處理,有利于挖掘數據中的重要屬性;最終得到的挖掘結果是有意見的規則,有利于用戶的理解。決策樹的主要缺點包括:對數據的時間屬性較為敏感,需要大量的預處理工作;對于非離散的連續性數據值處理效率和準確率不佳;易出現過度擬合的情況,產生大量的決策分支,導致決策規則過于龐大。

C4.5決策樹算法是決策樹算法的主流,它繼承于傳統的ID3算法,繼承了其優勢,改進了其缺點。但C4.5決策樹算法依然存在著較多的問題,其中最為突出的是過度擬合情況,以及決策準確性方面的問題。針對上述問題,本課題提出了一種改進的C4.5決策樹算法,在算法構建過程中,以樹分枝的信息熵為研究對象,將熵值較高的部分和熵值較低的部分進行合并和平衡處理,從而達到減少決策樹分支數量的目的;與此同時,考慮到C4.5算法在決策分支的確定過程中采用的是局部最優的方法,在準確性方面從整體上看有所欠缺,所以引入了了平衡因子控制算法的整體最優化性。

C4.5決策樹算法設研究對象數據集為,該數據集中包括個類別,每一個類別表示為,選取該數據集中的一個屬性數據,則可以被劃分為多個子集,設有個取值,則被劃分的子集可表示為。設為的例子總數,而為的例子數,為的例子總數,是的所有例子中所包括的的例子數,基于上述的設定,則可以得到如下定義:

(1)類別在出現的概率如式(1)所示:

(1)endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 精品黑人一区二区三区| 亚洲人成日本在线观看| 99re在线观看视频| 日本成人在线不卡视频| 欧美在线三级| 久久综合色天堂av| 欧美精品影院| 欧美狠狠干| 人人爱天天做夜夜爽| 国产成人欧美| 国产sm重味一区二区三区| 精品自窥自偷在线看| 香蕉久久永久视频| 综合色在线| 青青青视频91在线 | 毛片基地美国正在播放亚洲 | 极品国产在线| 午夜在线不卡| 久久国产亚洲偷自| 亚洲日韩精品综合在线一区二区| 手机在线看片不卡中文字幕| h网站在线播放| 秘书高跟黑色丝袜国产91在线| 香蕉综合在线视频91| 国产欧美高清| 色婷婷色丁香| 97视频在线精品国自产拍| 91精品啪在线观看国产| 青青草国产免费国产| 久久综合丝袜日本网| 97综合久久| 99视频免费观看| 色综合久久88| 92午夜福利影院一区二区三区| 亚洲成在人线av品善网好看| 婷婷午夜影院| 伊人色在线视频| 国产欧美日韩一区二区视频在线| 亚洲六月丁香六月婷婷蜜芽| 精品视频在线观看你懂的一区| 伊人色综合久久天天| 国产在线无码av完整版在线观看| 亚洲第一视频免费在线| 91麻豆久久久| www.亚洲一区二区三区| 国产伦片中文免费观看| 2021精品国产自在现线看| 久久99国产乱子伦精品免| 免费人成视网站在线不卡| 欧美在线网| 亚洲小视频网站| 免费看a毛片| 国产精彩视频在线观看| 国产91蝌蚪窝| 日韩人妻无码制服丝袜视频 | 欧美国产日韩在线| 国产福利在线免费观看| av一区二区无码在线| 婷婷久久综合九色综合88| 国产日韩欧美中文| 青草娱乐极品免费视频| 亚洲人成在线精品| 一级成人a做片免费| 特级aaaaaaaaa毛片免费视频| 在线国产91| 国产毛片高清一级国语 | 狼友视频国产精品首页| 日韩在线视频网| 久久亚洲欧美综合| 女人爽到高潮免费视频大全| 亚洲欧洲自拍拍偷午夜色| 欧美五月婷婷| 亚洲欧美国产五月天综合| 波多野结衣中文字幕一区二区| 狠狠色香婷婷久久亚洲精品| 国产无码性爱一区二区三区| a毛片免费看| 久久综合激情网| 亚洲性视频网站| 精品国产免费观看一区| 欧美三级不卡在线观看视频| 国产精彩视频在线观看|