999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

決策樹算法及其改進

2014-11-10 14:37:32蔡星
科技創新導報 2014年12期
關鍵詞:數據挖掘

蔡星

摘 要:該文對傳統的C4.5決策樹數據挖掘算法進行了改進,提出了一種雙重熵平均決策樹算法。傳統的C4.5決策樹算法易出現無意義分枝,過度擬合等問題,針對該類問題,基于雙重熵平均決策樹算法,通過兩次對樣本子集熵平均值的計算、排序、合并處理,得到修正后的屬性信息增益,并以此作為屬性選擇的依據,從而解決了傳統C4.5決策樹算法可解釋性差、易產生碎片等問題。

關鍵詞:C4.5決策樹 算法 熵 平衡因子

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2014)04(c)-0040-02

數據聯機分析功能是通過對數據的處理發現已知要素與分析度量值之間的關系,而數據挖掘則是從大量的數據中發現隱藏的規律。數據挖掘包括多種挖掘算法,為了研究畢業生不同屬性與其就業狀況之間的潛在知識和規律,該文采用決策樹方法對高校畢業生數據進行分析,主要選用的是C4.5決策樹算法。

1 C4.5算法思想

決策樹的優點在于原理簡單,發現知識較快;計算較為簡單,運算速度較快,對于訓練數據的處理和待決策數據的處理效率相對較高;適用于大量數據的綜合處理,有利于挖掘數據中的重要屬性;最終得到的挖掘結果是有意見的規則,有利于用戶的理解。決策樹的主要缺點包括:對數據的時間屬性較為敏感,需要大量的預處理工作;對于非離散的連續性數據值處理效率和準確率不佳;易出現過度擬合的情況,產生大量的決策分支,導致決策規則過于龐大。

C4.5決策樹算法是決策樹算法的主流,它繼承于傳統的ID3算法,繼承了其優勢,改進了其缺點。但C4.5決策樹算法依然存在著較多的問題,其中最為突出的是過度擬合情況,以及決策準確性方面的問題。針對上述問題,本課題提出了一種改進的C4.5決策樹算法,在算法構建過程中,以樹分枝的信息熵為研究對象,將熵值較高的部分和熵值較低的部分進行合并和平衡處理,從而達到減少決策樹分支數量的目的;與此同時,考慮到C4.5算法在決策分支的確定過程中采用的是局部最優的方法,在準確性方面從整體上看有所欠缺,所以引入了了平衡因子控制算法的整體最優化性。

C4.5決策樹算法設研究對象數據集為,該數據集中包括個類別,每一個類別表示為,選取該數據集中的一個屬性數據,則可以被劃分為多個子集,設有個取值,則被劃分的子集可表示為。設為的例子總數,而為的例子數,為的例子總數,是的所有例子中所包括的的例子數,基于上述的設定,則可以得到如下定義:

(1)類別在出現的概率如式(1)所示:

(1)endprint

摘 要:該文對傳統的C4.5決策樹數據挖掘算法進行了改進,提出了一種雙重熵平均決策樹算法。傳統的C4.5決策樹算法易出現無意義分枝,過度擬合等問題,針對該類問題,基于雙重熵平均決策樹算法,通過兩次對樣本子集熵平均值的計算、排序、合并處理,得到修正后的屬性信息增益,并以此作為屬性選擇的依據,從而解決了傳統C4.5決策樹算法可解釋性差、易產生碎片等問題。

關鍵詞:C4.5決策樹 算法 熵 平衡因子

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2014)04(c)-0040-02

數據聯機分析功能是通過對數據的處理發現已知要素與分析度量值之間的關系,而數據挖掘則是從大量的數據中發現隱藏的規律。數據挖掘包括多種挖掘算法,為了研究畢業生不同屬性與其就業狀況之間的潛在知識和規律,該文采用決策樹方法對高校畢業生數據進行分析,主要選用的是C4.5決策樹算法。

1 C4.5算法思想

決策樹的優點在于原理簡單,發現知識較快;計算較為簡單,運算速度較快,對于訓練數據的處理和待決策數據的處理效率相對較高;適用于大量數據的綜合處理,有利于挖掘數據中的重要屬性;最終得到的挖掘結果是有意見的規則,有利于用戶的理解。決策樹的主要缺點包括:對數據的時間屬性較為敏感,需要大量的預處理工作;對于非離散的連續性數據值處理效率和準確率不佳;易出現過度擬合的情況,產生大量的決策分支,導致決策規則過于龐大。

C4.5決策樹算法是決策樹算法的主流,它繼承于傳統的ID3算法,繼承了其優勢,改進了其缺點。但C4.5決策樹算法依然存在著較多的問題,其中最為突出的是過度擬合情況,以及決策準確性方面的問題。針對上述問題,本課題提出了一種改進的C4.5決策樹算法,在算法構建過程中,以樹分枝的信息熵為研究對象,將熵值較高的部分和熵值較低的部分進行合并和平衡處理,從而達到減少決策樹分支數量的目的;與此同時,考慮到C4.5算法在決策分支的確定過程中采用的是局部最優的方法,在準確性方面從整體上看有所欠缺,所以引入了了平衡因子控制算法的整體最優化性。

C4.5決策樹算法設研究對象數據集為,該數據集中包括個類別,每一個類別表示為,選取該數據集中的一個屬性數據,則可以被劃分為多個子集,設有個取值,則被劃分的子集可表示為。設為的例子總數,而為的例子數,為的例子總數,是的所有例子中所包括的的例子數,基于上述的設定,則可以得到如下定義:

(1)類別在出現的概率如式(1)所示:

(1)endprint

摘 要:該文對傳統的C4.5決策樹數據挖掘算法進行了改進,提出了一種雙重熵平均決策樹算法。傳統的C4.5決策樹算法易出現無意義分枝,過度擬合等問題,針對該類問題,基于雙重熵平均決策樹算法,通過兩次對樣本子集熵平均值的計算、排序、合并處理,得到修正后的屬性信息增益,并以此作為屬性選擇的依據,從而解決了傳統C4.5決策樹算法可解釋性差、易產生碎片等問題。

關鍵詞:C4.5決策樹 算法 熵 平衡因子

中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2014)04(c)-0040-02

數據聯機分析功能是通過對數據的處理發現已知要素與分析度量值之間的關系,而數據挖掘則是從大量的數據中發現隱藏的規律。數據挖掘包括多種挖掘算法,為了研究畢業生不同屬性與其就業狀況之間的潛在知識和規律,該文采用決策樹方法對高校畢業生數據進行分析,主要選用的是C4.5決策樹算法。

1 C4.5算法思想

決策樹的優點在于原理簡單,發現知識較快;計算較為簡單,運算速度較快,對于訓練數據的處理和待決策數據的處理效率相對較高;適用于大量數據的綜合處理,有利于挖掘數據中的重要屬性;最終得到的挖掘結果是有意見的規則,有利于用戶的理解。決策樹的主要缺點包括:對數據的時間屬性較為敏感,需要大量的預處理工作;對于非離散的連續性數據值處理效率和準確率不佳;易出現過度擬合的情況,產生大量的決策分支,導致決策規則過于龐大。

C4.5決策樹算法是決策樹算法的主流,它繼承于傳統的ID3算法,繼承了其優勢,改進了其缺點。但C4.5決策樹算法依然存在著較多的問題,其中最為突出的是過度擬合情況,以及決策準確性方面的問題。針對上述問題,本課題提出了一種改進的C4.5決策樹算法,在算法構建過程中,以樹分枝的信息熵為研究對象,將熵值較高的部分和熵值較低的部分進行合并和平衡處理,從而達到減少決策樹分支數量的目的;與此同時,考慮到C4.5算法在決策分支的確定過程中采用的是局部最優的方法,在準確性方面從整體上看有所欠缺,所以引入了了平衡因子控制算法的整體最優化性。

C4.5決策樹算法設研究對象數據集為,該數據集中包括個類別,每一個類別表示為,選取該數據集中的一個屬性數據,則可以被劃分為多個子集,設有個取值,則被劃分的子集可表示為。設為的例子總數,而為的例子數,為的例子總數,是的所有例子中所包括的的例子數,基于上述的設定,則可以得到如下定義:

(1)類別在出現的概率如式(1)所示:

(1)endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 欧洲成人在线观看| 精品人妻系列无码专区久久| 999精品视频在线| 91精品人妻一区二区| 精品无码一区二区三区在线视频| 久久精品无码一区二区国产区| 91精品国产自产在线老师啪l| 色婷婷丁香| 日本欧美在线观看| 亚洲性一区| 国产丝袜丝视频在线观看| 国产九九精品视频| 一级香蕉视频在线观看| 成年午夜精品久久精品| 国产成人精品一区二区免费看京| 亚洲综合狠狠| 在线欧美一区| 亚洲人成影院午夜网站| 四虎国产精品永久一区| 国产丝袜无码精品| 美臀人妻中出中文字幕在线| 国产尤物视频网址导航| 91香蕉视频下载网站| 日本不卡在线视频| 国产jizz| 成人福利在线视频| 欧洲日本亚洲中文字幕| 色网站在线视频| 操国产美女| 久久免费精品琪琪| 女人一级毛片| 欧美日本在线播放| 国产日韩欧美成人| 又黄又湿又爽的视频| 理论片一区| 女人毛片a级大学毛片免费| 欧美激情视频一区二区三区免费| 91在线播放免费不卡无毒| 蜜芽国产尤物av尤物在线看| 国产高清色视频免费看的网址| 国产人碰人摸人爱免费视频| 色婷婷亚洲综合五月| 欧美、日韩、国产综合一区| 99资源在线| 日韩AV无码一区| 久久精品国产91久久综合麻豆自制| 午夜啪啪网| 国产在线专区| 无码精油按摩潮喷在线播放| 国产在线精品99一区不卡| 亚洲欧美另类视频| 国产精品爆乳99久久| 麻豆精品在线视频| 在线无码九区| 精品国产香蕉在线播出| 午夜国产大片免费观看| 成人精品亚洲| www.狠狠| 亚洲综合久久成人AV| 女人18毛片水真多国产| 久久国产精品77777| 精品人妻一区二区三区蜜桃AⅤ| 国产一级特黄aa级特黄裸毛片| 亚洲 欧美 日韩综合一区| 亚洲一区二区日韩欧美gif| 亚洲开心婷婷中文字幕| 久久综合色播五月男人的天堂| 国产第二十一页| 97成人在线视频| 国产综合精品日本亚洲777| 国产色婷婷| 欧美在线精品一区二区三区| 欧美国产视频| 国产91丝袜在线观看| 欧美精品1区| 欧美特级AAAAAA视频免费观看| 一本大道AV人久久综合| 九色在线观看视频| 亚洲成人动漫在线观看| 国产黄在线观看| 欧美激情视频二区| 国产主播在线观看|