999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ID3算法的商務(wù)網(wǎng)站客戶分類研究

2020-03-20 03:42:37鄭焱
軟件工程 2020年3期

鄭焱

摘? 要:ID3算法作為最經(jīng)典的決策樹分類方法,因其直觀、簡(jiǎn)單、容易實(shí)現(xiàn)等優(yōu)點(diǎn),在電子商務(wù)領(lǐng)域得到了廣泛應(yīng)用。文章首先分析了ID3算法的基本原理與流程,然后以某商務(wù)網(wǎng)站為例,以其客戶交易數(shù)據(jù)為研究對(duì)象,深入探討了該算法在客戶分類中的具體應(yīng)用。通過該算法的使用,可對(duì)商務(wù)網(wǎng)站的客戶進(jìn)行準(zhǔn)確分類,從而為其開展個(gè)性化服務(wù)及精準(zhǔn)營(yíng)銷提供重要的理論依據(jù)。

關(guān)鍵詞:決策樹分類方法;ID3算法;客戶分類

中圖分類號(hào):TP305? ? ?文獻(xiàn)標(biāo)識(shí)碼:A

Abstract:ID3 algorithm is the most classical decision tree classification method.Because it is simple and easy to implement,it has been widely applied in EC.This paper first analyzes the basic principle and process of ID3 algorithm. Then this paper uses a business website as an example and takes its customer transaction data as the research object to discuss the specific application of ID3 algorithm in customer classification.With this algorithm,we can accurately classify the customers of business websites to provide an important theoretical basis for personalized service and precision marketing.

Keywords:the classification method of the decision tree;ID3 algorithm;customer classification

1? ?引言(Introduction)

ID3算法是最典型的決策樹分類算法之一,通過該算法可實(shí)現(xiàn)對(duì)樣本的精確分類,方便進(jìn)一步進(jìn)行精細(xì)化處理。因ID3算法的實(shí)用性,近年來許多專家學(xué)者對(duì)該算法的優(yōu)化及應(yīng)用進(jìn)行了探討與研究,如趙克新等[1]針對(duì)無人機(jī)空戰(zhàn)態(tài)勢(shì)估計(jì)中存在的多參數(shù)、非線性、實(shí)時(shí)性等問題,提出了一種改進(jìn)決策樹思想的態(tài)勢(shì)估計(jì)推理方法,并驗(yàn)證了該方法的效率及準(zhǔn)確性;徐兵等[2]提出了一種基于梯度提升決策樹的車輛換道融合決策模型,并以NGSIM車輛軌跡數(shù)據(jù)集為基礎(chǔ),對(duì)支持向量機(jī)(SVM)、隨機(jī)森林(RF)、GBDT及基于GBDT的融合決策模型進(jìn)行了訓(xùn)練及性能測(cè)試,驗(yàn)證了本文所提出方法的準(zhǔn)確率;柴宏濤[3]針對(duì)作戰(zhàn)體系中信息資源分類過程中存在的問題,提出了一種基于ID3算法的分類映射模型,并應(yīng)用算例進(jìn)行了模擬;陳茜等[4]通過調(diào)查問卷收集了湖北省相關(guān)高校及其他單位的人才需求信息,使用ID3算法構(gòu)建決策樹模型,分析了影響相關(guān)人才留在某二線城市和留在武漢主客觀因素,并據(jù)此提出了武漢市引進(jìn)、留住人才的對(duì)策建議;羅計(jì)根等[5]針對(duì)ID3算法的局限性提出了一種融合GINI指數(shù)的ID3改進(jìn)算法,較好地解決了信增益偏好屬性值多的問題,并應(yīng)用六組UCI數(shù)據(jù)集進(jìn)行效果驗(yàn)證等??梢?,目前該領(lǐng)域的研究仍然比較活躍,方法的改進(jìn)及應(yīng)用領(lǐng)域的拓展依然是研究的重點(diǎn)。

2? ID3算法的基本理論(The basic theory of ID3 algorithm)

2.1? ?相關(guān)定義

信息量(熵):用來反映決策樹一個(gè)結(jié)點(diǎn)的信息容量。設(shè)為樣本集合,,類別屬性。假設(shè)為類別中的樣本個(gè)數(shù),則該集合S所包含的信息量(熵)為[6]:

可見,是對(duì)給定對(duì)象進(jìn)行分類的信息量與利用屬性劃分當(dāng)前樣本集合信息量的差值。在構(gòu)建決策樹的過程中,可利用的值來對(duì)各屬性的重要性進(jìn)行評(píng)估。

2.2? ?ID3算法流程

ID3算法的核心是基于“信息熵”理論,其構(gòu)建決策樹的過程是:首先根據(jù)式(3)計(jì)算出每個(gè)屬性的值,然后將各屬性的值按由大到小排序,取出值最大的屬性作為劃分標(biāo)準(zhǔn),不斷重復(fù)該過程,直至生成一個(gè)決策樹。具體算法流程如圖1所示。

圖1 ID3算法流程

Fig.1 ID3 algorithm flow chart

3 ID3算法在商務(wù)網(wǎng)站客戶分類中的應(yīng)用(Application of ID3 algorithm in customer classification of business website)

隨著電子商務(wù)的高速發(fā)展,其經(jīng)營(yíng)管理的復(fù)雜程度也越來越大,尤其是客戶關(guān)系管理變得越來越復(fù)雜。因此,本文將ID3算法應(yīng)用到商務(wù)網(wǎng)站的客戶管理中,以決策樹方法來構(gòu)造模型,進(jìn)行客戶價(jià)值分析,找到最有價(jià)值的客戶,從而開展有針對(duì)性的促銷活動(dòng),更好地提供個(gè)性化的服務(wù)及精準(zhǔn)營(yíng)銷。

下面以某商務(wù)網(wǎng)站為例,詳細(xì)分析ID3算法在客戶分類中的具體應(yīng)用。

3.1? ?構(gòu)造訓(xùn)練集

根據(jù)某商務(wù)網(wǎng)站的數(shù)據(jù)倉(cāng)庫(kù)的用戶信息和日志,從中提取部分客戶交易信息構(gòu)建數(shù)據(jù)集,如表1所示。

3.2? ?計(jì)算信息增益

應(yīng)用ID3算法生成決策樹算法的過程如下:

(1)在表1的訓(xùn)練集S中,類別屬性集C有兩個(gè)不同取值,即{是,否},因此類別個(gè)數(shù)m=2。假設(shè)類C1對(duì)應(yīng)于“是”,而C2對(duì)應(yīng)于“否”,類C1有7個(gè)樣本,類C2的有三個(gè)樣本。根據(jù)公式(1)可計(jì)算出相應(yīng)樣本分類所需的信息熵:

其后,ID3算法利用的值對(duì)各屬性的重要程度進(jìn)行排序,取出值最大的屬性構(gòu)造決策樹的第一個(gè)結(jié)點(diǎn),并對(duì)該結(jié)點(diǎn)所代表的全部屬性值進(jìn)行測(cè)試,從而得到該結(jié)點(diǎn)的各個(gè)分支,依據(jù)這些分支將原有數(shù)據(jù)集分為若干個(gè)子數(shù)據(jù)集。若某結(jié)點(diǎn)所包含的所有數(shù)據(jù)類別相同,那么該結(jié)點(diǎn)就是就不用再細(xì)分,標(biāo)記為決策樹的葉結(jié)點(diǎn)。

3.3? ?構(gòu)建決策方案

根據(jù)計(jì)算結(jié)果可知,屬性“消費(fèi)金額”所獲得的信息增益最大,因此該屬性將作為測(cè)試屬性產(chǎn)生當(dāng)前分支結(jié)點(diǎn)。因該屬性有三個(gè)不同取值,故產(chǎn)生三個(gè)不同分支,則將當(dāng)前樣本集合劃分成三個(gè)不同子集。劃分結(jié)果如圖2所示。

從圖2可知,“消費(fèi)金額”<50的樣本類別的取值均為“是”,因此在該分支結(jié)果標(biāo)記為“是”,并產(chǎn)生一個(gè)葉結(jié)點(diǎn)。根據(jù)訓(xùn)練樣本集合,依據(jù)以上處理過程,最終所產(chǎn)生的決策樹如圖3所示。

通過ID3算法的分析,可知“消費(fèi)金額”是決策樹分支的最重要因素,其次為“購(gòu)買方式”“商品種類”“是否女性”等。根據(jù)圖3所示的決策樹,得出如下結(jié)論:

(1)易流失客戶為以下三類:

①消費(fèi)金額在50—100,購(gòu)買方式采用普通方式的客戶;

②消費(fèi)金額大于等于100,參加團(tuán)購(gòu),不是女性的客戶;

③消費(fèi)金額大于等于100,采用普通方式購(gòu)買的客戶。

(2)忠實(shí)客戶為以下三類:

①消費(fèi)金額小于50的客戶;

②消費(fèi)金額在50—100,參加促銷的客戶;

③消費(fèi)金額大于等于100,參加團(tuán)購(gòu),是女性的客戶。

根據(jù)分析結(jié)果,可對(duì)易流失的客戶有針對(duì)性地推出優(yōu)惠、促銷等活動(dòng),從而達(dá)到吸引客戶、留住客戶的目的。同時(shí),進(jìn)一步分析客戶流失的原因,找出商務(wù)網(wǎng)站經(jīng)營(yíng)管理過程中存在的問題,并針對(duì)問題制定出切實(shí)可行的解決對(duì)策,從而提高客戶的忠誠(chéng)度;對(duì)于忠實(shí)客戶,可進(jìn)一步分析其特征,挖掘其深層次的需求,做到比客戶更了解客戶,從而提供更好的個(gè)性化服務(wù)。

4? ?結(jié)論(Conclusion)

ID3算法是一種歸納分類算法,采用自頂向下的遞歸方式構(gòu)造決策樹,具有簡(jiǎn)單、便于實(shí)現(xiàn)等優(yōu)點(diǎn)。將該算法應(yīng)用于商務(wù)網(wǎng)站的客戶管理中,可以挖掘出大量的潛在的、隱含的、有價(jià)值的客戶信息,并在此基礎(chǔ)上構(gòu)建預(yù)測(cè)模型,對(duì)客戶進(jìn)行準(zhǔn)確分類,方便進(jìn)一步為客戶提供針對(duì)性更強(qiáng)的個(gè)性化服務(wù),或者精準(zhǔn)營(yíng)銷策略的深入開展。

參考文獻(xiàn)(References)

[1] 趙克新,黃長(zhǎng)強(qiáng),魏政磊,等.改進(jìn)決策樹的無人機(jī)空戰(zhàn)態(tài)勢(shì)估計(jì)[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2019(4):66-73.

[2] 徐兵,劉瀟.采用梯度提升決策樹的車輛換道融合決策模型[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2019(4):1-10.

[3] 柴宏濤,李建華,沈迪.基于ID3算法的信息資源分類管理映射模型研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2013(3):1082-1086.

[4] 陳茜,馬向平.基于決策樹ID3算法的人才留漢吸引政策研究[J].武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2019(4):148-153.

[5] 羅計(jì)根,杜建強(qiáng).融合GINI指數(shù)的ID3改進(jìn)算法[J].南昌大學(xué)學(xué)報(bào)(工科版),2019(3):80-84.

[6] 朱明.數(shù)據(jù)挖掘[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2002.

作者簡(jiǎn)介:

鄭? 焱(1998-),男,本科生.研究領(lǐng)域:計(jì)算機(jī)科學(xué)與技術(shù).

主站蜘蛛池模板: 免费无码在线观看| 亚洲国产日韩一区| 成人av手机在线观看| 国产自在自线午夜精品视频| 久久青青草原亚洲av无码| 免费毛片在线| 国产精品一区在线观看你懂的| 97人人模人人爽人人喊小说| 看国产毛片| 亚洲中文字幕在线一区播放| 亚洲天堂视频在线观看| 国产色伊人| 五月天综合婷婷| 欧美成人A视频| 欧美一区二区啪啪| 国产精品不卡永久免费| 国产97视频在线观看| 永久免费av网站可以直接看的| 在线免费亚洲无码视频| 亚洲人成网站在线观看播放不卡| 天天操天天噜| 婷婷色一区二区三区| 亚洲视频一区| 日韩欧美国产综合| 看国产一级毛片| 欧美精品亚洲精品日韩专区| 国产在线观看成人91| 美女无遮挡免费视频网站| 亚洲精品爱草草视频在线| 一本大道无码高清| 一级毛片免费观看不卡视频| 国产精品视频免费网站| 国产一区三区二区中文在线| 婷婷亚洲最大| 欧美日韩国产综合视频在线观看| 一本视频精品中文字幕| 国内精品久久久久久久久久影视| 无码粉嫩虎白一线天在线观看| 欧美黄网在线| 特级毛片免费视频| 国产主播一区二区三区| 国模私拍一区二区| 福利姬国产精品一区在线| 国产精品福利社| 成年av福利永久免费观看| 久久精品无码中文字幕| 国产xxxxx免费视频| 欧美午夜久久| 日本欧美在线观看| 熟妇丰满人妻| 久久久久久国产精品mv| 日韩欧美国产另类| 波多野结衣一区二区三区四区| 久久精品人人做人人综合试看| 91人妻在线视频| 精品免费在线视频| 中国国产一级毛片| 久青草国产高清在线视频| 亚洲福利一区二区三区| 久久久久免费精品国产| 美女亚洲一区| 久久6免费视频| 99久久国产精品无码| 香蕉视频在线精品| 又爽又大又黄a级毛片在线视频| 青青草欧美| 日韩区欧美区| 人人91人人澡人人妻人人爽| 成人亚洲视频| 国产白浆在线| 国产第一页免费浮力影院| 57pao国产成视频免费播放| 精品無碼一區在線觀看 | 亚洲成人在线网| 亚洲成av人无码综合在线观看| 欧美国产日韩在线观看| 99精品伊人久久久大香线蕉| 婷婷色在线视频| 青青久久91| 日本黄色不卡视频| 亚洲一级毛片在线播放| 99久久免费精品特色大片|