999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于決策樹(shù)改進(jìn)算法的客戶關(guān)系管理

2010-05-13 09:17:24嚴(yán)
現(xiàn)代電子技術(shù) 2009年20期

嚴(yán) 熙

摘 要:針對(duì)決策樹(shù)的經(jīng)典算法(ID3)計(jì)算比較復(fù)雜的問(wèn)題,提出利用條件概率等知識(shí)來(lái)改進(jìn)決策樹(shù)的構(gòu)造。分別利用這兩種方法建立客戶關(guān)系管理模型,并根據(jù)結(jié)果發(fā)現(xiàn),改進(jìn)后的方法在計(jì)算效率方面有所提高。

關(guān)鍵詞:CRM;ID3;條件概率;數(shù)據(jù)描述

中圖分類(lèi)號(hào):TP311.5文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1004-373X(2009)20-134-03

Advanced Algorithm Based on Calculation of ID3 in CRM

YAN Xi

(Jiangsu University of Science and Technology,Zhenjiang,212003,China)

Abstract:For the reason of that the calculation of ID3 is complex,an advanced way referring condition probability and other knowledge to improve the structure of the decision tree is proposed.These two methods are used to build two CRM models,the results show that advanced way really improved the efficiency of calculation.

Keywords:CRM;ID3;condition probability;data description

0 引 言

客戶關(guān)系管理(Customer Relationship Management,CRM)起源于西方的市場(chǎng)營(yíng)銷(xiāo)理論。近年來(lái),信息技術(shù)的長(zhǎng)足發(fā)展為市場(chǎng)營(yíng)銷(xiāo)管理理念的普及和應(yīng)用開(kāi)辟了廣闊的空間。以客戶為中心,視客戶為資源,通過(guò)客戶關(guān)懷實(shí)現(xiàn)客戶滿意度。客戶對(duì)企業(yè)的好感和忠誠(chéng)不僅來(lái)自于企業(yè)提供的商品,更來(lái)自于服務(wù)和經(jīng)驗(yàn)等非實(shí)體因素。企業(yè)要了解客戶的喜好,管理每一個(gè)客戶的關(guān)系,從每個(gè)客戶身上獲取最大利潤(rùn),降低市場(chǎng)營(yíng)銷(xiāo)費(fèi)用,并減少由于客戶離去和無(wú)效的營(yíng)銷(xiāo)策略產(chǎn)生的浪費(fèi)。用客戶關(guān)系管理的方法,即CRM方法可以使這些希望成為現(xiàn)實(shí)[1-4]。而數(shù)據(jù)挖掘方法可以從客戶數(shù)據(jù)庫(kù)中挖掘出有價(jià)值的信息,并且這些信息可以處理已有的和潛在的客戶關(guān)系,企業(yè)可以不斷改善適合每個(gè)客戶的個(gè)性化服務(wù)。

數(shù)據(jù)挖掘是一門(mén)廣義的交叉學(xué)科[5],融合了數(shù)據(jù)庫(kù)、數(shù)理統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、人工智能、高性能計(jì)算、可視化等多個(gè)領(lǐng)域的理論和技術(shù),是一個(gè)利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)之間關(guān)系的過(guò)程。使用這種模型和關(guān)系可以進(jìn)行預(yù)測(cè),它幫助決策者尋找數(shù)據(jù)之間潛在的關(guān)聯(lián),發(fā)現(xiàn)被忽略的因素,因而被認(rèn)為是解決當(dāng)前數(shù)據(jù)爆炸時(shí)代所面臨信息貧乏問(wèn)題的一種有效方法。

1 數(shù)據(jù)的描述與分析

客戶關(guān)系管理主要的目標(biāo)是將客戶分成兩類(lèi):只簽訂一張訂單的客戶和簽訂多張訂單的客戶。二值變量(用Y表示)可以用變量Total Number of Orders推導(dǎo)出。設(shè)定當(dāng)Total Number of Orders等于1時(shí),Y=0,表示客戶不忠誠(chéng);當(dāng)Total Number of Orders大于1時(shí),Y=1,表示客戶忠誠(chéng)。根據(jù)經(jīng)驗(yàn),探索性變量的選取如下:

Instalment:表示第一次購(gòu)買(mǎi)是否是分期付款的二值變量,使用分期付款為1,未使用分期付款為0。它表示客戶和企業(yè)保持聯(lián)系的時(shí)間長(zhǎng)短。如果一個(gè)人使用分期付款,與企業(yè)的合同就會(huì)延長(zhǎng)一些時(shí)間;

First Amount Spent:表示客戶第一次購(gòu)物所花費(fèi)的金額是否是可觀的二值變量,如果第一次購(gòu)物的金額大于或等于300 000美元,則令其為1,否則為0;

Number of Products at first Order(Numb):表示客戶第一次購(gòu)物的數(shù)量是否是可觀的二值變量,如果第一次購(gòu)物的數(shù)量大于或等于6件,則令其為1,否則為0;

Age:如果客戶的年齡小于或等于50歲,則Age取值為1,否則為0;

Area of Residence:客戶所在地域位于北部到中部,則Area of Residence取值為0,客戶所在地域位于中部到南部,則Area of Residence取值為1。

2 建立客戶關(guān)系管理模型

管戶關(guān)系是一個(gè)分類(lèi)問(wèn)題,響應(yīng)變量是二值變量,目標(biāo)是將客戶分成不忠誠(chéng)和忠誠(chéng)兩類(lèi)。分別應(yīng)用ID3方法和改進(jìn)的方法建立客戶分類(lèi)模型。

2.1 ID 3算法

設(shè)訓(xùn)練實(shí)例集為X,將其分為n類(lèi),記為C={X1,X2,…,Xn},設(shè)第i類(lèi)訓(xùn)練實(shí)例的個(gè)數(shù)是|Xi|,實(shí)例集X中的訓(xùn)練實(shí)例個(gè)數(shù)為|X|。若記一個(gè)實(shí)例屬于第i類(lèi)的概率為P(Xi),則決策樹(shù)劃分C的不確定程度為H(X,C),可簡(jiǎn)記為H(X),且:

H(X)=-∑P(Xi)log2[P(Xi)](1)

選擇測(cè)試屬性A進(jìn)行測(cè)試。設(shè)A具有性質(zhì)a1,a2,…,al,在A=aj的情況下,屬于第i類(lèi)的實(shí)例個(gè)數(shù)為|Xij|,A=aj的實(shí)例個(gè)數(shù)為|Xj|。記P(Xi|A=aj)為A取aj時(shí)屬于第i類(lèi)的概率,則有P(Xi|A=aj)=|Xij|/|Xj|,設(shè)Yi為A=aj時(shí)的實(shí)例集,此時(shí)決策樹(shù)對(duì)劃分類(lèi)的不確定程度就是實(shí)例集對(duì)屬性A的條件熵為:

H(X|A)=∑jP(A=aj)H(Yj)=

-∑i∑jP(A=aj)P(Xi|A=aj)?

log2[P(Xi|A=aj)](2)

屬性A對(duì)于分類(lèi)提供的信息量,即屬性A的信息增益I(A)為:

I(A)=H(X)-H(X|A)(3)

ID3算法就是以I(A)作為測(cè)試屬性的選取標(biāo)準(zhǔn),分割訓(xùn)練實(shí)例集最終生成的決策樹(shù)。樣本各節(jié)點(diǎn)處的最大信息增益熵見(jiàn)表1,生成的決策樹(shù)見(jiàn)圖1。

表1 ID3算法結(jié)點(diǎn)處的最大信息增益熵

結(jié)點(diǎn)名稱(chēng) 最大信息增益熵結(jié)點(diǎn)名稱(chēng) 最大信息增益熵

結(jié)點(diǎn)1-10.731 0結(jié)點(diǎn)1-50.111 5

結(jié)點(diǎn)1-20.263 1結(jié)點(diǎn)1-60.001 7

結(jié)點(diǎn)1-30.800 1結(jié)點(diǎn)1-70.271 9

結(jié)點(diǎn)1-40.659 7

2.2 改進(jìn)的算法

ID3算法是把信息熵作為選擇測(cè)試屬性的標(biāo)準(zhǔn),即樹(shù)結(jié)點(diǎn)的選擇策略,但在計(jì)算基于屬性的信息熵時(shí),公式比較復(fù)雜,計(jì)算量較大,相應(yīng)的復(fù)雜度也高。在對(duì)于實(shí)例集中的每一個(gè)屬性,所提供的信息量是具有一定規(guī)律的,特別是當(dāng)某個(gè)屬性發(fā)生時(shí),其某例別結(jié)果發(fā)生的條件概率提供給屬性對(duì)某例的信息量,基于這個(gè)原因,可以考慮采用屬性對(duì)某例的條件概率提供的分類(lèi)信息量構(gòu)造決策樹(shù)。

ID3算法是通過(guò)最大信息增益值選擇測(cè)試屬性,改進(jìn)的算法是通過(guò)最大條件概率值選擇測(cè)試屬性。

圖1 ID3生成的決策樹(shù)

根據(jù)概率統(tǒng)計(jì)知識(shí),設(shè)事件為A,B,稱(chēng)P(B|A)為事件A發(fā)生時(shí)事件B會(huì)發(fā)生的概率,并稱(chēng)這個(gè)條件概率P(B|A)為訓(xùn)練實(shí)例集A發(fā)生后,事件B對(duì)訓(xùn)練集中某例別的影響度。

P(B|A)=P(AB)/P(A)(4)

對(duì)于實(shí)例集中的各個(gè)屬性,首先計(jì)算所有屬性值的影響度,然后進(jìn)行比較可知影響度越大的屬性值對(duì)應(yīng)的屬性所提供分類(lèi)的信息量越大。依次比較,就可以確定屬性對(duì)分類(lèi)的影響程度的大小,因此可以根據(jù)此大小來(lái)構(gòu)造決策樹(shù)的生成算法。

具體算法如下:

Advanced Tree

Input:Attributes and Data

Output:A Tree

Start

W=An example

if W belong to a class X then

return N as a leave X

if attribute =NULL then

return N as a leave

for W do

for each attribute of class X do

利用公式(3)計(jì)算出attribute中具有最大條件概率值的屬性max attribute

V= max attribute//具有最大條件概率值的樣本集合

end for

end for

for each ai of max attribute do

grow a branch

end for

if V=Null then

add a leave

else 遞歸執(zhí)行算法Advanced Tree

End

該實(shí)驗(yàn)中所使用的樣本數(shù)據(jù)集按類(lèi)別可分為不忠誠(chéng)和忠誠(chéng)兩類(lèi),分別記為C1和C2。P(1|Instalment)表示第一次購(gòu)買(mǎi)使用分期付款的事件發(fā)生的概率;P(C1,1|Instalment)表示為第一次購(gòu)買(mǎi)使用分期付款,且類(lèi)別為C1的事件發(fā)生的概率;PC11|Instalment為第一次購(gòu)買(mǎi)使用分期付款,且類(lèi)別為C1的條件概率,其余類(lèi)推。根據(jù)式(4)可以得到每個(gè)屬性對(duì)分類(lèi)為C1的影響度,根據(jù)計(jì)算可得樣本各結(jié)點(diǎn)處最大條件的概率見(jiàn)表2。

表2 改進(jìn)算法結(jié)點(diǎn)處劃分的最大條件概率值

結(jié)點(diǎn)名稱(chēng)最大條件概率值

結(jié)點(diǎn)2-10.457 1

結(jié)點(diǎn)2-20.046 0

結(jié)點(diǎn)2-30.142 9

結(jié)點(diǎn)2-40.714 3

生成的樹(shù)如圖2所示。

圖2 改進(jìn)算法生成的決策樹(shù)

3 比較模型與分析

使用ID3算法生成的決策樹(shù)有7個(gè)結(jié)點(diǎn)和8片葉子,使用改進(jìn)后的算法生成的決策樹(shù)有4個(gè)結(jié)點(diǎn)和5片葉子,減少了Area of Residence這一屬性,簡(jiǎn)化了決策過(guò)程,直接把屬性值和類(lèi)別結(jié)果相聯(lián)系,降低了計(jì)算的復(fù)雜性,提高了計(jì)算效率。

4 結(jié) 語(yǔ)

這里分別使用ID3算法和改進(jìn)算法對(duì)客戶關(guān)系管理進(jìn)行研究。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的算法可以提高決策效率。利用這種方法對(duì)客戶關(guān)系進(jìn)行管理,可全面掌握客戶偏好和客戶信息,了解客戶的需求和信用風(fēng)險(xiǎn),可以更有針對(duì)性地開(kāi)發(fā)和選擇金融產(chǎn)品,制定正確的營(yíng)銷(xiāo)服務(wù)策略,將信息流的控制能力和快速反應(yīng)能力轉(zhuǎn)化成競(jìng)爭(zhēng)力,提高客戶滿意度,從而形成企業(yè)的核心競(jìng)爭(zhēng)力。

參考文獻(xiàn)

[1]Alex Berson,Stephen Smith,Kurt Thearling.構(gòu)建面向CRM的數(shù)據(jù)挖掘應(yīng)用[M].賀奇,鄭巖,魏藜,等譯.北京:人民郵電出版社,2001.

[2]戴艷紅,賀紅燕.數(shù)據(jù)挖掘技術(shù)在客戶關(guān)系管理中的應(yīng)用研究[J].商場(chǎng)現(xiàn)代化,2006(34):350-351.

[3]何祖銀,李靜,馬宏偉.面向CRM的數(shù)據(jù)挖掘應(yīng)用[J].物流科技,2006(9):73-75.

[4]張新香.決策樹(shù)挖掘在CRM中的應(yīng)用[J].電腦開(kāi)發(fā)與應(yīng)用,2007(4):52-54.

[5]黃曉芳.數(shù)據(jù)挖掘中決策樹(shù)算法及其應(yīng)用[J].兵工自動(dòng)化,2005(2):35-36.

[6]Wang X Z,Chen B,Qian G L,et al.On the Optimization of Fuzzy Decision Trees[J].Fuzzy Sets and Systems,2000,112:117-125.

[7]張桂杰,王帥.決策樹(shù)分類(lèi)ID3算法研究[J].吉林師范大學(xué)學(xué)報(bào):自然科學(xué)版,2008(3):136-137.

[8]郭玉濱.決策樹(shù)算法研究綜述[J].電腦知識(shí)與技術(shù),2006(2):155-156.

[9]龐哈利,高政威,左軍偉,等.基于變精度粗糙集的分類(lèi)決策樹(shù)構(gòu)造方法[J].系統(tǒng)工程與電子技術(shù),2008(11):2 160-2 163.

[10]白雪,段富.決策樹(shù)分類(lèi)算法的研究及其在教學(xué)評(píng)估中的應(yīng)用[J].電腦開(kāi)發(fā)與應(yīng)用,2007(2):24-26.

主站蜘蛛池模板: 尤物视频一区| 亚洲综合色婷婷| 欧美特黄一级大黄录像| 美女被躁出白浆视频播放| 97狠狠操| 欧美不卡视频在线观看| 一本大道视频精品人妻| 国产成人一区免费观看| 999国产精品永久免费视频精品久久| 亚洲综合久久一本伊一区| 亚洲精品无码不卡在线播放| 国产中文一区二区苍井空| 久久国产精品嫖妓| 亚洲IV视频免费在线光看| 美女视频黄频a免费高清不卡| 亚洲国产在一区二区三区| 国产麻豆aⅴ精品无码| 97久久超碰极品视觉盛宴| 国产成熟女人性满足视频| 青青青国产视频手机| 国产打屁股免费区网站| 亚洲欧美日韩动漫| 一级毛片视频免费| 99国产精品国产高清一区二区| 久久国产精品夜色| 国产aⅴ无码专区亚洲av综合网 | 免费AV在线播放观看18禁强制| 久久精品91麻豆| 久久中文字幕2021精品| a免费毛片在线播放| 欧美成人精品在线| 性色在线视频精品| 欧美成人综合视频| 国产真实乱了在线播放| 日韩精品免费一线在线观看 | 亚洲国产成人自拍| 伊人欧美在线| 丁香婷婷久久| 999精品视频在线| 国产人成乱码视频免费观看| 在线观看热码亚洲av每日更新| 亚洲视频欧美不卡| 特级做a爰片毛片免费69| 手机在线国产精品| 亚洲国产成人在线| 亚洲精品成人片在线观看| 久久国产黑丝袜视频| 日本久久久久久免费网络| 久久96热在精品国产高清| 91免费精品国偷自产在线在线| 午夜啪啪福利| 亚洲精品桃花岛av在线| 国产精品自拍露脸视频| 亚洲精品自拍区在线观看| 露脸国产精品自产在线播| 在线观看国产黄色| 日韩中文欧美| 久久综合色天堂av| 国产精品无码作爱| 日韩在线网址| 男人天堂伊人网| 国产在线无码av完整版在线观看| 婷婷亚洲视频| 国产不卡网| 精品一区二区三区无码视频无码| 视频二区中文无码| 波多野结衣久久高清免费| 91伊人国产| 国产精品视频观看裸模| 亚洲欧美日韩色图| 又大又硬又爽免费视频| 国产精品毛片在线直播完整版| 久久黄色视频影| 日本a∨在线观看| 无码日韩精品91超碰| 国产欧美日韩va| 波多野结衣一区二区三区四区视频 | 欧美精品成人| 日本黄色不卡视频| 91系列在线观看| 996免费视频国产在线播放| 国产午夜不卡|