(哈爾濱工業(yè)大學(xué) 管理學(xué)院, 哈爾濱 150001)
摘 要:為了解決客戶細(xì)分中由于客戶價(jià)值不同和不同價(jià)值客戶數(shù)量的懸殊差異造成對(duì)客戶錯(cuò)誤分類的代價(jià)不同和不平衡的數(shù)據(jù)樣本,研究了客戶價(jià)值細(xì)分問題中錯(cuò)誤分類代價(jià)形成機(jī)理,建立基于客戶價(jià)值的動(dòng)態(tài)代價(jià)函數(shù),在此基礎(chǔ)上設(shè)計(jì)了代價(jià)敏感的支持向量機(jī)分類器。實(shí)驗(yàn)結(jié)果說明,該方法可以更精確地控制代價(jià)敏感性,降低總體的錯(cuò)誤分類代價(jià),使模型能更準(zhǔn)確地反映分類的代價(jià),有效地識(shí)別客戶價(jià)值。
關(guān)鍵詞:客戶細(xì)分; 客戶價(jià)值; 代價(jià)敏感學(xué)習(xí); 支持向量機(jī)
中圖分類號(hào):TP30 文獻(xiàn)標(biāo)志碼:A
文章編號(hào):10013695(2009)01019203
Costsensitive method for customer segmentation
ZOU Peng, HAO Yuanyuan
(School of Management, Harbin Institute of Technology, Harbin 150001, China)
Abstract:To reflect the influence caused by the great difference of misclassification costs and unbalanced quantity distribution of customers who have various values, the paper proposed the costsensitive SVM (support vector machine) classifier by presenting misclassification cost function based on customer value, which was evaluated by the function of the exceptional lost. The data test result proves that the method can control the different types of errors distribution with various cost of misclassification accurately, reduce the total misclassification cost, and distinguish the customer value effectively.
Key words:customer segmentation; customer value; costsensitive learning; support vector machine
基于客戶價(jià)值的細(xì)分是根據(jù)客戶為企業(yè)創(chuàng)造價(jià)值的能力對(duì)客戶進(jìn)行分類,提供針對(duì)性的產(chǎn)品、服務(wù)和營銷模式的過程[1],能夠使企業(yè)更合理地分配資源,有效地降低成本,同時(shí)獲得更有利可圖的市場(chǎng)滲透。在數(shù)據(jù)挖掘領(lǐng)域,基于客戶價(jià)值的細(xì)分是根據(jù)客戶為企業(yè)創(chuàng)造的價(jià)值(利潤(rùn))將客戶分類,將客戶價(jià)值(利潤(rùn))作為分類標(biāo)志,是一種有監(jiān)督的學(xué)習(xí)方法。比較廣泛使用的是關(guān)聯(lián)規(guī)則[2,3]、決策樹[4]、CHAID算法[5]、神經(jīng)網(wǎng)絡(luò)[3]、貝葉斯網(wǎng)絡(luò)[6]。它們基本上都是采用一種普適性的數(shù)據(jù)挖掘算法,將總體準(zhǔn)確率作為分類性能的評(píng)價(jià)標(biāo)準(zhǔn),忽略了客戶價(jià)值分類問題中錯(cuò)誤分類代價(jià)和不同價(jià)值客戶在數(shù)量上的懸殊差異,沒能體現(xiàn)由于客戶價(jià)值不同對(duì)分類效果帶來的影響。為此,本文設(shè)計(jì)代價(jià)敏感支持向量機(jī)作為分類工具來解決上述問題。
1 文獻(xiàn)綜述
在某些分類問題中錯(cuò)誤分類的代價(jià)是一致的,錯(cuò)誤率最小就意味著分類器的性能最佳,因此可以使用基于錯(cuò)分率最小的數(shù)據(jù)挖掘算法,但在客戶價(jià)值細(xì)分問題中,錯(cuò)誤分類具有不同代價(jià)。很多研究表明,通常20%的客戶創(chuàng)造的利潤(rùn)占據(jù)企業(yè)利潤(rùn)總額的80%[7],中小銀行甚至有可能是超過90%的利潤(rùn)來自于10%的客戶[8]。這說明高價(jià)值客戶數(shù)量遠(yuǎn)遠(yuǎn)少于低價(jià)值客戶,但為企業(yè)創(chuàng)造的利潤(rùn)遠(yuǎn)遠(yuǎn)高于低價(jià)值客戶。企業(yè)要根據(jù)客戶價(jià)值分類的預(yù)測(cè)結(jié)果對(duì)不同價(jià)值的客戶分配資源,保持和發(fā)展客戶關(guān)系,實(shí)現(xiàn)預(yù)測(cè)的價(jià)值。如果將低價(jià)值客戶預(yù)測(cè)為高價(jià)值客戶,至多付出一些成本;如果將高價(jià)值客戶預(yù)測(cè)為低價(jià)值客戶,使企業(yè)未能充分挖掘高端客戶的潛在價(jià)值,不僅會(huì)造成大量的收入損失,還可能導(dǎo)致高端客戶的流失,而高端客戶的流失對(duì)企業(yè)形象和口碑傳播造成的負(fù)面影響比普通客戶更為嚴(yán)重。所以對(duì)企業(yè)而言,發(fā)生分類錯(cuò)誤的代價(jià)有很大差異。
高價(jià)值客戶占全部客戶比例較低,普適性的數(shù)據(jù)挖掘方法都是基于錯(cuò)誤率的,在一個(gè)非平衡分布數(shù)據(jù)集上建立的模型只會(huì)對(duì)數(shù)量上占優(yōu)勢(shì)的低價(jià)值客戶有較強(qiáng)的識(shí)別能力。如上文所述,數(shù)據(jù)集中高價(jià)值客戶的比例僅有10%~20%,分類器在該數(shù)據(jù)集上訓(xùn)練的模型會(huì)向低價(jià)值客戶偏差,即在正確識(shí)別低價(jià)值客戶的同時(shí)會(huì)將大部分高價(jià)值客戶識(shí)別為低價(jià)值。這樣即使全部高價(jià)值客戶都被識(shí)別為低價(jià)值。模型的準(zhǔn)確率也能達(dá)到80%以上。因此,在高度不平衡的數(shù)據(jù)集合上使用基于錯(cuò)誤率的分類算法建立的客戶價(jià)值細(xì)分模型并不能有效識(shí)別高價(jià)值客戶,僅用準(zhǔn)確率來評(píng)價(jià)客戶價(jià)值細(xì)分模型也不盡合理。
當(dāng)錯(cuò)分代價(jià)不相等時(shí),傳統(tǒng)的基于準(zhǔn)確率的算法不能很好地適應(yīng)客戶細(xì)分問題。代價(jià)敏感學(xué)習(xí)考慮了不同類型錯(cuò)分的代價(jià),并基于最小化總體誤分代價(jià)的原理來設(shè)計(jì)分類器,從而能更好地滿足錯(cuò)分代價(jià)不同的情況。代價(jià)敏感學(xué)習(xí)的研究可以追溯到Granger[9]對(duì)文本內(nèi)容分類的研究;Breiman等人[10]建立了代價(jià)敏感學(xué)習(xí)的研究框架;Elkan[11]發(fā)展了Granger的研究,建立錯(cuò)分代價(jià)矩陣,將待預(yù)測(cè)樣本分到期望代價(jià)最小的類別中;Turney[12]和Kwedlo等人[13]建立了基于分類準(zhǔn)確率和錯(cuò)分代價(jià)的擬合函數(shù)遺傳算法;Zadrozny等人[14]通過對(duì)訓(xùn)練數(shù)據(jù)賦權(quán)建立了基于代價(jià)敏感性的決策樹分類器;Ling等人[15]提出了決策樹代價(jià)最小化的剪枝策略;Pendharkar等人[16]在神經(jīng)網(wǎng)絡(luò)中引入錯(cuò)分代價(jià)閾值,將固定的錯(cuò)分代價(jià)改進(jìn)為動(dòng)態(tài)代價(jià)函數(shù)。代價(jià)敏感學(xué)習(xí)是數(shù)據(jù)挖掘領(lǐng)域的前沿[17]。國內(nèi)目前的研究還較少,如鄭恩輝等人[18]研究了代價(jià)敏感支持向量機(jī);羅菲菲等人[19]研究了基于代價(jià)敏感學(xué)習(xí)的范例推理方法在入侵檢測(cè)中的應(yīng)用。在客戶細(xì)分方面,夏國恩等人[20]用代價(jià)敏感學(xué)習(xí)預(yù)測(cè)電信客戶流失,取得了一些有益的進(jìn)展,但其只是根據(jù)經(jīng)驗(yàn)和文獻(xiàn)主觀設(shè)定錯(cuò)誤分類的代價(jià),不能根據(jù)客戶數(shù)據(jù)的真實(shí)情況設(shè)定代價(jià)函數(shù)或取值,不能精確控制和優(yōu)化分類預(yù)測(cè)的效果。
近年來支持向量機(jī)(SVM)的研究在廣泛開展。它是V.Vipnik 等人根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論(statistical learning theory,SLT)提出的一種新的機(jī)器學(xué)習(xí)方法,在解決小樣本、非線性及高維模式識(shí)別問題中表現(xiàn)出許多特有的優(yōu)勢(shì),有較好的泛化能力;而且當(dāng)訓(xùn)練數(shù)據(jù)中各類樣本數(shù)量差別較大時(shí),可以通過參數(shù)設(shè)置調(diào)整偏置[21]。本文嘗試在代價(jià)敏感學(xué)習(xí)機(jī)制下引入支持向量機(jī),建立以代價(jià)最小化為評(píng)價(jià)標(biāo)準(zhǔn)的客戶價(jià)值分類方法。
2 基于代價(jià)敏感學(xué)習(xí)的SVM
2.1 基本的SVM
對(duì)二元分類問題,假定己知觀測(cè)樣本集(x1,y1),…,(xi,yi),…,(xn,yn),xi∈Rl,yi∈{+1,-1}(i=1,…,n)。式(1)能被超平面(w#8226;x)-b=0分類,學(xué)習(xí)問題為最小化目標(biāo)函數(shù)。
R(w,ξ)=1/2‖w‖2+C(∑ni=1ξi)(1)
s.t. yi(xi#8226;w+b)≥1-ξi;ξi≥0;i=1,…,n
目標(biāo)函數(shù)中各參數(shù)意義和優(yōu)化問題的求解見文獻(xiàn)[22,23],得到最優(yōu)分類函數(shù)為
f(x)=sign{∑αiyik(xi#8226;x)+b}(2)
其中k(xi#8226;x)為核函數(shù)。
2.2 基于客戶價(jià)值的錯(cuò)分代價(jià)函數(shù)
式(1)是基于準(zhǔn)確率的,沒有考慮錯(cuò)分代價(jià),本文將基于客戶價(jià)值的代價(jià)敏感性學(xué)習(xí)引入SVM。考慮每個(gè)樣本都有不同的誤分類代價(jià),樣本集可重構(gòu)為(xi,yi,costi),xi∈Rl,yi∈{+1,-1},costi≥0(i=1,…,n)。其中costi為第i個(gè)樣本xi的誤分類代價(jià),為正常數(shù),它依賴于xi或yi。本研究假設(shè)企業(yè)能夠從客戶獲得所識(shí)別的全部?jī)r(jià)值,建立基于客戶價(jià)值的代價(jià)敏感函數(shù),即
costi=[E(V+1)+C(V-1)]/[E(V-1)+C(V+1)]
(3)
其中:E(V+1)和E(V-1)分別為第一類和第二類客戶價(jià)值的期望值;C(V+1)和C(V-1)分別為企業(yè)在第一類和第二類客戶投入的平均資源,均可根據(jù)企業(yè)對(duì)客戶價(jià)值的定義和財(cái)務(wù)數(shù)據(jù)計(jì)算。式(3)反映了由于錯(cuò)誤分類使企業(yè)付出的機(jī)會(huì)成本(即客戶價(jià)值)和財(cái)務(wù)成本總和的比較,實(shí)現(xiàn)了錯(cuò)分代價(jià)敏感性的精確控制,也體現(xiàn)了客戶價(jià)值差異對(duì)分類結(jié)果的影響。設(shè)樣本集(xi,yi,costi)能被超平面(w#8226;x)-b=0分類,那么問題為最小化目標(biāo)函數(shù)
R(w,ξ)=1/2‖w‖2+C(∑ni=1costiξi)(4)
s.t. yi(xi#8226;w+b)≥1-ξi;ξi≥0;i=1,…,n
與式(1)不同,式(2)的經(jīng)驗(yàn)代價(jià)考慮到不同樣本的誤差具有不同的誤分類代價(jià)。為求解優(yōu)化問題式(2),使用上述方法得到改進(jìn)的對(duì)偶Lagrange形式為
LD=1/2∑ni,j=1α⌒iα⌒jyiyj(xixj)-∑ni=1αi (5)
s.t. ∑ni=1αiyi=0;0≤αi≤costiC;i=1,…,n
此時(shí)得到最優(yōu)分類函數(shù)為
f ′(x)=sign{∑ni,j=1α⌒iyik(xi#8226;x)+b⌒i}(6)
3 數(shù)據(jù)實(shí)驗(yàn)
3.1 數(shù)據(jù)描述
本文以國內(nèi)某銀行信用卡客戶數(shù)據(jù)進(jìn)行實(shí)證研究。采集了2006年1月1日~2006年12月31日的15 260個(gè)客戶的數(shù)據(jù),銀行根據(jù)客戶的收入和成本,計(jì)算出每位客戶在2006年度在信用卡業(yè)務(wù)為銀行創(chuàng)造的利潤(rùn)作為客戶價(jià)值在該年度的實(shí)際體現(xiàn),考慮銀行的業(yè)務(wù)目標(biāo)和客戶價(jià)值的分布,將客戶按照價(jià)值從高到底分為A和B兩類,各類客戶比例分別為9.7%、90.3%。按照2∶1的比例劃分為訓(xùn)練集和測(cè)試集。
根據(jù)數(shù)據(jù)的來源,用于預(yù)測(cè)客戶價(jià)值的數(shù)據(jù)可分為三類指標(biāo):第一類是客戶在申請(qǐng)信用卡時(shí)提供的個(gè)人基本信息;第二類是根據(jù)客戶賬戶和交易記錄衍生出的匯總、比率和評(píng)分指標(biāo);第三類就是企業(yè)內(nèi)部數(shù)據(jù)庫所缺少的、可以從外部補(bǔ)充的指標(biāo)數(shù)據(jù),如客戶忠誠度數(shù)據(jù)[24]。
本文將信息增益分析技術(shù)和基于多維數(shù)據(jù)分析的方法集成在一起,刪除信息量較少的屬性,收集信息量較多的屬性[4,25],最終選擇了18個(gè)指標(biāo)模型的相關(guān)屬性集,包括年齡、學(xué)歷、收入、職業(yè)、持卡時(shí)間、信用額度、信用額度使用率、現(xiàn)金提取次數(shù)、消費(fèi)次數(shù)、拖欠額、信用風(fēng)險(xiǎn)評(píng)分、流失傾向評(píng)分、利息率、優(yōu)惠條款、參加促銷活動(dòng)記錄、錢包份額、口碑推薦、品牌認(rèn)同。
3.2 模型構(gòu)造
樣本集合(xi,yi)。其中:x為客戶樣本,是多維向量(18項(xiàng)指標(biāo));y∈{+1,-1},代表高價(jià)值和低價(jià)值兩類客戶。對(duì)于核函數(shù)和參數(shù)選擇,本研究用MATLAB 6.5實(shí)驗(yàn)比較了多項(xiàng)式核函數(shù)K(xi,xj)=(δxTixj+r)d,sigmoid核函數(shù)K(xi,xj)=tanh(αxTixj+β)和徑向核函數(shù)K(xi,xj)=exp{-λ|xi-xj|2}。當(dāng)λ=0.01時(shí)徑向核函數(shù)取得較好的效果。對(duì)兩個(gè)類別的分類,用式(3)計(jì)算其錯(cuò)分代價(jià)矩陣(表1),關(guān)系為costA,B(A錯(cuò)分為B)=1/costB,A;costB,A(B錯(cuò)分為A)=1/ costA,B。
3.3 結(jié)果分析
實(shí)驗(yàn)產(chǎn)生了如表2所示分類結(jié)果中各種樣本的數(shù)量。
a)將A類客戶分為B類客戶的錯(cuò)誤比率FA,B∪c=b/a+b;
b)將B類客戶分為A類客戶的錯(cuò)誤比率FB,A=c/c+d;
c)整體準(zhǔn)確率T=a+d+/a+b+c+d;
d)期望損失函數(shù)[26]定義為C= b×costA,B+c×costB,A;
e)平均錯(cuò)分代價(jià)為ave(C)=[(b)FA,B×costA,B+(c)FB,A×costB,A]/(a+b+c+d)。
本研究采用了基本SVM、代價(jià)敏感SVM和設(shè)計(jì)樣本比例SVM建模進(jìn)行比較。設(shè)計(jì)樣本比例SVM建模實(shí)驗(yàn)中,當(dāng)k=5時(shí),結(jié)果如表3所示。基本SVM在訓(xùn)練數(shù)據(jù)集直接建模,雖然將97%的高價(jià)值客戶分為中低價(jià)值,但由于高價(jià)值客戶數(shù)量很少,所以總體準(zhǔn)確率仍然較高,這樣不能識(shí)別絕大多數(shù)高價(jià)值客戶,對(duì)客戶價(jià)值細(xì)分和高端客戶管理是沒有意義的。設(shè)計(jì)樣本比例SVM實(shí)驗(yàn)過程中,當(dāng)k=5時(shí)分類效果最好,高價(jià)值客戶正確識(shí)別率明顯提高,但平均代價(jià)下降也不顯著。代價(jià)敏感SVM的實(shí)驗(yàn)不僅將98%的高價(jià)值客戶正確識(shí)別,還能將其他類別客戶的正確識(shí)別率控制在較好的范圍,同時(shí)顯著降低平均代價(jià)。結(jié)果證明,基于代價(jià)敏感學(xué)習(xí)機(jī)制下的SVM比傳統(tǒng)的SVM能在保證分類準(zhǔn)確率的同時(shí),顯著降低模型分類的代價(jià)。對(duì)比實(shí)驗(yàn)結(jié)果如圖1所示。
又用LIFT指標(biāo)比較三種分類器。首先將所有客戶按照其價(jià)值從高到低排序,定義命中率(X%)為價(jià)值最高的前X%名客戶,LIFT(X%)為高價(jià)值客戶的分類正確率。例如,高價(jià)值客戶占全部客戶比例的2%,設(shè)X=5,命中率(5%)=20%, 則LIFT(5%)=20/2%=10。表4和 圖2顯示,當(dāng)LIFT(10%)的三個(gè)實(shí)驗(yàn)結(jié)果十分接近,LIFT(X>10)時(shí),代價(jià)敏感分類器的效果不明顯,因?yàn)樵诒緦?shí)驗(yàn)采用的數(shù)據(jù)集合中高價(jià)值客戶比例低于10%(實(shí)際比例9.7%);當(dāng)LIFT(X<10)時(shí),如X=5,代價(jià)敏感分類器的效果顯著好于另外兩組,因?yàn)榇鷥r(jià)敏感分類器在分類代價(jià)差異明顯的不平衡數(shù)據(jù)上優(yōu)勢(shì)得以體現(xiàn)。
4 結(jié)束語
傳統(tǒng)的基于數(shù)據(jù)挖掘的客戶價(jià)值分類方法是普適性的學(xué)習(xí)方法。本文在支持向量機(jī)的基礎(chǔ)上引入代價(jià)敏感學(xué)習(xí),在一定程度解決了客戶價(jià)值細(xì)分問題中的不平衡數(shù)據(jù)分布和不同錯(cuò)分代價(jià)問題,通過計(jì)算客戶平均價(jià)值設(shè)定錯(cuò)分代價(jià),改善模型對(duì)高價(jià)值客戶的識(shí)別能力,提高了分類性能和實(shí)用價(jià)值。
實(shí)驗(yàn)結(jié)果說明,在基于代價(jià)敏感學(xué)習(xí)機(jī)制下的分類方法通過設(shè)定錯(cuò)分代價(jià),可以控制不同種分類錯(cuò)誤的分布,降低了總體的錯(cuò)誤分類代價(jià),但不一定能降低總體的錯(cuò)分率,所以僅用總體準(zhǔn)確率來評(píng)價(jià)分類模型的性能是不完全合適的,應(yīng)考慮實(shí)際應(yīng)用背景,引入錯(cuò)分代價(jià)或分類期望損失來評(píng)價(jià)模型的性能。理想的客戶價(jià)值細(xì)分模型要盡可能避免未能正確識(shí)別高價(jià)值客戶造成客戶價(jià)值挖掘不充分甚至高端客戶流失,同時(shí)也要考慮到把低價(jià)值客戶誤認(rèn)為高價(jià)值客戶所增加的客戶保持和發(fā)展成本,今后的研究應(yīng)對(duì)后者加以完善,使模型能更準(zhǔn)確地反映分類的代價(jià),精確識(shí)別各類客戶。
參考文獻(xiàn):
[1]RIGBY D, REICHHELD F F. Avoid the four perils of CRM[J]. Harvard Business Review, 2002,36(2): 101109.
[2]LIU D R, SHIH Y Y. Integrating AHP and data mining for product recommendation based on customer lifetime value[J]. Information Management, 2005,42(4):387400.
[3]HSIEH N C. An integrated data mining and behavioral scoring model for analyzing bank customers[J]. Expert Systems with Applications, 2004,57(6): 623633.
[4]鄒鵬, 李一軍, 葉強(qiáng). 客戶利潤(rùn)貢獻(xiàn)度的數(shù)據(jù)挖掘方法[J].管理科學(xué)學(xué)報(bào),2004,7(1):5359.
[5]JONKERA J J, PIERSMAB N, POEL D den van. Joint optimization of customer segmentation and marketing policy to maximize longterm profitability[J]. Expert Systems with Applications, 2004,57(2):159168.
[6]BART B A, GEERT V B, POEL D van den. Bayesian network classifiers for identifying the slope of the customer lifecycle of longlife customers[J]. European Journal of Operational Research, 2004,156(6):508523.
[7]HALES M. Focusing on the 15% of the pie[J]. BankMarketing,1995,27(4):30.
[8]BLOOMQUIST A. Small business, big profits [J]. Bank Marketing, 1998,30(8):18.
[9]GRANGER C W J. Prediction with a generalized cost of error function[J]. Operational Research Quarterly, 1969,20(2):199207.
[10]BREIMAN L, FRIEDMAN J H, OLSHEN R A, et al. Classification and regression trees[M]. Belmont, California:Wadsworth International Group, 1984.
[11]ELKAN C. The foundations of costsensitive learning[C]//Proc of the 17th International Joint Conference on Artificial Intelligence. Hawaii:[s.n.], 2001.
[12]TURNEY P D. Costsensitive classification:empirical evaluation of a hybrid genetic decision tree algorithm[J]. Journal of Artificial Intelligence Research, 1995,17(2):369409.
[13]KWEDLO W, De KRETOWSKI M L, FLACH P. An evolutionary algorithm for costsensitive decision rule learning[C]//Proc of ECML 2001. Heidelberg: Springer, 2001:288299.
[14]ZADROZNY B, LANGFORD J, ABE N. Costsensitive learning by costproportionate example weighting[C]//Proc of the 3rd IEEE International Conference on Data Mining. Sydney:[s.n.], 2003:435.
[15]LING C X, YANG Qiang, WANG Jianning,et al. Decision trees with minimal costs[C]//Proc of the 21st International Conference on Machine Learning. Seattle:[s.n.], 2004.
[16]PENDHARKAR P C. A threshold varying bisection method forcost sensitive learning in neural networks[J]. Expert Systems with Applications, 2007,60(1): 2837.
[17]ELKAN C. The foundations of costsensitive learning[C]//Proc of the 17th International Joint Conference on Artificial Intelligence. Hawaii:[s.n.], 2001.
[18]鄭恩輝,李平,宋執(zhí)環(huán). 代價(jià)敏感支持向量機(jī)[J]. 控制與決策, 2006,9(4):473476.
[19]羅菲菲,劉貴全,安景琦,等. 一種基于代價(jià)敏感學(xué)習(xí)的范例推理方法及其應(yīng)用研究[J]. 計(jì)算機(jī)應(yīng)用, 2005,25(10):24442446.
[20]夏國恩,金煒東.客戶流失預(yù)測(cè)中兩類錯(cuò)誤的平衡控制研究[J].營銷科學(xué)學(xué)報(bào), 2006,2(4):17.
[21]邊肇祺,張學(xué)工.模式識(shí)別[M].北京:清華大學(xué)出版社,2002.
[22]CLARKE D W, MOHTADI C. Generalized predictive control[J]. Automatic, 1987,23(2):137160.
[23]胡耀華,賈欣樂.廣義預(yù)測(cè)控制綜述[J].信息與控制,2000,29(3):248256.
[24]BUCKINX W, VERSTRAETEN G, Van DEN P D. Predicting customer loyalty using the internal transactional database[J]. Expert Systems with Applications, 2007,60(2):7185.
[25]HAN Jiawei, KAMBER M. Data mining concepts and techniques[M]. San Mateo: Morgan Kaufmann Publishers Inc, 2001.
[26]JOOS P, VANHOOF K, OOGHE H. Credit classification: a comparison of logic models and decision[C]//Proc ofEuropean Conference on Machine Learning. Chemnitz:[s.n.], 1999.
[27]蔡越江.論假設(shè)檢驗(yàn)中兩類錯(cuò)誤[J].數(shù)理統(tǒng)計(jì)與管理,1999,18(3):3035.
[28]SEBALD D J, BUCHLEW J A. Support vector machines and the multiple hypothesis test problem[C]//Proc ofIEEE Trans on Signal Processing. 2001:28652872.
[29]JONES T O, SASSER. Determinants of customer loyalty and share of wallet in retail banking[J]. Journal of Financial Services Marketing, 1995,9(3):231248.
[30]ZEITHAML V A, BERRY L L, PARASURAMAN A. The behavioral consequences of service quality: an examination of moderator effects in the fourstage loyalty model[J]. Journal of Marketing, 1996,60(2):3146.
[31]吳建彰. 產(chǎn)品契合度與品牌認(rèn)同度對(duì)品牌延伸策略之探討[D]. 中壢:國立中央大學(xué)博士論文,2001.