摘 要:針對(duì)目前客戶流失預(yù)測(cè)方法的不足,在利用訓(xùn)練樣本中不同類個(gè)數(shù)比值來確定各類懲罰參數(shù)的基礎(chǔ)上,改進(jìn)標(biāo)準(zhǔn)的C-支持向量分類機(jī)(SVC)。通過以美國(guó)某電信公司客戶流失預(yù)測(cè)為實(shí)例,與標(biāo)準(zhǔn)C-SVC、人工神經(jīng)網(wǎng)絡(luò)、決策樹、貝葉斯分類器等方法進(jìn)行了對(duì)比,發(fā)現(xiàn)該方法能獲得較好的正確率、命中率、覆蓋率和提升系數(shù),是研究客戶流失預(yù)測(cè)問題的有效方法。
關(guān)鍵詞:客戶流失;支持向量分類機(jī);電信業(yè);懲罰參數(shù)
中圖分類號(hào):F27文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1001-3695(2009)06-2044-03
doi:10.3969/j.issn.1001-3695.2009.06.013
Application of improved support vector classifier in customer churn prediction
XIA Guo-ena,SHAO Pei-jib
(a.Postdoctoral Station,b.School of Management,University of Electronic Science Technology of China, Chengdu 610054, China)Abstract:Aiming at the shortcomings of the methods for customer churn prediction,developed the improved C-support vector classifier(SVC) by using the ratio of different classes in training set to evaluate the penalty parameters of the classes. It pointed out that the method could acquire the better accurate rate,hit rate,covering rate and lift coefficient, compared with normal C-SVC, aritifical neural network, decision tree, logistic regression, naive Bayesian classifier etc by predicting custo-mer churn for some US telecommunication carrier.The results indicate that the method can be an effective measurement for customer churn prediction.
Key words:customer churn; support vector classifier(SVC); telecommunication industry; penalty parameter
客戶流失是許多行業(yè)關(guān)注的一個(gè)重要問題,特別是在激烈競(jìng)爭(zhēng)和越發(fā)自由的國(guó)內(nèi)外電信市場(chǎng),更是受到學(xué)術(shù)界和實(shí)業(yè)界的廣泛關(guān)注[1]。據(jù)估計(jì),電信業(yè)平均每月客戶流失率約為2.2%[2]。客戶流失不僅會(huì)因?yàn)闇p少銷售而產(chǎn)生機(jī)會(huì)成本,而且還會(huì)導(dǎo)致所吸引的新客戶減少[2]。而贏得一個(gè)新客戶所花費(fèi)的成本約為$300~600[3],這大約是保留一個(gè)老客戶所花費(fèi)成本的5、6倍[4]。為了有效地預(yù)測(cè)未來潛在的流失客戶,主要提出了以下兩類方法:a)傳統(tǒng)分類方法,如決策樹[5]、Logistic回歸[6,7]、貝葉斯分類[8]、聚類[9]。該類方法的主要特點(diǎn)是可以對(duì)定類數(shù)據(jù)和連續(xù)性的客戶數(shù)據(jù)進(jìn)行處理,并且對(duì)于所構(gòu)建的模型有較強(qiáng)的可解釋性。但是,該類方法處理大規(guī)模、高維度、含有非線性關(guān)系、非正態(tài)分布、有時(shí)間順序的客戶數(shù)據(jù)時(shí),其效果不理想,且不能保證所建模型的泛化能力。b)人工智能分類方法,如人工神經(jīng)網(wǎng)絡(luò)(ANN)[10]。自組織映射(SOM)[11]和進(jìn)化學(xué)習(xí)(EL)算法[12]。該類方法在一定程度上能克服第一類方法面臨的困難,不僅具有非線性映射能力和泛化能力,而且具有較強(qiáng)的魯棒性和較高的預(yù)測(cè)精度[10],但是此類方法主要依靠的是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則[13],容易導(dǎo)致泛化能力的下降且模型結(jié)構(gòu)難以確定。這些不足極大地限制了上述方法在實(shí)際中的應(yīng)用。支持向量分類機(jī)(SVC)[14]則很好地解決了上述問題,并在實(shí)際應(yīng)用中取得了很好的性能。但在標(biāo)準(zhǔn)的C-SVC中,由于對(duì)不同類別樣本錯(cuò)誤劃分采用了相同的懲罰參數(shù)C,使得分類面偏向樣本密度較小的一邊,在處理具有樣本類別數(shù)目不對(duì)稱特點(diǎn)的客戶流失預(yù)測(cè)問題時(shí),難以達(dá)到滿意的效果。
筆者針對(duì)電信業(yè)客戶流失數(shù)據(jù)的隨機(jī)性、較強(qiáng)的非線性、高維度、樣本類別數(shù)目嚴(yán)重不對(duì)稱等特點(diǎn),提出了一種改進(jìn)的C-SVC方法。根據(jù)對(duì)標(biāo)準(zhǔn)C-SVC的性能分析,樣本數(shù)少的類的邊界支持向量的上界比樣本數(shù)多的類的邊界支持向量上界大,即樣本數(shù)少的類中的樣本被錯(cuò)分的比例比樣本數(shù)多的類中的樣本被錯(cuò)分的比例大。因此,通過計(jì)算訓(xùn)練樣本中流失客戶數(shù)與非流失客戶數(shù)的比值來對(duì)C-SVC懲罰參數(shù)C賦予不同的值,建立了用于電信業(yè)客戶流失的預(yù)測(cè)模型,并給出了其詳細(xì)的優(yōu)化問題描述及訓(xùn)練算法。在選擇適當(dāng)?shù)哪P蛥?shù)和核函數(shù)的基礎(chǔ)上,通過對(duì)美國(guó)某電信公司未來潛在的客戶進(jìn)行預(yù)測(cè),并與標(biāo)準(zhǔn)C-SVC、ANN、決策樹、Logistic回歸、貝葉斯分類器等方法進(jìn)行了對(duì)比,發(fā)現(xiàn)在客戶流失率的第一個(gè)10分位上,改進(jìn)C-SVC方法綜合性能最好。
1 改進(jìn)C-支持向量分類機(jī)
1.1 改進(jìn)支持向量分類機(jī)原理及算法
根據(jù)文獻(xiàn)[15],C-SVC在各類別中樣本數(shù)大小不同時(shí),樣本數(shù)多的類別得到的訓(xùn)練誤差和預(yù)測(cè)誤差較小,而樣本數(shù)少的類別訓(xùn)練誤差和預(yù)測(cè)誤差較大。其主要原因在于對(duì)不同類別樣本錯(cuò)誤劃分采用了相同的懲罰參數(shù)C,使得分類面偏向樣本密度較小的一邊。這種偏差行為在實(shí)際中應(yīng)盡可能消除。例如,電信業(yè)客戶流失預(yù)測(cè)中,由于流失客戶的樣本數(shù)要比非流失客戶的樣本數(shù)少得多,客戶流失預(yù)測(cè)的誤差較大,從而導(dǎo)致預(yù)測(cè)錯(cuò)誤。為此,設(shè)計(jì)一種改進(jìn)的C-SVC來平衡樣本類別。
設(shè)樣本集為(xi,yi),i=1,2,…,n,xi∈Rn,yi∈{-1,1}是類別標(biāo)號(hào)。為了對(duì)不同的樣本類別采用不同的懲罰參數(shù)C,令C+是對(duì)正類點(diǎn)集的懲罰系數(shù),C-是對(duì)負(fù)類點(diǎn)集的懲罰系數(shù)。此時(shí)C-SVC的原始問題形式變?yōu)楠?/p>
min (w)=1/2‖w‖2+yi=1C+ξi+yi=-1C-ξi(1)
s.t. yi[(w×xi)+b]≥1-ξi;ξi≥0;i=1,2,…,n(2)
引入Lagrange系數(shù)ai≥0,βi≥0,構(gòu)造Lagrange函數(shù):
L=1/2‖w‖2+yi=1C+ξi+yi=-1C-ξi-ni=1[ai(yi(w×xi+b)-1+ξi)+βiξi](3)
計(jì)算偏微分,并令偏微分等于零,得
L/w=w-ni=1aiyixi=0(4)
L/b=-ni=1aiyi=0(5)
L/ξi=C+-ai-βi=0,yi=1
C--ai-βi=0,yi=-1(6)
將式(4)~(6)代入式(3)得到對(duì)偶表達(dá)式:
min Q(a)=1/2i, j=1aiajyiyj(xi×xj)-i=1ai(7)
s.t.ni=1yiai=0;0≤ai≤C+,yi=1;0≤ai≤C-,yi=-1(8)
一般情況,該優(yōu)化問題解的特點(diǎn)是大部分ai將為零,不為零的ai所對(duì)應(yīng)的樣本為支持向量。根據(jù)KKT條件,在鞍點(diǎn)有
ai[yi(w×xi+b)-1+ξi]=0;i=1,…,n
(C+-ai)ξi=0,yi=1;(C--ai)ξi=0,yi=-1
于是可得b的計(jì)算式:yi(lj=1ajyj(xj×xi)+b)-1=0。可以通過任意一個(gè)支持向量求出的值,得到最優(yōu)分類函數(shù)為f(x)=sign{ni=1aiyi(xi×x)+b}。
對(duì)于非線性問題,Vapnik引入了核空間理論:將低維的輸入空間數(shù)據(jù)通過非線性映射函數(shù)映射到高維屬性空間,將分類問題轉(zhuǎn)換到屬性空間進(jìn)行。可以證明,如果選用適當(dāng)?shù)挠成浜瘮?shù),輸入空間線性不可分問題在屬性空間將轉(zhuǎn)換為線性可分問題。這種非線性映射函數(shù)被稱之為核函數(shù)[13]。從理論上講,滿足Mercer條件的對(duì)稱函數(shù)K(x,x′)都可以作為核函數(shù)。引入核函數(shù)后,最優(yōu)分類函數(shù)為f(x)=sign{ni=1aiyiK(xi×x)+b}。
1.2 懲罰系數(shù)C+和C-的確定
在改進(jìn)C-SVC中,需對(duì)懲罰參數(shù)C+、C-進(jìn)行估計(jì)。由文獻(xiàn)[16]可知,支持向量(SV)是具有性質(zhì)ai>0的數(shù)據(jù)向量;標(biāo)準(zhǔn)支持向量(NSV)是具有性質(zhì)0<ai<C+,yi=1或者0<ai<C-,yi=-1的支持向量;邊界支持向量(BSV)是具有性質(zhì)ai=C+,yi=1和ξi>0或者ai=C-,yi=-1和ξi>0的支持向量。邊界支持向量的比例反映了分類正確率。
假設(shè)N+BSV和N-BSV分別代表正類和負(fù)類中邊界支持向量個(gè)數(shù),N+SV和N-SV分別代表正類和負(fù)類中所有支持向量個(gè)數(shù),n+和n-分別是正類和負(fù)類訓(xùn)練樣本的個(gè)數(shù)。根據(jù)式(5)有ni=1ai=yi=1ai+yi=-1ai,yi=1ai=yi=-1ai
又由式(8)可知,ai在yi=1時(shí),最大值為C+,在yi=-1時(shí),最大值為C-,所以有
N+BSV×C+≤yi=1ai≤N+SV×C+(9)
類似可得到
N-BSV×C-≤yi=-1ai≤N+SV
×C-(10)
用C+×n+和C-×n-分別除以式(9)(10),得
N+BSV/n+≤yi=1ai/(C+×n+)
≤N+SV/n+(11)
N-BSV/n-≤yi=1ai/(C-×n-
)≤N-SV/n-(12)
由式(11)(12)可知,如果n+≠n-,則正類和負(fù)類中邊界支持向量比例的上界和支持向量比例的下界不相等,樣本數(shù)少的類的邊界支持向量比例的上界比樣本數(shù)多的大。這意味著樣本數(shù)少的類中的樣本被錯(cuò)分的比例比樣本數(shù)多的大。為消除這種偏差,令yi=1ai/(C+×n+)=yi=-1ai/(C-×n-),于是可得C+/C-=n-/n+。
2 基于改進(jìn)支持向量機(jī)的客戶流失預(yù)測(cè)實(shí)證研究
2.1 指標(biāo)體系的建立
目前,在電信業(yè)客戶流失中采用的指標(biāo)可分為客戶基本特征、客戶通話行為、客戶接觸信息、客戶簽約信息、產(chǎn)品特征等。根據(jù)Yu Wei等人[17]的Delta客戶流失管理戰(zhàn)略模型,并綜合考慮客戶流失的各影響因素和數(shù)據(jù)的可獲得性,選取產(chǎn)品特征、客戶方案和客戶信息三類指標(biāo)共52個(gè),如表1所示。
產(chǎn)品特征手機(jī)價(jià)格、目前手機(jī)使用的時(shí)間、網(wǎng)絡(luò)掉線語音通話次數(shù)、網(wǎng)絡(luò)阻塞語音通話次數(shù)、網(wǎng)絡(luò)掉線、阻塞語音呼叫總次數(shù)
客戶方案無應(yīng)答語音通話次數(shù)、語音通話主叫次數(shù)、接聽語音通話次數(shù)、成功的語音通話次數(shù)、客戶關(guān)懷通話次數(shù)、客戶關(guān)懷通話使用的取整時(shí)間長(zhǎng)度、客戶關(guān)懷通話使用的非取整時(shí)間長(zhǎng)度、少于一分鐘的被叫通話次數(shù)、成功的語音通話使用的非取整時(shí)間長(zhǎng)度、接聽語音通話使用的非取整時(shí)間長(zhǎng)度、國(guó)際無線語音通話次數(shù)、國(guó)際無線語音通話使用的非取整時(shí)間長(zhǎng)度、國(guó)內(nèi)無線語音通話次數(shù)、國(guó)內(nèi)無線語音通話使用的非取整時(shí)間長(zhǎng)度、峰值語音通話次數(shù)、峰值語音通話使用的非取整時(shí)間長(zhǎng)度、非峰值語音通話次數(shù)、非峰值語音通話使用的非取整時(shí)間長(zhǎng)度、通話主叫次數(shù)、成功的通話次數(shù)、通話等待次數(shù)、總的服務(wù)月份數(shù)、客戶生命周期內(nèi)總的通話次數(shù)、客戶生命周期內(nèi)總的通話時(shí)間長(zhǎng)度、客戶生命周期內(nèi)調(diào)整的總的通話時(shí)間長(zhǎng)度、客戶生命周期內(nèi)調(diào)整的總的通話次數(shù)、客戶生命周期內(nèi)月均通話時(shí)間長(zhǎng)度、客戶生命周期內(nèi)月均通話次數(shù)、過去3個(gè)月月均通話時(shí)間長(zhǎng)度、過去3個(gè)月月均通話次數(shù)、月均通話費(fèi)用、月均通話時(shí)間長(zhǎng)度、月均連續(xù)消費(fèi)費(fèi)用、查號(hào)呼叫次數(shù)、月均超時(shí)使用時(shí)間長(zhǎng)度、過去3個(gè)月內(nèi)月均通話時(shí)間長(zhǎng)度改變的百分?jǐn)?shù)、過去6個(gè)月月均通話時(shí)間長(zhǎng)度、過去6個(gè)月月均通話次數(shù)
客戶信息第一家庭成員的年齡、總的通話收益、客戶生命周期內(nèi)調(diào)整的總的通話收益、客戶生命周期內(nèi)月均通話收益、過去3個(gè)月月均通話收益、月均超額收益、月均語音通話超額收益、過去3個(gè)月內(nèi)月均收益改變的百分?jǐn)?shù)、過去6個(gè)月月均通話收益
2.2 樣本數(shù)據(jù)處理
本文數(shù)據(jù)來源于美國(guó)DUKE大學(xué)TERADATA客戶關(guān)系管理中心。該數(shù)據(jù)包括6個(gè)月的客戶數(shù)據(jù),因此本研究將前4個(gè)月的客戶數(shù)據(jù)作為輸入指標(biāo),第6個(gè)月的客戶狀態(tài)為輸出指標(biāo),中間預(yù)留1個(gè)月作為時(shí)間延遲。首先對(duì)有30%以上缺失值的指標(biāo)進(jìn)行刪除,然后通過指標(biāo)均值對(duì)缺失項(xiàng)進(jìn)行處理,最后進(jìn)行穩(wěn)健性處理,選用兩倍、三倍標(biāo)準(zhǔn)差檢驗(yàn)進(jìn)行異常數(shù)據(jù)剔除。通過過抽樣,最終獲得3 367個(gè)訓(xùn)練客戶樣本數(shù)據(jù)(其中2 800個(gè)為非流失客戶,567個(gè)為流失客戶)、2 850個(gè)與訓(xùn)練客戶樣本相同時(shí)間下的測(cè)試客戶樣本數(shù)據(jù)(其中2 500個(gè)為非流失客戶,350個(gè)為流失客戶)和2 250個(gè)(其中2 000個(gè)為非流失客戶,250個(gè)為流失客戶)比上述測(cè)試客戶樣本數(shù)據(jù)晚2、3個(gè)月的未來時(shí)間下的未來客戶樣本數(shù)據(jù)。通過利用SPSS11.5對(duì)訓(xùn)練客戶樣本的數(shù)據(jù)進(jìn)行因子分析,并用方差最大正交旋轉(zhuǎn)法(VARIMAX),在特征值大于1的情況下,當(dāng)前樣本數(shù)據(jù)條件下的解釋因子數(shù)為10,其累計(jì)方差貢獻(xiàn)為86.79%,從而指標(biāo)被分成標(biāo)準(zhǔn)使用因子、生命周期使用因子、付費(fèi)意愿因子、額外開銷因子、使用時(shí)間長(zhǎng)度因子、客戶關(guān)懷因子、無線語音使用因子、產(chǎn)品價(jià)值因子、使用變化因子、產(chǎn)品質(zhì)量因子(表2)。
表2 因子分析結(jié)果
2.3 支持向量機(jī)模型的構(gòu)造
根據(jù)上述分析,構(gòu)造樣本集(x,y)。其中x的維數(shù)為10;y是樣本的類別屬性,對(duì)于流失客戶,y=1,對(duì)于非流失客戶,y=-1。對(duì)于核函數(shù)和參數(shù)的選擇,通過在MATLAB6.5上進(jìn)行實(shí)驗(yàn)分析并與線性核函數(shù)、多項(xiàng)式核函數(shù)進(jìn)行對(duì)比發(fā)現(xiàn),采用參數(shù)σ=1.80,C+=3×(2 800/567),C-=3的徑向基核函數(shù)K(xi,x)=exp{-|x-xi|2/(2σ2)}來構(gòu)造改進(jìn)C-SVC模型,在客戶流失率第一個(gè)10分位上能取得較好的效果(客戶流失率利用SVR計(jì)算)。另外SVR(support vector regression)模型也采用徑向基核函數(shù),其參數(shù)為σ=0.24,C=12,ε=0.02,評(píng)價(jià)標(biāo)準(zhǔn)為均方差(表3)。
2.4 實(shí)證結(jié)果分析
模型評(píng)價(jià)標(biāo)準(zhǔn)由表4可得:模型準(zhǔn)確率=(A+D)/(A+B+C+D);命中率=A/(A+C);覆蓋率=A/(A+B);提升系數(shù)=命中率/測(cè)試數(shù)據(jù)中的客戶流失率。表5對(duì)改進(jìn)C-SVC和其他方法的測(cè)試集客戶流失率在第一個(gè)10分位上預(yù)測(cè)結(jié)果進(jìn)行了對(duì)比。標(biāo)準(zhǔn)SVM采用σ=0.92,C=1.5的徑向基核函數(shù);ANN采用BP算法,目標(biāo)誤差為0.01,隱含層個(gè)數(shù)為7;決策樹C4.5采用信息增益方法來確定屬性。從表5中可以看出,在預(yù)測(cè)當(dāng)前時(shí)間下的潛在流失客戶時(shí),通過改進(jìn)的SVM得到的命中率、覆蓋率、模型準(zhǔn)確率和提升系數(shù)分別為0.261、0.628、0.583、3.121,除模型整體準(zhǔn)確率略低于ANN、Logistic回歸和貝葉斯分類器外,其余模型評(píng)價(jià)指標(biāo)高于其他方法所獲得的預(yù)測(cè)結(jié)果。較高的提升系數(shù)、命中率和覆蓋率說明利用該方法能在不同的客戶流失率電信市場(chǎng)環(huán)境下,以較小的成本來挽留較多的潛在流失客戶。其主要原因是,采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的改進(jìn)C-SVC不僅考慮了經(jīng)驗(yàn)風(fēng)險(xiǎn)最小和置信風(fēng)險(xiǎn)最小,而且利用樣本類別個(gè)數(shù)的比例,對(duì)不同類別的錯(cuò)誤劃分采用了不同的懲罰參數(shù),有效地消除了客戶流失樣本數(shù)據(jù)中的類別不平衡,因此在選擇適當(dāng)?shù)暮撕瘮?shù)和參數(shù)的情況下,改進(jìn)C-SVC模型在電信業(yè)客戶流失預(yù)測(cè)中能取得較好的效果。在預(yù)測(cè)未來時(shí)間的潛在流失客戶時(shí),所有方法所獲得的命中率、覆蓋率、整體準(zhǔn)確率和提升系數(shù)多低于在當(dāng)前時(shí)間下的預(yù)測(cè)結(jié)果。說明隨著時(shí)間跨度增加,利用上述方法所建立的預(yù)測(cè)模型需重新訓(xùn)練,才可能得到滿意的結(jié)果。
3 結(jié)束語
從本文的實(shí)驗(yàn)結(jié)果可以得到以下結(jié)論:a)機(jī)器學(xué)習(xí)算法的選擇不應(yīng)該人為地增加不平衡樣本集訓(xùn)練時(shí)的不平衡度;b)采用適當(dāng)?shù)暮撕瘮?shù)和參數(shù)可以提高客戶流失小樣本的SVM預(yù)測(cè)精度;c)本文提出的針對(duì)不同流失客戶類別給予不同權(quán)重的處理方法,可以提高客戶流失小樣本的精度而不影響總體的預(yù)測(cè)精度;d)隨時(shí)間跨度的增加,預(yù)測(cè)模型應(yīng)該重新訓(xùn)練。目前的預(yù)測(cè)算法只是基于樣本類別進(jìn)行加權(quán),即對(duì)不同的樣本類別采用不同的懲罰系數(shù),沒有考慮對(duì)單個(gè)樣本進(jìn)行加權(quán)。在后續(xù)工作中,可對(duì)單個(gè)樣本引入距離、客戶價(jià)值等權(quán)重,另外對(duì)于懲罰系數(shù)比例、核函數(shù)和參數(shù)的選取也需進(jìn)一步研究。類似的工作也可以啟發(fā)客戶流失以外的其他客戶信息數(shù)據(jù)的分類預(yù)測(cè),這樣,不平衡處理就會(huì)更有意義。
致謝:感謝美國(guó)DUKE大學(xué)TERADATA客戶關(guān)系管理中心Lakeisha Fusi先生所提供的數(shù)據(jù)支持。
參考文獻(xiàn):
[1]KEAVENEY S M.Customer switching behavior in service industries:an exploratory study[J].Journal of Marketing,1995,59(2):71-82.
[2]MOZER M C,WOLNIEWICZ R,GRIMES D B,et.al.Predicting subscriber dissatisfaction and improving retention in the wireless telecommunications industry[J].IEEE Trans on Neural Networks,2000,11(3):690-696.
[3]ATHANASSOPOULOS A D.Customer satisfaction cues to support market segmentation and explain switching behavior[J].Journal of Business Research,2000,47(3):191-207.
[4]BHATTACHARYA C B.When customers are members: customer retention in paid membership contexts[J].Journal of the Academy of Marketing Science,1998,26(1):31-44.
[5]CHIH P W,CHIU I T.Turning telecommunications call details to churn prediction: a data mining approach[J].Expert Systems with Applications,2002,23(2):103-112.
[6]KIM H S,YOON C H.Determinants of subscriber churn and customer loyalty in the Korean mobile telephony market[J].Telecommunications Policy,2004,28(9):751-765.
[7]ROSSET S,NEUMANN E.Integrating customer value considerations into predictive modeling[C]//Proc of the 3rd IEEE International Conference on Data Mining.Washington DC:IEEE Computer Society,2003:1-8.
[8]NATH S V.Data warehousing and mining: customer churn analysis in the wireless industry[D].[S.l.]:Florida Atlantic University,2003.
[9]YANG Yi-ming,WANG Hui,LI Lei,et al.Multi-dimensional model-based clustering for user-behavior mining in telecommunications industry[C]//Proc of the 3rd International Conference on Machine Learning and Cybernetics.[S.l.]:IEEE Press,2004:26-29.
[10]YAN L,MILLER D J,MOZER M C,et al.Improving prediction of customer behavior in nonstationary environments[C]//Proc of International Joint Conference on Neural Networks.2001:2258-2263.
[11]ULTCH A.Emergent self-organizing feature maps used for prediction and prevention of churn in mobile phone markets[J].Journal of Targeting,2002,4(10): 401-425.
[12]AU W, CHEN K C C,YAO X.A novel evolutionary data mining algorithm with applications to churn prediction[J].IEEE Trans on Evolutionary Computation,2003,7(6):532-545.
[13]VAPNIK V N.統(tǒng)計(jì)學(xué)習(xí)理論[M].許建華,張學(xué)工,譯.北京:電子工業(yè)出版社,2004.
[14]CORTES C,VAPNIK V.Support vector networks[J].Machine Learning,1995,20(3):273-297.
[15]CHEW H G,CRISP D J,BOGNER R E,et al.Target detection in radar imagery using support vector machine with training size biasing[C]//Proc of the 6th International Conference on Control,Automations,Robotics and Vision.2000.
[16]鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機(jī)[M].北京:科學(xué)出版社,2004.
[17]YU Wei,JUTLA D N,SIVAKUMAR S C.A churn-strategy alignment model for managers in mobile telecommunication[C]//Proc of the 3rd Annual Networks and Services Research Conference.[S.l.]:IEEE Press,2005:48-53.