[摘要] 客戶關(guān)系管理(CRM),現(xiàn)已逐漸成為企業(yè)生存與發(fā)展的焦點(diǎn)之一,也正成為計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域的一個(gè)活躍研究方向。文章簡(jiǎn)介紹CRM;針對(duì)客戶關(guān)系管理中的客戶分類問題,提出了一種基于蟻群算法和數(shù)據(jù)挖掘的客戶聚類算法,并開發(fā)了一個(gè)基于蟻群算法的客戶聚類軟件。最后對(duì)實(shí)際問題進(jìn)行驗(yàn)證,驗(yàn)證結(jié)果表明方法是可行的。
[關(guān)鍵詞] 蟻群算法聚類分析客戶關(guān)系管理
一、引言
迅速發(fā)展的Internet,使世界經(jīng)濟(jì)進(jìn)入前所未有的高速增長(zhǎng)期。隨著網(wǎng)絡(luò)技術(shù)的進(jìn)步和成熟,網(wǎng)絡(luò)經(jīng)濟(jì)和電子商務(wù)越來(lái)越深入人心、飛速發(fā)展,在全球范圍內(nèi)正加速改變著傳統(tǒng)商業(yè)模式。如今,網(wǎng)上客戶只需輕動(dòng)鼠標(biāo),就可使買方購(gòu)物鏈重構(gòu),會(huì)讓賣方供應(yīng)商重組。成為客戶社會(huì)作用放大器的網(wǎng)絡(luò)經(jīng)濟(jì)和電子商務(wù),已使客戶擁有在傳統(tǒng)商務(wù)時(shí)代所無(wú)法比擬的自主權(quán)、自由度、自選域與影響力。因此,處在“網(wǎng)絡(luò)經(jīng)濟(jì)新時(shí)代”的今天,企業(yè)界特別是IT界原來(lái)習(xí)慣的“只使現(xiàn)行流程實(shí)現(xiàn)數(shù)據(jù)處理自動(dòng)化,就可使企業(yè)擁有商業(yè)優(yōu)勢(shì)”的傳統(tǒng)觀念已經(jīng)過時(shí),賣方管理者必須具備與網(wǎng)際競(jìng)爭(zhēng)相匹配的全新思維,一定要掙脫束縛、改變視角、棄舊創(chuàng)新,高度重視管理、分析、研究和利用客戶關(guān)系,靈活應(yīng)對(duì)客戶需求流的變化及發(fā)展,提高客戶資源利用率與商品營(yíng)銷競(jìng)爭(zhēng)力。這對(duì)企業(yè)界特別IT界與時(shí)俱進(jìn)有重要意義。
二、客戶關(guān)系管理(CRM)
“客戶”,在全球網(wǎng)際賣方競(jìng)爭(zhēng)中,已升級(jí)為如今買方市場(chǎng)激烈競(jìng)爭(zhēng)下企業(yè)興衰成敗的關(guān)鍵。許多商業(yè)調(diào)查和行業(yè)分析家證實(shí):客戶的滿意度和忠誠(chéng)度將直接影響企業(yè)的銷售和成本。一個(gè)非常滿意的客戶其購(gòu)買意愿,將六倍于一個(gè)滿意的客戶;而2/3的客戶離開其供應(yīng)商,是因?yàn)樗鼘?duì)客戶關(guān)懷不夠。
“客戶關(guān)系管理”,并不單純是一種計(jì)算機(jī)軟件技術(shù),而是一種以計(jì)算機(jī)為基本工具的、但更注重“建立、改善和發(fā)展客戶關(guān)系”的商業(yè)戰(zhàn)略、企業(yè)理念、經(jīng)營(yíng)手段。客戶關(guān)系管理,旨在使以客戶為中心的企業(yè)業(yè)務(wù)流程不僅要實(shí)現(xiàn)自動(dòng)化,而且要使之具有隨機(jī)應(yīng)變、隨需而變的動(dòng)態(tài)重組能力。
客戶關(guān)系管理,以“廣泛收集、科學(xué)分析、積極建立、快速反饋、有效維系、逐步擴(kuò)大、合理利用廠商的客戶信息資源”為己任,是當(dāng)今廠商取得電子商務(wù)網(wǎng)際競(jìng)爭(zhēng)優(yōu)勢(shì)的最重要基礎(chǔ)和最有效法寶。CRM使企業(yè)提升客戶資源價(jià)值的主要手段主要如下:
1.分類管理客戶資源,重點(diǎn)關(guān)注核心客戶。
2.隨時(shí)跟蹤客戶變化,動(dòng)態(tài)管理客戶需求。
3.以人為本關(guān)愛客戶,定期溝通雙向交流。
4.全方位化關(guān)注客戶,延伸拓展客戶服務(wù)。
三、蟻群算法在CRM中的應(yīng)用
“K—中心”算法,是傳統(tǒng)聚類分析的主用算法。然而,隨著“海量客戶數(shù)據(jù)”的出現(xiàn)與“模式樣本、客戶分類”的數(shù)量很大時(shí),這種算法效率銳減、逐漸失效。
蟻群算法,是由意大利學(xué)者M(jìn).Dorigo等人首先提出。它借用蟻群在搜索食物源的過程中所體現(xiàn)出的尋優(yōu)能力,來(lái)解決一些頗為困難的尋求離散系統(tǒng)的優(yōu)化解或滿意解的問題。已經(jīng)用該辦法解決了旅行商問題、指派問題、調(diào)度問題等,取得了很好的結(jié)果。初步的研究表明,蟻群算法是一種基于種群行為特性的魯棒性較強(qiáng)的算法,具有很多優(yōu)良的性質(zhì)。
1.蟻群算法概述。螞蟻覓食時(shí),對(duì)于從蟻窩到食物源的諸多途徑,開始時(shí)不同的螞蟻會(huì)選擇不同的路徑,但最后,幾乎所有的螞蟻都會(huì)找到同一條最短的路徑。這是因?yàn)槲浵亴ふ易疃搪窂降倪^程,是一個(gè)非常有趣、十分合理的交互式過程:每個(gè)螞蟻都會(huì)在所經(jīng)過的路上留下一定量的外激素(pheromone),且能感知這種外激素的存在及強(qiáng)度,并有“朝外激素強(qiáng)度高的方向運(yùn)動(dòng)”的本能。這些外激素,既會(huì)隨所通過螞蟻數(shù)量的增加而增加,也會(huì)隨時(shí)間的流逝而按一定的衰減函數(shù)關(guān)系而消退(即:減退→淡化→消逝)。這樣,整個(gè)蟻群的集體行為便表現(xiàn)出一種信息正反饋現(xiàn)象;某一路徑上走過的螞蟻越多,則后來(lái)者選擇該路徑的概率就越大。顯然,最短路徑上所通過螞蟻的數(shù)量會(huì)按“較少→較多→最多”方式進(jìn)行演進(jìn),使最短路徑上所散布的外激素總比其他路徑濃得多(因?yàn)槠渎飞系耐饧に胤e累速度比消退速度大得多);蟻群則通過感知、交流和反饋外激素強(qiáng)度信息,并受高強(qiáng)度外激素的制導(dǎo)——“不斷調(diào)整自己覓食行進(jìn)方向,動(dòng)態(tài)集聚于外激素濃度高的路徑上”;從而,蟻群最終找到一條從蟻窩到食物源的最佳(即最短)路徑。受自然螞蟻系統(tǒng)及其行為機(jī)理的啟迪,人們創(chuàng)造出人工螞蟻(AA)、人工蟻群系統(tǒng)(ACS)以及蟻群算法(ACA)。人工螞蟻,類似于真實(shí)螞蟻,它在運(yùn)動(dòng)中會(huì)釋放出一定的行為特征信息,能感知該行為特征信息的存在及其強(qiáng)度,并按“向高強(qiáng)度特征信息集聚”的原則制導(dǎo)人工螞蟻的行為。
2.蟻群聚類算法。蟻群算法的聚類處理,其主要思想是:在基于蟻群算法的聚類分析中,把“數(shù)據(jù)”視為具有不同屬性的“人工螞蟻”,把“聚類中心”看作是這些螞蟻所要尋找的“食物源”;而把數(shù)據(jù)聚類過程,看作是人工螞蟻尋找食物源的過程。顯然,最后數(shù)據(jù)將會(huì)在“食物源”中聚集,從而達(dá)到對(duì)數(shù)據(jù)的自然聚類——正確分類。
為了敘述簡(jiǎn)便,可給出如下約定:設(shè)聚類集合,加權(quán)歐氏距離。在客戶關(guān)系管理中,各個(gè)指標(biāo)的貢獻(xiàn)往往不同,應(yīng)設(shè)定加權(quán)因子來(lái)反映這種變化。r0為初始聚類距離閥值。
(1)由于傳統(tǒng)的蟻群算法對(duì)初始聚類中心的選擇,沒有統(tǒng)一的一致方法。本文采用如下方法選擇初始聚類中心:
首先,如果聚類中心的距離小于r0,則重新選擇聚類中心,這樣能加快收斂速度。m為初始聚類個(gè)數(shù),為統(tǒng)計(jì)誤差,為數(shù)據(jù)到聚類中心路徑上殘留的外激素。第i個(gè)數(shù)據(jù)選擇第j個(gè)聚類中心的概率為:
其中為強(qiáng)度的持久性系數(shù),一般取0.5~0.9左右,Q為正常數(shù)。
然后,新聚類中心的確定方法,可采用K-均值法:,其中表示所有在此類中的數(shù)據(jù)。(注:新的聚類中心可能不在樣本集中)
(2)蟻群聚類CRM算法,可概述如下:
①初始化:設(shè)定r0(初始聚類半徑),r1(最后確定分類的聚類半徑),(誤差),Q,。
②任意選擇K個(gè)中心Cj,確定K個(gè)聚類(采用基于歐氏距離的最鄰近法則聚類)。如果聚類中心之間的距離小于r,則重新選擇聚類中心。給每個(gè)信息素變量賦予相同的數(shù)值。
③計(jì)算轉(zhuǎn)移概率(第i個(gè)螞蟻選擇第j個(gè)聚類中心的概率):
④對(duì)每個(gè)螞蟻按轉(zhuǎn)移概率選擇聚類中心。
⑤計(jì)算各點(diǎn)到聚類中心的距離:
⑥更新信息素:
⑦計(jì)算新的聚類中心(K-均值法):
⑧計(jì)算第i個(gè)聚類的偏離誤差:
⑨計(jì)算總體偏離誤差:
⑩如果成立,就看聚類中心的距離是否小于r1:若小于就可構(gòu)成一類,然后輸出聚類結(jié)果。不然,就轉(zhuǎn)“第4)步”。
在此算法中,為了減少蟻群算法迭代次數(shù),本文特提出一種動(dòng)態(tài)自適應(yīng)調(diào)整改進(jìn)方法,并對(duì)聚類中心的距離進(jìn)行了一定限制,從而對(duì)于輸出理想的聚類個(gè)數(shù)有一定幫助。不過,筆者認(rèn)為:這還不是很理想的聚類個(gè)數(shù)優(yōu)化確定方法,有待進(jìn)一步的優(yōu)化研究。
四、結(jié)論
企業(yè)的競(jìng)爭(zhēng)重點(diǎn),正在經(jīng)歷著從以產(chǎn)品為中心向以客戶為中心的轉(zhuǎn)移,客戶關(guān)系管理作為一種全新的管理、經(jīng)營(yíng)理念,越來(lái)越引起商家的重視。在數(shù)據(jù)倉(cāng)庫(kù)中進(jìn)行數(shù)據(jù)挖掘正逐漸成為CRM中最核心的部分。用蟻群數(shù)據(jù)挖掘聚類算法解決CRM的客戶聚類分析問題,是可行的。這在支持企業(yè)決策方面有著極為重要的理論參考價(jià)值和實(shí)際應(yīng)用意義,可以幫助高層管理者更好地管理企業(yè),使企業(yè)得到更好的順利發(fā)展。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。