摘 要:在電子商務環境下,客戶對企業起著至關重要的影響。新客戶的獲取無疑對企業的生存和發展起到很重要的作用。客戶關系管理系統中,通過分析海量數據之間的聯系,建立規范全面的信息模型。為了解決新客戶的獲取問題,采用數據挖掘技術對客戶類別進行預測。通過對數據挖掘各種算法的比較,做了決策樹算法編程實驗,獲得客戶類別的預測結果。結果表明,數據挖掘技術能有效提高客戶預測的準確率,提高了數據利用率。
關鍵詞:客戶關系管理; 數據挖掘; 決策樹; 客戶獲取
中圖分類號:
TN915-34
文獻標識碼:A
文章編號:1004-373X(2011)19
-0150
-04
Application of Data Mining Technology in Customer Relationship Management System
LIU Zhong-kui, GUO Min
(College of Electronic Information and Control Engineering, Beijing University of Technology, Beijing 100124, China)
Abstract: In E-commerce environment, customers play a crucial impact on the company. The acquisition of new customers plays an important role in the existence and development of enterprises. There is rich and complex customer data in customer relationship management system. By analyzing the links between the data, a more comprehensive information model is established. In order to solve the problem about how to get new customers, data mining technology is used to solve customer category forecast. Through the comparison of various algorithms in data mining, the decision tree algorithm programming experiment is made to get the prediction results of clients. The results indicate that the method can efficiently improve the accuracy and raise the data utilization.
Keywords: customer relationship management; data mining; decision tree; customer acquisition
收稿日期:2011-04-21
0 引 言
隨著信息時代的到來,電子商務的飛速發展,客戶比以往有了更多的選擇,這樣的商業現狀迫使企業從“以產品為中心”轉變為“以客戶為中心”。在這種經營理念的轉變下,了解現有客戶,認識到他們的需要是非常重要的。對現有客戶和潛在客戶的培養和挖掘,被認為是企業獲得進一步成功的關鍵??蛻絷P系管理就是在這樣的趨勢下應運而生的??蛻絷P系管理(Customer Relationship Management,CRM)是對企業和客戶之間的交互活動進行管理的過程[1]。它以信息技術為手段,對業務功能進行重新設計,并對工作流程進行重組。它的目標是縮減銷售周期和銷售成本,增加收入,尋找擴展業務所需的新市場和新渠道以及提高客戶的價值、滿意度、盈利性和忠實度[2]。
在電子商務CRM系統中,存在著豐富而復雜的客戶數據,包括客戶、市場、銷售、服務及整個企業內部的各種信息。由于這些數據十分繁雜,人們不斷尋找新的工具來對企業的運營規律進行探索,為商業決策提供有價值的知識,使企業獲得利潤。由此引發了一個新的研究方向:數據挖掘(Data Mining)。數據挖掘是從大量數據中提取信息和知識的過程。數據挖掘的強大功能使得它能夠在海量的客戶數據和信息中進行快速有效的深入分析和處理,從中找出規律,并預測客戶的各種行為模式,幫助企業更好地進行運籌決策。數據挖掘技術在CRM的研究中扮演了極其重要的角色[3]。
本文旨在研究數據挖掘在客戶關系管理中的應用,利用數據挖掘技術解決客戶關系管理中客戶的獲取問題。
1 客戶關系管理
從體系結構角度來看,CRM系統架構由以下三個主要部分組成:
操作型CRM,主要是提供以客戶為中心的市場、銷售、服務與支持等業務流程的自動化及擴展。主要功能是銷售自動化、營銷自動化、客戶服務與支持。
協作型CRM,管理企業與其客戶之間的交互方式。包括全自動的語音、傳真響應,電話、互聯網、電子郵件響應系統等,多個交互渠道,以及各個渠道之間可以協同、完整意義上地完成呼叫中心功能。
分析型CRM,對企業的銷售、客戶等數據進行統計分析。分析型CRM,以企業數據倉庫為基礎,通過聯機分析處理、數據挖掘、統計等分析方法,準確地了解客戶行為、期望、需要、歷史和與企業的全面關系,從而樹立全面的客戶觀念和客觀的客戶忠誠度標準。它是從宏觀上對企業經營戰略的確定,到微觀上個性化服務等全部以客戶為中心的經營決策的基礎??梢哉f,沒有成功的客戶關系分析與管理就不會有成功的CRM系統。
綜上所述,在CRM中使用數據挖掘技術,能夠增強分析型CRM的功能,對操作型CRM和協作型CRM的功能起支撐和促進作用。
2 數據挖掘
2.1 數據挖掘技術在CRM中的應用
數據挖掘可以應用到CRM各個不同領域和階段,如一對一營銷,客戶盈利能力分析,交叉銷售,客戶的獲取,客戶的保持等。在這些應用中,客戶的獲取和保持無疑是最為重要的,尤其在電子商務環境下,客戶的流失是不可避免的,客戶的獲取作用日益突出。
在客戶獲取的過程中,尋找那些已知信息和想要得到的行為模型之間的關系,建立預測模型,將依據所選擇的反應模式的類型預測一些指標變量,就可以找出那些對企業所提供服務感興趣的客戶,進而達到獲取客戶的目的[4]。
在解決客戶獲取問題時,同時考慮到數據挖掘技術在客戶細分和客戶盈利能力中的應用方法??蛻艏毞质菍⒁粋€大的消費群體劃分成一系列細分群體的過程??蛻艏毞挚梢栽谳^高的層次上查看整個數據庫中的數據,可以使經營管理者使用不同的方法處理不同細分的群體客戶。對客戶盈利能力的分析,數據挖掘技術可以預測在不同市場活動情況下客戶盈利能力的變化。利用數據挖掘從客戶的交易記錄中發現一些行為模式,以預測客戶盈利能力的高低,進而幫助分析和提高客戶盈利能力,使企業在市場競爭中獲取優勢。
2.2 數據挖掘算法的選擇
在客戶的預測問題上,很多的數據挖掘算法都可以應用,如決策樹算法、神經網絡算法、支持向量機等。在眾多分類算法中,決策樹算法在時間復雜度上很有優勢,而且預測準確率比較高,所以選用此算法是比較合適的。
決策樹是將一棵決策樹看作一個信號源,然后尋找各個屬性中具有最大信息量的屬性,建立決策樹的一個節點,然后依次將該屬性的不同取值作為信宿的表現狀態,找出信息量最大的屬性建立樹的分支,然后在每個分支子集中重復建立樹的下層節點和分支的過程,最終建立決策樹[5-8]。
3 數據挖掘系統建模
3.1 CRM的信息模型的建立
在電子商務CRM系統中,存在著豐富而復雜的客戶數據,包括:客戶的基本信息,銷售數據,訂購數據,退換貨數據,評價信息,各種詢問信息,服務信息等等。相關數據的ER模型如圖1所示。
圖1 數據的ER模型
3.2 系統模塊的組成
數據挖掘是從存放在數據庫、數據倉庫或其他信息庫中的大量數據中挖掘知識的過程。基于這種觀點,設計和應用的系統分成三個部分(系統結構圖如圖2所示):
(1) 數據流,構成從原始數據到最終知識這樣一個完整的數據挖掘流程。
(2) 控制實現模塊,它們是一些處理函數庫,直接控制數據流。
(3) 用戶控制接口,用戶通過它控制整個數據挖掘流程各個階段的工作。
數據流和控制實現模塊處于服務器端,用戶控制接口處于客戶端。系統的輸入是原始數據,即日常事務處理所得到的大量原始數據。系統的輸出是知識,即經過挖掘得到的有價值的信息。
3.2.1 挖掘管理模塊
該模塊是用戶的控制接口,用戶通過它控制整個挖掘流程,使挖掘工作能夠不斷反饋進行下去。包括下列子模塊:
參數設置 控制應用邏輯層的數據預處理模塊。定義系統使用的數據結構、處理操作,確定一些閾值。
挖掘向導 控制應用邏輯層的數據挖掘算法模塊。接收從模式判斷得到的反饋信息。
模式篩選 數據挖掘是一個反復的過程,過程的終止條件是用戶對發現的知識滿意,因此用戶對發現模式的判斷和篩選就是整個系統的反饋環節。
圖2 數據挖掘系統的組織結構圖
3.2.2 數據預處理模塊
針對挖掘任務所涉及到的對應于數據庫中的字段及任務指定的數據進行數據預處理工作,達到為數據挖掘算法模塊提供干凈、準確、簡化數據的目的。該模塊能夠減少數據挖掘算法模塊的數據處理量,提高挖掘效率,提高知識發現的起點和準確度。它包含下列子模塊:
數據收集與數據轉換
數據收集將原始數據轉變成易于處理的統一格式的數據。數據轉換找到數據的特征表示,減少有效變量的數目,其操作包括過濾、剪枝等。
數據簡化與數據凈化
數據簡化有兩個途徑:提取與問題相關的屬性和數據抽樣。該模塊完成數據的選擇抽取,簡化的數據需要做凈化處理;完成數據的最后處理,將抽取的正確可靠的數據提交給數據挖掘算法模塊。
3.2.3 數據挖掘算法模塊
該模塊進行挖掘操作,從經過預處理后得到的數據中發現模式、規則。該模塊使用決策樹算法,實現客戶分類的功能。
3.2.4 模式表達模塊
數據挖掘算法模塊得到的模式并不是最終知識,模式有可能是冗余的、無效的,甚至是錯誤的,這就需要做進一步的處理。模式表達實現對模式的解釋表達,使用戶能夠理解,進而能夠做出評估判斷。該模塊主要使用一些可視化技術和傳統的知識表達技術。
4 數據挖掘系統的設計與實現
4.1 系統架構的選擇
考慮到系統的可擴展性和用戶的方便使用,將程序邏輯與用戶界面分開,從而形成基于B/S(Browser/Server,瀏覽器/服務器)的三層應用模式。
在三層B/S結構下,表示層、應用邏輯層、數據服務層被分割成三個相對獨立的單元,如圖3所示。該結構中,用戶界面采用標準通用的瀏覽器,應用邏輯則運行在中間層的web服務器上。這種分層方式帶來了諸多的優點:系統維護和更新簡單;程序的可重用性增強;數據庫服務器負擔減輕;便于進行事務管理[9-11]。
圖3 三層B/S應用模型
4.2 創建數據倉庫
數據倉庫由以下表組成:銷售事實表,時間維表,客戶維表,地理維表,商品維表,商品類別維表,促銷維表。
4.3 屬性的選擇
針對目前的CRM系統,通常包含客戶的注冊信息、營銷信息、服務信息,通過分析這些數據,能夠發現新客戶和已有客戶之間的聯系,以預測新客戶的類別。以某電子商務網站的客戶數據和銷售數據為例,對潛在客戶的了解有客戶在系統中的注冊信息,包括客戶的性別、出生日期、職業、學歷、婚姻、地區等。建立客戶類別預測模型。分別對客戶的性別、出生日期、職業、學歷、婚姻等屬性與客戶對企業的貢獻進行了分析。如果發現某屬性不同區間的客戶對企業的貢獻不同,說明該屬性和客戶的盈利能力有關,就把該屬性加入分類屬性。最終確定輸入屬性為性別、年齡、職業、學歷、婚姻,預測屬性為客戶的類別。
4.4 數據預處理過程
數據預處理為數據挖掘提供清潔的數據,方法有:數據清理、數據集成與變換和數據歸約。針對具體數據庫,數據預處理主要步驟如下:
(1) 數據的提?。喊杨A處理需要的數據提取出來,并且加入客戶的盈利值。盈利值的提取方法是從客戶屬性表中提取相關屬性數據,用銷售事實表中的售價減去成本價,乘以數量,并計算每個客戶的盈利值。
(2) 連續值離散化,針對決策樹ID3算法的特性,要求屬性為離散型,由于客戶的年齡和盈利值屬性是連續型,所以需要將連續值進行離散化處理。
(3) 預處理后的表CRM_DM.newp32屬性及其屬性取值見表1。
4.5 算法的設計思路
4.5.1 整體設計
通過對ID3算法的分析,整體的設計包括以下幾部分:數據的讀取,數據的處理,結果的保存和應用。
首先,決策樹節點的生成是選擇分類屬性中信息增益最大的屬性,具有相似性,所以采用遞歸思想實現;其次,確定算法的核心是信息增益的計算;最后,計算信息增益的前提是對分類屬性類別的計算、概率的計算和熵的計算,把這三部分分別封裝成函數,通過傳遞不同的參數以實現計算需求。
模型的預測準確率維持在75%左右,在有4個預測類別的預測模型中,預測準確率較高,模型較穩定。
6 結 語
本文針對客戶的獲取問題,通過分析數據挖掘技術在客戶關系管理中的應用,綜合分析了數據挖掘技術在客戶獲取、客戶細分、客戶盈利能力中的應用,提出了解決方案。對CRM系統的全面分析,建立了ER模型。在數據挖掘系統中,建立了數據倉庫。在屬性選擇和數據預處理方面,進行了分析和處理。對決策樹算法進行了實現,建立了客戶類別預測模型,并對模型進行了驗證。
參 考 文 獻
[1]ZHANG Li-mei. Data mining application in customer relationship management \\// 2010 International Conference on Computer Application and System Modeling. \\: \\, 2010: V14-171 -V14-174.
[2]NGAI E W T, LI Xiu, CHAU D.C.K, et al. Application of data mining techniques in Customer relationship management: a literature review and classification \\. Expert Systems with Applications, 2009, 36(2): 2592-2602.
[3]FENG De-zhen, ZHANG Zai-mei, ZHOU Fang, et al. Application study of data ming on customer relationship management in E-commerce \\// Computer-aided Industrial Design and Conceptual Design. Kunming: \\, 2008: 706-710.
[4]ZHOU Jian-hong, XIE Yi. Design of customer relation-ship management systems based on data mining \\. 2008 International Sympo-sium on Electronic Commerce and Security. Guangzhou: \\, 2008: 722-725.
[5]DUAN Fu, ZHAO Zhen-xing, ZENG Xiang-dong, et al. Application of decision tree based on C4.5 in analysis of coal logistics customer \\// 2009 Third International Sympo-sium on Intelligent Information Technology Application. Piscataway, NJ, USA: IEEE, 2009: 380-383.
[6]WU Kun, LIU Feng-ying. Application of data mining in customer relationship management \\. \\: The MASS 2010 Conference, 2010.
[7]JIA Yu-feng, HU Ying-xin. Research on application of data mining in customer relationship management\\. Journal of Shijiazhuang Railway Institute(Social Science), 2009, 3: 31-34.
[8]LI Xian-peng. The research of data mining in mobile communication enterprise based on decision tree \\. Hunan: Hunan University, 2008: 2-3.
[9]ZHENG Yan-juan, WEN Ai-hua. Data mining application in insurance customer relationship management\\. China Business Trade, 2009: 62-63.
[10]YIN Xiao-li, FANG Xu-sheng. Data mining technology application in bank CRM\\. Economic Research Guide 2009: 112-113.
[11]XU Ling, SONG Li. Apply the theory to improve the relationship between assets, CRM implementation strategy research\\. The Vitality of Enterprises, 2009 (7): 210-216.