[摘 要] 本文研究了基于粗集理論的面向用戶的最佳約簡算法應用于客戶關系管理的方法,通過建立客戶價值決策表、屬性的最佳約簡和規則提取,實現了對客戶關系的最佳管理。
[關鍵詞] 最佳 屬性 約簡 客戶 關系 管理
一、前言
CRM(客戶關系管理)是對企業與客戶關系的管理,其核心是最大化客戶價值,即進行客戶價值評價,客戶價值是企業制定有效營銷策略的基礎。企業根據客戶價值大小分配有限的營銷資源,實施相應的客戶保持策略,提升客戶忠誠度,從而實現營銷效益最大化。因此,基于客戶價值的客戶關系管理越來越受到企業的重視。企業一般利用其歷史銷售數據來確定客戶的價值,由于歷史銷售數據量巨大,企業會利用諸如決策樹(DT)、人工神經網絡(ANN)和遺傳算法(GA)等技術來輔助確定客戶價值,找到最有價值的客戶,使企業以最小投人獲得最大回報。
對于客戶價值數據,可以利用決策樹生成若干規則,利用這些規則進而判斷客戶的價值,但對于大樣本集的情況,決策樹技術會顯著地降低分類精度。此外,利用神經網絡進行客戶樣本數據的訓練和分類是一種典型的應用,但由于神經網絡結構難以準確確定,加之訓練時間長,況且神經網絡推理過程不透明,不利于用戶理解和使用推理結果。遺傳算法使用概率搜索技術,而非確定性規則,同樣具有推理結果難以理解的缺點,此外,遺傳算法收斂較慢,且結果的穩定性較差,而粗糙集能有效地分析各種不完備的信息,能高效地處理大樣本數據,推理結果易于理解,且有很強的穩定性。因此,本文基于粗糙集理論,利用面向用戶的最佳屬性約簡算法提取客戶價值判斷規則,并給出了實際應用的方法,為企業決策提供支持。
二、面向用戶的最佳屬性約簡算法
1.面向用戶的最佳屬性約簡方法。粗糙集(Roughsets)理論是一種處理模糊、不精確的分類問題的新型數學工具。粗糙集理論已成為當前數據挖掘的主要方法之一,其主要思想是在保持分類能力不變的前提下,通過知識約簡,導出問題的決策或分類規則。
屬性約簡是Rough Set理論研究的核心內容之一。一般來講,一個決策表的屬性相對約簡不是惟一的,人們期望找到具有最少屬性的約簡,即最小約簡。
對于決策表S=(u,C,D,V, f),u是論域,C是條件屬性的集合,D是決策屬性的集合,V是屬性值的集合,f:u×C∪D→V是信息函數,u,C,D和V都是非空有限集,且C和D的交集為空集。表1為一個決策表。
設[u]=n,決策表S的差別矩陣M、是一個n×n的矩陣,其任一元素
且,其中:
(1)
顯然,M是一個對稱的矩陣.表2中給出了同表1中決策表對應的差別矩陣。
在決策表中,人們關心的是哪些條件屬性對于決策更重要。要考慮條件屬性與決策屬性之間的互信息。在決策表中添加某個屬性所引起的互信息的變化大小可以作為該屬性重要性的度量.
設T=為一個決策表,且RC.那么,在R中添加一個屬性。a∈C之后互信息的增量為:
(2)
這里,I(x; y)表示x與y的互信息;H(yx)表示已知x時,y的條件熵,該增量越大,說明在已知屬性R的條件下,屬性a對決策D就越重要。
定義1:設T=是一個決策表,且RC,則對于任意屬性
a∈C- R的重要性SGF(a,R, D)定義為:
(3)
若R=φ則SGF(a, R, D)變為:
(4)
即為屬性a與決策D的互信息。
SGF (a, R, D)的值越大,說明在已知R的條件下,屬性a對于決策D就越重要。
2.面向用戶的最佳屬性約簡算法。約簡包括對象的約簡和屬性的約簡,約簡的算法直接影響結果的準確性,所以約簡算法的選擇是很重要的。相對約簡的算法有很多種,粗集理論主要是采用核和等價關系等概念進行約簡。我們采用“面向用戶的最佳約簡算法”。具體過程如下:
輸入:
(1)任務相關的總關系中R‘增加標識位TAG,得到關系R,其中含糊元組的TAG值置為F,其余置為T,TAG為F的元組為邊界元組。(2)關系R‘的泛化關系屬性集合AR,這些屬性由條件屬性C(知識庫數據和以往設備出故障時的數據)和決策屬性D(目前設備數據)組成。(3)由R‘的差別矩陣M計算AR的核CO;(4)用戶指定一個屬性集UA
輸出:約簡后的一組屬性集REDU
算法:
step1:將屬性集UA與核屬性集列入屬性約簡后得到的屬性集合REDU,即REDU=CO∪UA。
step2:在可辨識矩陣中找出所有不包含核屬性的屬性組合,即
Q={mij:mij∩REDU≠Ф,i≠j, i.j=1,2,┉┉n},M=M-Q,B=C-REDU
Step3:對所有aK∈B且aK∈mij,i.j=1,2,┉┉,n的屬性計算其有效值SGF,根據最高有效值在B中選擇一個屬性aj,即
SGF(a,R,D)=K(R+{a},D)-K(R,D)
其中K(R,D)=Card(PosR(D))/Card(U) ,Card為集合的基,POS為D在R下的正域。
step4:將所選擇的屬性列入屬性約簡后得到屬性集合REDU,即REDU=REDU∪{aj}
step5:重復上述過程,直到M=Ф
三、面向用戶的最佳屬性約簡算法在客戶分類中的應用
1.客戶分類決策表的形成。在整個客戶生命周期上管理客戶價值是CRM的基本思想,因此,企業在評價客戶有價值與否時不僅要參照該客戶當前的價值表現更重要的是依據其對該客戶未來潛在價值的預測判斷。企業必須從這兩個方面全面地評價客戶,才能客觀公正地評判客戶對于企業的價值。因此,提出企業客戶價值評價體系如圖1所示。
在形成知識庫時,每個指標(條件屬性)的取值,為了簡便,我們進行離散化時只取0和l,分別代表該指標的兩個等級:“低”和“高”。評價結果(決策屬性)的取值也只取0和1,分別代表兩個評價級:“低”和“高”。
根據客戶價值評價指標體系和專家的經驗,可形成客戶分類決策如表3。
2.客戶分類決策表的約簡。由表3所示的故障決策表可得其差別矩陣如表4,由于差別矩陣是以對角線對稱的矩陣,因此,表4只給出半個矩陣。其中:a為客戶單位利潤;b為生命周期;c為客戶購買總量;d為銷售總服務成本;e為客戶忠誠度;f為客戶信用;g為創新推動力;h為口碑傳播能力;i為盈力能力;j為維持價值;k為交叉銷售可能性;m為社會價值;n為有價值客戶。
根據面向用戶的最佳屬性約簡算法進行約簡過程如下:
步驟1由表4的差別矩陣中含單個條件屬性的元素構成REDU={a,c,e,d,f}。
步驟2在判別矩陣中找出所有不包含核屬性的組合,即在差別矩陣中去掉包含核屬性的項,可得表5。
步驟3M=φ,程序結束。
所以,由該文的算法可得到一個約簡的屬性R={a,c,e,d,f},由約簡的屬性可得約簡后的決策表,如表6所示。
由表6可以提取有價值客戶的規則如下:
(5)
從有價值客戶的規則式(5)可以看出:作為一個有價值的客戶必須具備良好的信用和能創造較高利潤的能力,并且還要具有較高的購買產品總量與較高的忠誠度,或者雖然購買產品總量較低,但銷售總服務成本也較低。可以看出,以上結論與實際人們的價值觀念相附。因此,由約簡屬性R={a,c,e,d,f}可以有效的確定決策屬性,因此,證明將面向用戶的最佳約簡算法應用于客戶管理是行之有效的。
四、結論
通過將面向用戶的最佳約簡算法應用于客戶管理方法的研究,通過實例對客戶的價值進行最佳屬性約簡,可以看到,對有價值客戶的管理只要關注客戶的創造利潤的能力、客戶的信用、客戶購買產品總量、客戶的忠誠度和銷售總服務成本五個指標,大大減少了管理的復雜性,提高了管理的效率。
參考文獻:
[1]曹云忠:基于RFM和粗糙集的客戶分類規則提取. 微計算機信息,2009(3):227~228
[2]吳懿慧 倪現君:基于粗糙集客戶價值評價的規則挖掘.中國科技信息,2009(1):162~163
[3]陳堂敏:數據挖掘重整風機監控系統的研究. 計算機應用,2004(11):71~74
[4]陳堂敏:面向用戶的知識量最佳屬性約簡算法在數控機床故障預測中的應用.機械科學與技術,2006(2):163~167