[摘要] 隨著市場競爭的日益激烈,“以客戶為中心”的企業經營理念已成為共識。本文在分析CRM的功能以及客戶價值評估的重要性基礎上,提出了一種基于聚類算法和模糊推理的客戶價值評估方法,有效實現了對客戶的劃分和價值的評估。
[關鍵詞] 客戶關系管理聚類模糊推理
一、引言
CRM是客戶關系管理的簡稱,由于受到國外管理模式的影響以及周圍激烈競爭環境的推動,國內企業對CRM的需求日益旺盛。本文提出了一種基于聚類算法和模糊推理的客戶價值評估方法,有效實現了對客戶的劃分和價值的評估。
二、應用聚類算法劃分客戶
聚類是數據挖掘的一種策略,用來將數據對象劃分成多個簇,在同一個簇中的對象之間具有較高的相似度,而不同簇的對象之間差別較大。因而通過聚類分析,能將客戶劃分成不同的類。應用聚類算法劃分客戶的過程如下:
1.數據準備是數據挖掘過程中的重要環節,完成數據預處理和數據轉換。數據預處理主要解決噪聲問題和處理缺失信息,數據轉換包括數據的規范化、數據類型轉換以及選擇屬性和實例等。
我們在眾多屬性中選取了與客戶的價值有較大關聯的應收款、交易總額、信用額度、訂貨頻率、平均訂單利潤、支付方式以及訂貨頻率、平均訂單利潤和支付方式的標準差等作為特征度量。這些數據可以從數據庫中通過查詢計算獲得。其中需要注意的是有些非數值型屬性必須轉化成數值型。如支付方式共有5種,可以分別用0-4這幾個自然數來表示,取均值即可得到表征客戶支付習慣的“支付方式”屬性的值,最后將所有的數據進行歸一化處理。
2.客戶聚類和劃分。常用的聚類算法有劃分方法、層次方法、基于密度的方法、基于網格的方法以及基于模型的方法。K-Means算法是一種效率高,伸縮性相對較強的劃分方法。在執行這個算法之前,必須指定簇的數目k。其基本過程描述為:
第一步,任意選取k個對象作為簇的聚類中心。
第二步,計算對象到每一個簇中心的距離,并將其歸入距離值最小的那一簇。式(1)為某對象到第i個聚類中心的距離:(1)
其中n是維數(屬性的個數),xcj代表第j維的值,Cji代表第i個聚類中心的第j維的值。
第三步,計算簇的聚類中心,更新原來的聚類中心;
簇的聚類中心是簇中對象各維向量的平均值,例如:簇中有兩個二維對象,x1(1.0,2.0),x2(4.0,5.0);則簇的聚類中心為x0(2.5,3.5)。
重復第二步、第三步,直到聚類中心不再發生變化時,處理過程結束。
由此我們得到各聚類中心的數據以及客戶的劃分。客戶屬于其到各聚類中心的距離值最小的那一簇。
三、客戶價值的評估
為了進一步地確定各類客戶的價值,系統引入模糊推理機制。
模糊邏輯是一種用來推理基于規則系統中不確定性的啟發式技術,它使用0.0和1.0之間的值表示一個特定的值屬于某個集合的程度。如下圖所示,年齡34歲的人從某種程度上屬于青年人,但從更多程度上屬于中年人。
年齡的模糊集圖
設計模糊推理系統要解決三個問題:其一把精確的輸入變量模糊化,其二獲取模糊推理規則并在給定模糊輸入時得到輸出,其三是解模糊。
為了實現模糊推理,本例首先定義輸入輸出變量以及模糊子集,選擇應收款、交易總額、信用額度、訂貨頻率、平均訂單利潤、支付方式為系統輸入變量,客戶等級為輸出變量。所有輸入變量的模糊子集均為低、中、高,輸出變量的模糊子集為:低、中低、中、中高、高。
然后獲取模糊規則,模糊規則的一般形式設為:Ri:IF x1 is Ai1 and x2 is Ai2…….and xn is Ain THEN y is Ci 其中i是規則的條數,n是輸入變量的個數。
根據輸入變量與客戶價值的關系,按高中低分別賦值,如交易總額值越大,客戶價值越高,因此,對于交易總額按高中低分別賦予1,0,-1;而應收款越多,客戶價值越低,因此,對于應收款按高中低分別賦予-1,0或1,由此計算出每一條規則的輸出值: (n為輸入變量的個數)
輸出值與模糊子集之間的對應關系見表1。
表1 輸出值與模糊子集間的對應關系
最后進行模糊推理。在模糊推理的過程中,采用三角形隸屬度函數模糊化輸入變量,解模糊采用最大隸屬度法,由此推導出每一個聚類中心的等級。表2是對相關數據的分析結果,說明通過聚類分析,客戶被劃分成6個簇,屬于“0”簇的客戶為高級客戶,占所有客戶的1.67%,屬于客戶“5”簇的客戶為低級客戶,占所有客戶的8.33%。
表2各類用戶的等級
至此,客戶劃分及其價值評估得到實現。當然實際的處理過程要復雜得多,例如數據的預處理、合理的k值的獲取以及聚類效果的評估等等。
四、結論
本文闡述了客戶價值評估在CRM中的重要地位,介紹了聚類分析和模糊推理技術在客戶價值評估中的應用,為客戶價值評估提供了一種新的思路。