重慶大學經濟與工商管理學院 董琳琳
客戶忠誠度對企業的經濟效益有巨大的影響,企業從忠誠的客戶那里獲得最高的利潤,并且忠誠的客戶會長期大量購買企業的產品和服務,對于企業更優質的產品和服務,忠誠的客戶愿以較高的價格購買,為企業帶來更多利潤。有大量忠誠客戶的企業通常可以節省大量營銷費用、服務啟動費用及廣告費用[1]。因此,培養客戶的忠誠感是企業經營管理的重要目標[2]。
提高客戶忠誠度對提高企業經濟效益有重要的作用。本文運用主成分分析和支持向量機結合的方法對企業的客戶忠誠度進行預測,使企業根據預測的結果制定出保持老客戶和發展新客戶的策略,盡可能地避免忠誠客戶的流失。此外,支持向量機分類問題的可行性和有效性要優于神經網絡和決策樹[3]。
隨著全球經濟一體化進程的加快和市場競爭的加劇,企業的經營管理模式由傳統的以產品為中心向以客戶為中心轉變。客戶關系管理最初是由Gartner Group提出的,核心思想是”以客戶為中心”,提高客戶忠誠度,改善客戶關系,留住老客戶并不斷爭取新客戶和新的商機,從而提高企業的市場競爭力并為企業帶來更多的利潤。目前,普遍將客戶關系管理理解為是企業與客戶進行交互的循環流程,進而產生、收集和分析客戶數據,企業將對數據進行分析和預測的結果應用于企業的服務和市場活動中。數據挖掘是從大量原始數據中找出隱含在其中的、潛在有意義的信息,利用這些信息來指導行動。可見,客戶關系管理與數據挖掘有很大的聯系,支持向量機作為數據挖掘技術中的一個重要的方法,在客戶關系管理研究中有廣泛的應用。
客戶忠誠度是指客戶因為接受了產品或服務,滿足了自己的需求而對品牌或供應商產生的心理上依賴及行為上追捧。客戶忠誠度是反映消費者的忠誠行為與未來利潤相聯系的產品財富組合的指示器,是企業營銷工作中對客戶進行管理必須關注的重要因素。忠誠客戶對企業來說意味著具有長期穩定增長的銷售額、較低的營銷成本及持續上升的利潤。忠誠客戶是公司取得競爭優勢的源泉。因此,培育客戶忠誠成為企業客戶保持戰略追求的一個基本目標。
在問題研究中,為了全面系統地分析問題,須考慮眾多影響因素。而這些因素都在不同程度上反映了問題的某些信息,且這些因素間有一定相關性,因而所得的統計數據反映的信息在一定程度上有重疊。用統計方法研究問題時,變量太多會增加計算量和分析問題的復雜性。主成分分析法利用降維的思想,通過線性變換把多個相關的指標轉化為少數幾個不相關的指標。
支持向量機是在統計學理論不斷發展的基礎上,由線性可分情況下的最優分類超平面發展而來的,是實現結構風險最小化的一個有效途徑,具有較好的分類精確性。支持向量機在樣本線性可分的情況下的分類原理:
設訓練樣本集為(xi, yi),i=1,2,…,n,n為訓練樣本的個數,xi∈Rd為訓練樣本,y∈(-1,1)是輸入樣本的類標記(期望輸出)。d維空間中線性判別函數g(x)=wx+b ,決策邊界為: wx+b=0。將判別函數歸一化,使離決策邊界最近的樣本|g(x)|=1。若決策邊界對所有的樣本都能正確分類則有:
決策邊界H0:wxi+b=0為最優當且僅當(w,b)是下面優化問題的最優解:
用Lagrange乘子法解上述問題,等價于解對偶問題:
對每個訓練樣本xi,都有一個Lagrange乘子αi。解αi>0所對應的xi為支持向量。
本文用某大型超市某年5月的會員數據作為訓練數據,6月數據作為測試數據,根據對影響客戶忠誠度的客戶行為和情感特征的分析以及相關文獻選擇影響客戶忠誠度的因素:最近購買時間(a),購買頻率(b),總購買金額(c),產品評價(d),服務評價(e),價格敏感性(f),購買產品便利性(g)作為客戶忠誠度指標體系。h為客戶忠誠度。
本文通過數據清洗除掉噪聲、異常情況和重復數據。將非數值屬性數值化來降低分析的復雜度。在整個數據樣本中,屬性的取值空間變化較大,為使分析不受取值范圍的影響,在分析前,采用最小最大規范法將數據作規范化處理使他們都處在相似的空間,公式如下:
這樣屬性值就映射到0~1區間。
實例中取200個樣本,本文只列出經過數據處理后的前3個樣本數據:
表1 數據處理后前5個樣本數據
當h>0.5時,g(x)=1,即為忠誠客戶。當h≤0.5時, g(x)=-1,即為不忠誠客戶。(g(x)為訓練集的類標記。)
本文利用SPSS17.0軟件進行主成分分析,實驗用到主成分提取原則是主成分對應的特征值>1的前m個特征值。特征值在某種程度上可被看做是主成分影響力度大小的指標。如果特征值<1則表示該主成分影響力度不如直接引進一個原變量的平均解釋力度大。由解釋的總方差表中可知,前兩個成分的特征值>1 ,提取前兩個為主成分,其它成分作為噪聲項不納入訓練集的輸入變量,將主成分Y1,Y2作為支持向量機樣本屬性.將成分矩陣表中所示主成分與對應變量的相關系數進一步標準化得出下列主成分表達式,Xi’(i=1,2,……,7)是數據標準化后的值:
實驗選用libsvm軟件,將處理后的訓練樣本輸入SVM進行訓練和預測。實驗結果得出未進行主成分分析樣本數據進行訓練精度為80%,進行主成分分析后精度為81.8182%。可見主成分分析將數據降維后,消除冗余,提高了分析的精度。
客戶忠誠度預測模型是預測在未來時間段老客戶忠誠度變化趨勢和新客戶忠誠度,找出影響不同客戶忠誠度的規律性知識,本質是一種分類問題:忠誠客戶和不忠誠客戶。利用此模型對某段時間新跟蹤到的客戶相關數據分析其忠誠度,基于此,針對不同的客戶制定相應的策略來保持忠誠客戶和提高不忠誠客戶的忠誠度,達到企業利益最大化的目標。本文運用主成分分析和支持向量機相結合的方法對企業的客戶忠誠度進行預測。主成分分析法對原始數據進行降維,消除冗余來提高客戶忠誠度評價指標的分析精度,降低了客戶忠誠度評價方法的復雜度,而支持向量機提高了分類精度。該方法適用于企業實際問題的研究和客戶關系管理其他方面研究,實用性強。
[1]邵兵家,錢麗萍,伍穎,于同奎.客戶關系管理[M].清華大學出版社,2010.
[2]Reichheld Frederick F. The Loyalty Effect: The Hidden Force behind Growth, Profits, and Lasting Value [M].Boston. Mass: Harvard Business School Press, 1996.
[3]王觀玉,郭勇.支持向量機在電信客戶流失預測中的應用研究[J].計算機仿真,2011(4).
[4]鄧乃揚,田英杰.數據挖掘中的新方法——支持向量機[M].北京科學出版社,2004.
[5]鄭先越,劉志燾.一種基于支持向量機的客戶滿意度評價方法[J].市場現代化,2007(1).
[6]趙曉煜,黃小原.基于數據挖掘的客戶價值預測方法[J].東北大學學報,2006(27).
[7]李玉慧,段萬春,徐曉軍.客戶忠誠度關系模型與建立過程[J].企業經濟,2004(5).