曾 珠 王 斌 劉 冬
(武漢理工大學管理學院 武漢 430070)
研究客戶特征與服務映射關系是在日益競爭激烈的市場中企業尋求提高客戶忠誠度的重要途徑,為客戶提供更周到、更個性化的服務成為企業管理的重要任務之一[1].BP神經網絡基于梯度下降法,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和達到最小,具有優良的分類學習和映射能力,但標準BP算法具有收斂速度慢、局部極小值點、隱含層層數及神經元個數的確定無理論指導等缺陷[2-3].何明等[4]提出基于粗糙集不可分辨關系的粗糙集神經網絡模型,但未進行客戶屬性約簡和指定初始化連接權值.萬映紅等[5]提出基于粗糙集神經網絡的客戶消費分類模型,具有較好的客戶分類效果,但未給出客戶分類與服務的映射模型.本文提出有導師學習下的基于粗糙BP神經網絡客戶特征與服務映射模型,在客戶細分的基礎上尋求客戶特征與服務的映射關系.
提出根據客服歷史數據對由客戶特征和服務決策構成的決策表進行基于屬性重要程度的屬性約簡,得出各服務決策對各屬性的依賴程度,引入該決策支持度改進BP神經網絡算法,構建客戶群體特征與服務策略的映射模型.并運用該映射模型研究客戶群體特征與服務的關系,通過歷史數據的分群分組訓練,形成多個穩定的BP網絡,對客戶的服務項目和時間進行預測.改變傳統的客戶遇到困難找經銷商解決的服務模式,變為經銷商主動為客戶提供定制服務的模式,讓每個客戶都能體驗經銷商一對一的服務,提高客戶滿意度,從而提高客戶的忠誠度,增加企業收益.
粗糙集是繼概率論、模糊集、證據理論之后的又一個處理不確定性的數學工具.粗糙集觀點認為知識是主體對論域中的客體進行分類的能力,分類能力越強,主體所具備知識的可靠度越高[6].分類能力受主體分辨能力的影響,因此分類具有近似性.影響分類能力的因素很多,不同的因素重要程度不同,其中某些因素起決定性作用.具有相同屬性的實體,屬性取值的不同對分類能力也產生影響,屬性之間存在某種依賴關系[7-8].運用粗糙集理論能發現屬性間的完全或部分依賴,簡化冗余屬性,發現最重要的屬性,并計算具體的依賴程度.
BP(back propagation)神經網絡算法是模擬人腦思維構建的網絡計算結構,通過輸出后的誤差逐層反傳修改各層連接權值和閾值使網絡達到預期狀態[9],當誤差函數及全局均方誤差函數達到達到預設精度或學習次數達到設定的最大次數時即為BP網絡最終狀態.
利用BP神經網絡,設客戶特征屬性集為條件屬性,客戶服務項為決策屬性,進行客戶特征與服務內容的映射訓練,可以得出基于客戶特征的服務策略規則.但BP算法也存在一些不足之處:學習算法的收斂速度比較慢,易陷入局部極小值,網絡隱含層的層數以及隱含層神經元數的選取尚無理論指導等[10].
1)訓練方式的改進 在采用BP神經網絡進行客戶特征與服務映射訓練過程中,由于訓練網絡時的樣本數量較多,所以在BP改進算法中,張國翊等提出先把所有P個訓練樣本分為n組[11],讓每組樣本經過1次循環學習累積誤差后再調整學習率,而不是每輸入1個樣本就調整1次學習率.其優點是既能使不同學習率在每組樣本圖像循環訓練完成后得到適當調整,又能減小調整學習率的時間.
該方法可以在一定程度上縮短學習時間,使得網絡可以較為快速收斂,但對于海量的客服數據,這樣隨機的毫無明確目標的分組,最后并不能提高BP網絡的精確度.本文提出采用分群分組批處理的訓練方式,在對m個學習模式對樣本進行分組前先采用聚類算法,將樣本劃分為各具特性的客戶群,每個客戶群具有自己的共性特征和個性特征,再針對每個客戶群隨機均分為r組訓練,這樣可以快速獲得多個具有較高準確度的映射網絡.

圖1 BP網絡訓練方式改進機制圖
此時,不是每輸入一個模式對就進行一次誤差修正,而是在每訓練完一小組樣本后再調整,所以輸出層各個單元的校正誤差函數)對應的改為累積誤差函數dt=.
2)網絡結構的改進 根據萬映紅等的研究,提出了基于粗糙集的神經網絡拓撲結構,但沒有明確BP網絡權值確定的依據.本文作者提出基于粗糙集的BP神經網絡結構,給出基于典型的3層BP網絡隱含層神經元個數及網絡權值確定的依據.

圖2 基于粗糙集改進三層BP神經網絡結構圖
樣本模式對在進入BP網絡訓練之前,先進行屬性約簡,剔除冗余屬性,劃分每個條件屬性對于決策屬性的不可分辨關系,獲取等價關系.條件屬性集中為核的屬性個數即為3層BP網絡的輸入層神經元個數,而隱含層的神經元個數即為各個核心屬性的所有等價類數量之和,輸出層神經元個數為決策屬性所有不同屬性值的個數.
基于改進的BP神經網絡算法及客戶群理論,本文構建如圖3所示的客戶服務映射模型框架.

圖3 基于粗糙BP網絡的客戶服務映射框架
客戶群體特征包括客戶屬性、客戶行為屬性和環境屬性.客戶屬性主要指客戶自身的基本特征,如性別、年齡、年收入等特征,客戶自身的特征對其使用商品或者服務有著顯著的影響.客戶行為屬性,主要指客戶在使用某種商品的時候的習慣性行為,不同的習慣行為對產品造成的影響不同.以汽車客戶為例,若駕駛者在駕駛的時候習慣經常猛踩剎車,則汽車的剎車片和輪胎將會很容易磨損.環境屬性指客戶所處的自然環境、人文環境等,如汽車用戶行駛的道路環境,環境屬性對客戶使用產品會造成客觀因素的影響.客戶群體特征包含眾多屬性,每個屬性對客戶所需要的服務的影響不一樣,本文采用粗糙集理論對客戶特征進行分析,計算基于屬性重要程度的客戶特征對服務項目的隸屬度.
設由條件屬性集C和服務決策屬性集D組成的知識表達系統四元組S=(U,A,V,F),U 為對象的非空有限集合,亦稱論域;A為屬性的非空有限集合,A=C∪D,C∩D=?;V表全體屬性的值域;f為U×A→V的一個映射,稱為信息函數.在客戶群體特征與服務項目的映射關系中S表示成一張二維表,其中U是所有服務記錄的集合,A是所有客戶群特征屬性列的集合,V是二維表中服務項目取值的集合.
定義:?x,y∈U,如果對?α∈R,R?C都有fα(x)=fα(y),且有fD(x)≠fD(y),則稱對象x,y在等價關系R下是不可分辨的,否則稱對象x,y在等價關系R 下是可分辨的,其中fα(x)是對象x在信息函數f下對應的屬性α的值.這種由R決定的不可分辨關系可表示為IND(R),在不產生混淆的情況下記為R:

對于一個客戶群體特征與服務項目的決策表,粗糙集理論除了提供知識約簡和求核方法外,還具備從決策表中抽取規則的能力,這樣就可以在保持服務決策一致的條件下刪除多余的客戶群體特征屬性.此時:

為客戶群特征α對客戶群特征屬性全集C相對于服務決策屬性D的重要程度.其中,γC(D)=通過計算客戶群特征的重要程度,篩選影響客戶服務項目的核心屬性,剔除冗余屬性,以便構建客戶群體特征與服務項目的映射模型.
對客戶服務歷史數據進行數據預處理,運用粗糙集基于屬性重要程度的約簡算法對客戶特征屬性進行約簡,刪除冗余屬性和數據,采用K-means算法進行客戶群劃分.針對劃分好的每個客戶群,再次運用粗糙集基于屬性重要程度的約簡算法,重新計算客戶特征屬性對服務屬性的支持度,劃分客戶等價類,見表1.根據約簡后的客戶特征核心屬性數量確定BP神經網絡輸入層神經元的個數,根據每個輸入層屬性特征的等價類的數量確定與對應屬性相連接的隱含層神經元數量,輸入層每個神經元只與其在隱含層的等價類神經元相連,其連接權值為該屬性對服務屬性的支持度.

表1 客戶服務決策表
對每個客戶群分別建立單獨的BP神經網絡,并將每個客戶群服務樣本數據進行分組.在訓練的時,只在每一組樣本數據訓練完后才計算全局誤差,直到訓練結束.訓練完成后,每個客戶群形成自己的BP網絡,對應相應的客戶特征與服務映射模型.當新客戶數據到達時,先劃分新客戶所屬客戶群,再利用對應客戶群的BP網絡映射其所需服務.
模擬某汽車4S店客戶服務的3 000條歷史數據,假設汽車某類客戶群體特征可分為駕齡、年齡、車輛型號、主要用途、車齡、總行駛里程、月行駛里程、平均車速、道路環境、氣候環境、保養意識和保養周期12個方面的特征,以客戶是否需要更換剎車片為例,利用Rosetta軟件進行數據離散化預處理等,數據離散化結果見表2.

表2 數據離散化

表3 客戶屬性篩選機隸屬度計算
對所有客戶服務數據運用Rosetta軟件進行基于屬性重要程度的約簡預處理,剔除年齡、車輛型號、主要用途、平均車速、氣候環境及保養周期等重要程度較小的屬性,獲得結果見表3.依據表3的結果,刪除其他列屬性,采用K-means算法對服務數據進行聚類分析,本文采用SPSS軟件操作,獲得如表4所列的聚類結果.

表4 最終聚類中心
根據聚類分析結果,對客戶群1(其余各群類似處理)再次運用Rosetta進行屬性約簡,并計算各個客戶群特征對服務決策屬性的隸屬度,刪除客戶群特征對服務決策屬性隸屬度小于0.5的特征獲取核心屬性,核心屬性及其隸屬度見表5.

表5 客戶群特征核心屬性及隸屬度
根據表5所列,對于客戶群更換剎車片服務決策的核心屬性及隸屬度分別為駕齡(0.76)、月平均里程(0.90)、平均車速(0.86)、道路環境(0.78)和保養意識(0.76)五個屬性特征.再利用Matlab軟件編程實現BP網絡訓練算法,根據前面數據約簡的結果確定BP網絡結構為5-7-1三層,將客戶服務記錄輸入神經網絡,以客戶特征為輸入,以服務為期望輸出,訓練BP神經網絡,可以得出客戶特征與服務項目的映射關系.此時整個收斂且穩定的BP神經網絡(包括其神經網絡層數、各層神經元個數、各層之間的權值和閾值)構成核心條件屬性(駕齡、月平均里程、平均車速、道路環境和保養意識)與決策屬性(更換剎車片)之間的映射關系.
通過對模擬數據的約簡、BP網絡訓練發現,改進之前的收斂速度明顯低于改進之后的網絡.在訓練次數同為100的情況下,改進前的全局誤差為0.262 753,改進后的全局誤差為0.001 136,改進后的訓練時間也縮短了0.1s左右.所以采用改進后的BP網絡訓練方式更能快速收斂,形成穩定的BP網絡.同理可以通過該模型訓練得出其他各項汽車服務項目和對應服務時間間隔的BP網絡結構,從而針對客戶群建立客戶特征與服務的映射關系.BP網絡改進前后訓練收斂對比圖見圖4.

圖4 BP網絡訓練對比圖
同理,以客戶特征為輸入,以服務時間間隔為為輸出,可以得出對應服務項目的服務時間映射關系,從而實現根據客戶特征預測客戶所需服務項目,以有的放矢地為客戶提供主動服務,提高客戶服務質量.
本文研究了運用粗糙集改進BP神經網絡算法和結構,并采用分群分組的方式改進BP網絡的訓練方式,構建新的BP神經網絡模式.運用該BP網絡結構,在分析客戶屬性、客戶行為屬性和環境屬性的基礎上,研究了客戶特征與服務間的映射模式.
但本文主要針對客戶群體而研究的群體特征與服務的映射模式,對于每個獨立的客戶而言,具有自己的個性特征,其個性特征對所需要的服務項目和時間有較大的影響.所以在之后研究中,將進一步研究客戶個性特征與群體特征的差異,及其對服務內容和時間的影響,以調節客戶特征與服務的映射關系.
[1]王 虎,喻 立.主動服務導向下的服務挖掘模型研究[J].武漢理工大學學報:信息與管理工程版,2010,32(2):284-288.
[2]李敏生,劉 斌.BP學習算法的改進與應用[J].北京理工大學學報,1999,19(6):721-726.
[3]徐春梅.BP算法改進及在控制系統中應用[J].計算機仿真,2010,27(2):188-191.
[4]何 明,馮博琴,馬兆豐,等.一種基于粗糙集的粗糙神經網絡構造方法[J].西安交通大學學報,2004,38(12):1240-1242.
[5]萬映紅,胡萬平,曹小鵬.基于粗糙神經網絡的客戶消費分類模型研究[J].管理工程學報,2011,25(2):142-148.
[6]葉玉玲.模糊粗糙神經網絡的結構與參數優化[J].系統工程與電子技術,2009,31(12):2989-2993.
[7]薛 鋒,孔 林.粗糙集神經網絡系統在商業銀行貸款五級分類中的應用[J].系統工程理論與實踐,2008,28(1):40-45.
[8]THANGAVEL K,PETHALAKSHMI A.Dimensionality reduction based on rough set theory:A review[J].Applied Sost Computing,2009,9(1):1-12.
[9]MICHAEL C,KEN P,STAN L.Customer satisfaction analysis:identification of key-driver[J].European Journal of Operational Research,2004,154(3):819-827.
[10]李敏生,劉 斌.BP學習算法的改進與應用[J].北京理工大學學報,1999,19(6):721-726.
[11]張國翊,胡 錚.改進BP神經網絡模型及其穩定性分析[J].中南大學學報:自然科學版,2011,42(1):115-124.