金 英,蘇 萌,涂 平
(北京大學 光華管理學院,北京100871)
具有同樣滿意程度的客戶可能會有不同的行為意向,滿意度閾的不同可能是造成這種情況的原因之一。以往研究提出,不同的客戶可能有不同的滿意度閾,只有當滿意度分數超過某個閾值時,客戶才會體現推薦或出重購行為[1]。滿意度調查通常只能得到客戶的滿意程度,但是無法了解具體什么程度的滿意度可以導致客戶忠誠。而高滿意度不一定能導致客戶忠誠[2][3]。因此,只測量客戶滿意度是不夠的。較低的滿意度閾意味著該客戶的滿意水平容忍度和忠誠度較高,而較高的滿意度閾則表示該客戶對滿意水平的容忍度低,不容易產生重購意愿和行為[1][4]。如果企業能夠估計出每個客戶的滿意度閾,則不僅可以幫助企業加深了解客戶內在的忠誠性,而且可以根據不同滿意度閾值,設計個性化的客戶忠誠計劃。
滿意度閾是一個潛在的變量,如果采用客戶自我報告的方法來獲得,其客觀性和可靠性會存在問題。因而滿意度閾更適合采用間接估算的方法。但是,目前有關這方面的定量研究還非常少,有限的幾個相關研究也存在各自的局限性。如Mittal和Kamakura的binary probit模型[1]在估計個體層次的重購閾上不夠完善,造成所有具有相同人口統計變量的客戶有完全相同的閾值;而單變量分層Bayes Probit模型[5]雖然可以估計出客戶個體層次的推薦閾和重購閾,但是推薦意愿和重購意愿必須分別考慮。重購意愿和推薦意愿是反映客戶忠誠的兩個最主要的維度[6][7][8]。考察客戶忠誠應當同時考慮客戶在不同維度上的聯合表現。因為除了人口統計因素和產品及消費經歷因素,某些消費者的人格特征可能會共同影響其推薦意愿和重購意愿。如果能在模型中捕捉到這部分因素,對推薦閾和重購閾進行聯合建模,會更有利于準確地估計。
Mittal和Kamakura的研究[1]針對美國汽車消費者,使用Probit模型來考察客戶滿意度對未來實際重購行為的影響,他們的模型中包含了重購閾參數。Mittal和Kamakura假設消費者j有重購行為的概率等于他的真實的滿意度大于其滿意度閾的概率[1]:

其中,Yj是消費者j是否重購的0-1變量,Sj是消費者j的真實滿意度,uj是該消費者的滿意度閾。Mittal和Kamakura進一步假設,消費者的滿意度閾受他的人口統計因素的影響,所以他們將滿意度閾表達為人口統計變量的回歸:

其中,γ0和γk是參數,K是人口統計變量的個數,Zjk是人口統計變量,η是誤差項,服從標準正態分布。
Mittal和Kamakura認為,消費者報告的滿意度分數Oj只是一個反映消費者潛在的真實滿意度的指標,因而他們把真實的滿意度表示為Oj的回歸:

其中,βj是參數,ε是誤差項,服從標準正態分布。
Mittal和Kamakura假設報告的滿意度轉換為真實的滿意度的關系受到消費者特征的影響:

其中δ0和δk是參數。把(3)和(4)式代入(2)式,得到:

從(5)式可以看出,η和ε不能識別。因此,要計算客戶個體層次的重購閾只能使用:

這樣就不能把未測量的消費者特征因素考慮進去,結果造成所有具有相同人口統計變量的消費者將具有完全相同的重購閾的不合理現象。Mittal和Kamakura的模型主要是為了捕捉客戶特征對滿意度與重購行為之間關系的調節作用,因此對重購閾的建模不夠完善。因此,該模型不適于估計個體層次的重購閾。
單變量分層Bayes Probit模型分別對客戶推薦閾和重購閾進行如下建模[5]:

其中,Yi=1表示客戶i選擇推薦或重購,ri表示客戶i的推薦閾或重購閾,βi是客戶i的線性系數,Oi是客戶i報告的滿意度分數,ε是誤差項。
另外一層模型用于控制參數異質性(heterogeneity),

其中,Zi表示客戶i的特征變量所構成的向量;表示系數向量的轉置向量;v是誤差項。單變量分層模型的局限在于沒有考慮客戶的某些內在因素可能會共同影響推薦意愿或重購意愿,因而在一定程度上削弱估計的準確性。
本研究采用與Mittal和Kamakura[1]類似的假設:客戶報告的滿意度分數是客戶真實的滿意度水平的反映,當真實的滿意度超過其推薦閾時,客戶就有推薦意愿;反之,則無。也可以說是,客戶有推薦意愿的概率等于他的真實滿意度大于其推薦閾的概率。用公式可以表示為:

其中,Y1i=1表示客戶i(i=1,…,n)表示愿意推薦,Y1i=0表示不愿意推薦;w1i是潛變量;Xi是客戶i自我報告的滿意度分數;β1i是系數,反映了客戶報告的滿意度對其推薦閾的影響;r1i表示客戶i的推薦閾;ε1i是誤差項。
用同樣的方法,可以對重購閾建模:

其中,Y2i=1表示客戶i表示愿意重購,Y2i=0表示不愿意重購,w2i是潛變量,β2i是系數,r2i表示客戶i的重購閾,ε2i是誤差項。
由于可能有某些共同的潛在因素會影響到客戶對是否愿意推薦和重購的判斷,所以(9)和(10)式的誤差項可能具有一定的相關關系,因而可以假設它們共同服從一個雙變量正態分布。用公式表達為:

需要注意的是,對于Probit模型來說,模型的回歸系數和協方差是不能被識別的[9]。為了處理參數識別問題,依據Chib和Greenberg[9]的方法,這里設定協方差矩陣Σ等于它的相關矩陣ρ是兩個誤差項的相關系數。這樣,由(9)、(10)和(11)式共同構成了一個雙變量Probit模型。
對于上述雙變量Probit模型,需要估計的參數有r1i,β1i,r2i,β2i和Σ。由于本研究的目的是估算出每個客戶的滿意度閾,所以r1i,β1i,r2i和β2i被定義為客戶個體層次的參數,即不同客戶的r1i,β1i,r2i和β2i值是不同的。Rossi,McCulloch和Allenby等人[10]使用的分層Bayes建模方法適用于處理此類異質性參數問題。使用該方法需要進一步對系數r1i,β1i,r2i和β2i建立線性回歸模型。這種分層建模方法假設客戶各自不同的系數是受他自身特征因素影響的,因而這些特征因素可以作為解釋變量對第一層模型的系數r1i,β1i,r2i和β2i進行回歸,并形成第二層模型。具體可用公式表示為:


其中,Zi表示客戶i的特征變量所構成的向量;表示系數向量的轉置向量,分別對應參數r1i,β1i,r2i和β2i。并且,考慮到可能存在某些不可觀測的客戶特征因素影響其推薦閾和重購閾,假設誤差項ηji服從多變量聯合Normal(0,V)。V是協方差矩陣。同樣,為了處理參數不可識別問題,我們假設協方差矩陣等于它的相關矩陣D:

至此,由(9)~(12)式共同構成了一個分層的雙變量Probit模型。但是該模型的對數似然函數卻難以用傳統方法進行估計。主要是因為雙變量的概率形式是非標準的,而且對參數求導困難。因此,本文采用Bayes MCMC模擬方法解決模型估計問題。
首先需要對模型參數Δ、Σ和D設定先驗概率分布。參照Bayes模型的標準做法,設定Δ和D的先驗概率分布為:

其中,A-1為對角矩陣,D服從Inverted Wishart分布。
另外,設定Σ的先驗概率分布為InvertedWishart(υ0,Λ0)。
本模型的參數后驗模擬抽樣算法可以由下面的Gibbs抽樣步驟構成。
第一步:設定β1i,r1i,β2i,r2i,Σ和D的初始值;
第二步:給定β1i,r1i,β2i,r2i和Σ,對潛變量w1i和w2i進行抽樣;
第三步:給定D和Σ,對β1i,r1i,β2i和r2i進行抽樣;
第四步:給定β1i,r1i,β2i,r2i,w1i和w2i,對Σ進行抽樣;
第五步:給定β1i,r1i,β2i和r2i,對 Δ 和D進行抽樣。返回第二步。
具體來說,在第二步為了實現對Σ的抽樣,首先對潛變量 w1i和w2i進行抽樣。假設給定了β1i,r1i,β2i,r2i和Σ,則w1i和w2i可由二元正態分布隨機產生。但是,需要注意的是,w1i和w2i的正負與Y1i和Y2i取值相對應。Y為0時,w應當小于等于0;Y為1時,w大于0。因此,實際上這個隨機分布應當是截斷的二元正態分布。在抽取w1i和w2i時,本研究采用GHK算法來實現截斷二元正態隨機數的產生[11][12]。該算法可以將截斷的二元正態分布轉換為兩個獨立的截斷一元正態分布,這樣可以保證一次性產生符合條件的隨機數。
根據給定的D和Σ,對β1i,r1i,β2i和r2i進行抽樣。β1i,r1i,β2i和r2i是個體層次的參數,本研究參照分層Logit模型的Gibbs算法中對個體層次參數的處理方法[13],對β1i,r1i,β2i和r2i的抽樣使用隨機游走Metropolis-Hastings算法來實現[14]。具體步驟如下:
(3)令

(4)對 u ~ Uniform[0,1]進行隨機抽樣,如果u≤α(Bi
(k-1);Bi) ,則;否則,
給定β1i,r1i,β2i,r2i,w1i和 w2i,對Σ進行抽樣。只要知道了β1i,r1i,β2i,r2i,w1i,w2i和 Xi,則(9)和(10)式就構成兩個SUR(Seemingly Unrelated Regression)方程[15]。對于SUR模型,如果假設Σ的先驗概率服從InvertedWishart(υ0, Λ0)分布,那么它的后驗概率分布也是Inverted Wishart,即:
Σ|β1i,r1i,β2i,r2i,w1i,w2i,Xi~InvertedWishart(υ0+n,S+Λ0)
其中,S=E’E,E為誤差,可以根據β1i,r1i,β2i,r2i,w1i,w2i和Xi計算出來。這樣就可以根據它的后驗概率分布對Σ進行抽樣了。
給定β1i,r1i,β2i和r2i,可以對 Δ 和D進行抽樣,這相當于一個雙變量線性回歸模型。首先,依據下面的后驗條件概率分布對D進行抽樣:

其中,S=E’E

其次,給定D,根據下面后驗條件概率分布對Δ進行抽樣:

上述步驟完成之后,再回到算法的第二步,進入下一次迭代。
本研究以公開發行的自由軟件R 2.7.0[16]為編程環境,在 bayesm[17],MASS[18],mvtnorm[19],msm[20]等軟件包的基礎上編程實現數據模擬和模型估計及檢驗。
首先,任意設定參數取值如下:ρ=-0.1;d12=d13=模擬的樣本大小為n=5000。然后,根據模型(9)~(12)式生成模擬數據。用本研究提出的雙變量分層Bayes Probit模型的MCMC算法對參數進行估計。運算迭代10000次。為了去除相鄰迭代間可能存在的相關關系,每隔5次保留1次抽樣結果,共獲得2000次抽樣的模擬數據。然后再去除其中前1000次數據,以消除先驗假設的影響。對模擬數據的運算結果表明(表1),絕大多數參數的估計比較準確。

表1 參數估計
本研究的實證數據來源于某品牌汽車經銷商對其客戶隨機抽樣所做的一次滿意度調查,樣本規模為1433人。本研究涉及的變量包括四類:(1)客戶對經銷商服務的總體滿意度;(2)客戶推薦意愿和重購意愿;(3)人口統計變量;(4)產品和消費經歷變量。其中,總體滿意度由10分量表測量,代表5個滿意度水平。推薦意愿和重購意愿都是0-1變量。樣本的滿意度接近正態分布,其均值為7.6,標準差為1.4。與該公司進行的其它滿意度調查數據相比較,該分布正常。對樣本特征進行的描述性統計分析顯示,樣本構成基本符合該汽車品牌總體客戶的特征,顯示樣本具有代表性。
模型的初始值設定采用發散的、無信息的方式。用MCMC模擬抽樣方法,每個模型都迭代20000次,采用間隔5次取樣的方法,共獲得4000次的抽樣數據。最后進入計算的是后2500次較穩定的模擬數據。
為了檢驗本研究所提出的雙變量分層Bayes Probit模型在實證數據分析中的有效性,本文分別進行了內部效度和外部效度檢驗。在內部效度上,本研究比較了兩個Bayes模型的LML(Log Marginal Likelihood)指標:雙變量分層Bayes Probit模型(BHP模型)和單變量分層Bayes Probit模型(HP模型)。LML值越大,說明模型對數據的擬合情況越好[13]。表2顯示,本研究模型(BHP模型)的LML值(-266.731)比HP模型的LML的(-324.215)要大,說明本研究模型對數據的擬合情況比單變量分層模型更好。

表2 模型擬合度比較(LML)
在外部效度上,本研究比較了三個模型的樣本外預測的準確率。首先將全部數據隨機分為訓練數據和驗證數據。針對訓練數據,三個模型分別估計出參數,將估計出的參數應用于驗證數據,分別預測推薦和重購,與真實情況比較計算出預測準確率。表3結果顯示,本研究模型在推薦意愿和重購意愿上都是預測最準確的。

表3 模型預測精確度比較
圖1是推薦閾和重購閾的直方圖。左側的圖是用雙變量模型估計出的結果,右側的圖是用單變量模型估計的結果。因為雙變量模型的數據擬合度指標LML優于單變量模型,因而可以認為左圖更接近于數據的真實情況。用單變量模型會低估推薦閾小于1的客戶數量。這樣會高估滿意度分數的作用,但是,雙變量模型的結果顯示,15.6%的人的推薦意愿不會隨著滿意度分數的提高而變動。這一比例要高于單變量模型的估計結果。而從圖1可以看出,單變量模型低估了重購閾高于10的那部分人的比例。這也在一定程度上高估了滿意度分數的作用。

圖1 推薦閾和重購閾的后驗概率分布直方圖
本研究提出了一種雙變量分層方法聯合估算個體層次的推薦閾和重購閾,并采用Bayes MCMC方法對模型進行了估計。該方法可以比其他方法更有效地估計客戶個體層次的推薦閾和重購閾。本研究提出的雙變量分層Bayes Probit模型也為其它關于二元雙變量的聯合分析提供了實用工具。例如,客戶忠誠意愿和忠誠行為的聯合分析。本研究的主要局限在于,由于數據限制只考察了客戶的忠誠意愿而沒有考察忠誠行為。鑒于企業更加關心的是客戶的忠誠行為,未來研究應當聯合考慮客戶的忠誠意愿和行為。對此,本研究提出的方法可以很容易地應用于客戶行為數據。
[1] Mittal V,Kamakura W A.Satisfaction,Repurchase Intent,and Repur?chase Behavior:Investigating the Moderating Effect of Customer Char?acteristics[J].Journal of Marketing Research,2001,(38).
[2] Jones T O,Sasser W E.Why Satisfied Customers Defected[J].Har?vard Business Review,1995,(6).
[3] Reichheld F F.Learning from Customer Defections[J].Harvard Busi?ness Review,1996,(2).
[4] Yi Y,La S.What Influences the Relationship between Customer Satis?faction and Repurchase Intention?Investigating the Effects of Adjust?ed Expectations and Customer Loyalty[J].Psychology&Marketing,2004,21(5).
[5] 金英,蘇萌.基于分層Bayes方法的滿意度閾值估計[J].營銷科學學報,2008,4(3).
[6]Andreassen T W.From Disgust to Delight:Do Customers Hold a Grudge?[J].Journal of Service Research,2001,4(1).
[7] Brady M K,Cronin J J,Brand R R.Performance-only Measurement of Service Quality:A Replication and Extension[J].Journal of Busi?ness Research,2002,(55).
[8] Olsen L L,Johnson M D.Service Equity,Satisfaction,and Loyalty:from Transaction-Specific to Cumulative Evaluations[J].Journal of Service Research,2003,5(3).
[9] Chib S,Greenberg E.Analysis of Multivariate Probit Models[J].Bio?metika,1998,85(2).
[10] Rossi P E,McCulloch R,Allenby G.The Value of Purchase History Data in Target Marketing[J].Marketing Science,1996,(15).
[11] Geweke J.Efficient Simulation from the Multivariate Normal and Stu?dent-t Distributions Subject to Linear Constraints[C].Computing Science and Statistics:Proceedings of the 23rdSymposium on the In?terface,Alexandria,VA:American Statistical Association,1991.
[12] Hajivassiliou V,McFadden D,Ruud P.Simulation of Multivariate Normal Rectangle Probabilities and their Derivatives[J].Journal of Econometrics,1996,(72).
[13] Rossi P E,Allenby G,McCulloch R.Bayesian Statistics and Market?ing[M].New York:John Wiley and Sons,2005.
[14] Chib S,Greenberg E.Understanding the Metropolis-Hastings Algo?rithm[J].The American Statistician,1995,49(4).
[15] Zellner A.An Efficient Method of Estimating Seemingly Unrelated Regressions and Tests for Aggregation Bias[J].Journal of the Ameri?can Statistical Association,1962,(57).
[16] R Development Core Team.R:A Language and Environment for Sta?tistical Computing[M].Austria:R Foundation for Statistical Comput?ing,2008.
[17] Rossi P E,McCulloch R.Bayesm:Bayesian Inference for Marketing/Micro-econometrics[Z].R Package Version 2.2-1,2008.
[18] Venables W N,Ripley B D.Modern Applied Statistics with S(4thEdition)[M].New York:Springer,2002.
[19] Genz A,Bretz F,Hothorn T.Mvtnorm:Multivariate Normal and Dis?tribution[Z].R Package Version 0.9-0,2008.
[20] Jackson C.Msm:Multi-state Markov and Hidden Markov Models in Continuous Time[Z].R Package Version 0.8,2008.