于偉杰
(天津大學 管理與經濟學部,天津 300072)
基于結構方程模型的顧客細分
于偉杰
(天津大學 管理與經濟學部,天津 300072)
文章介紹了基于結構方程模型的REBUS-PLS分類方法,該方法是結構方程模型中專用于分類的比較新的方法。作者用此方法對S銀行顧客分類,結果顯示這種顧客細分方法行之有效。
顧客細分;結構方程模型;REBUS-PLS;滿意度
傳統顧客分類一般是直接根據人口統計信息等先驗信息分類或用聚類方法對顧客分類。先驗式分類把具有相同人口統計信息的顧客歸為一類,其一大缺點是人口統計信息很難捕捉到顧客“異質性”的根源(Hahn 2002)[1],實際上顧客分類目的是將有相似心理特征、行為特點的歸為一類,人口統計信息只是顧客外在特征的描述,不足以反映顧客的內在特點,即Hahn所說“異質性”。聚類方法是根據樣本之間的距離分類,因此也存在上述問題,另外聚類算法需要假設變量之間相互獨立(Jedidi et al.1997)[2],但是調查數據很難滿足這一點。先驗式分類和聚類式分類的諸多不足促使研究者尋找一種根據顧客內部特征的分類方法,結構方程模型恰好能描述顧客的內部特征,因此便成為學者們首先考慮的對象。
用結構方程模型探究顧客內部特征時,一般默認為總體是同質的,建立一個總結構模型就以概括總體的特性。然而現實總體可能是由幾個不同質的次級總體(類)混合而成,每個次級總體所包含顧客的行為相似,但是次級總體之間有明顯的差異。建立一個總體模型會把次級總體之間的差異中和,總體模型表現出的“共同規律”只能使管理者了解總體的大致輪廓,對具體決策而言并無多大幫助。如果能把現實中存在的“類”找到,總結出各類所具有的特征,管理者根據不同類的特征采取針對性的策略,那意義無疑是巨大的。
結構方程模型有兩大類估計方法:基于協方差的最大似然估計和基于主成分的偏最小二乘估計。前一種方法在求解過程中嚴格依賴協方差矩陣,并假設測量變量呈正態分布,而測量變量的頻數常常為非正態分布。基于偏最小二乘(PLS)的結構方程模型不要求分布,有效解決了變量非正態問題[3],再者基于PLS的結構方程模型能有效應對小樣本問題,使得此方法越來越流行,特別是在顧客滿意度領域,著名的美國顧客滿意度指數(ACSI)正是采用了PLS算法。
協方差的結構模型是比較傳統的方法,學者首先對基于這種方法的顧客分類進行了一系列研究,但始終無法有效解決分布問題,因而近幾年基于偏最小二乘結構方程模型(PLS-PM)的分類成為學者們研究的焦點。Hahn(2002)提出了有限混合偏最小二乘法(FIMIX-PLS)[1],將協方差結構方程模型中的有限混合分類方法擴展到PLS結構方程模型的分類中,開啟了基于PLS結構方程模型框架下顧客分類研究的先河。有限混合模型把總體當成是兩個或以上次級總體(類)的混合,而每個次級總體都服從一個特殊的分布。Hahn認為顧客之間的差異源于內部特征以及特征之間關系的不同,所以他把潛變量作為研究基礎,假設內生潛變量服從有限混合多元正態分布,計算每個樣本屬于不同類別的概率。Ringle[4](2006)等人對FIMIX-PLS方法進行了改進,但仍沒有克服FIMIX-PLS的主要不足:假設內生潛變量呈正態分布;認為所有類別的測量模型是一致的;分類數量事先不知道,需要借助AIC、BIC等規則加以確定。
與FIMIX-PLS的概率分類思想不同,一些學者沿用聚類方法中“距離”的概念。 Squillacciotti(2005)把偏最小二乘分類回歸方法(typological regression)引入到結構方程中,提出了PLS-TPM,這是一種預測導向的、不假設分布的、基于響應的分類技術[5]。PLS-TPM分類的基本過程是,對初始分類分別建立結構方程模型,根據每個樣本到各類模型“距離”遠近重新分配樣本,一直重復建模和分配過程直到各類的構成不再變化。
PLS-TPM與FIMIX-PLS相比有3個優點:對變量不要求分布;考慮到各類測量模型的差異而不是僅關注結構模型;各個類模型確定過程是一個不斷迭代優化的過程。PLS-TPM的不足之處:目前只用于“反應式”測量模型中;盡管分類結果通常可以實現,但是迭代過程收斂性并沒有得到證明[6]。Trinchera(2007)對PLS-TPM中的“距離”加以改進,提出了基于響應的分類算法REBUS-PLS[6],此方法具有PLS-TPM所有優點,并進一步提高了分類的效果。
Trinchera等人認為,如果總體中存在不同的類,那么同一類中的樣本就應該具有相似的行為特征,即適用同一個結構方程模型。若樣本都能被正確的分類,那對各個類分別建立結構方程模型要比把顧客錯誤分類或者對所有顧客建模效果好得多。REBUS -PLS分類所用的“距離”是基于結構方程模型整體擬合優度GOF建立的,顯然以擬合效果為分類依據的此分類方法所得到的各類模型的表現,如GOF要比總體模型好很多[6]。
REBUS-PLS是基于PLS結構方程模型完成對顧客的分類。與聚類方法不同,REBUS -PLS中的“距離”是樣本與模型之間的距離,其分類過程可以這樣概括,如果一個樣本對某個類模型的擬合效果比其他類模型都好,就斷定此樣本到這個類模型的距離近,樣本就可以歸到這一類。
結構方程整體擬合優度GOF(Goodness of fit)是測量模型和結構模型的擬合效果指標的幾何平均,是對結構方程模型整體表現效果的評價,具體表達式如下:
基于GOF的思想,Trinchera等人提出的衡量樣本到類模型“距離”的指標CM(closeness measure),公式如下:
i表示第i個樣本,g表示第g類,最大為G。
Pj:第j個潛變量的顯變量個數,J:潛變量總數。
N:樣本量,mg是維數,因為測量模型都是反應式所以默認為1。
CM式的左半部分表示在第g類模型的構建下,第i個樣本的測量殘差與所有樣本測量殘差均值的比值,值越小說明將第i個樣本歸入第g類的理由越充分。右半部分表示在在第g類模型的構建下,第i個樣本的結構殘差與所有樣本結構殘差均值的比值,值越小說明將第i個樣本歸入第g類的理由越充分。綜合兩部分,CM值越小說明歸入某一類的可能性越大,樣本最終分類是選擇其自身在所有可能分類中CM值最小的那一類。
REBUS-PLS算法是一個不斷迭代優化的過程,需要設置精度和最大迭代次數。在開源的R軟件中可以找到實現的程序包。
1)根據已構建好的概念模型估計總體PLS結構方程模型。
2)計算所有樣本的測量殘差(communality residuals)和結構殘差(structural residuals),對所得殘差進行分層聚類,確定各樣本的初始分類和總體的類數G。
3)對G組樣本分別建立類模型。
4)計算每個樣本到各個類模型的CM值,將樣本分配到CM值最小的那一類中。
5)計算樣本的分類變化情況,若變化率小于設定精度或者達到最大迭代次數則計算停止,否則返回3。
“距離”CM的定義保證了分類模型的效果,與PLSTPM一樣,REBUS-PLS方法只適用于測量模型是反應式的情況,收斂性也沒有得到證明,Trinchera等人發現此方法在現實應用中一般是收斂的。
為了了解顧客滿意度,2008年國外S銀行設計問卷并調查取得了1300個銀行顧客的數據。問卷采用了11級李克特量表。根據歐洲顧客滿意度模型(ECSI),作者將問卷所有問項劃分為品牌形象、顧客期望、感知質量、感知價值、顧客滿意、顧客忠誠六個子量表,具體對應關系如表1所示。
分別對6個子量表的結構效度和信度進行檢驗,結果如表1。
表1 問項與潛變量對應關系Tab.1 Description of the manifest variables for each of the latent constructs
6個子量表中,Cronbach’α值都遠超過0.7的標準,說明各個子量表的內部一致性非常好。各問項的因子載荷除了“產品和服務的可靠性”一項為0.703外,其余均大于0.71。綜上所述6個測量模型(子量表)的信度和效度均達到了預期的效果。
作者構造的S銀行顧客滿意度模型與ECSI基本一致,但沒有顧客抱怨這一潛變量。采用R軟件中的PLSM程序包進行偏最小二乘路徑分析,潛變量之間的關系及路徑系數見圖1。
圖1 S銀行顧客滿意度模型Fig. 1 Customer satisfaction model of the S bank
5個內生潛變量的擬合優度(R2)在0.43到0.67之間,說明每一個潛變量都可以很好的被其他潛變量所解釋,結構模型的構建較為合理。6個潛變量的平均方差提取量(AVE)在0.61到0.84之間超過了0.5,說明測量模型的構建合理。對結構方程模型中的載荷系數和路徑系數進行bootstrap非參檢驗,在5%的顯著性水平下,所有系數都通過了檢驗,說明結構方程模型整體是非常穩健的。在此結構方程模型基礎上對顧客分類,其結果是可信的。
對所有樣本進行分層聚類,從聚類效果看,分成3類更合理,所以按分層聚類的結果首先把顧客分成3類,然后用REBUS-PLS方法優化分類,迭代23次后分類變化率為0.1%,分類完成。總結構模型與分類模型的路徑系數等結果如表2。
表2 總體與分類模型路徑系數Tab.2 Path coeff i cients of the path models for global and local model
對比3類顧客結構方程模型的路徑系數,可以發現每一類顧客都有各自的特點。就第一類顧客而言,品牌形象對顧客滿意的影響是所有分類之中最高的,達到了0.281,但是此類顧客的感知質量對顧客滿意的影響是所有類中最低的為0.083。由此可以推斷,第一類顧客非常注重企業的品牌形象,而不太在意企業提供產品和服務的質量。第二類顧客的感知價值和感知質量對顧客滿意的影響都是所有類中最高,分別為0.508、0.392,而品牌形象對顧客滿意是3類中最低的,可以推斷此類顧客非常重視銀行為他們提供的產品和服務的質量,而不太在意銀行的形象。第三類顧客的品牌形象對顧客忠誠影響程度是3類中最高的,為0.337。
分類模型的GOF值平均為0.648,高于原總模型的0.630,說明按此方法對顧客分類,能夠找到內部特征相似的顧客群體,GOF值證實了這一點。
通過對比各類顧客的結構方程路徑系數,可以發現3類顧客有各自的內部特征,除內部特征外,了解各類顧客的外部特征對新顧客的分類也具有十分重要的意義。作者利用年齡、性別、受教育程度等人口統計特征與類別做分析,并沒有發現十分有價值的規律。
3類顧客沒有各自的人口統計特征,作者又轉而探究問卷的問項與分類的關系。體現顧客忠誠的“選擇別的銀行可能性”問項與類別的頻數統計結果如表3,其中問項從“0一定會”到“10一定不會”分別體現了顧客的忠誠程度。
分析表3可以看出,第三類顧客在這一問項中有73.7%的人選擇了7到10,說明第三類人因為該銀行良好的品牌形象成為忠實的顧客。第一、二類人大多分布在5到8分之間,這兩類人的忠誠程度還有待提高。由于第二類顧客很重視產品或服務的質量,因此銀行在面對第二類顧客時,需要在感知質量和感知價值做出比一般顧客更多的努力,這并非是顧客歧視,而是有針對性的采取措施留住顧客。另外第一、三類人都非常重視品牌形象,因此該銀行有必要為打造自己良好的品牌形象付出更多的努力。
表3 三類顧客忠誠度統計表Tab.3 Loyal table for three segmentations
文中介紹了基于結構方程模型分類的新方法-REBUSPLS,并用此方法對S銀行顧客分類,結果顯示這種顧客細分方法能夠找到有相似內部特征的顧客群體,通過對比結構方程模型,可以找到各類顧客各自的特點,這樣針對不同類的顧客就可以找到相應的應對措施,以最大程度降低成本提高決策的有效性。另外,此方法的不足之處是收斂性需要在實踐中得到檢驗。
[1]Hahn C,Johnson M, Herrmann A,Huber F.Capturing customer heterogeneity using a finite mixture PLS approach [J].Schmalenbach Business Review 2002,54(3):243-269.
[2]Jedidi K,Jagpal SH,De Sarbo WS. Finite-mixture structural equation models for response-based segmentation and unobserved heterogeneity[J].Marketing Science(1986-1998)1997,16(1):39-60.
[3]林盛,劉金蘭,韓文秀.基于PLS結構方程的顧客滿意度評價方法[J].系統工程學報,2005,20(6):653-656.
LIN Sheng,LIU Jin-lan,HAN Wen-xiu.Method on customer satisfaction assessment based on the partial least square for structual equation[J].Journal of Systems Engineering,2005,20(6):653-656.
[4]Ringle C M,Wende S,Will A.Finite mixture partial least squares analysis:Methodology and numerical examples[C]//In Esposito Vinzi V (Eds.),Handbook of partial least squares:Concepts,methods and applications in marketing and related fieldsforthcoming,Berlin et al: Springer,2007.
[5]Squillacciotti S.Prediction oriented classification in PLS Path Modelling[C]//In:Proceedings of the PLS’05 International Symposium,2005:499-506.Aluja T, Esposito Vinzi V(Eds.),SPAD Test &Go.
[6]Squillacciotti S,Trinchera L,and Esposito Vinzi V.PLS Typological Path Modeling:a model-based approach to classification[C]//In:Electronic Proceedings of the Workshop on Knowledge Extraction and Modeling (KNEMO),Esposito Vinzi V,Lauro C, Braverman A(Eds),2006.
[7]Trinchera L,Squillacciotti S,Esposito Vinzi V and Tenenhaus M.PLS path modeling in presence of a group structure: REBUSPLS,a new response-based approach[C]//In:Proceedings of the PLS’07 International Symposium,2007:79-82.Martens H,Naes T(Eds),Matforsk, As,Norway.
Customer segmentation based on the REBUS-PLS method
YU Wei-jie
(College of Management and Economics,Tianjin University,Tiangin300072, China)
This paper introduce REBUS_PLS to the customer segmentation.REBUS_PLS is a totally new method based on the Structural Equation Modeling to find out the differences between people.It shows excellent effects when using this method to solve the customer segmentation problem in S bank.
customer; segmentation; REBUS-PLS; satisfaction
TN-9
A
1674-6236(2014)07-0008-04
2013-09-03稿件編號201309017
國家自然科學基金資助項目(70672027)
于偉杰(1988—),男,山東青島人,碩士。研究方向:顧客細分。