斯介生 肖宏偉 蔣遠營
摘要:文章在總結近年來文獻成果的基礎上,通過分析兩類結構方程模型的理論本質,指出了這兩種方法在綜合評價實踐中的問題,并給出正確運用這兩類方法進行綜合評價的建議。文章認為,基于協方差分析的結構方程模型(CB-SEM)適用于評價多個指標的相關結構。而基于偏最小二乘的結構方程模型(PLSPM)適用于構建綜合指數進行綜合評價。
關鍵詞:協方差分析;偏最小二乘;結構方程模型;綜合評價
一、 引言
近年來,綜合評價方法有了更多的發展。更為復雜的統計模型被引入到綜合評價領域,其中,結構方程模型就是最近幾年經常被用于綜合評價的新方法之一。結構方程模型是潛變量模型與路徑分析模型的結合,可以分析不能被直接觀測的潛在概念間的關系,因而在社會學、心理學、教育學、市場研究等學科中有著獨特優勢。從參數估計的角度分,有兩種類型,一種基于方差-協方差分析(CB-SEM),另一種基于偏最小二乘(PLSPM)。通過查閱近幾年的文獻發現,兩類方法的綜合評價研究都有不少成果。例如,前者的文獻涉及的領域有:醫學(劉享輝等,2009;劉嶺等,2009),教育(周平紅等,2011;王理峰,2012),管理(任飏等,2007;谷曉燕,2009),經濟發展(高文杰和高旭,2010;張瑛和王惠文,2008),競爭力評價(易麗蓉,2006;羅玉波和王玉翠,2013)等等。后者涉及的領域有:醫學(楊威和張拓紅,2012),教育(孫繼紅等,2010),管理(莫一魁和沈旅歐,2009;鮮思東和彭作祥,2011;林盛,劉金蘭和韓文秀,2005;關子明等2009,區晶瑩等,2011),經濟發展(阮敬和紀宏,2006)等等。可見,兩類方法在綜合評價應用的領域有很多交叉。并且,從目前的研究成果可以看出,兩類方法進行綜合評價的方式也基本類似,都通過設計指標體系,建立理論模型,然后計算綜合指數得分實現綜合評價。但是,從統計學方法論角度而言,這兩類方法的除了目標都是路徑模型之外,沒有任何內容上的交叉(吳喜之,2013),因此模型的實質和解釋都有很大差異。為此筆者認為,在綜合評價實踐中,兩類方法不能用相似的方式應用,但是如何區分對待?目前為止,鮮有文獻對此問題做出明確回答。本文將圍繞該問題,結合結構方程模型理論要點和綜合評價要求,分析如何正確使用這兩類結構方程模型進行綜合評價,并給出建議。
二、 兩類結構方程模型的理論要點
雖然兩類結構方程模型在理論上有差別,但是在實際建模中,都需要事先設計指標體系,設定理論模型,才能進行估計。指標體系和理論模型的設定由實際問題的理論背景支撐,模型的估計有現成的軟件,例如CB-SEM的常用軟件有AMOS,而PLSPM則有smartPLS等,因此,應用這兩類方法正確與否的關鍵在于對模型估計的理解。為此我們分析兩類結構方程模型參數估計的理論要點。
1. CB-SEM的參數估計。CB-SEM由結構模型和測量模型組成,分別刻畫潛變量與潛變量之間的關系,潛變量與可測變量之間的關系。建模時,需要對可測變量劃分為不同的組,每組對應一個潛變量,并且設定好潛變量與可測變量以及潛變量與潛變量之間的關系。關于模型的表達式參見易丹輝(2008)。關于模型的參數估計,有很多種方法,在實際應用中常見的估計方法為似然方法,其擬合函數為:
FML=ln|?撞(?茲)|+tr(S?撞-1(?茲))-ln|S|-(p+q)
這里的p和q分別為內生可測變量和外生可測變量的個數。還有一些其他方法,如未加權最小二乘,擬合函數為:
FULS=■tr[(S-?撞(?茲))2]
以及使得擬合函數
FGLS=■tr{[(S-?撞(?茲))W-1]2}
最小的廣義最小二乘方法。此外,還有利用工具變量的兩步最小二乘等。其中,S為總體協方差矩陣,用樣本協方差矩陣代替。?撞(?茲)為模型預測值的協方差矩陣,含有未知參數?茲,這些方法最終都可以歸結為?撞(?茲)與S盡可能接近的原理,即協方差矩陣的重復問題。如果模型是正確的,協方差矩陣就可以被準確地重復出來,這是CB-SEM參數估計的出發點和核心。
我們指出兩點需要注意的地方:
(1)由模型產生的協方差矩陣?撞(?茲)重復的是總體協方差矩陣S,但是在實際應用中,總體協方差矩陣不可能知道,為此實際中的S是樣本協方差矩陣。這就導致了代替的合理性問題,即樣本協方差矩陣能在多大程度上反映總體協方差矩陣呢?這個問題很難回答,但是如果樣本量不夠的話,代表性一定不好。這就要求在實際中使用大樣本,使得樣本協方差矩陣能夠更好地刻畫總體協方差矩陣。
(2)可測變量的總體協方差矩陣刻畫了各變量間的相關關系,因此,?撞(?茲)對總體協方差矩陣的重復本質上是用總體協方差矩陣去考察模型所設定的不同組可測變量間關系的合理性,如果參數通過顯著性檢驗和合理性檢驗,就認為模型設定的關系得到了總體信息的驗證。這意味著CB-SEM首先是一種驗證性的方法,驗證的是模型設定的結構。本質上是各可測變量間的相關關系。為此需要注意,CB-SEM只是刻畫了不同組可測變量間的相關結構,并通過潛變量具體表達。至于各組可測變量能在多大程度上被對應的潛變量刻畫,該方法并不能回答。
2. PLSPM的參數估計。相比CB-SEM,PLSPM完全是另外一套邏輯,為了分析其特點,我們通過分析其參數估計過程入手。PLSPM的參數估計由迭代算法完成,分為兩個部分,第一部分是利用一系列最小二乘和加權運算進行迭代,得到潛變量的估計值,第二部分利用第一部分的結果得到路徑模型中的載荷系數和路徑系數。這兩部分中,第一部分是核心。
具體而言,首先要分劃好可測變量的歸屬,一個潛變量對應一組可測變量。假設有Q個潛變量?孜1,…,?孜Q,第j個潛變量對應的可測變量為Xj=(xj1,…,xjpj)′,j=1,…,Q。則有xjh=?姿jh?孜j+?著jh(h=1,2,…,pj)或者?孜j=?撞pjh=1wjhxjh+?著j,前者為反映型(Reflective),系數為載荷;后者為反映型(Formative),系數為權重,選擇何種形式需要根據實際問題決定,這種反映可測變量與潛變量關系的模型為測量模型。其次要設定好潛變量與潛變量之間的關系結構,即?孜i=?撞j≠i?茁ij?孜j+vij。這部分模型稱為結構模型,模型中的系數為路徑系數。潛變量的得分(即潛變量的估計值)是進行綜合評價的關鍵,對其估計通過迭代實現。由三大步驟組成:
外部逼近:
Yj∝■wjhxjh
Yj是?孜j的外部逼近估計量,∝表示左邊是右邊的標準化,Wj=(wj1,…,wjpj)′是外部權重。
內部逼近:
Zj∝■ejiYi
其中,i:i?圮j表示與第j個潛變量直接有關的潛變量的下標。eji是內部權重,有三種不同的形式(Tenenhaus M 2005)。
更新權重:
內部權重由潛變量間的結構決定,迭代過程中需要更新的是外部權重,當測量模型為反映型時,對于xjh,其新權重為以Zj為自變量,xjh為因變量的一元線性回歸系數,但由于Zj被標準化,因此有wjh=cov(xjh,Zj)
當測量模型為構成型時,新的權重以Zj為因變量,與之對應的可測變量xjh為自變量的多元線性回歸的回歸系數,即
Wj=(Xj′Xj)-1Xj′Zj
上述步驟反復迭代,直到權重變化不大,就認為收斂,得到最終的權重估計值,潛變量的得分就是可測變量的加權平均值。
通過上述對迭代過程的描述,我們也得到兩點關于PLSPM的認識:
(1)在PLSPM框架下,沒有涉及總體協方差矩陣。迭代過程完全基于樣本信息展開。事實上,Dijkstra. T(1983)證明,PLSPM的迭代本質上是不動點的迭代算法,具體為:
反映型:Wj∝?撞i:j?圮ieji·SjiWi,其中Wj′SjjWj=1;
構成型:Wj∝S-1jj?撞i:j?圮ieji·SjiWi,其中Wj′SjjWj=1
其中,Sji為第j組可測變量與第i組可測變量的樣本協方差矩陣,Sjj是第j組可測變量的樣本方差矩陣。
因此,PLSPM挖掘的是樣本信息,對樣本量的要求沒有CB-SEM高。
(2)PLSPM的迭代過程本質上通過一系列的最小二乘(OLS)實現,因此不必假定分布。另外,PLSPM的迭代事實上是不斷逼近某個潛變量估計值的過程。每次迭代都適用最小二乘,追求潛變量與可測變量間的距離最小化。因此是尋找最能刻畫可測變量的潛變量的過程。而不是CB-SEM那樣驗證可測變量間相關關系的過程。這意味著兩種方法的目的很不一樣。
三、 綜合評價中實踐中的問題和評述
將結構方程模型引入綜合評價領域的優勢已經被很多學者認同,這是因為,在綜合評價實踐中很多方法都面臨一個共同的問題:很多方法沒有考慮到指標變量之間的相關關系,因此,當所選擇的指標變量集合中存在嚴重的多重相關性時,很可能會夸大系統中某些特征的作用,從而得到不合理的評估結論。王惠文和付凌暉(2004),張瑛和王惠文(2008)都認為結構方程模型可以解決這樣的問題。但是目前很多研究都利用結構方程模型構建綜合指數實現綜合評價,將兩種理論上存在差異的方法以類似的方式進行綜合評價,筆者認為需要推敲其合理性。為此我們提出:CB-SEM和PLSPM是否都可以通過構建綜合指數實現綜合評價?
下面回答這個問題。我們有以下結論:
1. CB-SEM不能用于構建綜合指數。
首先我們要明確綜合評價的要義,蘇為華(2005)指出,綜合評價需要將多個因素和指標綜合起來,因此,綜合方法構成了評價的基本模型。為此,利用綜合指數進行綜合評價時,對指數的基本要求是能夠概括多個指標各方面的信息。
當利用結構方程模型構建綜合指數時,這個要求就變成:首先,每個潛變量是否在某種準則下對其對應的可測變量進行了概括。其次,這些潛變量是否反映了各組可測變量的多重相關性。對于CB-SEM而言,其參數估計方法決定了該方法構建的綜合指數只能反映各組可測指標的多重相關性。這是因為其參數估計依據的優化準則本質上都是使得由模型得到協方差矩陣逼近總體協方差矩陣。如果模型是正確的,那么總體協方差矩陣就能被準確地重復出來(易丹輝,2008),所以,模型正確是指正確反映了各組可測變量的協方差結構,即它們的多重相關性。但是每組可測變量對應的潛變量是否將可測變量的信息進行了充分的概括,我們是不知道的。利用這樣的潛變量得分作為綜合指數不能反映真實情況。事實上,在實際應用中,利用CB-SEM分析數據時,我們只需要知道一個樣本協方差矩陣就可以利用軟件估計。言下之意,我們不用去關心可測指標如何取值,量綱如何等綜合評價中關鍵的問題,只要協方差矩陣相同,即使具體指標完全不同也可以得到相同的估計結果,這個事實反過來說明CB-SEM構建綜合指數是值得商榷的。
2. PLSPM可以構建綜合指數。與CB-SEM不同,PLSPM的參數估計是從潛變量在平方損失角度下概括可測變量的角度出發的,其迭代過程由最小二乘和加權運算構成,本質上是在xjh=?姿jh?孜j+?著jh(h=1,2,…,pj)或者?孜j=?撞pjh=1wjhxjh+?著j中,使得?撞j?撞hE(?著2jh)最小或者?撞jE(?著2j)最小,且結合各潛變量之間的關系不斷迭代實現的參數估計。為此,利用PLSPM得到的潛變量得分是在平方損失意義下對各組可測變量的概括,符合構建綜合指數的基本要求。相對CB-SEM,PLSPM更適合構建綜合指數進行綜合評價。但是需要注意的是,PLSPM的最小化準則是最小化平方損失,雖然在統計學中,這是一種十分常用的方法。例如線性回歸模型、主成分分析、因子分析等都是如此,但是是否適用于綜合評價需要根據實際問題。關于這個問題的討論是多元統計方法應用于綜合評價的共同問題,蘇為華(2000)曾詳細討論。
3. 兩類方法適用性評述。前面已經支出,CB-SEM不適合構建綜合指數,但是不意味著這個方法在綜合評價時就一無是處。通過分析其參數估計的實質,我們認為,CB-SEM適合考察多組可測指標間的多重相關性。如果只是通過相關系數,只能很粗略地知道多個可測變量之間的相關結構。但是通過CB-SEM可以更細致地考察多個可測指標間的復雜結構關系。PLSPM可以用來構建綜合指數,但其參數估計方法決定了其不能像CB-SEM那樣從整體上對所有可測指標的相關結構進行考察,為此有學者認為,兩種方法是互補的(邱皓政,2011)。筆者認為,這種相輔相成性是由于兩種方法處理的問題本質上是不一樣的,實際應用中可以將兩種方法結合起來一起使用,可能效果更好,但目前在學術界沒有看到這方面的研究。
另外,前面分析也指出兩類方法對于樣本和分布的要求是不同的。PLSPM不需要大樣本和分布假定,這被很多人認為是CB-SEM不具備的優勢。筆者認為,進行綜合評價從統計學角度講是利用已有樣本信息,去推測為止的信息,本質上是預測的過程。因此建議,無論用哪一種方法,都盡量使用大樣本,才能得到更加可信的結果。
四、 結論和建議
本文通過分析兩類結構方程模型(CB-SEM和PLSPM)的參數估計理論,明確了兩種方法是兩種不同的方法。結合綜合評價的要求,我們有以下結論:
1. CB-SEM的參數估計過程決定了該方法不適用構建綜合指數,因為其中的潛變量在多大程度上概括了對應的可測變量是不清楚的;
2. CB-SEM適用于評價多組可測指標的多重相關性,利用該方法可以得到多個可測指標間細致的相關結構的刻畫;
3. 相比CB-SEM,PLSPM更適合用于構建綜合指數進行綜合評價。因為,這個方法是基于平方損失下最大化概括可測指標信息實現潛變量得分估計的。符合綜合評價的基本要求。
4. PLSPM沒有從整體上直接對多個可測指標的多重相關性進行刻畫,為此從適用性上,評價多個可測指標的相關結構不如CB-SEM合適。從這個意義上講,兩種方法是互補的。
在實際進行綜合評價時,我們建議,首先需要明確實際問題的側重,如果側重評價多重相關結構,就推薦使用CB-SEM,如果需要構建綜合指數,就使用PLSPM。
參考文獻:
1. 高文杰,高旭.基于SEM的我國重要城市現代化水平綜合評價模型研究.數學的實踐與認識,2010,(18):56-64.
2. 谷曉燕.基于結構方程模型的崗位評價研究.中國管理科學,2009,(2):146-151.
3. 關子明,常文兵,王薇.基于結構方程模型的銀行員工績效考核方法.經濟論壇,2009,(2):108-109.
4. 劉嶺,程迪祥,陳洪,易東.結構方程模型在綜合評價中的應用.自動化與儀器儀表,2010,(2):74-75.
5. 劉亨輝,王建生,周脈耕,王駿,王黎君,胡以松,王玉英,葛輝,楊功煥.結構方程模型在中國居民自報健康狀況評價中的應用.中國健康教育,2009,(5):333-337.
6. 羅玉波,王玉翠.結構方程模型在競爭力評價中的應用綜述.技術經濟與管理研究,2013,(3):21-24.
7. 林盛,劉金蘭,韓文秀.基于PLS-結構方程的顧客滿意度評價方法.系統工程學報,2005,(6):653-656.
8. 莫一魁,沈旅歐.城市公交系統公眾評價的偏最小二乘通徑模型.深圳大學學報(理工版),2009,(4):436-440.
9. 區晶瑩,張淞琳,俞守華.基于偏最小二乘通徑模型的農民工信息能力綜合評價.農業系統科學與綜合研究,2011,(4):495-501.
10. 阮敬,紀宏.基于PLS結構方程模型的中國西部地區經濟發展綜合評價.統計教育,2006,(8):4-7.
11. 孫繼紅,楊曉江,繆榕楠.我國高等教育發展統計特征的PLS通徑模型分析.數理統計與管理,2010,(2):362-371.
基金項目:國家自然科學基金(項目號:11361019);廣西自然科學基金重點項目(項目號:2013GXNSFDA019001)。
作者簡介:斯介生,中國人民大學統計學院博士生;肖宏偉,中國人民大學經濟學博士,國家信息中心經濟預測部助理研究員;蔣遠營,中國人民大學統計學院博士生,桂林理工大學理學院副教授。
收稿日期:2014-09-22。