湖州師范學院醫學院(313000)
王麗娜△ 李莎莎
結構方程模型在修正和中介作用分析中的誤區和對策*
湖州師范學院醫學院(313000)
王麗娜△李莎莎
結構方程模型(structural equation modeling,SEM)作為多變量資料統計分析技術之一,其在營銷學、心理學、管理學、社會及行為科學等領域的量化研究上已成為主流分析技術。近5年,在生物-心理-社會醫學模式的指導下,SEM在醫學相關領域的科研工作中應用活躍,包括醫療糾紛、職業倦怠感、心理健康狀況、自我管理行為等變量的成因分析或中介機制的探索,以及量表結構效度評定的驗證性因素分析。本文在廣泛參閱國內外SEM相關著作及文獻的基礎上,對SEM在科研工作中的應用誤區進行剖析,以減少SEM的分析判斷失誤,提高其統計分析質量,使各學科研究過程更為科學、規范。
1975年瑞典統計學家J?reskog[1]首次開發了用于分析多指標變量之間復雜關系結構的多元統計分析方法SEM。該技術是結合證實性因素分析與回歸分析或路徑分析而形成。根據不同的統計分析目的,SEM的功能可劃分為:(1)陳述、估計以及檢驗變量之間線性關系與非線性關系的假設[2];(2)檢驗觀察變量與潛變量之間關系的假設[3];(3)同步檢驗一組觀察變量或潛在變量之間的直接效果及間接效果的假設[4]。SEM統計分析的目的與回歸分析相似,但由于其在使用上同時考慮了模型的交互作用、非線性關系、自變量相關、測量誤差、測量誤差相關、多指標的外生潛在變量及多指標的內生潛在變量,因此SEM的統計分析過程更為嚴謹,結果更具有說服力,尤其適用于科學研究中以問卷或量表測量為手段的研究變量間關系的分析。
SEM作為第二代統計技術,其與SPSS/SAS等第一代統計技術相比,具有2個顯著的優勢。
1.SEM較SPSS/SAS更為嚴謹
SPSS/SAS只能分析觀察變量,對于潛在變量的分析,將通過各維度題目加總后再代入多元回歸方程[5]。各維度分數加總即承認了每個題目的信度均為100%的假設,鑒于隨機誤差及系統誤差的存在,這種假設是不切實際的,特別是通過問卷量表、測評獲取的資料。同時,SPSS/SAS只能分析變量之間的直接效果,無法分析間接效果。在可能存在間接效果的模型中,需要執行兩次回歸才能完整分析出所有變量之間的關系。同一模型進行兩次統計推斷,將導致I型錯誤的增加。SEM考慮了觀察變量的估計殘差,能夠反應樣本資料的真實情況,因此估計的偏差較小,結果更為嚴謹。
2.SEM圖形輸出簡潔,易于理解
SEM可以根據模型圖上的執行結果迅速判讀變量(觀察變量或潛在變量)之間的相關程度及影響方向,并可以直觀地顯示中介效果或干擾效果。SPSS將多個變量納入回歸方程,統計結果缺少圖形呈現功能,此時,多數學者的做法是通過繪制路徑分析圖加以呈現各變量間的影響方向,但路徑分析圖忽略了自變量間的共線性。Raykov[6]認為,當多個自變量同時估計因變量時,自變量之間不可能完全獨立。因此,Raykov團隊在制定SEM模型估計準則時強調:自變量間的共變是結構方程模型估計的參數,如果自變量間的共變性被忽略,將造成估計上的偏差。
“結構方程模型”、“影響因素”、“中介效應/機制”、“探索性因素分析”及“驗證性因素分析”檢索近5年科研文獻,通過專家咨詢及文獻佐證,本研究共總結3點SEM的使用誤區。
1.模型修正過程中對修正指數的指導作用尚不明確
通過樣本數據構建的結構方程模型不一定均符合研究的預期或理論假設。此時,研究者需進行模型修正。模型修正可依據既往研究的理論基礎,增加或刪減變量,以實現模型和數據的擬合;或通過SEM軟件產生的參考指標對配適度不良的模型加以修正。修正指數(modification indices,MI)是模型修正的常用參考指標,一般SEM軟件均可提供。MI利用資料驅動的方式,改變指標之間的關系以達到改善配適度的目的。MI主要提供兩個修正檢驗值:變量之間的相關及殘差獨立的相關。因此,MI值將建議增加相關以達到改善模型的目的。既往科研文獻呈現的結構模型圖常存在同一潛變量下觀察變量間殘差獨立相關,或不同潛變量的觀察變量間殘差獨立相關。
這種做法有2點質疑之處:如果修正的模型中潛變量下的觀察變量間殘差獨立相關,即承認了觀察變量間的相關性,那么,研究者為何在理論假設模型構建之初沒有考慮到這種相關性;(2)按照MI增加相關的建議,模型依據某一特定的樣本進行修正后,修訂后的模型是否穩定,即是否同樣適合于研究總體中抽取的其他隨機樣本?這便引發模型是否是隨機產生的問題。因此,模型修正不能僅靠模型估計復雜化的手段以改善模型配適度[7]。正如Diamantopoulos[8]在其評論中強調,除非存在清晰而具體的理論基礎提供支持,否則,無論MI提供增加相關的建議多誘人,都應加以嚴格拒絕。在此背景下,Hu[9]提議,進行量表結構效度檢驗時,參照MI建議的增設相關,可以認定同一構面(即一個維度或因子所包含的條目形成一個構面,或一個潛變量所包含的數個觀察變量形成一個構面)的兩個題目較為相似,建議刪除其中一個題目。這一提議,為模型修正提供了一條科學的路徑,并在后期多項研究中得到了廣泛運用[10-11]。
2.研究變量間中介作用/效果的顯著性缺乏科學的統計推斷
中介變量是社會科學領域中研究變量間關系時重點關注的一個因素。其意義在于:(1)中介變量意味著自變量對因變量影響的一種內在機制,能夠解釋兩個變量之間“如何”及“為何”發生關系的過程;(2)如中介效果顯著,便可通過中介變量尋找更多影響中介變量的自變量,這將有助于對因變量進行更為全面而深入的研究;(3)以實務統計角度分析,對中介變量的調整及操控,可以對因變量發揮預測及控制作用。
自變量X對因變量Y的作用包括直接效果(c′)、間接效果(a×b)和總效果(c),其中直接效果及間接效果的識別是中介效果檢驗的主要工作。自SEM方法引入科學研究以來,中介效果的統計推斷技術大體經歷了3種方法的變革。
(1)因果法(B-K method)
Baron和Kenny[12]最早提出了中介作用的因果檢驗法。該方法通過建立三個回歸方程式,憑借回歸系數對中介作用的顯著性進行判定。Me中介作用檢驗的具體操作過程:
(1)Me=aX+ε……1→a≠0 且顯著;
(2)Y=cX+ε……2→c≠0 且顯著(總效果);
(3)Y=bMe+c′X+ε…3→b≠0 且顯著,
如c′≠0 為部分中介效果,c′=0 為完全中介效果
a、b均顯著,表明中介效果存在,c′如顯著,則中介變量發揮部分中介作用,如不顯著,則發揮完全中介作用。在某些學科的科研中,一些研究者多憑借路徑分析技術,在因果法原理的指導下檢驗中介效果的顯著性。伴隨著SEM應用技術的日趨成熟,因果法的局限性逐漸暴露,包括:(1)因果法檢驗中介效果的必要前提為c顯著,但在一些實際情況中,由于抑制效應的存在[13],盡管c不顯著,仍然存在實際意義上的中介效果;(2)X對Me的作用(a)顯著,Me對Y的作用(b)顯著,但卻無法保證X通過Me對Y的作用(a×b)顯著。實際上,因果法并沒有對中介效應(a×b)的顯著性進行檢驗。
(2)系數乘積法(sobel test)
基于因果法無法實現a×b顯著性檢驗的功能,針對a×b顯著性檢驗的系數乘積法[14]應用而生,即系數乘積法。具體操作過程為:Sobel 檢驗統計量為z值,計算公式z=ab/SEab,
其中,a與b均為非標準化系數,SEa及SEb分別為a與b的標準誤,在α=0.05的檢驗水準下,z值>±1.96即為中介效果顯著。然而,系數乘積法最大的缺陷在于其在使用條件上要求樣本服從正態分布。在多數情況下,即使a和b均服從正態分布,a×b通常多不符合正態分布的要求[15-16]。同時,|z|值>1.96在實務上并不代表一定顯著,中介效果在0.05的置信區間上是否顯著,仍有待于檢驗[17]。經回顧,既往多數科研文獻中尚未發現系數乘積法技術的應用。
(3)置信區間法(bootstrapping method)
為解決因a×b非正態分布導致的中介效果顯著性檢驗失效的問題,Hayes[18]提出了bootstrapping技術。該技術的運用原理是以研究樣本作為抽樣總體,經多次重復抽樣(通常為2000次),重新建立起足以代表總體分布特征的新樣本(自舉樣本)。對于一個研究樣本,只能計算某個統計量(例如均值)的一個取值,無法獲知均值統計量的分布情況。但通過bootstrapping技術可以模擬出均值統計量的近似分布。有了這種數據分布便可計算相應的統計量(Z值),用以推測實際總體的情況。同時,bootstrapping技術亦可呈現Z值的置信區間,可進一步用于假設檢驗(a×b的置信區間如不包含0,表明間接效果成立)。
bootstrapping技術比上述2種中介效果檢驗法具備更強的統計功效。隨著Amos軟件功能的不斷拓展,bootstrapping抽樣法對中介效果的檢驗得到了廣泛應用。然而,近5年的醫學相關學科,甚至是某些人文社會學科的科研文獻中,鮮見bootstrapping技術的運用與報道。鑒于bootstrapping技術精準的統計分析質量,有必要在某些學科的科研中,特別是中介效應探索的研究中進行推廣。
3.忽略多因子無因果中介模型的中介效果檢驗過程
bootstrapping技術僅用于驗證單因子中介效果,對于多因子無因果中介模型的中介效果檢驗目前應用最為廣泛的技術,即Preacher等[19]提出的SPSS Syntax語法編輯技術,分別評估不同中介變量遠程特定的間接效果。既往醫學相關學科的科研文獻中(亦包括某些人文社會科學文獻),雖有雙因子無因果中介模型的構建,但尚未采用任何技術對各項中介因子的間接效果進行單獨剖析,從而無法純化單一中介因子對因變量變異的貢獻程度。
SEM技術在各學科科研中的應用日趨廣泛,其在潛變量與觀察變量間的結構分析中以及潛變量間的關系分析中顯示了強大而精準的統計優勢。在SEM的應用過程中,應妥善處理MI的建議,并按照相應的統計程序對中介作用進行顯著性檢驗,從而強化SEM技術的規范化使用,以提高其在科研中的統計判斷效能。
[1]J?reskog KG,Goldberger AS.Estimation of a model with multiple indicators and multiple causes of a single latent variable.Journal of the American Statistical Association,1975,70(351):631-639.
[2]Rigdon EE.Structural equation modeling:In modern methods for business research quantitative methodology.New Jersey:Lawrence Erlbaum Associates,1998:251-294.
[3]Hoyle RH,Panter AT.Writing about structural equation models,in structural equation modeling:concepts,issues,and applications.California:Sage publications,1995:158-176.
[4]MacCallum RC,Austin JT.Applications of structural equation modeling in psychological research.Annual Review of Psychology,2000,51:201-226.
[5]Hair JF,Anderson RE,Tatham RL,et al.Multivariate data analysis 5nd ed.New Jersey:Prentice Hall,1998:224-238.
[6]Raykov T,Marcoulides GA.A first course in structural equation modeling.New Jersey:Lawrence Erlbaum Associates,2006,210-224.
[7]MacCallum RC,Roznowski M,Nwcowitz LB.Model modifications in covariance structure analysis:The problem of capitalization on change.Psychological Bulletin,1992,111:490-504.
[8]Diamantopoulos A,Siguaw JA.Introducing LISREL:a guide for the uninitiated.California:Sage publications,2000:148-157.
[9]Hu L,Bentler PM.Cutoff criteria for fit indices in covariance structure analysis:Conventional criteria versus new alternatives.Structural Equation Modeling,1999,6(1):51-55.
[10]Jennifer CE,Kate BC,Lori AF.Development of a decisional balance scale for young adult marijuana use.Psychology Addict Behavior,2011,25(1):90-100
[11]Watt T,Groenvold M,Deng N,et al.Confirmatory factor analysis of the thyroid-related quality of life questionnaire ThyPRO.Health Quality Life Outcomes,2014,12:126.
[12]Baron RM,Kenny DA.The moderator-mediator variable distinction in social psychological research:Conceptual,strategic,and statistical considerations.Journal of Personality and Social Psychology,1986,51(6),1173-1182.
[13]Mackinnon DP,Kbull JL,Lockwood CM.Equivalence of the mediation,confounding and suppression effect.Prevention Science,2000,1(4):173-181.
[14]Sobel ME.Asymptotic intervals for indirect effects in structural equations models.San Francisco:Jossey-Bass,1982:290-312.
[15]Bollen KA,Stine R.Direct and indirects:Classical and bootstrap estimates of variability.Sociological Methodology,1990,20(1):150-140.
[16]Stone CA,Sobel ME.The robustness of total indirect effects in covariance structure models estimated with maximum likelihood.Psychometrika,1990,55(2):337-352.
[17]Mackinnon DP,Lockwood CM,Williams J.Confidence limits for the indirect effect:Distribution of the product and resampling methods.Multivariate Behavioral Research,2004,39(1):99-128.
[18]Hayes AF.Beyond Baron and Kenny:Statistical mediation analysis in the new millennium.Journal of Communication Monographs,2009,76(4):408-420.
[19]Preacher KJ,Hayes AF.Asymptotic and resampling strategies for assessing and comparing indirect effects in multiple mediator models.Behavior Research Models,2008,40(3):879-891.
(責任編輯:劉 壯)
* 本文獲國家社會科學基金項目資助(項目編號:13CRK009)
△ 通信作者:王麗娜,E-mail:aring2000@163.com