付會斌 潘海燕 孔丹莉 丁元林△
結構方程模型(SEM)建模包含內容頗多,如何快速掌握常用的建模方法并用軟件準確實現,盡快產生研究成果和經濟效益是多數初學者頭疼的問題。SEM所包括的類型眾多,不同的模型類別具有其特殊的性質,對結構方程后續分析工作產生較大的影響。按照構成模型變量的性質不同,可以分為結構模型和測量模型;按照反映變量之間的關系不同,可以分為驗證性因子分析和因果關系模型;根據隱變量的層次可以劃分為一階模型和多階模型。本文從模型設定、模型求解、模型擬合以及模型修正等方面來介紹利用SPSS AMOS(analysis of moemnt structure)軟件作為技術工具實現二階驗證性因子模型的基本方法,采用探索性因子分析(exploratory factor analysis,EFA)和驗證性因子分析(confirmatory factor analysis,CFA)相結合的因子分析方法評價量表的結構效度,以期合理和科學地評價CN-ADDQoL量表的因子結構,通過實際的案例分析,以達到快速掌握SEM相關原理和熟悉AMOS軟件的目的。
資料來源為2006年張廣恩〔1〕碩士論文中的調查數據,研究對象為2005年8月至2006年1月廣東醫學院附屬醫院內分泌科確診的2型糖尿病住院和門診病人,共732例。剔除23例記錄不全的病人和12例先發生甲亢等其他疾病后繼發糖尿病或兩者發生的先后關系不明確定的病人,可用于分析的對象共697例,所有病例均填寫基礎調查表和CN-ADDQoL量表。
EFA與CFA是探討所收集資料中隱含的類型或主題的兩個重要方法,EFA可以了解資料的潛在意義是什么,而CFA可驗證根據先前理論提出的假設。針對CN-ADDQoL量表可能獨有的因子結構,本文采用EFA尋找最佳的理論構建,采用 SPSS15.0軟件對CN-ADDQoL量表除兩個獨立分析的條目外,對其余19個條目進行EFA,挖掘出量表所隱含的深層意義與因子結構(哪些條目用于研究哪些公因子?),提出初始模型,采用AMOS7.0軟件構建驗證性因子模型對CN-ADDQoL量表的結構效度進行分析。
由于CN-ADDQoL量表的第9個問題涉及性生活方面,而大多數糖尿病患者為中、老年人,思想觀念較為傳統,此題應答率較低,分析時將此項問題刪除。量表中除了兩個獨立分析的條目外的其余19個條目進行因子分析,公因子的提取原則采用特征根大于1,因子負荷的估計方法采用主成分分析法,公因子涵蓋的子項按因子載荷大于0.4原則入選,因子旋轉采用promax,結果KMO=0.889,Bartlett's球形檢驗的結果P<0.05,提示數據子項間存在相關性,可進行因子分析。提取的四個公因子依其實際意義(括號內為各因子的因子載荷、含義)分別取名為社會關系維度(v6,0.787,家庭生活;v7,0.809,朋友關系和社交生活;v8,0.809,親近的個人關系;v13,0.621,人們的反應)、心理感受維度(v10,0.731,身體外表;v11,0.776,自信心;v12,0.812,動力;v14,0.702,未來的感覺)、軀體生理維度(v1,0.699,休閑活動;v2,0.501,工作生涯;v3,0.822,旅程;v4,0.647,度假;v5,0.523,體力活動)、物質生活維度(v15,0.592,經濟狀況;v16,0.427,不得不依賴他人;v17,0.583,生活狀況和生活條件;v18,0.809,吃東西的隨意性;v19,0.716,喝東西的隨意性),這四個公因子(四個潛在變量)從不同角度反映了糖尿病患者的生存質量狀況。EFA提示該量表應該是一個包含四個維度二級結構的量表,為進一步考核量表的結構效度,采用CFA方法對所得數據擬合。
(1)模型構建及假設
依據理論及EFA分析結果,量表的四個維度高度相關,構建一階四因子CFA模型。對模型做一些規定〔2〕:①每個條目都有一個不是零的負荷量在其所測量的一級因子上,但是對其他的一級因子的負荷量為0;②條目與條目之間所聯結的測量誤差彼此不相關。為解決量尺特質未定性的問題,將某些因子負荷量固定為1,為估計誤差的變異量,將測量誤差的路徑系數全部固定為1,利用AMOS7.0繪制一階四因子模型的路徑圖。
(2)模型擬合過程及結果
采用最大似然(ML)估計對模型進行擬合,為便于比較將模型修飾過程中每步驟的總體擬合指數整理成表1,由表4可知,該模型仍未達到理想,某些模型參數之間必須做修正,將修正指數大于20的方差系數整理,見表1。

表1 模型修飾各步驟的總體擬合指數

表2 初始模型參數修正指數摘要表
MI表示一個先前固定的參數被釋放后,模型重新估計下所降低的最小卡方值。統計上,一個MI可以解釋為一個自由度的卡方分配。由于一個自由度的卡方統計臨界值(α=0.05)為3.84,因此,當MI值大于3.84時就被認為足夠大,而此參數的因果性有足夠的理論支持的話,便可將之釋放,重新估計。由表2可知e13-F3、e13-F2、e5-F2 的 MI值分別為21.334、25.080、22.392,顯示它們各兩項之間存在密切關系,但該結果違反SEM的基本假設:殘差與因子間無相關,故不可以釋放估計。e18-e19的MI值為83.470,該值很大,查看量表中18題題目(如果我沒有患糖尿病,我吃東西的隨意性將會?),與19題題目(如果我沒有患糖尿病,我喝東西的隨意性將會?)發現兩題內容雖不完全相同,但都為測量飲食方面對患者生存質量的影響,在此考慮下,對e18和e19的變量先釋放,接著查看其適配度的變化。e18和e19的變量釋放后,其各項擬合指數見表3,其中χ2RMR、AIC比變量釋放前變小,而這三個值愈小愈好,PNFI 、GFI、AGFI、NFI、RFI、CFI較釋放前變大,但NFI、RFI仍未達到0.90的臨界標準,說明該修正模型雖有改善,但仍需對部分變量進行修正。

表3 釋放e18-e19后模型參數修正指數摘要表
由表3可知,e6和e13的MI仍較大,查看量表6題目(詢問患者家庭生活)與13題題目(詢問人們對患者的反應),從兩題題意人們對患者的反應可能影響其家庭生活,即兩者存在相關,故釋放e6和e13。

表4 釋放e6-e13后模型參數修正指數摘要表
由表4可知,e11和e12的MI仍較大,查看量表11題題目(詢問自信心)與12題題目(詢問動力),從兩題題意知人們的自信心與動力可能會相互影響,即兩者存在相關,故釋放e6-e13。
AMOS7.0中可輸出未標準化和標準化的模型,選擇標準化的路徑圖(圖1)可顯示標準化的回歸系數、相關系數以及R2。由圖1可知,有些指標的信度似乎不是非常理想(λ值未大于 0.70,R2未大于0.50),且四個潛在變量的相關系數均不小(介于0.59~0.78),提示該模型可能具有更高層次的因子結構。

圖1 一階驗證性因子終模型標準化路徑系數估計結果
(1)模型構建及假設
依據理論及一階CFA分析結果顯示,四個潛在變量的相關系數均不小(介于0.59~0.78),提示該模型可能具有更高層次的因子結構,構建糖尿病患者生存質量的二階四因子CFA模型。模型的假設如下:(1)2型糖尿病患者生存質量可由四個一階因子及一個高階共同因子說明。(2)每個題目沒有橫跨因子的現象,即每個題目均落在所構建的單一因子上。(3)誤差項間獨立無關。利用AMOS7.0繪制二階四因子CFA模型的路徑圖。
(2)模型擬合過程及結果
采用ML估計對模型進行擬合,AMOS的主要的擬合指標如下:χ2=502.568,GFI=0.925 ,AGFI=0.902,RMR=0.289,NFI=0.868,RFI=0.846,CFI=0.898,PNFI=0.734,AIC=582.568。結果顯示,該模型仍未達到理想,顯示某些模型參數之間必須做修正。
根據AMOS提供的修正指數,結合專業知識,將某些誤差變量之間的固定參數釋放為自由參數等,然后再進行模型擬合,如此反復修改,最終結果見圖2。該模型的初始與最終模型的總體擬合指標見表5。從表5可知,最終模型的總體擬合在可接受范圍內,其中GFI=0.935,AGFI=0.937,NFI=0.919,CFI=0.950,均比要求值高,說明所得模型較為理想。
眾所周知,不同人群使用同一份已被證實具有較好信度及效度的量表,結果可能有所不同。因此,對引進量表的結構效度進行評價,以確保結果的準確性與可靠性是必不可少的。由于地區文化背景、風俗習慣和研究對象的差異,CN-ADDQoL量表可能有其獨有的因子結構。Garratt等[3]根據其制定的選入和剔除標準,從量表的信度、效度、反應度等方面對ADDQoL量表進行了評價,認為該量表是單維度的。孔丹莉[4]等將該量表按條目含義分為幾個維度,然后進行CFA,數據擬合較好,但無法挖掘出中文版量表的因子結構。本文采用EFA對CN-ADDQoL量表的因子結構進行分析,提取出四個公因子依其實際意義分別取名為社會關系、心理感受、軀體生理、物質生活,這四個維度從不同角度反映了糖尿病患者的生存質量狀況,結果提示量表應該是一個包含四維度二級結構的量表。按照社會心理流行病學理論,2型糖尿病患者軀體生理方面的生存質量與心理感受方面的生存質量彼此依存、互為因果,若人為割裂它們之間因果關系,把其中某一個單獨作為因變量來分析研究,其結果必然是片面的、不切實際的。

表5 二階驗證性因子模型始模型與終模型總體擬合指標

圖2 二階驗證性因子終模型標準化路徑系數估計結果
依據上述理論及EFA分析結果,量表的四個維度具有高度相關,構建糖尿病患者生存質量的一階四因子CFA模型,一階四因子修正模型與資料擬合較好,是一個可行的模型,由模型修正后的終模型知:測量誤差間并非完全是獨立無關的,而是存在部分相關,可能是受試者本身問題造成(如誤答、猜答等)。四個因子的相關系數均不小(介于0.59~0.78),提示該模型可能具有更高層次的因子結構,從而構建并擬合了糖尿病患者生存質量的二階四因子CFA模型。比較一階和二階驗證性因子模型終模型的總體擬合指標提示:兩者的最終模型相似且最終擬合指標相差不大。從卡方值看,兩模型自由度不同,卡方值相差不大;從GFI和TLI兩指標看,一階因子模型好于二階因子模型;而從AGFI、NFI、CFI等指標看,二階因子模型又好于一階因子模型,很難判斷哪個模型更能反映該量表的結構。在驗證性因子分析時,當模型只有3個一階因子時(共有3個相關),二階因子模型在數學上等同于一階因子模型。本次研究中兩最終模型只含有4個一階因子,由二階因子模型來看,二階因子與一階因子關系很強(0.76,0.77,0.95,0.80),則二階因子能夠充分表達一階因子間的關系,且一階與二階因子模型擬合指數相差不大,可認為由單一高階因子表達并無不可。因一階因子模型是一個更為省儉的模型,可以用更少的參數表達變量的關系,故選取一階驗證性因子模型更合理些。
實際上,EFA和CFA是研究過程的兩個階段[5],不能截然分開。只有兩者結合運用,才能相得益彰,使研究更有深度。一般來說,如果研究者沒有堅實的理論基礎支撐,應先用探索性因子分析產生若干關于內部結構的理論,再在此基礎上進行驗證性因子分析[6]。本文使用EFA和CFA相結合的方法評價CNADDQoL量表的結構效度,結果提示該量表具有較好的結構效度,構建的一階和二階驗證性因子模型擬合都較好,可認為該量表從四個不同的方面反應了糖尿病患者的生存質量,在CFA過程中,構建的一階和二階CFA擬合都較好,可認為該量表從四個不同的維度反映了糖尿病患者的生存質量,而這四個維度又反映了一個總的生存質量,各條目包含了心理健康和社會功能。研究2型糖尿病患者生存質量的影響因素時,為發現同一因素對患者不同維度生存質量的影響因素,把CN-ADDQoL量表判定為四維度量更為合理。根據相關的專業知識和有關的文獻回顧可認為2型糖尿病患者軀體生理方面與心理感受方面的生存質量相互影響,社會關系方面和物質生活方面的生存質量對軀體生理方面、心理感受方面的生存質量有影響,物質生活方面對社會關系方面也有影響。整體來看,2型糖尿病患者四個方面的生存質量存在相互影響、相互依存的關系,一個方面的生存質量對另一個方面的生存質量,不但有直接作用還有間接的作用,這提示我們對于2型糖尿病患者如果暫時無法直接改善某一方面的生存質量時,可通過改善其他方面的生存質量來間接加以改善。
1.張廣恩.糖尿病特異性生存質量量表的引進及探討2型糖尿病患者生存質量影響因素的結構方程模型.廣東醫學院碩士論文,2006.
2.李茂能.結構方程模型軟件AMOS之簡介及其在測驗編制上之運用:Graphic &Basic.臺北:心理出版社,2006.
3.Garratt AM,Schmidt L,Fitzpatrick R.Patient-assessed health outcome measures for diabetes a structured review.Diabet Med,2002,19(1):1-11.
4.孔丹莉,張廣恩,潘海燕,等.糖尿病特異性生存質量量表的信度與效度初探.中國慢性疾病預防與控制,2007,15(3):202-204.
5.李燦,辛玲.調查問卷的信度與效度的評價方法研究.中國衛生統計,2008,25(5):541-545.
6.付會斌,孔丹莉,潘海燕,等.非線性結構方程模型的研究進展.中國衛生統計,2010,27(1):101-103.