葉寶娟,楊 強(qiáng)
(1.江西師范大學(xué)心理學(xué)院,江西省心理與認(rèn)知科學(xué)重點(diǎn)實(shí)驗(yàn)室,南昌330022;2.江西師范大學(xué)教育學(xué)院,南昌330022)
信度是衡量測(cè)驗(yàn)質(zhì)量的重要指標(biāo),α 系數(shù)是目前最常用的評(píng)價(jià)測(cè)驗(yàn)信度的指標(biāo),但在題目測(cè)量誤差(簡(jiǎn)稱誤差)相關(guān)的情況下往往會(huì)高估測(cè)驗(yàn)信度,這種高估的偏差可以高達(dá)兩成(Green & Yang,2009;Revelle & Zinbarg,2009;Sijtsma,2009;溫忠麟,葉寶娟,2011)。雖然在大多數(shù)的研究中,假定誤差不相關(guān)是合理的,但在一些情況下誤差之間會(huì)相關(guān),如速度測(cè)驗(yàn)、刺激材料相同的測(cè)驗(yàn)題目、測(cè)驗(yàn)分?jǐn)?shù)有瞬間誤差(transient error,被試對(duì)測(cè)驗(yàn)有某種特殊的感情、態(tài)度等會(huì)影響其測(cè)驗(yàn)分?jǐn)?shù)而產(chǎn)生的誤差)等等(Green,2003;Green & Hershberger,2000;Green &Yang,2009;Steinberg,2001)。在心理與教育中,經(jīng)常使用加入反向題目(negatively worded item)的單維測(cè)驗(yàn),比如感恩測(cè)驗(yàn)、自尊測(cè)驗(yàn)、自我概念測(cè)驗(yàn)、家庭功能測(cè)驗(yàn)等,這類測(cè)驗(yàn)正向題、反向題的誤差也可能存在相關(guān)。在以往的研究中,平衡使用正向題和反向題的單維測(cè)驗(yàn)通常當(dāng)作單維分析,但越來越多的研究者發(fā)現(xiàn)這樣的測(cè)驗(yàn)存在項(xiàng)目表述方法效應(yīng)(method effect),即由項(xiàng)目表述引起的變異,應(yīng)當(dāng)加以控制(DiStefano & Motl,2009;Marsh,Scalas,& Nagengast,2010;Vautier & Pohl,2009;Ye,2009)。檢驗(yàn)測(cè)驗(yàn)是否存在方法效應(yīng)的一種做法是相關(guān)特質(zhì)相關(guān)特性(Correlated - Trait Correlated - Uniqueness,CTCU)模型,把項(xiàng)目表述效應(yīng)當(dāng)作影響因子結(jié)構(gòu)的噪音,通過限制所有的正向題或反向題的測(cè)量誤差相關(guān),將項(xiàng)目表述效應(yīng)分離。在誤差相關(guān)的情況下,使用α 系數(shù)估計(jì)測(cè)驗(yàn)信度是不合適的,利用驗(yàn)證性因子模型,用合成信度(composite reliability)可以比較準(zhǔn)確地估計(jì)測(cè)驗(yàn)信度(Bentler,2009;溫忠麟,葉寶娟,2011;Yang & Green,2010)。
許多研究者提倡用置信區(qū)間來報(bào)告參數(shù)估計(jì)結(jié)果(例如,Bonett,2010;Maydeu -Olivares,Coffman,&Hartmann,2007;Woods,2007;葉寶娟,溫忠麟,2011,2012a;Zou,2007)。如果可接受的信度包含在測(cè)驗(yàn)信度的置信區(qū)間中,則還不能判斷此測(cè)驗(yàn)的信度是否可以接受(葉寶娟,溫忠麟,2011)。
對(duì)于誤差不相關(guān)的情形,有三種方法或途徑估計(jì)合成信度的置信區(qū)間:Bootstrap 法、Delta 法和直接引用SEM 軟件(如LISREL)輸出的標(biāo)準(zhǔn)誤進(jìn)行計(jì)算(葉寶娟,溫忠麟,2011)。Bootstrap 法得到的結(jié)果是實(shí)證結(jié)果,最為可信,但需要數(shù)據(jù)模擬技術(shù),非常麻煩。Delta 法是一種近似計(jì)算,可在SEM 軟件中添加額外參數(shù)編程,根據(jù)結(jié)果文件輸出,進(jìn)行簡(jiǎn)單計(jì)算即可得到標(biāo)準(zhǔn)誤,比Bootstrap 法簡(jiǎn)單。SEM 軟件添加額外參數(shù)估計(jì)合成信度時(shí),結(jié)果文件會(huì)直接給出其標(biāo)準(zhǔn)誤,此法比Bootstrap 法和Delta 法都要簡(jiǎn)單。葉寶娟和溫忠麟(2011)的模擬研究顯示,Delta 法的標(biāo)準(zhǔn)誤與Bootstrap 法的標(biāo)準(zhǔn)誤差異很小,而LISREL 輸出的標(biāo)準(zhǔn)誤遠(yuǎn)遠(yuǎn)大于Bootstrap 法的標(biāo)準(zhǔn)誤,推薦用Delta 法估計(jì)合成信度的置信區(qū)間,但不能直接用LISREL 輸出的標(biāo)準(zhǔn)誤來計(jì)算。用Mplus 容易計(jì)算Delta 法估計(jì)的合成信度的置信區(qū)間,若用LISREL 需要將有關(guān)的結(jié)果代入Delta 法公式進(jìn)行計(jì)算。
對(duì)于誤差相關(guān)的情形,目前尚未見到用Delta法計(jì)算合成信度標(biāo)準(zhǔn)誤公式,本文將進(jìn)行這方面的工作。簡(jiǎn)單介紹了單維測(cè)驗(yàn)合成信度;介紹了如何用Delta 法估計(jì)誤差不相關(guān)時(shí)單維測(cè)驗(yàn)合成信度置信區(qū)間;對(duì)誤差相關(guān)的情形,推導(dǎo)出用Delta 法計(jì)算合成信度標(biāo)準(zhǔn)誤的公式,據(jù)此可以計(jì)算合成信度置信區(qū)間;用中文版FAD 分測(cè)驗(yàn)“總的功能”為例說明了如何用本文推導(dǎo)的公式進(jìn)行計(jì)算。
設(shè)一個(gè)單維測(cè)驗(yàn)由p 個(gè)題目x1,x2,…,xp組成,測(cè)量了因子ξ,δ1,δ2,…,δp分別為x1,x2,…,xp的誤差,則有

其中,λi表示題目i 在因子ξ 上的負(fù)荷。如果整份測(cè)驗(yàn)的分?jǐn)?shù)相加有意義,整份測(cè)驗(yàn)分?jǐn)?shù)X = x1+ x2+ … + xp的合成信度為(Yang & Green,2010)

其中,cov(δi,δk)表示誤差δi和δk之間的協(xié)方差。當(dāng)誤差之間不相關(guān)時(shí),cov(δi,δk)= 0 ,則公式(2)變?yōu)?/p>

公式(3)是公式(2)的特例。很容易看出,如果誤差存在相關(guān),但仍用公式(3)計(jì)算合成信度是不準(zhǔn)確的。如果題目的誤差存在正相關(guān),忽略誤差相關(guān)計(jì)算的合成信度可能高估測(cè)驗(yàn)信度。
近年來,許多研究用Delta 法估計(jì)參數(shù)的置信區(qū)間(例如,Laenen,Alonso,Molenberghs,& Vangeneugden,2009a,2009b;Raykov,2011;Raykov & Penev,2009,2010)。Raykov(2002)最先將Delta 法用于合成信度的區(qū)間估計(jì)中,在誤差不相關(guān)的條件下,他推導(dǎo)出估計(jì)單維測(cè)驗(yàn)合成信度的標(biāo)準(zhǔn)誤公式為

其中,u 是標(biāo)準(zhǔn)化因子負(fù)荷之和,u^是其估計(jì),v 是誤差方差之和,是其估計(jì):

D1和D2由下面公式計(jì)算得到:

如果誤差相關(guān),用公式(4)估計(jì)的合成信度的標(biāo)準(zhǔn)誤可能不準(zhǔn)確,此時(shí)需要推導(dǎo)新的公式。
Raykov(2002)用Delta 法推導(dǎo)公式(4)的時(shí)候,是從公式(3)出發(fā)的。在誤差相關(guān)的情形,要從公式(2)出發(fā)。設(shè)

則(2)式變?yōu)?

對(duì)上述公式應(yīng)用Delta 法(葉寶娟,溫忠麟,2012b),可以推導(dǎo)出誤差相關(guān)單維測(cè)驗(yàn)合成信度的標(biāo)準(zhǔn)誤為:

其中,D3和D4為:

測(cè)驗(yàn)合成信度的置信度為1 - α 的置信區(qū)間為:

其中,Zα/2是標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)α 分位點(diǎn)。公式(10)就是Delta 法得到的置信區(qū)間,半徑為Zα/2·SE(),表示信度估計(jì)的誤差范圍。區(qū)間長(zhǎng)度越短(即標(biāo)準(zhǔn)誤越小),估計(jì)的信度精確度越高,反之,精確度越低。
下面用一個(gè)例子說明如何用本文推導(dǎo)的公式計(jì)算誤差相關(guān)的單維測(cè)驗(yàn)合成信度的置信區(qū)間。
家庭是個(gè)體成長(zhǎng)和社會(huì)化的重要場(chǎng)所。家庭功能(family functioning)是衡量家庭系統(tǒng)運(yùn)行狀況的重要標(biāo)志,會(huì)對(duì)家庭成員心理發(fā)展產(chǎn)生很大影響。家庭實(shí)現(xiàn)其功能的過程越順暢,家庭成員的身心健康狀況就越好,反之,則容易導(dǎo)致家庭成員出現(xiàn)各種心理問題以及行為問題。
最常用的評(píng)價(jià)家庭功能的工具之一是家庭功能評(píng)價(jià)測(cè)驗(yàn)(簡(jiǎn)稱FAD),是依據(jù)Mcmaster 的家庭功能模式編制的家庭功能測(cè)驗(yàn)(第三次修訂版),中文版由劉培毅、何慕陶(1999)進(jìn)行翻譯和修訂,有7 個(gè)分測(cè)驗(yàn),共60 個(gè)項(xiàng)目,25 個(gè)正向題,35 個(gè)反向題。雖然測(cè)驗(yàn)中包含反向題,但以往的研究者沒有研究此測(cè)驗(yàn)是否存在方法效應(yīng),直接使用α 系數(shù)估計(jì)測(cè)驗(yàn)信度。如果存在方法效應(yīng),α 系數(shù)失去了參考價(jià)值。本例將研究FAD 分測(cè)驗(yàn)“總的功能”,在探討其結(jié)構(gòu)的基礎(chǔ)上,演示如何比較準(zhǔn)確的計(jì)算其合成信度及其置信區(qū)間。
采用整群隨機(jī)抽樣,選取某地區(qū)六所初級(jí)中學(xué)(三所城市普通中學(xué),三所鄉(xiāng)鎮(zhèn)普通中學(xué))的600 名青少年(平均年齡為14.54 歲,SD=0.86)作為調(diào)查對(duì)象。其中,男生283 人,女生317 人,初一216 人,初二197 人,初三187 人;父親和母親沒有固定工作者分別為15.2%和40.1%。父親與母親的受教育水平為“未受過正規(guī)教育或小學(xué)”者分別為15.8%和34.6%,“初中”水平者分別為52.0%和49.0%,“高中/職高”水平者分別為22.4%和12.7%,“大學(xué)專科/本科及以上”者為9.8%和3.7%。這與國(guó)家統(tǒng)計(jì)局公布的第六次全國(guó)人口普查數(shù)據(jù)相應(yīng)群體受教育水平的全國(guó)平均狀況以及本調(diào)查所在地區(qū)的平均狀況均非常接近。
采用FAD 分測(cè)驗(yàn)“總的功能”,共12 題,其中第1、3、5、7、9、11 為反向題,2、4、6、8、10、12 為正向題,采用4 級(jí)評(píng)分制,其評(píng)分為:很像我家=1、像我家=2、不像我家=3、完全不像我家=4。將6 個(gè)反向題反向計(jì)分。
在征得學(xué)校領(lǐng)導(dǎo)和青少年本人的知情同意后,以班級(jí)為單位進(jìn)行團(tuán)體施測(cè)。主試為經(jīng)過嚴(yán)格培訓(xùn)的心理學(xué)研究生。要求被試根據(jù)指導(dǎo)語要求認(rèn)真、獨(dú)立作答。被試完成全部問卷約需5 分鐘,所有問卷當(dāng)場(chǎng)回收。
為分離項(xiàng)目表述效應(yīng),按照Tomás 和Oliver(1999)的建議,本研究構(gòu)建7 個(gè)理論模型。其中,模型M1認(rèn)為分測(cè)驗(yàn)的結(jié)構(gòu)是單維的,即只有一個(gè)因子。而M2、M3和M4均為相關(guān)特質(zhì)相關(guān)特性模型(CTCU),它們?cè)谝粋€(gè)因子的基礎(chǔ)上,假定存在正向題的測(cè)量誤差相關(guān)(M2)或反向題的測(cè)量誤差相關(guān)(M3)或兩者同時(shí)存在(M4)。而M5、M6和M7為相關(guān)特質(zhì)相關(guān)方法模型(CTCM),即在一個(gè)因子的基礎(chǔ)上分別假定存在一個(gè)反向題項(xiàng)目表述效應(yīng)因子(M6)或正向題項(xiàng)目表述效應(yīng)因子(M7),或兩者同時(shí)存在(M5)。接下來從擬合指數(shù)、模型的負(fù)荷兩方面來比較7 個(gè)競(jìng)爭(zhēng)模型。
模型M4沒有收斂,因此未將其列入比較之列。由表1 可知,單因素模型M1擬合最差,χ2/df 最大,RMSEA 大于臨界值0.08(溫忠麟,侯杰泰,Marsh,2004);考慮項(xiàng)目表述方法效應(yīng)的模型均好于模型M1,其中,模型M2和模型M5擬合很好,χ2/df,SRMR很小,模型M3、M6和M7居中,擬合也不錯(cuò)。由此可見,與M1相比,考慮項(xiàng)目表述效應(yīng)的模型擬合更好,并且模型更簡(jiǎn)約。

表1 競(jìng)爭(zhēng)模型的擬合指數(shù)比較
溫忠麟等(2004)認(rèn)為,評(píng)估模型的優(yōu)劣,除了要考慮擬合指標(biāo)是否達(dá)到臨界值,還要考察參數(shù)估計(jì)值的意義以及模型的可解釋性。如表2 所示,在模型M5中,第11 題在方法因子的負(fù)荷為負(fù)值,這不太合理,同時(shí)分離出方法效應(yīng)后,第5 題在總的功能上的負(fù)荷小于0.3,此題沒有很好的測(cè)量總的功能,因此,模型M5不好;分離出方法效應(yīng)后,在模型M2、M6、M7中,第1 和第5 題的負(fù)荷小于0.3,第5 題在總的功能上的負(fù)荷尤其低,這說明第1 和第5 題沒有很好的測(cè)量總的功能,因此,模型M2、M6、M7不好;在模型M1中,第5 題在總的功能上的負(fù)荷小于0.3,此題沒有很好的測(cè)量總的功能,因此模型M1不好;相比之下,在模型M3中,除第5 題外,各題的負(fù)荷均在0.4 之上,第5 題的負(fù)荷也高于在其它模型中的負(fù)荷,所有題目都較好的測(cè)量了總的功能,因此,相對(duì)于其它模型來說,模型M3好。
實(shí)施最嚴(yán)格的耕地保護(hù)制度。全省耕地保有量1.14億畝,劃定永久基本農(nóng)田9587萬畝,連續(xù)18年實(shí)現(xiàn)耕地占補(bǔ)平衡,保障糧食生產(chǎn)能力穩(wěn)步提升。建立生態(tài)紅線管理和生態(tài)補(bǔ)償制度,對(duì)重要生態(tài)區(qū)域?qū)嵤┘t線管理,對(duì)生態(tài)公益林、重要濕地和海域海島保護(hù)給予生態(tài)補(bǔ)償。建立自然保護(hù)地管理制度。在資源集中、區(qū)位重要、特色鮮明區(qū)域,建立各類省級(jí)以上自然保護(hù)區(qū)45處、地質(zhì)礦山公園67處、森林公園119處、濕地公園204處、海洋公園12處,典型自然生態(tài)系統(tǒng)和生物多樣性得到有效保護(hù)。持續(xù)推進(jìn)礦產(chǎn)資源整頓規(guī)范,取締關(guān)閉非法采礦和一批露天開采礦山,建成國(guó)家級(jí)綠色礦山37處,數(shù)量居全國(guó)第二位。
綜合擬合指數(shù)、負(fù)荷方面信息,我們認(rèn)為反向表述CTCU 模型M3是對(duì)總的功能結(jié)構(gòu)的最好解釋,即中文版FAD 總的功能分測(cè)驗(yàn)是單維結(jié)構(gòu),所有題目都測(cè)量了總的功能一個(gè)因子,反向題的測(cè)量誤差相關(guān)。此外,對(duì)反向題項(xiàng)目表述效應(yīng)進(jìn)行統(tǒng)計(jì)控制后,此分測(cè)驗(yàn)的單維結(jié)構(gòu)更好。

表2 競(jìng)爭(zhēng)模型的負(fù)荷比較
接下來計(jì)算總的功能的信度,附錄1 是計(jì)算這份測(cè)驗(yàn)?zāi)P蚆3的合成信度的LISREL 程序,并且可得到用公式(9)計(jì)算置信區(qū)間所需要的參數(shù)。這個(gè)程序與普通的CFA 程序差不多,僅多了幾個(gè)額外參數(shù)。LISREL 的輸出結(jié)果可以給出公式(2)中的合成信度的點(diǎn)估計(jì)值,以及公式(9)中的所有參數(shù)(但D3和D4需要計(jì)算)將LISREL 的輸出結(jié)果代入公式(9)容易求得合成信度的標(biāo)準(zhǔn)誤,進(jìn)而用公式(10)計(jì)算其置信區(qū)間。本例合成信度的點(diǎn)估計(jì)值為0.76,合成信度的標(biāo)準(zhǔn)誤為0.02,合成信度95%的置信區(qū)間為(0.72,0.80)。
為了進(jìn)一步驗(yàn)證用Delta 法得到的置信區(qū)間的精確度,在LISREL 中用Bootstrap 法抽樣1000 次,得到合成信度的標(biāo)準(zhǔn)誤為0.02(可以看作真值,參見葉寶娟,溫忠麟,2011),因而95%的置信區(qū)間為(0.72,0.80),與用Delta 法得到的置信區(qū)間(0.72,0.80)相同,說明用Delta 法估計(jì)的結(jié)果相當(dāng)精確。
如果此例按誤差不相關(guān)的公式(3)計(jì)算合成信度,用公式(4)計(jì)算標(biāo)準(zhǔn)誤,合成信度的點(diǎn)估計(jì)值為0.85(高 估 了0. 09)。標(biāo) 準(zhǔn) 誤 為0. 01(低 估 了0.01),95%的置信區(qū)間為(0. 83,0. 87),與Bootstrap 法得到置信區(qū)間(0.72,0.80)差別很大,信度下限相差了0.11。本例α 系數(shù)點(diǎn)估計(jì)值為0.86(高估了0.10),用Bonett(2010)的方法計(jì)算其置信區(qū)間為(0.84,0.88),信度下限相差0.12。
估計(jì)測(cè)驗(yàn)的信度是進(jìn)行數(shù)據(jù)分析的必須前提和關(guān)鍵性步驟(Biemer,Christ,& Wiesen,2009;Vangeneugden et al.,2010)。如果測(cè)驗(yàn)信度估計(jì)不準(zhǔn)確,可能會(huì)高估或低估變量間的真實(shí)關(guān)系,直接影響基于信度基礎(chǔ)上所做的統(tǒng)計(jì)分析的結(jié)果(Lachin,2004;Laenen et al.,2009a)。
在一些情況下測(cè)驗(yàn)誤差之間會(huì)相關(guān),此時(shí),最常用的評(píng)價(jià)測(cè)驗(yàn)信度指標(biāo)α 系數(shù)往往會(huì)高估測(cè)驗(yàn)信度,而用合成信度可以較好的評(píng)價(jià)此種情況下測(cè)驗(yàn)信度。測(cè)驗(yàn)的合成信度是一個(gè)未知的總體參數(shù),實(shí)證研究中需要用樣本的合成信度來估計(jì)。同其它參數(shù)的點(diǎn)估計(jì)一樣,樣本的合成信度會(huì)圍繞總體的合成信度波動(dòng)。用合成信度的置信區(qū)間來評(píng)價(jià)測(cè)驗(yàn)的信度,尤其是當(dāng)樣本的點(diǎn)估計(jì)值在可接受的信度水平附近時(shí),可對(duì)測(cè)驗(yàn)的質(zhì)量做出更為客觀的評(píng)價(jià)。
在實(shí)證研究中,如果用速度測(cè)驗(yàn)、刺激材料相同的測(cè)驗(yàn)題目或測(cè)驗(yàn)分?jǐn)?shù)有瞬間誤差及測(cè)驗(yàn)有正向題、反向題時(shí),應(yīng)當(dāng)檢查測(cè)驗(yàn)題目的誤差是否相關(guān)。如果相關(guān),不能用α 系數(shù)估計(jì)信度,也不能用誤差不相關(guān)的合成信度公式,而應(yīng)該用誤差相關(guān)的合成信度公式及標(biāo)準(zhǔn)誤公式計(jì)算測(cè)驗(yàn)的合成信度及其置信區(qū)間,才能比較準(zhǔn)確地估計(jì)測(cè)驗(yàn)信度。本文的例子已經(jīng)充分說明了這一點(diǎn)。
在FAD 分測(cè)驗(yàn)“總的功能”中,反向題存在項(xiàng)目表述效應(yīng),導(dǎo)致反向題的誤差相關(guān),分離出項(xiàng)目表述效應(yīng)的單維模型M3能較好地解釋測(cè)驗(yàn)的結(jié)構(gòu)。建議在使用該測(cè)驗(yàn)時(shí),考慮此測(cè)驗(yàn)的方法效應(yīng),建立反向題誤差相關(guān)的CFA 模型估計(jì)測(cè)驗(yàn)的信度及其置信區(qū)間。
Mplus 軟件的高版本(如6.0 以上)用Delta 法計(jì)算合成信度的標(biāo)準(zhǔn)誤(Muthén & Muthén,2010),并可以直接輸出合成信度的置信區(qū)間,與本文用Delta 法求得的一樣(計(jì)算誤差除外)。附錄1 給出了用Mplus6.11 求本文例子合成信度的點(diǎn)估計(jì)值及其置信區(qū)間的程序。在程序中OUTPUT 部分添加CINTERVAL 命令可以直接得到合成信度的置信區(qū)間。附錄1 的程序可以直接得到合成信度的點(diǎn)估計(jì)值、Delta 法的標(biāo)準(zhǔn)誤,以及相應(yīng)的合成信度置信區(qū)間。如果讀者使用Mplus 軟件,可以套用附錄1 的程序進(jìn)行計(jì)算。
劉培毅,何慕陶. (1999). 家庭功能評(píng)定. 見 汪向東等. (主編).心理衛(wèi)生評(píng)定量表手冊(cè)(增訂版)(pp.149 -150).北京:中國(guó)心理衛(wèi)生雜志出版社.
溫忠麟,侯杰泰,Marsh.(2004). 結(jié)構(gòu)方程模型檢驗(yàn):擬合指數(shù)與卡方準(zhǔn)則.心理學(xué)報(bào),36(2),186 -194.
溫忠麟,葉寶娟.(2011).測(cè)驗(yàn)信度估計(jì):從α 系數(shù)到內(nèi)部一致性信度.心理學(xué)報(bào),43(7),821 -823.
葉寶娟,溫忠麟. (2011). 單維測(cè)驗(yàn)合成信度三種區(qū)間估計(jì)的比較.心理學(xué)報(bào),43(4),453 -461.
葉寶娟,溫忠麟.(2012a).測(cè)驗(yàn)同質(zhì)性系數(shù)及其區(qū)間估計(jì).心理學(xué)報(bào),44(12),1687 -1694.
葉寶娟,溫忠麟. (2012b). 用Delta 法估計(jì)多維測(cè)驗(yàn)合成信度的置信區(qū)間.心理科學(xué),35(5),1213 -1217.
Bentler,P. M. (2009). Alpha,dimension - free,and model -based internal consistency reliability. Psychometrika,74,137-143.
Biemer,P.P.,Christ,S.L.,& Wiesen,C.A.(2009).A general approach for estimating scale score reliability for panel survey data.Psychological Methods,14,400 -412.
Bonett,D.G.(2010). Varying coefficient meta -analytic methods for alpha reliability. Psychological Methods,15,368 -385.
DiStefano,C.,& Motl,R. W. (2009). Personality correlates of method effects due to negatively worded items on the Rosenberg Self - Esteem scale. Personality and Individual Differences,46,309 -313.
Green,S. B. (2003). A coefficient alpha for test - retest data.Psychological Methods,8,88 -101.
Green,S.B.,& Hershberger,S. L. (2000). Correlated errors in true score models and their effect on coefficient alpha.Structural Equation Modeling,7,251 -270.
Green,S.B.,& Yang,Y.(2009).Commentary on coefficient alpha:A cautionary tale.Psychometrika,74,121 -135.
Lachin,J. M. (2004). The role of measurement reliability in clinical trials.Clinical Trials,1,553 -566.
Laenen,A.,Alonso,A.,Molenberghs,G.,& Vangeneugden,T.(2009a).A family of measures to evaluate scale reliability in a longitudinal setting.Journal of the Royal Statistical Society,172,237 -253.
Laenen,A.,Alonso,A.,Molenberghs,G.,& Vangeneugden,T.(2009b). Reliability of a longitudinal sequence of scale ratings.Psychometrika,74,49 -64.
Marsh,H.W.,Scalas,L. F.,& Nagengast,B. (2010). Longitudinal tests of competing factor structures for the Rosenberg Self-Esteem scale:Traits,ephemeral artifacts,and stable response styles.Psychological Assessment,22,366 -381.
Maydeu - Olivares,A.,Coffman,D. L.,& Hartmann,W. M.(2007).Asymptotically distribution free(ADF)interval estimation of coefficient alpha. Psychological Methods,12,157 -176.
Muthén,L.K.,& Muthén,B. O. (2010). Mplus user’s guide(6th ed.).Los Angeles:Muthén & Muthén.
Raykov,T. (2002). Analytic estimation of standard error and confidence interval for scale reliability.Multivariate Behavioral Research,37,89 -103.
Raykov,T.(2011). Intraclass correlation coefficients in hierarchical designs:Evaluation using latent variable modeling.Structural Equation Modeling,18,73 -90.
Raykov,T.,& Penev,S.(2009).Estimation of maximal reliability for multiple - component instruments in multilevel designs.British Journal of Mathematical and Statistical Psychology,62,129 -142.
Raykov,T.,& Penev,S.(2010).Evaluation of reliability coefficients for two - level models via latent variable analysis.Structural Equation Modeling,17,629 -641.
Revelle,W.,& Zinbarg,R. (2009). Coefficients alpha,beta,omega and the glb:Comments on Sijtsma. Psychometrika,74,145 -154.
Sijtsma,K.(2009).Reliability beyond theory and into practice.Psychometrika,74,169 -173.
Steinberg,L. (2001). The consequences of pairing questions:Context effects in personality measurement.Journal of Personality and Social Psychology,81,332 -342.
Tomás,J.M.,& Oliver,A. (1999). Rosenberg’s self -esteem scale:Two factors or method effects.Structural Equation Modeling,6,84 -98.
Vangeneugden,T.,Molenberghs,G.,Laenen,A.,Geys,H.,Beunckens,C.,& Sotto,C.(2010).Marginal correlation in longitudinal binary data based on generalized linear mixed models.Communications in Statistics - Theory and Methods,39,3540 -3557.
Vautier,S.,& Pohl,S.(2009).Do balance scales assess bipolar constructs?The case of the STAI scales.Psychological Assessment,21,187 -193.
Yang,Y.,& Green,S.B.(2010).A note on structural equation modeling estimates of reliability. Structural Equation Modeling,17,66 -81.
Ye,S.(2009).Factor structure of the General Health Questionnaire(GHQ - 12):The role of wording effects. Personality and Individual Differences,46,197 -201.
Zou,G. Y. (2007). Towards using confidence intervals to compare correlations.Psychological Methods,12,399 -413.
附錄1 計(jì)算單維測(cè)驗(yàn)的合成信度的Mplus 程序

注釋:合成信度的點(diǎn)估計(jì)值及用Delta 法計(jì)算的合成信度的標(biāo)準(zhǔn)誤,對(duì)應(yīng)于Mplus 輸出結(jié)果中的“MODEL RESULTS”部分中的“New/Additional Parameters”H4 的參數(shù)估計(jì)值及其標(biāo)準(zhǔn)誤,其值為0.76 和0.01。合成信度的95%置信區(qū)間的下限和上限,對(duì)應(yīng)于Mplus 輸出結(jié)果中的“CONFIDENCE INTERVALS OF MODEL RESULTS”部分中的“New/Additional Parameters”H4的“Lower 2.5%”和“Upper 2.5%”的值,其值為0.72 和0.80。