999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多維IRT與單維IRT在多維量表中應用的差異

2011-02-03 03:50:24中山大學公共衛生學院醫學統計與流行病學系510080林岳卿方積乾
中國衛生統計 2011年3期
關鍵詞:理論分析模型

中山大學公共衛生學院醫學統計與流行病學系(510080) 林岳卿 方積乾

多維IRT與單維IRT在多維量表中應用的差異

中山大學公共衛生學院醫學統計與流行病學系(510080) 林岳卿 方積乾△

目的探討單維條目反應理論與多維條目反應理論在多維量表分析中的差異,并從中找出較優的分析方法。方法 用單維分部評分模型(PCM)和多維分部評分模型分別對世界衛生組織生存質量研究小組提供的來自世界20個研究中心的WHOQOL-OLD量表數據進行條目和量表結構的分析。結果 “感覺能力”領域中的條目OLD_10“您的感覺功能的問題影響您和他人交往的能力嗎?”同時不擬合兩種模型,單維IRT得到Infit和Outfit均方擬合指數、6個維度的信度系數及潛在特質間的相關系數均低于多維IRT。結論 多維IRT更適合于條目數較少的多維量表的分析和評價。

多維量表 條目反應理論 多維條目反應理論模型 生存質量

△通訊作者:方積乾

條目反應理論(item response theory,IRT)又譯為項目反應理論。IRT的出現克服了經典測量理論(classical test theory,CTT)的種種缺陷,同時建立了調查對象對條目的反應與其潛在特質之間的非線性關系,這種關系可用不同的概率函數模型表示,并通過這些模型估計出調查對象的特質參數(能力參數)和條目參數〔1,2〕。然而,IRT的單維性假設與許多心理測驗或者一般的生存質量量表在理論上是不相符的,因為人的心理特質是多個維度的,病人生存質量的高低是由多個側面共同決定的,很少有研究只測量單一的潛在特質。對于這樣的多維量表,有些研究者分維度進行IRT分析,在維度內維持單維性;也有些研究者認為輕微違背單維性是可以接受的,特別是維度相關性較高的情況,于是將整個量表看作一維量表進行分析,這樣的處理方法是否恰當?多維的條目反應理論是否會更優呢?為解決這一問題,本研究分別用單維IRT和多維IRT方法對同一組數據進行分析,比較這兩種方法的差異。

資料與方法

1.資料來源

本研究的資料由世界衛生組織生存質量研究小組提供,由世界20個不同的研究中心于2000~2004年用世界衛生組織生存質量老年人量表(WHOQOLOLD)調查60歲及以上老年人收集得到的,共調查了5 566人。WHOQOL-OLD量表是在WHOQOL-100和WHOQOL-BREF的基礎上發展起來的一個多維量表,Power等〔3〕的研究表明此量表包括6個維度,每個維度有4個5級有序記分條目,從1到5表示健康狀態由差到好。這些維度分別為:感覺能力、自主、死亡、過去/現在和將來的活動、社會參與、親密。

2.方法

(1)單維條目反應理論(UIRT)〔2〕

單維IRT分析的基本步驟:

①檢驗IRT的應用假設:單維性和局部獨立性,只有兩個假設都滿足才能更好地體現IRT模型的優越性。這兩個假設可用探索性(EFA)和驗證性因子分析(CFA)進行檢驗,若EFA顯示第一特征值與第二特征值的比值大于3,則可認為數據滿足單維性〔4〕。若CFA顯示條目的殘差相關系數小于0.2,則可以認為量表的條目是滿足局部獨立性的〔5〕。

②用邊緣極大似然估計法和EM算法估計PCM模型中的特質參數和閾值參數。

③用項目功能差異(DIF)分析和條目擬合統計分析檢驗條目與理論模型的擬合情況。DIF分析用于判斷條目在性別、年齡組(<80與>80)、國家(歐洲國家與非歐洲國家)、健康情況(健康與非健康)等方面內容和結構的等價性。當同一條目在兩個亞組中的條目閾值差異大于0.5,則可認為該條目存在DIF〔6〕。Infit均方(MNSQ)和Outfit均方是條目擬合分析中常用的兩個擬合指標〔7〕。假設N是觀察例數,X是觀察值,E是PCM模型的參數估計理論值,σ2是模型的理論方差,則Infit=∑(X-E)2/∑(σ2),表示條目對接近調查對象能力的非理論反應模式的敏感度,而Outfit=∑((X-E)2/σ2)/N,表示條目對遠離受試者能力的非理論反應模式的敏感度。這兩擬合指標的理論值均為1,多數研究者認為這兩個值介于0.7~1.3之間,則可認為條目是擬合模型的。

④上述分析是分維度進行的,每個維度都可以估計自己的特質參數值和測量信度。計算6個維度潛在特質參數估計值的相關系數,分析它們之間的相關性。

(2)多維條目反應理論(MIRT)

3.統計方法 分析在ConQuest 2.0軟件中進行,單維分析中潛在特質間的相關性用SPSS 17.0分析,探索性和驗證性因子分析用Mplus 5.21分析,檢驗水準為0.05(雙側)。

結果與分析

1.單維IRT分析結果

探索性因子分析顯示,6個領域的第一特征值與第二特征值的比均大于3,且最大的殘差相關系數為0.144,說明6個領域的數據都滿足單維性和局部獨立性。所有24個條目在性別、年齡組、國家、健康情況等4個方面均沒有顯示具有統計學意義的項目功能差異。“感覺能力”領域中的條目OLD_10“您的感覺功能的問題影響您和他人交往的能力嗎?”顯示輕度地不擬合單維的分部評分模型(Outfit Mnsq=1.32)。其他條目的擬合指數都顯示好的擬合。6個領域的信度系數和潛在特質之間的相關系數分別介于0.73~0.84之間和0.05~0.67之間,詳見表1和表2。

2.多維IRT分析結果

表1 多維和單維條目反應理論分析的信度系數及單維信度提高到多維的信度水平需要增加的條目比例(N=5 566)

表2 多維和單維IRT分析的相關系數矩陣(N=5 566)

討 論

隨著生存質量研究的不斷發展,早期用于教育和心理測量學領域的條目反應理論受到越來越多醫學研究者的關注。它不僅可用于指導量表編制和條目篩選,而且可以用于量表信效度的考核,由于其理論較成熟,模型相對簡單,且有很多的參數估計軟件支持而得到廣泛的應用。然而,根據上述分析結果,單維IRT在多維量表的分析中仍存在一些技術問題。很多研究表明生存質量是一個多維的概念,包括身體功能、心理功能、社會功能等側面,而條目反應理論中的單維性假設對于這樣一個多維的生存質量研究顯然是不恰當的。同時,當維度間的相關性較低時,單維IRT方法對被試人群的特質估計、條目的參數估計、條目選擇等方面也存在偏倚。對一個維度間具有高相關的量表,如果用單維IRT分析,研究者會錯誤地認為維度間只有低的或者中等程度的相關。從表2可知,單維IRT由于在分析的過程中沒有考慮測量誤差的影響而導致潛在特質間的相關性偏低。同時,表1也顯示單維IRT由于沒有考慮維度間的相關性,從而導致測量信度偏低,不利于個體的診斷。從擬合指標上來看,有很多研究者也認為Infit和Outfit Mnsq指數在0.6~1.4這個范圍內也是可以接受的。對于條目OLD_10,單維IRT分析的擬合指數大于1.3,但小于1.4,若按上面的標準,則尚可認為這個條目是擬合模型的;然而多維IRT顯示的兩個擬合指數都大于1.4,表明此條目不擬合模型。從這個例子可以看出,多維IRT更容易發現條目的優劣。

與單維IRT相比,多維IRT由于能同時考慮測量誤差和維度間相關的影響,不僅能提高參數估計的準確性,而且能改善測量的精度(信度)。在量表的發展過程中,研究者經常面臨這樣一個問題:既想獲得被試者更多的信息,又想得到更準確的信息,即“寬度-準確問題”(bandwidth-fidelity dilemma)。然而,這兩者經常是矛盾的,條目信息涉及的范圍越廣,準確性越低。多維IRT的發展成功地解決了這個問題。對于條目數較少的多維量表,尤其是每個維度條目數均很少的情況,多維IRT的使用能更好突顯它的優越性〔9〕。目前也有很多計算機軟件支持MIRT的分析,如Con-Quest、TESTFACT、NOHARM、SAS 中的 NLM IXED、STATA中的GLLAMM等。因此,對于多維量表的分析,無論是從理論上還是技術上,都需要把單維的IRT拓展為多維的IRT,多維IRT更適合多維量表的分析和評價。

(致謝:衷心感謝世界衛生組織生存質量研究小組為本次研究提供數據。)

1.韓耀風,郝元濤,方積乾.項目反應理論及其在生存質量研究中的應用.中國衛生統計,2006,23(6):562-565.

2.Embretson SE,Reise SP.Item response theory for psychologists.Mahwah,NJ:Law rence Erlbaum Associates,2000,3-12.

3.Power M,Quinn K,Schmidt S,WHOQOL-OLD Group.Development of the WHOQOL-Old module.Qual Life Res,2005,14(10):2197-2214.

4.Slocum SL.Assessing unidimensionality of psychological scales:using individual and integrative criteria from factor analysis.2005.

5.Reeves BB,Hays RD,Bjorner JB,et al.Psychometric evaluation and calibration of health-related Quality of Life item banks:Plans for the Patient-Reported Outcomes Measurement Information systems(PROM IS).Med Care,2007,45(Supp l 1):22-31.

6.Lai JS,Cella D,Chang CH,et al.Item banking to improve,shorten and computerize self-reported fatigue:an illustration of steps to create a core item bank from the FACIT-Fatigue Scale.Qual Life Res,2003,12(5):485-501.

7.Prieto L,Alonso J,Lamarca R.Classical test theory versus rasch analysis for quality of life questionnaire reduction.Health Qual Life Outcomes,2003,1(27):1-13.

8.康春花,辛濤.測驗理論的新發展:多維項目反應理論.心理科學進展,2010,18(3):530-536.

9.Wang WC,Yao G,Tsai YJ,et al.validating,improving reliability,and estimating correlation of the four subscales in the WHOQOL-BREF using multidimensional Rasch analysis.Qual Life Res,2006,15(4):607-620.

10.Cheng YY,Wang WC,Ho YH.Multidimensional rasch analysis of a psychological test with multiple subtests:a statistical solution for the bandwidth_fidelity dilemma.Educ Psychol Meas,2009,69(3):369-388.

11.Adams RJ,Wilson M,Wang WC.The multidimensional random coefficients multinomial logit model.J Appl Meas,1997,21(1):1-23.

The Difference between Unidimensional IRT and Multidimensional IRT in the Application of Multidimensional Scale

LinYueqing,FangJiqian.DepartmentofMedicalStatisticsandEpidemiology,SchoolofPublicHealth,SunYat-SenUniversity(510080),Guangzhou

ObjectiveTo explore the difference between unidimensional IRT and multidimensional IRT in the application of scale which includes several subscales and find out the better method.MethodsThe data of WHOQOL-OLD came from the field study of 20 national study centers of WHOQOL Group which was conducted.The Unidimensional Partial Credit Model and Multidimensional Partial Credit Model were used to analyze the property of items and construct of scale.ResultsI-tem OLD_10(Problems with sensory functioning affect ability to interact)in the“Sensory Abilities”domain showed poorer fit to two models.And the In fit and Outfit Mnsq,reliability coefficients and correlation coefficients of latent ability of six domains from unidimensional IRT analysis all were lower than that of multidimensional IRT analysis.ConclusionMultidimensional IRT is more appropriate than unidimensional IRT for the analysis and evaluation of multidimensional and short scale.

Multidimensional scale;Item response theory;Multidimensional item response theory model;Quality of life

猜你喜歡
理論分析模型
一半模型
堅持理論創新
當代陜西(2022年5期)2022-04-19 12:10:18
神秘的混沌理論
理論創新 引領百年
隱蔽失效適航要求符合性驗證分析
相關于撓理論的Baer模
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
主站蜘蛛池模板: av色爱 天堂网| 国产自在线拍| 无码 在线 在线| 国产在线观看成人91| 亚洲狠狠婷婷综合久久久久| 久久无码av一区二区三区| 亚洲欧州色色免费AV| 久久无码av三级| 黄色一级视频欧美| 91 九色视频丝袜| 亚洲国产成人久久精品软件| 8090午夜无码专区| 91在线播放国产| 国产成人亚洲欧美激情| 国产丝袜精品| 亚洲精品手机在线| 国产乱子伦无码精品小说| 五月激激激综合网色播免费| 国产91在线|中文| 2021国产精品自产拍在线观看| 国产男人天堂| 欧美一区二区三区国产精品| av天堂最新版在线| 日韩在线播放中文字幕| 91精品国产麻豆国产自产在线| 在线va视频| 亚洲国产日韩在线观看| 狂欢视频在线观看不卡| 精品国产成人a在线观看| 欧美一级夜夜爽| 日韩欧美国产成人| 色亚洲成人| 亚洲欧洲日产国产无码AV| 亚洲国产精品美女| 91精品日韩人妻无码久久| 亚洲一区色| 亚洲第一视频区| 欧美成人免费午夜全| 操美女免费网站| 国产杨幂丝袜av在线播放| 久久婷婷人人澡人人爱91| 国产区免费| 日韩欧美91| www.99精品视频在线播放| 免费国产高清视频| 久久精品最新免费国产成人| 婷婷午夜天| 亚洲精品动漫在线观看| 美女一区二区在线观看| 国产一区在线视频观看| 91成人在线免费视频| 国语少妇高潮| 久久久国产精品免费视频| 1769国产精品免费视频| 91丝袜美腿高跟国产极品老师| 亚洲另类第一页| 久久夜色撩人精品国产| 亚洲伦理一区二区| av在线无码浏览| 国产自视频| 丝袜国产一区| 日本午夜三级| 亚洲精品天堂在线观看| 国产高清免费午夜在线视频| 青青青国产免费线在| 日本午夜影院| 精品国产一二三区| 国产爽妇精品| 亚洲无线视频| 91国内在线视频| 国产第四页| 国产精品一线天| 午夜久久影院| 亚洲第一成网站| 日韩高清一区 | 亚洲人成网站日本片| 精品无码一区二区三区在线视频| 最新日本中文字幕| 日韩欧美91| 乱人伦中文视频在线观看免费| 999精品免费视频| 高清欧美性猛交XXXX黑人猛交|