姚寧寧 陳炳為△ 申春悌 錢劉蘭 黃 灝
·應用研究·
對數線性模型在評分者一致性研究方法中的應用*
姚寧寧1陳炳為1△申春悌2△錢劉蘭1黃 灝1
目的研究對數線性模型在等級資料評分者一致性研究方法中的應用。方法由高級和中級及以下職稱的醫生獨立收集慢性支氣管炎的四診信息,以口唇青紫程度為例,其評分為4個等級。采用不同的對數線性模型對觀測頻數進行擬合,選擇擬合程度好的模型,再進行一致性結構分析。結果對三個對數線性模型進行比較,得到等權重模型的結果最好,表明高級和中級及以下職稱的醫生之間存在正相關。結論在一致性研究中應用對數線性模型,可以分析一致性結構,對特定的假設進行檢驗,不再是應用單個統計量總結一致性。
一致性評價 對數線性模型 中醫 慢性支氣管炎
隨著大規模科研合作研究的越來越多和新方法的不斷出現,一致性評價的重要意義越來越明顯。一般常用kappa系數評價兩種檢驗方法和同一方法兩次檢驗結果的一致性,它考慮了機遇因素對一致性的影響。然而,僅用單個的kappa系數總結一致性可能會損失一些重要信息,而且kappa值對邊際分布形式敏感,當存在多個表格時,kappa系數也不能比較[1-2]。Tanner和Young提出構建研究者間的一致性結構。后來Alan采用對數線性模型構建研究者間的一致結構,不再只是得到一致性評價的單個統計量,它可以檢驗一些特定的假設,這些特定的參數用來解釋在獨立模型下單元格數值與期望值之間的差異,其特定假設的意義與一致性的意義是一致的[3]。
在中醫學的傳統辨證中,證候的診斷標準主要基于“望、聞、問、切”得到的四診資料,醫師根據四診信息所歸納出的證候是一個無法直接測量的綜合變量[4]。定量證候診斷是中醫證候規范的重點與難點[5]。中醫證候的量化主要在于兩個步驟:第一是四診信息的采集,從資料類型上看,四診信息通常由兩分類和(或)等級分類資料組成;第二是證候量化分類過程,可應用現代測量理論和技術對醫師通過臨床觀察所收集的四診信息篩選,探索這些臨床表現與其證候之間的關系,如結構方程模型、潛在類別模型[5]等。如果不同醫師在四診信息采集上存在偏差,將會對證候量化存在影響,因此四診信息的采集量化尤為重要。對中醫四診信息進行一致性研究,可以提高中醫辨證的精確性和可重復性。本文的目的是研究對數線性模型在等級資料評分者一致性方法中的應用。
對i×j的交叉表,對數線性模型要求i=j。基本模型:

mij是觀測頻數,λ0是截距參數,和分別為行變量(評估者A)和列變量(評估者B)的主效應參數,eij是殘差。基本模型中沒有包含交互,因為模型中滲透著交互或者評估者的等級可能相關,但也可能由于其他原因。為了方便研究,可以用設計矩陣的方法來表示,因此基本模型也可以表示為:log M=Xλ+e。其中,X=■xb,xδ,xβ,xc」。M是觀測頻數的列向量;X是設計矩陣;λ是參數向量。Xb是基本模型的設計矩陣;Xδ是反應評分者一致的設計矩陣;Xβ是定義模型有關特性的設計矩陣;Xc是協變量的設計矩陣。X的編碼通常有啞變量編碼和效應編碼,常用啞變量編碼,但為了方便解釋,可以選擇效應量編碼。假設上述參數都存在,那么可以推廣到廣義對數線性模型:

在對數線性模型中,一致性為兩部分:機遇一致和評分者一致[3]。模型擬合后計算廣義 kappa系數元格的實際觀測頻數與總頻數的比,θ2為對角線單元格的期望頻數與總頻數的比),意義是:特定假設下的模型未能解釋的一致和不一致的比例[2]。廣義kappa與Cohen′s kappa的θ2值不同,前者同時考慮到機遇和非機遇因素的影響,后者僅考慮到機遇因素的影響。根據選擇模型的分析結果,篩選出擬合程度好的模型,對于最后選擇的模型的特定參數可以用對角線優勢比θ(diagonal odds ratio theta)解釋。當模型中僅含有δ時,θ=exp(2δ),即 OR=exp(2δ),而當模型中同時含有 β和 δ時,θ=exp(β+2δ),即 OR=exp(β+2δ)[2,7]。如果對角線單元格的等級發生率大于非對角線的,則OR>1,OR提供了描述評分者間一致性的另一種選擇[2,8]。
以高級職稱醫生和中級及以下職稱醫生分別對同一個患有慢性支氣管炎的病人的口唇青紫程度進行評價為例,高級職稱醫生包括主任中醫師和副主任中醫師,中級及以下職稱醫生包括主治中醫師和住院中醫師。采用對數線性模型對其進行一致性評價,數據整理如下(表1)。其中,B代表高級職稱醫生,A代表中級及以下職稱醫生,口唇青紫程度分為4個等級(0=無,1=輕度,2=中度,3=重度)。

表1 慢性支氣管炎口唇青紫程度評價的頻數表
從表1中可以看到,對角線單元格的頻數明顯多于非對角線單元格的頻數。在研究者中,假定各變量等級是同等重要的,不考慮誤診的情況和協變量的影響,則有三種模型,分別為:
(1)主效應模型:

(2)等權重模型:

(3)帶有線性間交互的等權重模型:

口唇青紫的程度為等級變量,X采用效應量編碼,對于模型 3,μi=i,μj=j。研究中使用 SAS PROC GENMOD步進行分析,分析后結果見表2。

表2 三種對數線性模型的匯總
從表2得出:模型1說明高級職稱醫生和中級職稱及以下醫生在慢性支氣管炎口唇青紫程度的診斷之間存在相關;模型2和模型3中P>0.05,說明模型擬合較好,兩者相對于模型1都有很大的提高,差異是具有統計學意義的,但是模型3相對于模型2的提高是沒有統計學意義的,所以最終選擇模型2,其各參數估計值見表3。根據模型2的參數估計值,得到模型的期望頻數(見表4)。

表3 模型2參數估計值

表4 等權重模型估計的期望頻數
研究最終選擇的模型2(等權重模型)得到廣義kappa=0.000,說明在該模型未能解釋的一致和不一致的比例接近于0,模型能很好地擬合觀測頻數。等權重模型中特定參數 δ=3.068(ASE=0.3584,P<0.001),說明參數δ的設定具有統計學意義,一致性除了機遇因素造成外,還存在額外的一致。OR=exp(2δ)=462.2>1,表明高級職稱醫生和中級及以下職稱醫生在慢性支氣管炎口唇青紫程度的診斷之間存在正相關。對于i=1,2,3,4,高級職稱醫生的診斷是i+1的優勢比中級及以下職稱醫生的診斷是i+1的優勢要高出462.2倍。
對數線性模型的一致性是對一致性結構進行構造。對數線性模型的主效應模型所得的期望頻數與常用方法所求期望是一致的,其他模型均是考慮到一些特定的假設,如果模型擬合程度好,則所求期望頻數與觀測頻數是非常接近的。廣義kappa接近于0,說明模型中參數的假設是有意義的,模型擬合較好;廣義kappa越接近于1,說明模型不能很好的擬合其觀測頻數,機遇因素和非機遇因素的影響較小。應用一致性的對數線性模型分析一致性的結構,而不再是應用單個統計量來總結信息,它考慮到了變量間本身存在的線性關系、各變量等級的重要程度,以及協變量對一致性造成的影響,使得對一致性的結構分析更加合理。
目前中醫臨床四診信息的采集方法仍然沿用傳統中醫學的望聞問切方法,如果缺乏四診信息采集規范,臨床信息則采集不統一,搜集的癥狀缺乏客觀性,就會導致在填寫臨床調查表時,不同的研究者對同一研究疾病患病的四診信息采集發生較大差異。創建規范的操作程序,讓各臨床單位研究者掌握統一的中醫臨床四診信息采集操作標準,加強不同研究單位和不同研究者對四診信息采集的一致性研究,可以提高中醫臨床辨證的精確性和可重復性,可使臨床試驗中療效評價相對科學、客觀。將中醫診療結果量化,選擇合適的模型進行分析,尋找出規律,會為中醫理論的傳承與發展提供巨大的幫助。
[1] Feinstein AR,Cicchetti DV.High agreement but low kappa:I.the problems of two paradoxes.Journal of clinical epidemiology,1990,43(6):543-549.
[2]Eye Av,Mun E.Analyzing Rater Agreement:Manifest Variable Methods.Mahwah,New Jersey:Law rence Erlbaum,2005.
[3]Tanner MA,Young MA.Modeling agreementamong raters.Journal of the American Statistical Association,1985,80(389):175-180.
[4]陳炳為,陳啟光,許碧云,等.潛在變量模型及其在中醫證候中的應用概述.中國衛生統計,2009,29(5):535-538.
[5]鄭建光,陳炳為,陳啟光,等.證實性因子分析在腦梗死病人中醫證候的應用.中國衛生統計,2011,28(5):504-506.
[6] Eye Av,Mun E.Log-linear modeling:Concepts,Interpretation,and Application.US:W iley,2013.
[7] Agresti A.A model for agreement between ratings on an ordinal scale.Biometrics,1988,44:539-548.
[8]Michelle C,Laura M,Debajyoti S.Beyond kappa:A review of inter rater agreement measures.The Canadian Journal of Statistics,1999,27(1):3-23.
“十二五”國家科技支撐計劃(2013BAI13B035);國家自然科學基因(81273190)
1.東南大學公共衛生學院(210009)
2.南京中醫藥大學附屬常州市中醫醫院
△通信作者:陳炳為,E-mail:drchenbw@126.com;申春悌,E-mail:czsct@163.com
(責任編輯:鄧 妍)