伏啟翔,覃 愿,王黎明,邱世芳
(重慶理工大學(xué) 理學(xué)院,重慶 400054)
估計(jì)疾病流行率是生物醫(yī)學(xué)研究中的一個(gè)重要問(wèn)題。為收集數(shù)據(jù),價(jià)格便宜的篩檢方法常被用來(lái)做初步診斷,但由于其分類(lèi)誤差而導(dǎo)致有誤的分類(lèi)結(jié)果,進(jìn)而導(dǎo)致基于這些有誤分類(lèi)數(shù)據(jù)的統(tǒng)計(jì)推斷不太合理。無(wú)誤判的金標(biāo)準(zhǔn)通常存在昂貴、耗時(shí)等不足,因而常不能用于每個(gè)個(gè)體的檢驗(yàn)。為此,Tenenbein[1]提出了二重抽樣方法,即從感興趣的總體中抽取的樣本(如N)都接受篩檢檢驗(yàn),然后再隨機(jī)抽取部分個(gè)體(如n)再次接受金標(biāo)準(zhǔn)檢驗(yàn)。由于這n個(gè)個(gè)體同時(shí)接受了篩檢檢驗(yàn)和金標(biāo)準(zhǔn)檢驗(yàn),反映了個(gè)體的真實(shí)特征。因而通過(guò)二重抽樣方法得到的數(shù)據(jù)又稱(chēng)為部分核實(shí)數(shù)據(jù)[2]。對(duì)于有金標(biāo)準(zhǔn)部分核實(shí)數(shù)據(jù)的研究得到了很多學(xué)者的關(guān)注,如Tenenbein等[3-4]將二重抽樣方法推廣到多項(xiàng)分布數(shù)據(jù)的研究,Hochberg[5]推廣到多維數(shù)據(jù)的研究,Geng等[6]發(fā)展了部分核實(shí)數(shù)據(jù)的Bayesian分析方法。對(duì)于有序部分核實(shí)數(shù)據(jù),Poon等[7]發(fā)展了一類(lèi)參數(shù)模型,Qiu等[8]從有序效應(yīng)度角度研究了疾病流行率的等價(jià)性評(píng)價(jià)問(wèn)題。以上研究都是基于有金標(biāo)準(zhǔn)下的研究,事實(shí)上,臨床診斷中并不一定存在完全無(wú)誤判的金標(biāo)準(zhǔn)。當(dāng)2種檢驗(yàn)都有誤判時(shí)基于部分核實(shí)數(shù)據(jù)的統(tǒng)計(jì)分析具有重要的現(xiàn)實(shí)意義。為此,Nedelman[9]基于條件獨(dú)立性假定提出了3種模型并研究了疾病流行率、敏感度和特異度的估計(jì)問(wèn)題,Lie等[10]基于2種二重抽樣模型進(jìn)行了研究。在Nedelman等[9-10]提出的模型基礎(chǔ)上,Qiu等[11-13]基于無(wú)金標(biāo)準(zhǔn)部分核實(shí)數(shù)據(jù)研究了假設(shè)檢驗(yàn)、區(qū)間估計(jì)及樣本量確定問(wèn)題。疾病流行率的研究可能受到年齡、性別等混雜因素的影響,因而將這些混雜因素看成分層變量,研究分層設(shè)計(jì)下的部分核實(shí)數(shù)據(jù)的統(tǒng)計(jì)推斷問(wèn)題是一種重要的研究問(wèn)題。在小樣本下基于大樣本漸近分布的檢驗(yàn)過(guò)程常常會(huì)得到不太令人滿(mǎn)意的結(jié)果,因而在小樣本下研究基于分層設(shè)計(jì)下的部分核實(shí)數(shù)據(jù)對(duì)疾病流行率的齊性檢驗(yàn)是一個(gè)有意義的研究問(wèn)題。
假設(shè)存在有誤判的2種分類(lèi)器(初級(jí)分類(lèi)器J和高級(jí)分類(lèi)器S)。從第j層(j=1,2,…,J)總體中隨機(jī)抽取Nj個(gè)個(gè)體接受初級(jí)分類(lèi)器進(jìn)行檢驗(yàn),Jj=1表示第j層的個(gè)體被診斷為陽(yáng)性,反之,Jj=0;然后再?gòu)闹须S機(jī)抽取nj(nj<Nj)個(gè)個(gè)體接受高級(jí)分類(lèi)器的檢驗(yàn),Sj=1表示被診斷為陽(yáng)性,反之,Sj=0。從而得到如表1所示的部分核實(shí)數(shù)據(jù)。
設(shè)Dj=1表示第j層中個(gè)體患病,反之,Dj=0;令πj=Pr(Dj=1)表示第j層中個(gè)體患病的概率,ηj=。為了使模型可識(shí)別,不妨假定不存在假陽(yáng)性。

表1 第j層部分核實(shí)數(shù)據(jù)

表2 模型1下第j層概率結(jié)構(gòu)
以下為齊性檢驗(yàn):H0:π1=π2=…=πJ=π?H1:至少有一對(duì)πi≠πj(i≠j)。
設(shè)mj=(n11j,n10j,n01j,n00j,xj,yj),π=(π1,…,πJ)′,η=(η1,…,ηJ)′,θ=(θ1,…,θJ)′,則基于m={mj:j=1,2,…,J}的對(duì)數(shù)似然函數(shù)為:l1(m;π,η,θ)=,其中

顯然,πj,ηj,θj的非限制性極大似然估計(jì)是方程組的解。根據(jù)文獻(xiàn)[12]可得,當(dāng)n11jn00j≥n10jn01j時(shí),


在H0:π1=π2=… =πJ=π下,π,ηj,θj的限制性極大似然估計(jì)是如下方程組的解:,由于無(wú)顯表達(dá)式,因而可用牛頓迭代法等求得方程組的解。

表3 模型2下第j層概率結(jié)構(gòu)
基于m={mj∶j=1,2,…,J}對(duì)數(shù)似然函數(shù)為,其中:

則πj,ηj,θj的非限制性極大似然估計(jì)為


在H0:π1=π2=… =πJ=π下,π,ηj,θj的限制性極大似然估計(jì)通過(guò)求解以下兩式:,得到:

根據(jù)Rao[14]所提出的Score檢驗(yàn)的一般理論,在2種模型下,經(jīng)過(guò)簡(jiǎn)單計(jì)算可得在H0:π1=π2=…=πJ=π成立下的Score檢驗(yàn)統(tǒng)計(jì)量為

其中Sj是2種模型下的Score函數(shù),
I11j為第j層Fisher信息陣的逆矩陣的第一主對(duì)角元素(見(jiàn)附錄)。當(dāng)Nj→∞(j=1,2,…,J)時(shí),檢驗(yàn)統(tǒng)計(jì)量Tsc漸近服從自由度為J-1的卡方分布[15]。
根據(jù)研究,可得如下的加權(quán)最小二乘估計(jì)檢驗(yàn)統(tǒng)計(jì)量[16]:



式中:漸近服從于自由度為J-1的卡方分布。

為評(píng)價(jià)提出方法的有效性,考慮如下的樣本量:①平衡設(shè)計(jì)nj=20,Nj=30(j=1,2,3);②非平衡設(shè)計(jì):(n1,n2,n3,N1,N2,N3)=(10,10,15,20,15,30)和參數(shù)設(shè)置:π=0.10(0.20)0.50;η1=0.50(0.05)0.60,η2=η1+0.05,η3=η1+0.10;θ1=0.70(0.05)0.80,θ2=θ1+0.05,θ3=θ1+0.10研究各種檢驗(yàn)的犯第1類(lèi)錯(cuò)誤的概率,模擬結(jié)果列于表4、5。同時(shí),考慮以上2種樣本量下δ=0.10(0.10)0.30和以上參數(shù)設(shè)置各檢驗(yàn)的功效,由于篇幅的限制,本研究只列出了nj=20,Nj=30(j=1,2,3)下的模擬結(jié)果,如表6所示。
模擬結(jié)果表明,2種模型下基于Bootstrap的小樣本檢驗(yàn)過(guò)程優(yōu)于漸近的檢驗(yàn)方法,前者犯第1類(lèi)錯(cuò)誤的概率更接近名義水平且具有更高的功效,而后者在小樣本下犯第1類(lèi)錯(cuò)誤的概率太保守。特別地,基于Score檢驗(yàn)的Bootstrap檢驗(yàn)過(guò)程在2種模型下的犯第1類(lèi)錯(cuò)誤的概率最接近名義水平。

表4 平衡小樣本量nj=20,Nj=30(j=1,2,3)下各檢驗(yàn)統(tǒng)計(jì)量在顯著性水平為α=0.05下犯第1類(lèi)錯(cuò)誤的概率(%)

表5 非平衡小樣本量設(shè)置下(n1=10,n2=10,n3=10;N1=20,N2=15,N3=30)各檢驗(yàn)統(tǒng)計(jì)量在置信水平α=0.05下犯第1類(lèi)錯(cuò)誤的模型結(jié)果概率(%)

表6 平衡小樣本量設(shè)置下(Nj=20,Nj=30,j=1,2,…,3)各檢驗(yàn)統(tǒng)計(jì)量在置信水平α=0.05下的檢驗(yàn)功效(%)
考慮Nedelman[9]在研究瘧疾流行率時(shí)按年齡分層的瘧疾數(shù)據(jù),本研究考慮如表7所示的3個(gè)成年組數(shù)據(jù),其中“+”表示被診斷為陽(yáng)性,“-”表示被診斷為陰性。

表7 成人組瘧疾數(shù)據(jù)
基于以上數(shù)據(jù),可得到2個(gè)模型下參數(shù)πj、ηj、θj的非限制性和限制性極大似然估計(jì),如表8所示。

表8 成人組瘧疾數(shù)據(jù)的非限制性極大似然估計(jì)(MLE)與限制性極大似然估計(jì)(CMLE)
對(duì)于假設(shè)檢驗(yàn):H0∶π1=π2=π3?H1∶π1,π2,π3不全相等,各種檢驗(yàn)的漸近p值和Bootstrap檢驗(yàn)p值如表9所示。

表9 成人組瘧疾數(shù)據(jù)的檢驗(yàn)p值
由表9可知,2種模型下各種檢驗(yàn)的漸近和Bootstrap檢驗(yàn)p值都大于0.05,因而在顯著性水平0.05下都沒(méi)有足夠的理由拒絕原假設(shè)。
本研究考慮了分層設(shè)計(jì)下的無(wú)金標(biāo)準(zhǔn)部分核實(shí)數(shù)據(jù)對(duì)疾病流行率的齊性檢驗(yàn)H0∶π1=π2=… =πJ?H1∶πi,πj不全相等(i≠j),提出了小樣本下基于檢驗(yàn)統(tǒng)計(jì)量Tsc,Twls,Tlog,Tlogit,Tdlog的Bootstrap檢驗(yàn)過(guò)程。模擬研究結(jié)果表明,在小樣本下基于Bootstrap的檢驗(yàn)過(guò)程犯第1類(lèi)錯(cuò)誤的概率更接近顯著性水平,且具有更高的功效。因而,在小樣本下推薦使用Bootstrap的檢驗(yàn)過(guò)程。
附錄
第j層Fisher信息陣的逆矩陣的第一主對(duì)角元素為

其中,
在模型1下:

在模型2下:
