劉青松,王黎明,瞿穎秋,邱世芳
(重慶理工大學 理學院,重慶 400054)
在生物醫(yī)學研究中,人們常常需要處理大量的相關數據,例如,在眼科(耳科)研究中,每個個體可以得到2只眼睛(耳朵)中每1只眼睛(耳朵)的重要信息,而得到的這些數據往往是高度相關的。研究表明:忽視這些成對數據之間的相關性往往會得到錯誤的統(tǒng)計推斷[1]。如在治療兒童中耳炎時,Mantel等[2-3]在雙盲臨床試驗中比較2種抗生素(Cefaclor和Amoxicillin)的治愈率。既有1只耳朵患病又有2只耳朵都患病的兒童,被隨機分配到使用不同抗生素的治療組中,每個兒童都接受為期14 d的治療。2只耳朵都患病的兒童經過14 d治療后,治療的結果被分為3類:一是兒童的2只耳朵都被治愈;二是兒童僅僅只有1只耳朵被治愈;三是兒童沒有1只耳朵被治愈。只有1只耳朵患病的兒童治療后,結果有被治愈和沒有治愈2種情況。試驗數據見表1所示。

表1 接受14 d治療后兒童的中耳炎數據
針對此類研究,人們常常想要檢驗的是Cefaclor和Amoxicillin的治愈率是否相同。近年來,對于此類組內相關數據的研究備受關注。Rosner[1]在樣本量很大的情況下,基于大樣本理論討論了雙邊數據的統(tǒng)計假設檢驗,提出了該檢驗假設的2種檢驗統(tǒng)計量。隨后,Tang等[4]針對這種成對器官的雙邊治療數據,提出了獨立性假設和非獨立性假設下的漸近和近似非條件的檢驗過程,Tang等[5]基于2種藥物治療率之差提出了其置信區(qū)間的構造方法。對于混合單雙邊試驗數據,Pei等[6]基于治愈率之比研究了2種治療的等價性檢驗問題,覃愿等[7]研究了單雙邊混合試驗設計下,2種治療的治愈率之比的漸近置信區(qū)間。
然而,在臨床試驗研究中,對樣本量的研究也是至關重要的。對于具有組內相關的雙邊試驗數據,邱世芳等[8-9]基于比例差分別從顯著性檢驗的角度和區(qū)間估計的角度,推導了近似樣本量的公式和有效算法。然而,對單雙邊混合試驗設計下基于比例差的區(qū)間估計所需要的樣本量的確定還未有文獻研究,本文將就此問題進行研究,提出幾種有效的樣本量的確定公式或有效算法。
假設i=0表示使用Cefaclor的治療組,i=1表示使用Amoxicillin的治療組。假設(i=0,1;q=1,2)表示個體接受第i種治療后,有h只耳朵被完全治愈的患者的個數。當q=1時,代表單邊數據,此時h=0,1;當q=2時,代表雙邊數據,此時h=0,1,2代表其相應的概率。單雙邊混合試驗設計下的數據結構如表2所示。

表2 單雙邊混合試驗數據的觀測頻數及相應的概率

其中,R是用來衡量患者2只耳朵相關性的指標。顯然,當R=1時,表示2只耳朵完全獨立,即1只耳朵治愈與另外1只耳朵治愈情況完全無關。基于以上假設,易得到:

令Δ表示2種藥物治療的治愈率之差,即Δ=λ0-λ1。因此,在此模型下,對于觀測頻數m=的對數似然函數為:

式中:C是1個常數。本文所感興趣的參數是Δ,λ1和R是當前問題的討厭參數。

因此,Δ的100(1-α)%置信區(qū)間為

式中:zα/2是標準正態(tài)分布的上α/2分位數。簡單計算可以得到Δ的100(1-α)%置信區(qū)間寬度控制在2ω內的樣本量為

2.2.1 基于限制性極大似然估計的Wald統(tǒng)計量的置信區(qū)間
在給定的原假設Δ=Δ0下,λ1和R的限制性極大似然估計和可以通過如下的方程組求得:

這個方程組是沒有顯示解的,因此可以通過一種迭代的方法(如Fisher-Score迭代)求解。的方差中的參數可以使用其限制性極大似然估計,從而得到的方差的估計為:


此方程沒有顯示解,可通過迭代法求出此方程的解。
2.2.2 基于Score檢驗統(tǒng)計量的置信區(qū)間
在Rosner模型下,假設檢驗H0∶Δ=Δ0的Score檢驗統(tǒng)計量為:


下限和上限分別是方程Ts(Δ)=zα/2和Ts(Δ)=-zα/2的解。
2.2.3 基于似然比檢驗統(tǒng)計量的置信區(qū)間
當樣本量足夠大時,Rosner模型下,對于假設檢驗H0∶Δ=Δ0的似然比檢驗統(tǒng)計量為:

在大樣本下Tl服從自由度為1的卡方分布。因此,基于似然比統(tǒng)計量關于Δ的100(1-α)%置信區(qū)間上下限可通過迭代方法求解關于Δ的方程得到:

2.2.4 樣本量的數值解法
由于基于限制性極大似然估計的Wald檢驗統(tǒng)計量、Score檢驗統(tǒng)計量和似然比檢驗統(tǒng)計量的置信區(qū)間都沒有顯表達式,因而本文采用如下的近似算法來計算區(qū)間寬度控制在2ω內的樣本量:
步驟1給定m+1、R、λ1、Δ、κ和s的值,產生K組樣本其中服從二項分布服從三項分布
步驟2基于步驟1產生的隨機樣本,分別通過式(9)(11)(13)得到Δ的100(1-α)%置信區(qū)間,從而得到在樣本量m+1下Δ的經驗區(qū)間寬度,記為c*(m+1)。
步驟3如果c*(m+1)大于(小于)2ω,則增大(減小)m+1的值,重復步驟1、2,直到區(qū)間寬度c*(m+1)非常接近于給定的區(qū)間寬度2ω,即滿足min{m+1:|c*(m+1)-2ω≤0.001}的m+1即為所求的樣本量。
通過以上算法獲得的基于限制性極大似然估計的Wald、Score和似然比置信區(qū)間的樣本量分別記為Nw2,Ns和Nl。
為了檢驗所提出方法的準確性,考慮參數設置:Δ=-0.1,0.0,0.1;λ1=0.3,0.5;R=1.0,1.2以及κ=1.0,1.2,s=0.5,1.0;置信水平為1-α=0.95,置信區(qū)間寬度的一半控制在ω=0.05,0.1下的樣本量的確定。通過式(6)和樣本量的數值算法,可得到近似的樣本量Nw1、Nw2、Ns和Nl,為了考察樣本量公式的準確性,基于估計的樣本量,隨機模擬計算了各種置信區(qū)間的經驗覆蓋概率(ECP)和經驗覆蓋寬度(ECW),結果見表3~6。

表3 置信區(qū)間寬度控制在2ω下的近似樣本量、經驗覆蓋概率和區(qū)間寬度(κ=1.0,s=0.5)
模擬研究表明:
1)基于Wald置信區(qū)間、Score置信區(qū)間和似然比置信區(qū)間確定的樣本量都很準確,因為在估計的樣本量下,各種置信區(qū)間的經驗覆蓋概率接近于事先給定的置信水平,且半區(qū)間寬度也很接近預先設定的寬度ω。
2)在文中所提出的4種方法中,基于似然比置信區(qū)間得到的樣本量是最大的,基于非限制性極大似然估計的Wald置信區(qū)間得到的樣本量是最小的,基于限制性極大似然估計的Wald置信區(qū)間和基于Score置信區(qū)間所得到的樣本量差別不大。
3)隨著Δ、λ1、R的增大,要使95%的置信區(qū)間寬度控制在2ω以內,所需要的樣本量就越大。

表4 置信區(qū)間寬度控制在2ω下的近似樣本量、經驗覆蓋概率和區(qū)間寬度(κ=1.0,s=1.0)

續(xù)表(表4)

表5 置信區(qū)間寬度控制在2ω下的近似樣本量、經驗覆蓋概率和區(qū)間寬度(κ=1.2,s=0.5)

表6 置信區(qū)間寬度控制在2ω下的近似樣本量、經驗覆蓋概率和區(qū)間寬度(κ=1.2,s=1.0)
對于表1中的兒童中耳炎數據,采用所提出的方法研究樣本量。從表1的數據易知:=-0.203 7,=0.537,R^=1.517 1。因此,可認為此數據是高度組內相關的。假設κ=1.0,s=0.5,當ω=0.05時,利用提出的方法,可得到基于非限制性極大似然估計的Wald、限制性極大似然估計的Wald、Score和似然比置信區(qū)間確定的樣本量(m+1)分別為:587、588、577、736。它們所對應的經驗覆蓋概率(經驗覆蓋寬度)分別為:95.45(0.099 9)、95.20(0.099 7)、94.80(0.090 1)、96.60(0.090 0)。當ω=0.1時、基于非限制性極大似然估計的Wald、限制性極大似然估計的Wald、Score和似然比置信區(qū)間方法確定的樣本量(m+1)分別為:147、157、137、169。它們所對應的經驗覆蓋概率(經驗覆蓋寬度)分別為:94.60(0.198 6)、94.35(0.192 1)、94.95(0.184 8)、96.95(0.191 9)。
基于單雙邊混合試驗設計下治愈率之差,考慮了基于2種Wald型置信區(qū)間、Score置信區(qū)間和似然比置信區(qū)間的寬度控制在給定長度內的樣本量計算公式和近似樣本量的數值算法。通過研究表明:
1)基于Wald置信區(qū)間、Score置信區(qū)間和似然比置信區(qū)間所得到的近似樣本量的置信區(qū)間的經驗覆蓋概率與給定的置信水平十分接近,且區(qū)間寬度也很接近設定的寬度,因此在實際中這4種方法應被推薦使用。
2)所需樣本的大小與參數取值有關,參數Δ、λ1、R的值越大,所需要的樣本量就越大。綜上所述,文中提出的樣本量的估計公式和數值算法都是有效的。
附錄:
在Rosner模型下,檢驗H0′:Δ=Δ0的Score檢驗統(tǒng)計量為:

其中:

且
