南方醫(yī)科大學公共衛(wèi)生學院生物統(tǒng)計學系(510515) 吳海燕 劉偉杰 傅利強 譚旭輝
【提 要】 目的 使用內(nèi)部預(yù)試驗解決成組序貫設(shè)計中方差未知時樣本量估計的問題,同時得出內(nèi)部預(yù)試驗適宜的樣本量。方法 以兩樣本均數(shù)比較的優(yōu)效性檢驗為分析目的,利用損耗函數(shù)法在拒絕型成組序貫設(shè)計下,通過設(shè)定不同的內(nèi)部預(yù)試驗樣本量、方差真實值和方差估計值,計算方差重估法的Ι類錯誤、功效Power和平均樣本量。結(jié)果 方差估計正確時,方差重估法能控制Ι類錯誤,功效和平均樣本量隨著內(nèi)部預(yù)試驗樣本量n0的增加而增加,當n0≥20時能獲得較好的功效和適宜的平均樣本量;方差估計錯誤時,方差重估法同樣能控制Ι類錯誤且不會出現(xiàn)傳統(tǒng)成組序貫設(shè)計中功效過高或過低的情況,當標準差估計值s為10,標準差真實值σ分別為6、8、12和14時,該方法的功效分別為0.895、0.886、0.887和0.887。結(jié)論 方差重估法能有效解決成組序貫設(shè)計中方差未知的問題,避免了方差錯誤估計時導(dǎo)致的功效異常。
在臨床試驗中,成組序貫設(shè)計(group sequential design)由于能夠有效降低試驗所需樣本量和提前結(jié)束試驗而成為了較好的設(shè)計選擇[1]。損耗函數(shù)法(error spending function method)[2]是成組序貫設(shè)計中一種常用的方法。為了使試驗?zāi)軌蛞砸欢ǖ墓πОl(fā)現(xiàn)處理組間的差異,試驗設(shè)計階段必須合理估計所需的樣本量,但在試驗設(shè)計之初用于估計樣本量的方差往往是未知的,其估計值通常來源于以往的經(jīng)驗和文獻回顧。如果設(shè)計方差估計過大,會造成資源的浪費;反之,會導(dǎo)致功效不足。Wittes&Brittain[3]針對這一問題提出利用內(nèi)部預(yù)試驗(internal pilot studies,IPS)來重新估計方差。其中,重新估計方差可在盲態(tài)和揭盲狀態(tài)下進行,為保證試驗的完整性,一般在盲態(tài)下進行。故本文在大樣本成組序貫設(shè)計的條件下,利用內(nèi)部預(yù)試驗在盲態(tài)條件下對設(shè)計方差進行重估,比較基于內(nèi)部預(yù)試驗的方差重估法和傳統(tǒng)成組序貫設(shè)計的優(yōu)劣,為該方法在成組序貫設(shè)計中的應(yīng)用提供理論參考。
1.成組序貫設(shè)計
成組序貫設(shè)計能在試驗過程中對已經(jīng)累積的數(shù)據(jù)進行多次期中分析。由于期中分析[4]為試驗提供了提前終止的可能,成組序貫設(shè)計可以顯著減少試驗樣本量,縮短試驗周期。從設(shè)計角度來看,成組序貫設(shè)計將試驗劃分成K個連續(xù)的階段,每個階段內(nèi)都有新的受試者加入。當?shù)趉個階段(k=1,2,…,K)結(jié)束后,把之前所有階段的試驗結(jié)果累積起來進行一次統(tǒng)計分析。對于拒絕型的成組序貫設(shè)計,如果拒絕H0則試驗結(jié)束,否則繼續(xù)下一階段試驗。在最后的試驗階段,其結(jié)果只能是接受H0或拒絕H0[5]。
損耗函數(shù)法是成組序貫設(shè)計臨界值計算的一種方法,每階段損耗的I類錯誤為αk,總I類錯誤α=α1+…+αK,具體損耗過程如下[6]:
α1=f(I1/IK)
(1)
αk=f(Ik/IK)-f(Ik-1/IK),k=2,…,K
(2)
每階段分析的臨界值ck滿足以下條件:
Pr{Z1≥c1}=α1
(3)
Pr{Z1 (4) 其中Ik為第k階段累積信息量,f(t)=min(αt3,α)為選定的損耗函數(shù),Zk為第k次期中分析的檢驗統(tǒng)計量。 2.基于內(nèi)部預(yù)試驗的成組序貫設(shè)計 在功效一定的情況下估計樣本量,往往需要知道一些未知參數(shù)的估計值,例如方差或事件率,而這些參數(shù)在試驗設(shè)計階段通常是無法準確獲得的。解決這類問題的常用辦法是在主要試驗開始之前進行初步的預(yù)試驗研究[6]。Wittes&Brittain[3]在其研究中利用內(nèi)部預(yù)試驗估計方差并重新估計試驗所需的樣本量。該方法允許利用首批進入試驗的部分受試者信息對相關(guān)未知參數(shù)進行估計。相關(guān)研究表明,該方法可以解決試驗設(shè)計中方差估計不準所導(dǎo)致的樣本量偏差[7-10]。 現(xiàn)以兩均數(shù)比較的優(yōu)效性成組序貫設(shè)計為例,利用內(nèi)部預(yù)試驗對方差進行重新估計。在研究設(shè)計開始時,方差σ2的估計值大多數(shù)源于以往的經(jīng)驗或文獻,假定其估計值為s2,在單側(cè)檢驗水準為α、兩均數(shù)之差為δ和總階段數(shù)為K的情況下,為使功效達到1-β,試驗所需總樣本量由公式(5)算出。 n=R(K,α,β)nf(α,β,δ,s2) (5) (6) 其中,nf(α,β,δ,s2)={Φ-1(1-α)+Φ-1(1-β)}22s2/δ2 τ={Φ-1(1-α)+Φ-1(1-β)}22R(K,α,β)/δ2,R(K,α,β)是根據(jù)K,α,β確定的常數(shù),其取值要滿足檢驗所需的功效。 (7) (8) (9) 在大樣本條件下,本文通過隨機模擬研究,對拒絕型損耗函數(shù)法成組序貫設(shè)計條件下方差重估法的實際效果進行評估,并對內(nèi)部預(yù)試驗的樣本量進行探討。在此基礎(chǔ)上,對方差重估法和傳統(tǒng)成組序貫設(shè)計的優(yōu)劣性進行比較。 本文以兩樣本均數(shù)比較的成組序貫為設(shè)計框架,采用SAS 9.4隨機產(chǎn)生模擬研究的數(shù)據(jù)。本模擬過程分為兩個部分,設(shè)計框架均為優(yōu)效性假設(shè)檢驗H0:θ≤0,H1:θ>0(δ=2),單側(cè)α=0.05,β=0.1(即Power=0.9),成組序貫設(shè)計方法為損耗函數(shù)法,其中損耗函數(shù)為f(t)=min(αt3,α),階段數(shù)K=5,模擬次數(shù)為2000次;δ為效應(yīng)差值,試驗組均值Mt=5或7,對照組均值Mc=5,σ為標準差真實值,s為標準差估計值,每階段每組樣本量m=30、50或100,內(nèi)部預(yù)試驗樣本量n0設(shè)定為20或根據(jù)內(nèi)部預(yù)試驗樣本比例ρ計算,其中ρ=0.25,0.5,0.75。對于非劣效性假設(shè)檢驗H0:θ≤-Δ,H1:θ>-Δ(Δ為非劣效界值),當非劣效界值為0時,本文所設(shè)定的統(tǒng)計優(yōu)效性假設(shè)檢驗實際上等價于非劣效性假設(shè)檢驗。 1.模擬比較一 在方差估計正確的條件下(即σ=s,其中σ為標準差真實值,s為標準差估計值),用不同的標準差σ、內(nèi)部預(yù)試驗樣本量n0計算方差重估法的I類錯誤、功效(power)和平均樣本量(average sample number,ASN)等指標,得出適宜的內(nèi)部預(yù)試驗樣本量n0。具體參數(shù)設(shè)置如表1所示: 表1 參數(shù)設(shè)定(模擬一) 2.模擬比較二 在方差估計錯誤的情況下(即σ≠s),使用傳統(tǒng)的成組序貫設(shè)計能控制住總體Ι類錯誤,但功效不能保持。當設(shè)計方差(即總體方差估計值)偏離總體方差真實值時,功效通常會出現(xiàn)低估或高估的情況。因此本研究采用方差重估法解決這一難點問題。根據(jù)模擬比較一的結(jié)果,我們在內(nèi)部預(yù)試驗樣本量n0=20的情況下計算方差重估法的總體Ι類錯誤、功效和平均樣本量等指標,評價該方法的優(yōu)劣。具體參數(shù)設(shè)置如表2所示: 表2 參數(shù)設(shè)定(模擬二) 1.模擬比較一 在方差估計正確的情況下,按照表1的參數(shù)設(shè)置進行模擬研究,方差重估法的Ι類錯誤、功效(power)和平均樣本量(ASN)如表3所示。由表3的模擬結(jié)果可以看出,方差重估法可以較好地將Ι類錯誤控制在0.05左右。在大樣本條件下,總樣本量和內(nèi)部預(yù)試驗樣本量的變化對Ι類錯誤影響不大。陰性研究的平均樣本量隨著內(nèi)部預(yù)試驗樣本量的增加輕微增加。 在陽性研究條件下,功效受內(nèi)部預(yù)試驗樣本量的影響較大,內(nèi)部預(yù)試驗的樣本量越大,功效越高。當σ=5.8且n0=8和σ=7.5且n0=13時,功效分別為0.875和0.878。由此可見,當內(nèi)部預(yù)試驗樣本量較小時,功效偏低。陽性研究的平均樣本量也隨內(nèi)部預(yù)試驗樣本量的增加而略微增加。在大樣本成組序貫設(shè)計條件下,內(nèi)部預(yù)試驗樣本量在20以上時,功效均能較好的維持在0.9左右。 2.模擬比較二 在方差估計錯誤的情況下,按照表2的參數(shù)設(shè)置進行模擬研究,方差重估法的Ι類錯誤、功效(power)和平均樣本量(ASN)如表4所示。由表4的模擬結(jié)果可以看出,當內(nèi)部預(yù)試驗樣本量為20時,在方差估錯的情況下,方差重估法與傳統(tǒng)的成組序貫設(shè)計一樣能較好地控制Ι類錯誤在0.05左右。 表3 方差估對時Ι類錯誤、功效(power)和平均樣本量(ASN) 就功效和平均樣本量來看,方差重估法能較好地維持住功效和獲得適宜的平均樣本量。當方差真實值小于方差估計值時,傳統(tǒng)成組序貫設(shè)計的功效均明顯高于設(shè)定功效0.9,而方差重估法的功效均能控制在0.9左右,其平均樣本量明顯低于傳統(tǒng)成組序貫設(shè)計;當方差真實值大于方差估計值時,傳統(tǒng)成組序貫設(shè)計的功效明顯低于設(shè)定功效0.9,而方差重估法的功效依舊能較好維持功效在0.9左右,其平均樣本量相較于傳統(tǒng)成組序貫設(shè)計有明顯的提高。 表4 方差估錯時Ι類錯誤、功效(power)和平均樣本量(ASN) 當方差估計錯誤時使用傳統(tǒng)的成組序貫設(shè)計會導(dǎo)致功效得不到保證,當方差真實值小于方差估計值時會導(dǎo)致功效過高,造成樣本量不必要的浪費;當方差真實值大于方差估計值時會導(dǎo)致功效過低,說明試驗的樣本量不足。通過模擬研究二我們發(fā)現(xiàn)方差重估法能較好的解決這個問題。從實際效果來看,當方差真實值小于方差估計值時,方差重估法能降低過高的功效,避免樣本量的浪費。在使用內(nèi)部預(yù)試驗重估樣本量的過程中,會存在重估樣本量低于設(shè)計樣本量的情況。而在實際臨床試驗的過程中,減少試驗樣本量有時是很難被人接受的。按照Wittes[3]和Birkett[9]的觀點,當出現(xiàn)重估樣本量低于設(shè)計樣本量的時候,應(yīng)繼續(xù)使用原來設(shè)計時樣本量,從而使得樣本量在試驗過程中只增不減。如果在方差重估法中使用這種樣本量“只增不減”的策略,此時基于內(nèi)部預(yù)試驗的方差重估法必然也會導(dǎo)致功效過高和樣本量增加的情形。因此,在試驗過程中如要降低樣本量并維持住功效,那么基于內(nèi)部預(yù)試驗所得的方差估計值必須足夠精確和可信。這就需要內(nèi)部預(yù)試驗的樣本比例ρ不能太低,我們認為內(nèi)部預(yù)試驗樣本比例ρ在75%以上時,基于內(nèi)部預(yù)試驗的方差估計值是可信的。當方差真實值大于方差估計值時,該方法能提高功效,避免功效過低。在此過程中,方法重估法一般情況下并不會出現(xiàn)重估樣本量低于設(shè)計樣本量,即減少樣本量的情況。 在臨床試驗中可能會存在早期試驗數(shù)據(jù)不穩(wěn)定的情況,這種不穩(wěn)定會導(dǎo)致方差重估法估計方差時出現(xiàn)偏差,從而對樣本量的重估計產(chǎn)生較大的影響。因此,針對早期數(shù)據(jù)不穩(wěn)定的情形,可通過適當?shù)脑黾觾?nèi)部預(yù)試驗的樣本量來減少估計偏差(例如ρ增大到75%)。另外,在每次期中分析后,利用已有的數(shù)據(jù)進行方差重估,并重新計算下一階段的樣本量,也可有效解決早期數(shù)據(jù)不穩(wěn)定導(dǎo)致的樣本量錯估問題。由于此方法屬于適應(yīng)性設(shè)計,不屬于經(jīng)典成組序貫設(shè)計范疇,故本文不做討論。 綜上所述,在大樣本成組序貫試驗中,當設(shè)計方差大于真實方差時,對于重估樣本量小于設(shè)計樣本量的情況需慎重處理,尤其是要考慮內(nèi)部預(yù)試驗樣本量和早期不穩(wěn)定的試驗數(shù)據(jù)對方差估計值的影響。當設(shè)計方差低于真實方差且早期試驗數(shù)據(jù)較穩(wěn)定時,可采用基于內(nèi)部預(yù)試驗的方差重估法對樣本量進行重估計,從而避免因為設(shè)計方差的錯誤估計導(dǎo)致試驗設(shè)計功效的異常。


模擬比較


結(jié) 果


討 論
