999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

自適應樣本量調整中Fisher合并P值法和傳統檢驗法的模擬比較

2012-07-25 08:15:34王素珍孟維靜呂軍城石福艷夏結來
統計與決策 2012年14期

王素珍,孟維靜,呂軍城,石福艷,夏結來

0 引言

樣本量調整是臨床試驗自適應設計的一個熱點問題,樣本量調整的方法有很多,目前關注最多的是兩階段自適應設計的樣本量調整。而在兩階段樣本量調整中,又包括根據第一階段的合并方差S21進行樣本量調整、根據第一階段的組間差值進行調整以及同時根據S21和進行調整等,本文主要研究根據S21和進行樣本量調整時數據的分析方法。

第一階段完成后,在盲態或揭盲狀態下進行期中分析[1],利用新得到的組間差值來代替最初設計的有臨床意義的差值δ、新得到的合并方差代替原計劃的方差重新計算樣本量,受到很多統計學家的推崇[2-6],本研究采用兩階段設計方法設計一安慰劑對照的臨床試驗,在揭盲狀態下對樣本量進行調整,借助蒙特-卡羅(Monte Carlo)計算機模擬方法[7],采用SAS軟件[8]模擬樣本量調整中的兩個階段。第一階段結束后估算組間差值以及近似方差并據此重新計算樣本量,完成第二階段的試驗模擬,第二階段結束后采用合并P值法分析全部數據,并與傳統檢驗方法相比較,以探討合并P值法對樣本量調整后Ⅰ型錯誤和檢驗效能的影響,為兩階段設計在臨床試驗中的應用提供參考依據。

1 方法及設計

1.1 揭盲狀態下利用δ和調整樣本量的方法

假定有一研究某降壓藥療效的安慰劑對照Ⅲ期臨床試驗,具有A,B兩個處理組,分別接受治療藥物A和B,主要終點指標是仰臥舒張壓SDBP(Supine diastolic blood pressure,單位mmHG)。現采用兩階段自適應設計方法設計該試驗,即在試驗進行中調整樣本量[9~11],同時觀察藥物療效。由常識知A,B兩個處理組的療效均服從正態分布,根據先前的試驗,預先估計處理組和安慰劑組的共同方差為,兩組之間有臨床有意義的處理差別為δ。由此可以計算在Ⅰ型錯誤概率α、檢驗效能1-β下試驗所需的樣本量N。初始方案中的第一階段每組樣本量為n1,即從總樣本中取出一部分n1作為第一階段樣本進行試驗,試驗完成后在揭盲狀態下計算組間差值δ以及合并方差

,據此重新計算整個試驗的樣本量Nrecalc,然后進行第二階段的試驗,第二階段的樣本量為重計算所得樣本量減去第一階段的樣本量,即n=Nrecalc-n1。

1.2 模擬設計

由前面的假定已知A,B兩個處理組的組間差值δ,共同的方差,現假定藥物組A和安慰劑組B對應的主要療效分別具有均值ux、uy,則模擬過程如下:應用SAS隨機數函數rannor分別產生均值ux方差和均值uy方差的兩組隨機數各n1個,作為第一階段的樣本量。此處的為第一階段的方差,此值可設置與相等或略有不等。第一階段完成后,利用2n1個樣本做期中分析,計算A,B兩個處理組的組間差值以及合并方差,根據和重新計算樣本量,模擬產生第二個階段的數據。對上述兩個階段分別進行方差分析和合并P值法進行檢驗,其中方差分析法是對兩個階段的合并數據進行檢驗,而合并P值法則是對兩個階段分別做方差分析,然后將兩個階段得到的P值合并。不斷改變n1的值,重復上述模擬試驗。在既定的參數設置下,程序每循環一次對一個樣本量為N的樣本完成一次兩階段模擬,也即對一個樣本量為n1的樣本完成一次第一階段模擬,兩組的組間差為0時計算Ⅰ型錯誤,為某一固定值時計算檢驗效能對每一個既定的兩階段過程循環10000次計算Ⅰ型錯誤,5000次循環計算檢驗效能。n1從5開始,每次增加5個,直到達到總樣本量的80%。

2 結果

根據前面假定的研究某降壓藥臨床試驗例子產生模擬數據,先前研究得到的兩組SDBP與基線相比平均舒張壓下降的差值δ=3,方差=64,在Ⅰ型錯誤α=0.05時,獲得1-β=0.9的檢驗效能所需的最初樣本量為151例,簡單起見取150例,即N=150,從中取一定比例的樣本量n1=πN模擬第一階段試驗。第一階段的組間效應即是兩組SDBP與基線相比平均舒張壓下降值的差值,此值與最初設定值相同,即3mmHG,第一階段的方差與最初設置的不同,設為=92=81,據此產生第一階段模擬數據。由模擬數據計算出組間均值差的估計值,以及第一階段的合并方差,并根據1j和重新估算樣本量,進行第二階段的試驗,第二階段的模擬數據根據和產生。在 δ1j=0時,計算Ⅰ型錯誤,而在δ1j=3mmHG計算檢驗效能。在不斷變化第一階段樣本量的條件下,比較方差分析法和合并P值法的Ⅰ型錯誤和檢驗效能。對每一個既定的樣本量完成10000次循環計算Ⅰ型錯誤,5000次循環計算檢驗效能。所得結果如表1和表2所示。其中N_ips為第一階段樣本量,MeanNr和MedNr分別為10000或5000次重計算的樣本量的均值和中位數,MeanN2和MedN2分別為第二階段樣本量的均值和中位數。表1中最右側的兩列分別對應方差分析法和合并P值法的Ⅰ型錯誤;表2中最右側的兩列則分別對應兩種方法的檢驗效能。

由表1可以看出,調整后樣本量的均值比最初預設的樣本量要大。這是因為在模擬Ⅰ型錯誤時,假定兩組間的均值差為0,此時在第一階段完成后,計算得到的兩組間差值會很小,因此重計算的樣本量較大。當第一階段樣本量較小時,比如小于70(約為最初設計樣本量的一半左右)時,方差分析法的Ⅰ型錯誤明顯高于合并P值法,而第一階段樣本量高于70時,方差分析法的Ⅰ型錯誤逐漸減小,沒有出現大于名義檢驗水準0.05的情況;而合并P值法的Ⅰ型錯誤卻還出現大于0.05的情況。這似乎告訴我們,當采用IPS方差及觀測到的組間差值進行樣本量調整時,如果第一階段的樣本量較小,比如小于最初計劃樣本量的一半時,則應采用合并P值法對兩階段數據分別分析;而在第一階段樣本量大于計劃樣本量的一半時,可采用方差分析分析兩階段的合并數據。然而,從表2的檢驗效能比較中卻發現,在樣本量較小時,合并P值法的檢驗效能遠低于方差分析法的檢驗效能,比如當第一階段樣本量為20時,方差分析法的效能為0.828,但合并P值法的檢驗效能卻只有0.682,離預期的檢驗效能相差太遠,因此我們只根據Ⅰ型錯誤就斷定IPS樣本量較小時應采用合并P值法來分析數據是不合理的。

表2 方差分析法和合并P值法在不同IPS樣本量時的檢驗效能

3 討論

自適應樣本量調整中,Ⅰ型錯誤的膨脹一直為人們所關注[1,4]。綜合本文中兩種方法的Ⅰ型錯誤和檢驗效能,可以得出這樣的結論:當采用第一階段方差及觀測到的組間差值進行樣本量調整時,第一階段的樣本量不能小于計劃樣本量的1/3,在此為50例,若小于計劃樣本量的1/3,則無論采用傳統的統計方法還是采用合并P值法,都很難在控制Ⅰ型錯誤和保證檢驗效能之間達成較好的平衡,因為此時如果采用方差分析法,則Ⅰ型錯誤過大;采用合并P值法,Ⅰ型錯誤略有增大,但是檢驗效能過低。當第一階段樣本量大于計劃樣本量的1/3而小于計劃樣本量的一半時,應選擇合并P值法,此時雖然檢驗效能有所降低,但是可保證Ⅰ型錯誤不增大。而當第一階段樣本量超過計劃樣本量的一半時,則應采用方差分析法分析兩個階段的合并數據,此時既有較高的效能,又能防止Ⅰ型錯誤的增大。

樣本量調整中不增大Ⅰ型錯誤,不僅與藥物審批要求[17]相一致,而且節約了成本,保證了試驗的可行性。在樣本量調整過程中,合理的選擇檢驗方法,是保證試驗成功的關鍵因素之一。本文給出了不同樣本量時檢驗方法的選擇途徑。另外,在模擬中還有兩個隨機數,即調整后的樣本量Nrecalc和第二階段的樣本量n2,這兩個值同樣對Ⅰ型錯誤和檢驗效能有影響。由于樣本的隨機性,有時根據第一階段數據得出的很小,而很大,使得重計算的樣本量非常大;有時得出的很大,而很小,重計算的樣本量就會很小。當重計算的樣本量很小時,可以按照Birkett和Day[13]的規限制則,取重計算的樣本量不小于第一階段的樣本量;但是當重計算的樣本量很大時,按照Birkett和Day的規則,應該取重計算樣本量和第一階段樣本量中的較大者,這會使得重計算的樣本量相當大,有的甚至到了上萬例,使得第二階段的臨床試驗變得根本不現實。這無論對臨床試驗的申辦方還是研究者,都是難以接受的。重計算樣本量的目的就是為了節約成本,在用最少樣本的情況下得出最準確可靠的結論。如果重計算的樣本量大于原計劃樣本量的4倍,應即視之為異常值。為了防止異常值的出現,應該對第一階段設計有效或無效停止的邊界,比如,可以按照檢驗效能做出規定:如果條件效能至少為60%的話,則增加樣本量,否則的話,就宣布無效停止;也可以按照第一階段檢驗所得的P值做出規定,當P值小于或大于某一臨界值時,宣布試驗有效或無效,及時停止試驗,這樣可以避免因出現異常大的樣本量調整值而導致試驗無法進行。

[1] Zucker D.M.,Wittes J.T.,Schabenberger O.et.al.Internal Pilot Stud?ies II:Comparison of Various Qrocedures[J].Statistics in Medicine,1999,(18).

[2] Bauer P,Kohne K.Evaluation of Experiments with Adaptive Interim Snalyses[J].Correction in Biometrics,1996,(52).

[3] Proschan MA,Hunsberger SA.Designed Extension of Studies Based on Conditional Power[J].Biometrics,1995,(51).

[4] Kieser M,Friede T.Simple Procedures for Blinded Sample Size Ad?justment that do not Sffect the TypeⅠ Error Rate[J].Statistics in Med?icine,2003,(22).

[5] Lan KKG,Wittes J.The B-value:A Tool for Monitoring Data[J].Bio?metrics,1988,(44).

[6] Liu Q,Chi Gyh.On Sample Size and Inference for Two-stage Adap?tive Designs[J].Biometrics,2001,(57).

[7] Sheldon M.Ross,Simulation.(3th Edition)[J].Printed in China by POSTS&TELECOM Press,2006.

[8] SAS Institute Inc.SAS/STAT User's Guide Version 8.2[CP/CD].North Carolina,2006.

[9] Werner Brannath,Peter Bauer,Martin Posch.On the Efficiency of Adaptive Designs for Flexible Interim Decisions in Clinical Trials[J].Journal of Statistical Planning and Inference,2006,(136).

[10] Zhu Chunhua,Chen Guijing.Some Optimal Adaptive Designs in Clinical Trials[J].Chinese Journal of Applied Probability and Statis?tics,2005,(21).

[11] Wittes J,Brittain E.The Role of Internal Pilot Studies in Increasing the Efficiency of Clinical Trials[J].Statistics in Medicine,1990,(9).

主站蜘蛛池模板: 亚洲制服中文字幕一区二区| 国产欧美日韩免费| 婷婷午夜影院| 一本久道久久综合多人| 精品国产一区91在线| 亚洲日韩精品欧美中文字幕| 高清无码不卡视频| 日韩视频免费| 国产香蕉国产精品偷在线观看| 亚洲精品无码日韩国产不卡| 欧美日韩国产精品va| 亚洲国产成人精品青青草原| 久久 午夜福利 张柏芝| 国产精品久线在线观看| 亚国产欧美在线人成| 日本不卡免费高清视频| 国产高清色视频免费看的网址| 中文字幕在线日本| 午夜福利在线观看成人| 亚洲国产天堂久久综合| 91精品人妻互换| 国产91在线|中文| 91色在线观看| 日本手机在线视频| 91视频精品| 国产日韩丝袜一二三区| 91国内视频在线观看| 国产欧美日韩综合一区在线播放| 日韩高清中文字幕| 人妻夜夜爽天天爽| 啪啪啪亚洲无码| 成人精品亚洲| 精品欧美一区二区三区久久久| 午夜激情福利视频| 人妻少妇乱子伦精品无码专区毛片| 国产成人久久777777| jijzzizz老师出水喷水喷出| 亚洲欧美成人综合| 日本草草视频在线观看| 99福利视频导航| 99re这里只有国产中文精品国产精品| 五月丁香在线视频| 亚洲看片网| 日韩无码白| 欧美成人一级| 欧美一区日韩一区中文字幕页| 亚洲精品国产首次亮相| 亚洲无卡视频| 国产成人精品高清不卡在线 | 91啦中文字幕| 日韩成人午夜| 成年女人a毛片免费视频| 国产手机在线小视频免费观看| 国产成人精品综合| 9丨情侣偷在线精品国产| 久久精品视频一| 日韩精品资源| 欧美中文字幕在线二区| 日韩欧美亚洲国产成人综合| 国产xx在线观看| 亚洲一区二区约美女探花| 欧美午夜在线观看| 伊人成人在线| 欧美一区二区三区香蕉视| 免费国产无遮挡又黄又爽| 久久精品aⅴ无码中文字幕| 奇米影视狠狠精品7777| 亚洲精品大秀视频| 五月天久久婷婷| 亚洲成在人线av品善网好看| 色老二精品视频在线观看| 麻豆AV网站免费进入| 国产成人无码久久久久毛片| 亚洲日韩图片专区第1页| AV不卡在线永久免费观看| 新SSS无码手机在线观看| 国产午夜福利片在线观看| 久久精品亚洲专区| 亚洲三级a| 国产高潮视频在线观看| 男人天堂亚洲天堂| 一本一道波多野结衣一区二区|