劉曉萌 王 彤
·論著·
國家自然基金項目(81473073)
1.山西醫科大學公共衛生學院衛生統計教研室( 030001)
2.北京市大興區疾病預防控制中心
△通信作者:王彤,E-mail:wtstat@21cn.com
Ⅱ期臨床劑量反應試驗中基于不確定參數模型的劑量估計研究*
劉曉萌1,2王 彤1△
參數模型 多重比較 劑量反應關系
在新藥研發過程中探索正確的劑量非常關鍵,尋找正確的劑量或劑量組發生在新藥研究的每一個階段[1]。劑量估計是新藥臨床試驗的重要環節,貫穿于新藥研發的各個階段,其中又以I 期和II 期臨床試驗為重[2]。I 期臨床試驗主要用于探索新藥的毒性,即確定最大耐受劑量[3];II 期臨床試驗主要用于探索新藥的有效性,即確定劑量反應關系和最小有效劑量;III期臨床試驗通常是大規模的長期研究,這些研究證實階段I和II的發現[4]。
藥物開發的根本目的是找到一個劑量或劑量范圍,使之滿足有效性(改善或治愈目的疾病)和安全性(可接受風險的不利影響)[4]。選擇劑量過高可能導致不可接受的毒性反應,從而對安全性有影響,而選擇劑量過低則使得藥物的療效無法得到肯定,在III期確證性研究中不能獲得藥物有效的證據,從而使藥物未上市即遭到淘汰。由于選擇的藥品劑量不合適,有許多藥品被認為是無效的或者是不安全而遭到淘汰[2]。近年來,很多同行做了相當大的努力一直在改善藥物開發過程中選擇合適劑量的效率[5-6]。然而,盡管有這些努力,在II 期臨床試驗后期仍缺乏足夠的關于藥物劑量的有效性和安全性的知識,所以在后續的驗證性研究中選擇合適劑量仍然是新藥臨床試驗中需要解決的一個主要的問題[7-8]。
在劑量探索研究中通常分兩個方面來評估新藥的效果,一方面,確定藥物有效的證據,也稱為PoA(proof-of-activity)或PoC(proof-of-concept);另一方面,估計目標劑量的精確性,選擇合適的劑量或劑量組,為III期臨床試驗提供依據[9]。為了達到這兩個目的,劑量探索研究的數據分析主要是基于兩類策略:多重比較方法和基于參數模型的方法。基于參數模型的方法是假定劑量和反應之間有一個函數關系,把劑量作為一個定量因素,根據預先設定的參數模型得到劑量反應關系。然后利用該擬合模型來檢驗藥物是否有效,即PoA是否成立,如果成立,則該模型可用于估算一個適當的劑量以達到期望的反應,但其結論的有效性高度依賴于正確選擇先驗的未知劑量反應模型。多重比較過程把劑量作為定性因素,而且多重比較過程很少或者幾乎不用假設先驗的劑量反應模型。一種常用的方法是在控制總的一類錯誤FWER(familywise error rate)的條件下對比不同劑量水平的反應值之間的差異是否有統計學意義[10]。本研究介紹一種兩階段合并的策略來分析劑量反應數據,即將劑量反應研究中劑量估計的兩種方法多重比較法[11-12]和參數模型法[13]合并為一體,縮寫為MCP-Mod。
Bretz[10]等于2005年提出了MCP-Mod方法,該方法將劑量反應研究中劑量估計的兩種方法多重比較法和參數模型法合并為一體。MCP-Mod法對于解決II期臨床試驗中的確定劑量反應關系以及在后續驗證性研究中選擇合適的劑量這些問題是非常有效的[10]。該方法分幾個步驟來完成劑量估計:(1)我們尋找一組候選的參數模型來描述該劑量反應數據,計算出參數模型的最優比對系數;(2)利用多重比較過程從候選參數模型集中選出有統計學意義的一個或幾個“最佳”模型;(3)根據模型選擇標準選擇模型,進而就能有效地估計感興趣的目標劑量。
對于一個給定的k組平行劑量組d1,d2,d3,…,dk,d1表示安慰劑組,Y表示每組劑量對應的反應結果,該結果可以是有效性或安全性的一個效應值(在此我們只考慮單變量模型),并假設該反應結果相互獨立且服從正態分布,則劑量反應關系的參數模型為

(1)
θ表示模型的參數向量,i表示劑量組別(i=1對應于安慰劑組),j表示每組的觀察人數,f(di,θ)表示關于參數θ的一個線性或非線性的函數。表1給出了一部分常用的劑量反應關系的參數模型f(di,θ),以及其各自的標準化版本。圖1給出了這幾種參數模型的圖形。

表1 一組常用的劑量反應關系參數模型


(2)


圖1 常見的劑量反應參數模型的輪廓圖
常用的模型選擇標準有maxT法、AIC(赤池信息準則)、BIC(貝葉斯信息準則)以及加權平均AIC、BIC。
maxT法:通常我們采用統計量最大值法來選擇最佳模型,即選取最大的統計量Tm,Tmax=max{T1,…,Tm},如果Tmax大于臨界值q,或者調整的Pm值小于α,則拒絕零假設,備擇假設成立,則說明該模型可以被選為最佳模型來進行下一步的劑量估計。
AIC法(赤池信息準則):AIC=2k-2ln(L),其中:k是參數的數量,L是似然函數,一般選擇AIC值最小的模型為最佳模型。
BIC法(貝葉斯信息準則):BIC=-2 ln(L)+ln(n)×k,其中:k是參數的數量,L是似然函數,同理,BIC一般選擇BIC值最小的模型為最佳模型。
加權平均AIC法:對幾個候選的模型的AIC值取加權平均值,權重為w=exp(-0.5AICi)/sum(exp(-0.5AICi))[16]。
加權平均BIC法:同AIC一樣,對幾個候選的模型的BIC值取加權平均值,權重為w=exp(-0.5AICi)/sum(exp(-0.5AICi))。
模擬研究目的是通過模擬各種劑量反應關系,產生模擬數據來探討MCP-Mod方法,主要從三個方面進行分析(1)確定藥物有效的證據,即評估PoA的效能;(2)模型選擇的正確率;(3)劑量估計的精確度。
在一個隨機雙盲平行組設計的劑量反應關系中,劑量組共五個水平(d=0,0.05,0.2,0.6,1),每個劑量水平下的病人數分別為n=10,25,50,75,100,150,每個病人的反應值為一個單一測量值,并且服從Y~N(μ(d),σ2)。檢驗PoA的單側檢驗水準設定為α=0.05,正態分布標準差為σ=0.65,最小有效劑量的臨床效應閾值設定為Δ=0.4。利用R包MCPMod中的genDFdata函數,根據反應均值μ(d)模擬產生9種不同的劑量反應函數的數據(表2)。以樣本量為10的Double-logistic模擬數據為例,其R語言代碼如下:
doses<-c(0,0.05,0.2,0.6,1)
mu8<-rep(0,times=5)
for (i in 1:5){
if (doses[i]<=0.5)
mu8[i]<-0.198+0.61/(1+exp(18*(0.3-doses[i])))
else mu8[i]<-0.499+0.309/(1+exp(18*(doses[i]-0.7)))
}
#產生Double-logistic劑量-反映數據,并計算PoA
#######樣本量為10的double-logistic函數##
model1<-rep("null",times=1000)
model2<-rep("null",times=1000)
poa<-rep("null",times=1000)
for (i in 1:1000){
set.seed(i)
dat<-genDFdata(mu = mu8,doses =doses,
n = rep(10,times=5),sigma = 0.65)
models<- list(linear = NULL,linlog = NULL,emax = 0.2,
exponential = 0.7,quadratic = -0.85,logistic =c(0.4,0.09))
fit<- MCPMod(dat,models,alpha = 0.05,resp = "resp",
dose = "dose",clinRel = 0.4,twoSide = FALSE,pVal = TRUE)
poa[i]<-fitMYMsignf
model1[i]<-fitMYMmodel1
model2[i]<-fitMYMmodel2
rm(dat)
rm(fit)
}
table(poa)
table(model1)
table(model2)
這些模擬數據的劑量反應關系有以下特點:①安慰劑組劑量為d=0時,其反應值為0.2,即基準效應為0.2;②除了常數函數外,其他的劑量反應函數的最大效應值為0.8,因此除去基準效應后劑量的最大效應為0.6。在每組樣本量×劑量反應形狀組合的情況下都進行1000次模擬,并采用R包MCPMod中的函數MCPMod來計算PoA的效能和選擇正確的模型的概率。劑量反應形狀見圖1。

表2 9種劑量反應關系的模擬數據
在上述劑量反應函數中,常數函數是用來評價MCP-Mod法犯總的一類錯誤FWER的表現。Emax函數、對數線性函數、線性函數、指數函數、二次項函數、logistic函數是常用的參數模型,在本次模擬試驗中,這六個參數模型組成了候選模型來進行多重比較。Double-logistic模擬數據和convex模擬數據可以用來評價當劑量反應關系不明確時,MCP-Mod法發現PoA的能力,因為他們不對應于候選模型中的任何一個模型,但是可以近似于其中的某幾個。

表3 在不同組合條件下1000次模擬中MCP-Mod法發現PoA的概率
從表3可知,(1)在常數函數形狀下,6組樣本量的結果都近似于檢驗水準α=0.05;(2)由于本次模擬試驗的標準差偏小,所以在樣本量偏小的情形下就有較高的效能,而在樣本量較大時各種劑量反應的效能都趨近于1;(3)發現PoA的效能越高說明至少有一個候選模型可以被選出用來進行之后的劑量選擇步驟。

表4 在相應的劑量反應數據下各候選模型選擇正確的概率
表4是在相應的劑量反應模擬數據下,MCP-Mod法從候選模型中選出正確模型的概率。由上表可以看出,指數模型和二次項模型的識別度較高,即使在樣本量偏低時這兩個模型也有近半數的正確率;而線性函數和對數線性函數的識別度較低,因為這兩個模型的形狀相似,因此要想提高他們的識別度需要較大的樣本量。
表5是在各劑量反應模擬數據下,MCP-Mod法從候選模型中選出的用于下步劑量估計的模型的識別率。表5與表4的區別在于:表4選出的正確模型對應于P值最小的模型;而表5選出的正確模型對應于進行劑量選擇的模型。產生這個不同的原因在于表4中P值最小的模型在估計目標劑量時可能會遇到不收斂的問題,在這種情況下程序會自動選擇P值次小的模型進行估計,直到選到合適的模型。發生不收斂問題的原因很多,比如模型中包含的參數較多,與劑量水平接近,或者劑量水平分布不均勻。在本次模擬中,logistic模型含有四個參數,而劑量組有5個水平,因此logistic模型在兩個表中的差別非常明顯,而其余模型都隨著樣本量增加識別概率變大。

表5 在相應的劑量反應形狀下各候選模型用于劑量選擇的概率

表6 六種候選模型對D-logistic和convex模擬數據擬合的概率

表7 六種候選模型對D-logistic和convex模擬數據進行劑量選擇的概率
D-logistic和convex數據不包含在六種候選模型中,用這兩種數據來檢驗MCP-Mod法的效能。與表4、表5類似,表6是在D-logistic和convex模擬數據情形下各候選模型選擇正確的概率,表7是在D-logistic和convex模擬數據情形下用于劑量選擇的各模型的概率。從以上兩表可以看出D-logistic數據可以由二次項函數和logistic函數擬合,在表6中隨著樣本量增加二次項函數和logistic函數對D-logistic函數擬合的概率增加,而在表7中logistic函數由于不收斂問題其概率變得很小;而convex函數可由指數函數擬合,隨著樣本量增加指數函數對convex函數的擬合概率增加。


表8 在閾值Δ=0.4的條件下,各個模型的最小有效劑量MED

表9 在各模型數據下MED估計量的中位數相對偏移度和相對四分位數間距
本文介紹了一種合并的策略來分析劑量反應數據,以達到兩個目的:對劑量反應關系是否建立進行檢驗(PoA)和對目標劑量進行估計。我們利用多重比較的過程來檢驗一組候選的參數模型中各組劑量反應之間的差異是否有統計學意義,并根據選擇標準將有意義的模型選出來,然后根據該模型進行目標劑量的估計。Ⅱ期劑量探索試驗是新藥研發的重要環節,合理的劑量選取往往會關系到確證性臨床試驗階段的成敗。該方法對于解決II期臨床試驗中檢驗劑量反應關系是否成立并且選擇一個合適的劑量用于后續驗證性研究的問題是非常有效的,該方法可以將II期臨床試驗的兩個目的無縫銜接。

[1] Pinheiro J,Bornkamp B,Glimm E,Bretz F.Model-based dose finding under model uncertainty using general parametric models.Statistics in medicine,2014,33(10):1646-1661.
[2] 張春茂;夏結來,李嬋娟.Ⅱ期劑量探索試驗中逐步比較理論及應用研究.西安:第四軍醫大學;2010.
[3] Neuenschwander B,Branson M,Gsponer T.Critical aspects of the Bayesian approach to phase I cancer trials.Statistics in medicine,2008,27(13):2420-2439.
[4]Naitee T.Dose Finding in Drug Development.New York:Spinger,2006:127-181.
[5] Krishna R.Dose Optimization in Drug Development.New York:Informa Healthcare,2006:196-205.
[6] Chevret S.Statistical Methods for Dose Finding Experiments.ChichesterUK:Wiley,2006:142-155.
[7] Bornkamp B,Bretz F,Dmitrienko A,et al.Innovative approaches for designing and analyzing adaptive dose-ranging trials.J Biopharm Stat,2007,17(6):965-995.
[8] Pinheiro J SF,Bornkamp ZAB,Bretz F,Chuang-Stein C,Dragalin V,Fardipour P,Gallo P,Gillespie W,Hsu C,Padmanabhan FMS,Patel N,Perevozskaya I,Roy A,Sanil A,Smith J.Adaptive and model-based dose-ranging trials:quantitative evaluation and recommendations.Statistics in Biopharmaceutical Research,2010,2:435-454.
[9] Pinheiro J,Bornkamp B,Bretz F.Design and analysis of dose-finding studies combining multiple comparisons and modeling procedures.J Biopharm Stat,2006,16(5):639-656.
[10] Bretz F,Pinheiro JC,Branson M.Combining multiple comparisons and modeling techniques in dose-response studies.Biometrics,2005,61(3):738-748.
[11] Bretz F,Maurer W,Brannath W,Posch M.A graphical approach to sequentially rejective multiple test procedures.Statistics in medicine,2009,28(4):586-604.
[12] Stewart WH,Ruberg SJ.Detecting dose response with contrasts.Statistics in medicine,2000,19(7):913-921.
[13] Thomas N.Hypothesis testing and Bayesian estimation using a sigmoid Emax model applied to sparse dose-response designs.J Biopharm Stat,2006,16(5):657-677.
[14] Bretz F,Hothorn LA.Statistical analysis of monotone or non-monotone dose-response data from in vitro toxicological assays.Altern Lab Anim,2003,31 Suppl 1:81-96.
[15] Genz AaB,F.Comparison of methods for the computation of multivariate t-probabilities.Journal of Computational and Graphical Statistics,2002,11:950-971.
[16] Buckland ST,Burnham KP,Augustin NH.Model selection an integral part of inference.Biometrics,1997,53:603-618.
[17] O′Neill RT,Temple R.The prevention and treatment of missing data in clinical trials:an FDA perspective on the importance of dealing with it .Clin Pharmacol Ther,2012,91(3):550-554.
DoseEstimationResearchBasedonUncertaintyParameterModelinDose-responseClinicalStudies
Liu Xiaomeng,Wang Tong
(DepartmentofHealthStatistics,SchoolofPublicHealth,ShanxiMedicalUniversity(030001),Taiyuan)

Parametermodel;Multiple comparisons;Dose response relationship
(責任編輯:鄧 妍)