楊春蘭
(云南師范大學(xué),云南 昆明 650000)
在許多臨床試驗(yàn)研究中,縱向的生物標(biāo)志物信息常常與事件結(jié)果的信息一起收集。聯(lián)合模型同時(shí)分析了縱向和生存結(jié)果,能夠有效減少參數(shù)估計(jì)的偏差,提高統(tǒng)計(jì)推斷的效率。聯(lián)合模型不僅可以評(píng)估縱向過程與生存結(jié)果之間的關(guān)系,還可以用于預(yù)測(cè),在個(gè)性化醫(yī)療計(jì)劃的推動(dòng)下,聯(lián)合建模領(lǐng)域的一個(gè)前沿研究方向是利用所有可用的生物標(biāo)志物信息對(duì)患者預(yù)后(如生存概率)進(jìn)行個(gè)性化動(dòng)態(tài)預(yù)測(cè)。
本研究收集到的縱向數(shù)據(jù)是間歇性的,對(duì)每個(gè)研究對(duì)象測(cè)試的時(shí)間tij都有誤差。為了衡量縱向協(xié)變量對(duì)事件風(fēng)險(xiǎn)的影響,需要估計(jì)潛在的縱向協(xié)變量在時(shí)間t的真實(shí)度量值mi(t),并成功地重建每個(gè)個(gè)體的完整縱向歷史信息Mi(t)。通過建立線性混合效應(yīng)模型來分析肝硬化患者凝血酶原指數(shù)的重復(fù)測(cè)量隨時(shí)間的變化,縱向子模型:

其中,xiT表示固定效應(yīng)β的設(shè)計(jì)矩陣,ziT是隨機(jī)效應(yīng)bi的設(shè)計(jì)矩陣,bi~N(0,D),εi(tij)是誤差項(xiàng),且εi(tij)~N(0,σ2)。誤差項(xiàng)εi與隨機(jī)效應(yīng)bi相互獨(dú)立。由于樣條函數(shù)的局部自然和好的數(shù)值特性,Ruppert等[1]認(rèn)為,樣條函數(shù)比多項(xiàng)式更合適。在聯(lián)合建模結(jié)構(gòu)中,Brown等[2]利用了具有多維隨機(jī)效應(yīng)的b樣條,Rizopoulos等[3]考慮了自然3次樣條;另一種方法是在線性混合模型中加入一個(gè)附加隨機(jī)項(xiàng),以捕獲未被隨機(jī)效應(yīng)捕獲的觀測(cè)測(cè)量中剩余的序列相關(guān)性,從而對(duì)特定個(gè)體進(jìn)展的高度非線性形狀建模。在此框架下,采用線性混合模型為:

其中,ui(t)是均值為0且獨(dú)立于bi和εi(t)的隨機(jī)過程,mi(t)與式(1)有相同的混合效應(yīng)模型結(jié)構(gòu)。
生存分析在臨床和流行病學(xué)研究中應(yīng)用最廣泛,可能包括死亡、腫瘤的出現(xiàn)、某些疾病的發(fā)展、疾病的復(fù)發(fā)、受孕或戒煙。過去對(duì)生存數(shù)據(jù)的研究主要集中在生存概率的估計(jì)以及對(duì)不同條件下實(shí)驗(yàn)對(duì)象生存分布的簡(jiǎn)單比較。近年來,研究的重點(diǎn)逐漸轉(zhuǎn)向生存數(shù)據(jù)的統(tǒng)計(jì)建模。多個(gè)獨(dú)立的預(yù)后因素可以同時(shí)分析,治療差異可以評(píng)估,同時(shí)調(diào)整異質(zhì)性和基線特征的不平衡,預(yù)測(cè)可以更好地校準(zhǔn)。
生存子模型表示在時(shí)間t縱向結(jié)果的真實(shí)值和非觀測(cè)值。為了量化與生存風(fēng)險(xiǎn)之間的相關(guān)性,采用比例風(fēng)險(xiǎn)模型:
其中,Mi(t)={mi(s),0≤s<t}表示mi到時(shí)間點(diǎn)t之前不可觀測(cè)的縱向過程的歷史,h0(t)為基線風(fēng)險(xiǎn)函數(shù),ωi是基線協(xié)變量,γT表示相應(yīng)的回歸系數(shù)向量,α表示潛在的縱向結(jié)果回歸系數(shù),量化了縱向結(jié)果對(duì)肝硬化風(fēng)險(xiǎn)的影響。參數(shù)α假設(shè)在時(shí)間t發(fā)生肝硬化的風(fēng)險(xiǎn)取決于真實(shí)的縱向軌跡mi(t),通過其在時(shí)間t的值,將兩個(gè)子模型聯(lián)合在一起,如果α=0,那么聯(lián)合模型的優(yōu)勢(shì)取消,如果α顯著,那么縱向測(cè)量指標(biāo)與是否患肝硬化之間高度相關(guān)。
利用已知的生存函數(shù)和累積危險(xiǎn)函數(shù)之間的關(guān)系,可以得到如下生存函數(shù):

HSIEH等[4]指出在聯(lián)合建模結(jié)構(gòu)下,不指定h0(·)的分布可能會(huì)導(dǎo)致對(duì)參數(shù)估計(jì)標(biāo)準(zhǔn)誤差的低估,為解決此問題通常一個(gè)標(biāo)準(zhǔn)的選擇使用一個(gè)風(fēng)險(xiǎn)函數(shù)對(duì)應(yīng)于一個(gè)已知的參數(shù)分布。
對(duì)特定患者以及隨訪期間的特定時(shí)間點(diǎn),希望利用獲得的所有可用信息來預(yù)測(cè)生存概率。獲取這些信息將使醫(yī)生能夠更好地了解疾病動(dòng)態(tài),最終在該特定時(shí)間點(diǎn)做出最佳決定。由于目前醫(yī)療實(shí)踐中個(gè)性化醫(yī)療的趨勢(shì)以及這種個(gè)性化預(yù)測(cè)可發(fā)揮的重要作用,其聯(lián)合建??蚣芤鹆撕芏嗯d趣。基于隨機(jī)樣本Dn={Ti,δi,yi;i=1,...,n}的聯(lián)合模型,對(duì)預(yù)測(cè)提供了一組縱向測(cè)量值Yi(t)={yi(s);0≤s<t}且有一個(gè)基線協(xié)變量向量ωi的新個(gè)體i的生存概率感興趣,在生存時(shí)間u>t的前提下,關(guān)注生存時(shí)間u>t的條件概率更有意義,即:

充分利用了定義聯(lián)合模型的條件獨(dú)立假設(shè),則:

基于式(6)使用bi的經(jīng)典貝葉斯估計(jì)推導(dǎo)πi(u|t)的一階估計(jì):

由凝血酶原指數(shù)的縱向軌跡圖可看到患者2的凝血酶原指數(shù)水平波動(dòng)更加明顯,表明病情惡化;患者25顯示較低的凝血酶原指數(shù)水平更加穩(wěn)定,表明有更高的生存概率。比較πi(u|t)的近似估計(jì)與蒙特卡羅公估計(jì),發(fā)現(xiàn)兩者差異較小。由動(dòng)態(tài)生存概率圖可知,25號(hào)患者的存活率高于2號(hào)患者,沒有經(jīng)歷死亡或閃失。