陳金寶 侯雅文 陳 征△
在疾病的預后研究中,觀察到的終點事件往往不止一種,并且各終點事件呈相互競爭狀態,稱為競爭風險 (competing risks)[1-4]。例如在SARS流行期間,患者從入院接受治療到研究結束,可能出現治愈和死亡這兩個競爭的終點事件[5]。累積發生率 (cumulative incidence function,CIF) 是描述性競爭風險分析中最重要的指標之一[6],CIF置信區間是可以按預先給定的概率 (95%、99%等) 確定包含CIF的一個范圍,一般可表示為 (L,U),分別表示區間下限 (L≥ 0) 和區間上限 (U≤ 1)。經典CIF區間是基于假定CIF近似服從正態分布構造得到的,然而卻可能出現區間下限L<0或區間上限U> 1越界的異常情況,特別是在小樣本時[7],而邏輯轉換[7]、反正弦平方根轉換[10]可以避免區間出現越界情況。對此本文將基于對CIF進行不同轉換,分別為線性轉換 (經典)、對數轉換、雙對數轉換、反正弦平方根轉換以及邏輯轉換[8-9],構造5種不同形式的置信區間,均先構造CIF轉換形式置信區間,再轉換為其原尺度下的置信區間。然后基于不同區間可信度 (90%、95%和99%)、事件發生率、樣本量、刪失率以及多個時刻點t上,通過模擬研究,綜合評價和比較上述5種置信區間的錯誤覆蓋率,最后進行一個實例分析。
本文研究只有一個組別,假設樣本量為n,可能發生的終點事件有K種,第j個個體的觀測數據為(tj,δj),j=1,2,…,n。Tj和Cj分別表示第j個個體的生存時間和刪失時間,并且Tj和Cj相互獨立,則tj=min(Tj,Cj),δj=I(Tj≤Cj),I(·)為指示變量,如果觀測到個體發生終點事件(包括興趣事件和競爭事件),則定義為對應第k種終點事件,k=1,2,…,K,否則為右刪失。競爭風險中CIF是指在給定時刻點t之前,發生第k種終點事件的失效概率,則第k種終點事件CIF估計式為:

其中dj表示在時間tj上合并所有終點事件類型的事件數。設定置信區間可信度為1-α,則時刻點t上CIF的線性轉換 (經典) 100(1-α)%的雙側置信區間 (CIline) 為:
(1)

由置信區間的一般形式,可以構造如下分別基于對數轉換、雙對數轉換、反正弦平方根轉換以及邏輯轉換的CIF置信區間,這四種置信區間均是非對稱區間。
(2)
(3)
(4)

(5)
通過Monte-Carlo模擬比較上述5種置信區間的性能。模擬研究只有一組,設定樣本量為50,100和200,生存時間分布服從參數為1的指數分布,刪失時間分布服從均勻分布U(0,a),改變a值獲得不同刪失率 (0%、10%、20%、30%、40%、50%和60%)。假定競爭風險模擬數據[12]只有一個興趣事件 (類型1) 和一個競爭事件 (類型2),則興趣事件和競爭事件理論CIF分別為I1(t)=p1(1-e-t)和I2(t)=(1-p1)(1-e-t),其中p1和1-p1分別表示興趣事件和競爭事件最大的事件發生概率,p1取值為0.4、0.6和0.8。通過預模擬實驗發現,模擬數據時間四分位數近似為0.25、0.60和0.95,所以模擬比較的三個時間點t為0.25、0.60和0.95。雙側置信區間范圍為90%、95%和99%,對應的檢驗水準α為0.10、0.05和0.01。通過判斷興趣事件CIF的置信區間是否包含興趣事件理論CIF,定義評價指標為錯誤覆蓋率,模擬循環次數為10000次。
為了能更加清晰綜合評價5種轉換置信區間的表現,使用方差分析技術 (ANOVA)[13]綜合評價錯誤覆蓋率。首先定義錯誤覆蓋率減去檢驗水準作為結果變量M,即最終評價指標為平均偏差,不同置信區間范圍有不同檢驗水準。方法表現越好則其期望E(M) 越接近于常數0。模型中考慮了4個影響因素:Test、P1、Num、Cen和T,分別代表5種置信區間形式、3種興趣事件最大發生概率、3種樣本量、7種刪失率和3種時刻點t,擬合不同的不帶截距項模型。模型1表示在控制了其他影響因素下,研究不同興趣事件最大發生概率對不同置信區間的影響,模型2~4與1類似,而模型5是控制所有影響因素,研究不同置信區間的邊際效應。
模型1:E(M)=Test×P1+Num+Cen+T;
模型2:E(M)=Test×Num+P1+Cen+T;
模型3:E(M)=Test×Cen+Num+P1+T;
模型4:E(M)=Test×T+Cen+Num+P1;
模型5:E(M)=Test+Cen+Num+P1+T。
表1是不同區間范圍下,5種CIF置信區間形式分別擬合模型1~5的平均偏差。不同區間范圍下,CIline相比于其他置信區間都有著最大正數平均偏差,即有著最大的錯誤覆蓋率;CIarcsin次之,且輕微高估錯誤覆蓋率;CIlogit有最小負數平均偏差,顯得過于保守;CIlog顯得不穩健,在90%和95%范圍輕微保守,而99%范圍則輕微高估;CIloglog輕微保守,最接近于常數0,顯得最為穩健可靠。不同模型下,從模型1看出隨著興趣事件最大發生概率的增大,5種方法基本都呈現越接近0的趨勢;模型2看出隨著樣本量的增加,除了CIarcsin在90%時遠離0,其余情況5種區間基本都呈現越接近于0的趨勢;模型3看出5種區間的變化趨勢波動,但依舊可以發現CIloglog顯得最為穩健可靠,特別是在高刪失時;模型4看出5種區間變化趨勢不一,但CIloglog總是和大多數的區間變化趨勢保持一致;模型5結果基本和不同區間范圍的結果一致。
一項關于霍奇金病患者的治療研究[14],隨訪時間從1968年到1986年。采用外周血液移植治療方式共有49人,興趣事件是移植后發生慢性移植物抗宿主反應 (n=45),移植后死亡或復發是競爭事件 (n=3),其余為右刪失 (n=1)。對外周血液移植治療第0.5、0.75和1年求其CIF值的5種雙側95%置信區間。從各時刻點區間看出 (圖1),時刻點越大區間寬度越小,除CIline外其余置信區間均非對稱。在第0.5和0.75年5種置信區間上下限均未出現越界情形,然而在第1年時,CIlog上限L=1.007和CIline上限L=1.003均出現了大于1的異常情況,CIarcsin、CIlogit和CIloglog上限L分別為0.982、0.972和0.971,均保持在[0,1]范圍內,很好地克服出現越界情況,結合模擬研究,推薦以CIloglog為準。

表1 ANOVA技術綜合評價3種不同范圍的5種CIF置信區間的模擬結果的平均偏差
P1:擬合模型1;Num:擬合模型2;Cen:擬合模型3;T:擬合模型4;最后一行:擬合模型5。

圖1 外周血液組CIF及其95%CI范圍
在疾病的預后研究中,競爭風險型數據是常見的生存壽命數據類型之一,并且其CIF是最重要的描述性指標,因此準確地給出其100(1-α)%雙側置信區間也是重要的,然而CIline(經典) 上限可能出現越界的異常情形,對此考慮了對CIF進行對數轉換、雙對數轉換、反正弦平方根轉換以及邏輯轉換來構造置信區間,后三種可以有效地避免越界情形的出現。根據模擬結果,CIline和CIarcsin均有較大的正數偏差,CIlog則易出現波動,CIlogit有最小負數偏差,只有CIloglog偏差最接近于期望常數0,顯得最為穩健可靠。實例分析中發現CIline和CIlog無法克服出現越界情況,且CIlog表現不穩定,CIarcsin、CIlogit和CIloglog則很好地克服出現越界情況。值得注意,當高刪失率或小樣本時,CIloglog均表現相對穩健較佳,另外小樣本下CIarcsin表現也相對穩健較佳。在醫學研究中,特別是當數據是小樣本或高刪失時,要謹慎使用CIline(經典)。另外,也可以利用置信區間上下限值,對兩組間時刻點上CIF進行差異性比較的初步分析。
[1] Lau B,Cole SR,Gange SJ.Competing risk regression models for epidemiologic data.Am J Epidemiol,2009,170(2):244-256.
[2] Austin PC,Lee DS,Fine JP.Introduction to the Analysis of Survival Data in the Presence of Competing Risks.Circulation,2016,133(6):601-609.
[3] 楊召,王少明,粱赫,等.競爭風險型數據統計分析理論研究進展.中國衛生統計,2016,33(6):1088-1091.
[4] 盧梓航,周立志,韓棟,等.競爭風險型數據的統計推斷處理及應用.現代預防醫學,2013,40(5):804-807.
[5] 陳征,Nakamura T.基于競爭風險理論和概要型數據的病死率估計模型.中國衛生統計,2010,27(3):249-252.
[6] Kalbfleisch JD,Prentice RL.The Statistical Analysis ofFailure Time Data.New York:Wiley,2002.
[7] Hong Y,Meeher WQ.Confidence interval procedures for system reliabilityand applications to competing risks models.Lifetime Data Anal,2014,20(2):161-184.
[8] 陳金寶,邱李斌,王北琪,等.固定點處組間生存率比較的統計檢驗法.中華流行病學雜志,2015,36(2):186-188.
[9] 項永兵,高玉堂,金凡,等.生存率置信區間的五種估計方法.中華流行病學雜,1995,16(5):306-309.
[10] Choudhury JB.Non-parametric confidence interval estimation for competing risks analysis:application to contraceptive data.Stat Med,2002,21(8):1129-1144.
[11] Aalen O.Nonparametric estimation of partial transition probabilities in multiple decrement models.Ann Stat,1978,6(3):534-545.
[12] Beyersmann J,Latouche A,Buchholz A,et al.Simulating competing risks data in survival analysis.Stat Med,2009,28(6):956-971.
[13] Klein JP,Logan B,Harhoff M,et a1.Analyzing survival curves at a fixed point in time.Stat Med,2007,26(24):4505-4519.
[14] Pintilie M.Competing Risks:A Practical Perspective.England:John Wiley & Sons,2006.