濰坊醫學院(261053)
田 野 馬 潔 黃 璐 杜澤玉 呂軍城 石福艷 孟維靜 王素珍△ 潘慶忠△
隊列研究是臨床流行病學重要的研究方法之一,在研究反應變量與處理因素之間關系的因果推斷中,隨機對照試驗(randomized controlled trials,RCT)被視為評價臨床試驗干預措施的金標準。但在實際的臨床實踐中,由于受樣本量、研究費用、持續時間以及倫理學等方面的因素影響,隨機對照試驗的實施受到很大的制約[1]。近年來,非隨機對照研究、隊列研究、臨床數據挖掘等臨床流行病學方法在循證醫學領域廣受關注。觀察性臨床研究不同于RCT臨床試驗可以按照試驗設計進行隨機分組從而減少混雜因素所產生的偏倚。如果在回顧性隊列研究資料進行分組后直接比較處理效應,所做出的統計結論容易增大犯II類錯誤的概率,當協變量數目較多且無法精確獲知其對處理分配和生存結局的影響時,直接估計未調Kaplan-Meier值及生存曲線會導致偏倚,因此,對于傳統的傾向性評分(propensity score,PS)方法如匹配法、分層法、加權法等應用于生存資料分析時并不容易實現[2]。
基于PS雙穩健半參模型法是對傳統PS方法的改進,自20世紀90年代Scharfstein[3]首次引入雙重穩健模型的概念以來,近些年其得到了眾多的關注和研究[4]。有研究結果顯示,在生存資料分析時應用雙穩健模型可以直接估計出處理(暴露)對生存結局的絕對和相對效應[5],最大程度地減小混雜偏倚。本文以乳腺癌患者常用的CAF(環磷酰胺、多柔比星、氟尿嘧啶)和TAC(多西他賽、多柔比星、環磷酰胺)兩種化療方案為例,運用基于PS的 IPTW和DRIPTW、SMRW和DRSMRW(IPTW:inverse probability of treatmentweighting;SMRW:Standardized mortality ratio weighting;DRIPTW:Doubly robustinverse probability of treatmentweighting;DRSMRW:Doubly robust Standardized mortality ratio weighting)等多種PS改進模型分析不同化療方案對乳腺癌患者的因果效應和預后結果的影響,從而使研究結果更接近“真實世界(realword,RW)”的實際干預效果,最終為臨床實踐提供可靠的循證依據。
從美國SEER(surveillance,epidemiology,and end results)腫瘤患者縱向數據庫中,選擇2000年到2012年12年間的乳腺癌患者作為研究對象,排除無法使用的病例,共計800例,其中CAF組513例,TCA組287例。收集的指標有:手術類型(1:CAF方案,2:TAC方案)、年齡(歲)、婚姻狀況(1:單身,2:已婚,3:離婚,4:喪偶,5:未知)、偏側化(1:乳房左側,2:乳房右側,3:雙側)、腫瘤性質(1:原位癌,2:惡性轉移癌)、分期(1:Ⅰ期,2:Ⅱ期,3:Ⅲ期,4:Ⅳ期)、腫瘤大小(mm)、癌胚抗原CEA(1:有,2:無)、糖類抗原CA15-3(1:有,2:無)、生存狀態(0:生存,1:死亡)、生存時間(月)等。
Rosenbaum和Rubin[6]把PS定義為:在可觀察的協變量(Xi)條件下,研究對象i(i= 1,2,…,N)接受某種處理(或暴露)因素(Zi=1)而非對照因素(Zi=0)的條件概率,計算公式為:
e(X)=Pr(Z=1|X=Xi)
如果協變量Xi為分組變量Zi相互獨立,那么對任意Xi,有:
e(X)或者P,即傾向性評分PS。
由公式可得,PS實際上是一個綜合多個協變量的函數,其值在0和1之間[7]。傾向評分PS方法可以平衡協變量的影響,在組間協變量均衡的前提下,對平均因果效應(average causal effect,ACE)做出推斷。實際上,傾向評分是用一個函數表示多個協變量共同作用的結果,可以“降維”。經過傾向評分調整后,協變量均衡可比,只有干預因素和治療效果不同,出現“事后隨機化”的效果。
傾向性評分加權法先將主要混雜變量的信息綜合成一個變量傾向評分,然后運用標準化法的原理將所得的傾向評分進行加權,通過各對比組中傾向評分分布一致來達到使各混雜因素在各比較組中分布一致的目的[8]。該方法將每一觀察單位看作一層,不同傾向評分值預示這一觀察單位在兩組中的概率不同。在假定不存在未識別混雜因素的條件下,加權調整是基于在一定條件下的兩種相反事件的對比來對數據進行調整的,即假設使每個觀察對象均接受處理因素和使每個觀察對象均不接受處理因素兩種相反情況。利用傾向評分估計的權重對各觀察單位加權產生一個虛擬的標準人群,在虛擬人群中,兩組的混雜因素趨于一致,均近似于某一預先選定的標準人口分布[8]。
傾向性評分加權法的關鍵在于對權重的計算。IPTW是以所有受試者(試驗組和對照組合并的人群)為“標準人群”進行調整。Robins[9]等給出的加權方法得到的人群往往與原人群數量不同,因此虛擬人群各變量的方差大小發生變化。為了得到與原人群的樣本量相同的標準人群,Hernan[10]等對計算方法進行了調整,將整個研究人群的處理率和非處理率加入公式進行調整得到穩定權重。具體方法是:試驗組觀察單位的權重Wt=Pt/PS,對照組觀察單位的權重Wc=(1-Pt)/(1-PS)。Pt為整個人群中接受處理因素的比例。SMRW法是將處理組觀察對象作為“標準人群”進行調整。Sato和Matsuyama[11]給出的加權系數計算方法是:試驗組觀察單位的權重Wt=1,對照組觀察單位的權重Wc=PS/(1-PS)。同樣,由于對照組得到的人群數與處理組樣本量一致,而與原對照組樣本量不同,因此需要進一步作如下調整,計算其穩定權重:Wc=[PS(1-Pt)]/[(1-PS)Pt]。
雙穩健半參模型法是對傳統PS法的改進,將PS加權法(邊際結構模型)和半參Cox回歸模型相結合。具體實施步驟:第一步:估計傾向性評分,包括模型和變量的選擇;第二步:計算權重,包括逆概率處理和標化死亡比權重;第三步:均衡性診斷;第四步:生存結局的處理效應估計,包括相對處理效應和絕對處理效應。其中,相對處理效應是將權重進行加權,后估計經加權調整樣本的調整 Kaplan-Meier 估計值(adjusted Kaplan-Meier estimator,AKME)及其方差和加權 log-rank 檢驗;絕對處理效應是雙穩健半參模型法的構建,將Zi和對結局有影響的基線協變量與權重共同納入半參Cox回歸模型進行分析,估計HR及其置信區間,起到雙穩健的作用。
定性或等級資料采用構成比描述,定量資料采用均數±標準差表示,兩組定性或等級資料比較采用χ2檢驗,兩組定量資料比較采用t檢驗。PS法分別采用匹配法、加權法和回歸調整法,匹配法采用卡鉗匹配,卡鉗值設為0.02;加權法采用逆概率處理加權法(IPTW)和標準化死亡比加權法(SMRW),并對加權之后的樣本進行調整 Kaplan-Meier估計值及其方差和加權log-rank 檢驗,同時,將各個模型分別與Cox回歸模型相結合進行比較。雙穩健半參模型法的所有統計分析均采用SAS 9.4編程完成,以P<0.05為差異有統計學意義,檢驗水準均為α=0.05。
原始資料入選的協變量有:年齡(歲)、婚姻狀況、偏側化、腫瘤性質、腫瘤分期、腫瘤大小(mm)、癌胚抗原CEA、糖類抗原CA153等。在TAC方案組和CAF方案組的基線資料中,兩組乳腺癌患者的年齡、婚姻狀況、腫瘤性質在匹配前不均衡(P<0.05),而兩組患者的腫瘤大小、腫瘤偏側化情況、腫瘤分期、癌胚抗原CEA含量、糖類抗原CA153含量分布均衡(P>0.05)。在匹配和加權之后,對兩組乳腺癌患者協變量進行檢驗可知,匹配前不均衡的協變量,如年齡、婚姻狀況、腫瘤性質等變量經匹配和加權之后在兩組的分配達到了平衡(P>0.05),結果見表1~2。

表1 不同方法處理不同樣本基線資料之間均衡性情況[n(%)]

表2 不同方法處理基線資料組間均衡性比較情況統計量,P值
(1)絕對處理效應估計匹配、穩定逆概率處理加權、穩定標化死亡比加權后的樣本TAC與CAF組的生存曲線差異均有統計學意義,見圖1(log-rank檢驗:χ2=25.60,P<0.001;穩定逆概率處理加權log-rank檢驗:z=2.326,P=0.043;穩定標化死亡比加權log-rank檢驗:z=1.154,P=0.014)。從生存曲線中可以看出,匹配之后的生存曲線相較于加權調整之后的曲線,其CAF組生存率下降的更快,TAC組與CAF組生存率曲線間存在較大差異。與之相比,加權調整之后的PS-TPTW和PS-SMRT模型中TAC組與CAF組的生存曲線更加穩健。

圖1 匹配、穩定逆概率處理加權穩定標化死亡比加權后的樣本中TAC與CAF組的生存曲線
(2)相對處理效應估計在乳腺癌患者中,以生存結局為因變量,Zi為自變量,進行Cox回歸分析估計θ為0.627。以生存結局為因變量,以Zi和對結局有影響的基線協變量為自變量,進行調整Cox回歸分析,估計的HR及其置信區間為1.797(1.378,2.344),相對偏倚為0.065;在IPTW樣本和DRIPW樣本中,加權Cox回歸分析估計的HR及其置信區間分別為1.725(1.335,2.230)和1.813(1.389,2.366),相對偏倚分別為0.131和0.051。在SMRW樣本和DRSMRW樣本中,加權Cox回歸分析估計的HR及其置信區間分別為1.766(1.365,2.285)和1.830(1.430,2.341),相對偏倚分別為0.093和0.037。在匹配之后的樣本中,Cox回歸分析估計的HR及其置信區間為1.800(1.394,2.324),相對偏倚為0.062。

表3 各種PS模型對TAC方案組和CAF方案組Cox回歸分析
雙穩健半參模型法作為控制混雜因素的模型,在臨床流行病學研究中應用越來越廣泛。本研究的主要目的是通過多種PS模型比較對處理效應估計的優劣,其中均衡性診斷是判斷模型正確性的一個重要方法。雙穩健半參模型法對于PS模型的指定如果正確,那么在匹配、加權之后的樣本中試驗組與對照組間基線協變量分布應該相同[12]。本文結果表明,在原始數據中TAC方案組和CAF方案組乳腺癌患者的年齡、婚姻狀況、腫瘤性質在匹配前不均衡,在匹配、加權之后得到均衡,經過log-rank檢驗兩組生存曲線之間差別有統計學意義(P<0.05),且結果均顯示TAC化療方案治療乳腺癌的效果優于CAF化療方案,與趙璐[13-15]等人的研究結果相同。同時,通過對不同模型之間的比較,利用DRIPTW模型和DRSMRW模型得出的處理效應的偏倚顯著減小,且減小偏倚的效果優于與之相對的IPTW和SMRW法,同時也優于匹配法和回歸調整法,其中DRSMRW模型法最優,相對偏倚為0.037。由本次研究得知,在臨床實踐中,TAC方案中將蒽環類化療藥物聯合紫杉類化療藥物化療效果更好。
本研究顯示,雙穩健半參模型法較傳統PS法具有明顯的優勢。第一,該方法是基于PS加權(基于個體的標準化法的邊際結構模型),與估計邊際效應的PS匹配法相比,適用于數據中包含時依性暴露或混雜變量的研究,也可用于更為復雜的研究設計[8];第二,該方法與回歸調整法相比,避免了效應估計時參數過多及共線性的問題所導致的偏倚,易于比較加權調整前后的均衡程度[16];第三,該方法相對于傳統分層法而言,其將多個協變量綜合為一個均衡分值,將每一觀察單位看作一層,避免了協變量較多或存在連續變量時無法解決的過度匹配或過度分層問題[5];第四,該方法不要求試驗組的樣本量小于對照組的樣本量等。此外,僅通過計算一次 PS,就可以構造一個均衡的加權樣本,在此樣本中能分析多重結局。同時,雙穩健半參模型法也存在不足之處:第一,該方法依賴于構造一個加權樣本,均衡化原理不如匹配、分層等方法易于理解;第二,該方法對于PS模型錯誤指定更為敏感[17]等。下一步,我們將繼續針對計算PS模型進行比較研究,如利用貝葉斯、隨機森林、神經網絡等提升雙穩健半參模型的穩健性。
綜上所述,在回顧性隊列研究中對于基線不均衡的生存分析數據而言,隨訪期較長,混雜或處理(暴露)因素中很有可能包括時依性變量,可采用基于PS的雙穩健模型法進行分析,得到類似于RCTs報告中的相對和絕對處理效應結果。因此,雙穩健模型法更適用于生存數據的研究。