濰坊醫學院公共衛生學院衛生統計學教研室(261053) 呂軍城 王素珍
傾向指數匹配法在肺癌化療效果評價中的應用*
濰坊醫學院公共衛生學院衛生統計學教研室(261053) 呂軍城 王素珍△
目的收集臨床肺癌病人觀測資料,按照臨床化療方法不同將肺癌病人分為NP方案(長春瑞濱+順鉑)和TP方案(紫杉醇+順鉑)兩組,用傾向指數匹配法均衡兩組間的混雜因素,比較匹配前后差異,評價兩種治療方案的效果。方法采用logistic回歸計算肺癌病人的傾向指數,按照傾向指數進行組間卡鉗匹配,采用Kaplan-Meier法對匹配后的數據進行分析,用log-rank檢驗比較兩組生存差異。結果匹配前協變量在兩組中不均衡,NP方案組和TP方案組的中位生存期分別為2.360年和2.100年,兩組生存率無統計學差異(P=0.0516),匹配后協變量在兩組中得到很好均衡,NP方案組和TP方案組的中位生存時間分別變為2.560年和2.180年,生存率間有統計學差異(P=0.0134)。結論傾向指數法能夠彌補臨床觀測數據的不足,通過匹配可有效降低組間混雜偏倚,有利于對肺癌患者不同治療方案療效做出更準確評價。
傾向指數 匹配法 肺癌 生存分析
評價藥物或者治療方法的最佳方案是隨機對照的臨床試驗(random ized controlled trial,RCT),然而在實際臨床中,受倫理學和病人病情等因素的限制,不可能在治療之前規定患者嚴格按照隨機化臨床試驗方案進行治療,也就是說隨機化的實施往往面臨較大困難[1-3]。當隨機化試驗在臨床上難以實現時,混雜因素在組間的不平衡性就會影響療效的評價,導致對不同治療方案的效果評價出現偏倚。為了對組間差異做出正確的評價,需首先將組間混雜因素平衡,然后再進行統計分析評價,傾向指數法(propensity score)是解決此問題的一種實用方法[4-5]。近年來得到越來越多的關注。
1.資料來源
本研究肺癌患者臨床觀測數據來自2007-2012年山東省內多家醫院和腫瘤科室。收集的指標有性別、年齡、職業、吸煙史、結核病史、癌胚抗原(CEA)、家族史、神經特異性希酸化酶(NSE)、病灶數目、是否轉移、病理類型、臨床分期(cTNM)以及治療方式。其中,化療方式分為NP方案(長春瑞濱+順鉑)和TP方案(紫杉醇+順鉑)兩種。共收集肺癌患者386例,排除信息不全或邏輯錯誤病例36例,最后NP方案患者159例,TP方案患者191例。在醫院隨訪科室的配合下,根據患者病歷登記的電話和地址,采用電話隨訪或書信隨訪方式獲得患者生存結局及生存時間。
2.分析方法
由于臨床獲得的患者觀測數據并非由隨機化臨床試驗得到,多個協變量在兩組間的分布不均衡。為了減少協變量分布不平衡對生存分析結果的影響,采用傾向指數匹配法均衡協變量,達到近似隨機化目的。
傾向指數匹配法是在通過模型估計傾向指數后,從對照組中選出與暴露組傾向指數相同或相近的個體進行配對,達到均衡組間協變量的目的[6]。匹配時如果將暴露組與對照組個體傾向指數差值設定在某個范圍內,即為卡鉗匹配[7]。傾向指數匹配及所有的統計分析均采用SAS9.2編程完成[8-9]。
1.匹配前兩組協變量比較
原始資料中入選的協變量有:性別、年齡、職業、吸煙史、結核病史、癌胚抗原(CEA)、家族史、神經特異性希酸化酶(NSE)、病灶數目、是否轉移、病理類型、臨床分期(cTNM)。傾向指數匹配前,對兩組間的協變量進行統計分析,其中定量指標根據方差是否齊,采用兩組獨立樣本t檢驗和t′檢驗;采用χ2或其校正公式對定性指標進行統計分析。檢驗結果如表1所示。
專業考慮協變量中吸煙史、結核病史、家族史、神經特異性希酸化酶(NSE)、是否轉移、臨床分期(cTNM)六個協變量在兩個組中分配均衡性有統計學意義。若不對這些協變量進行有效統計學均衡處理,必將影響統計分析結果的準確性。
2.匹配后兩組協變量比較
以治療方案為因變量,以可能的混雜因素為自變量,采用logistic回歸計算每個患者的傾向指數。likelihood ratio結果顯示logistic回歸方程有統計學意義,擬合優度指標顯示方程擬合度較好。計算的傾向指數的均數和標準差為0.454±0.011。采用SAS9.2編程法對兩組數據進行卡鉗匹配,共有127對匹配成功。兩組肺癌病人協變量的均衡性比較顯示,匹配前不均衡的吸煙史、結核病史、家族史、神經特異性希酸化酶(NSE)、是否轉移、臨床分期(cTNM)六個協變量,統計分析結果P均大于0.05,無統計學差異,表明經匹配后在兩組的分配達到很好平衡,結果見表1。

表1 傾向指數匹配前、后兩組肺癌患者協變量分布
3.匹配前、后生存率比較
對傾向指數匹配前、后的兩組臨床觀測數據資料進行生存分析,結果如表2所示。

表2 傾向指數匹配前、后兩組肺癌病人生存率比較
由表2可知,未作匹配之前的原始資料中,NP方案組和TP方案組的中位生存期分別為2.360年和2.100年;95%置信區間分別為2.170~2.780年和1.833~2.470年,log-rank檢驗結果表明兩組生存率間無統計學差異(P=0.0516>0.05)。
用傾向指數卡鉗法對匹配之后的127對新樣本進行生存分析,結果見表2。兩化療組間協變量被均衡后,NP方案組和TP方案組的中位生存時間分別變為2.560年和2.180年;95%置信區間分別為2.167~3.040年和1.958~2.550年;log-rank檢驗結果表明兩組生存率之間差別有統計學意義(P=0.0134<0.05)。說明在治療肺癌病人的實際臨床過程中,NP方案的療效好于TP方案。經傾向指數匹配前后兩組肺癌病人的生存曲線見圖1,圖2。由生存曲線圖可以看出,在沒有進行傾向指數匹配前兩種方法生存曲線存在多次相交現象,而采用傾向指數匹配后除開始之后兩生存曲線沒有出現再次相交現象,也表明傾向指數匹配法對兩組進行了較好的匹配。

圖1 匹配前兩組化療肺癌病人的生存曲線圖

圖2 匹配后兩組化療肺癌病人的生存曲線圖
當隨機化試驗在臨床上難以實現或僅獲得臨床觀測性數據時,混雜因素在組間的不平衡性導致難以對不同治療方案效果做出準確的評價,傾向指數法是平衡組間協變量不均衡的一種有效方法[10-11]。本研究采用卡鉗匹配法對肺癌化療病人的臨床觀測數據進行匹配研究,比較不同化療方式肺癌病人預后情況,為醫生及病人選擇合適的臨床治療方案提供智力支持和理論依據;同時也為以后正確應用傾向指數法處理非隨機化臨床試驗數據提供實踐經驗。傾向指數方法在處理非隨機臨床觀測數據方面體現出它的明顯優勢。
傾向指數法盡管有其特有優勢,但亦有不足之處,如需較全面的臨床專業知識,在分析之前找準、找全混雜因素;受配對條件的限制,需較大樣本量觀測數據等特點;在實際應用過程中應加以注意。
1.Hong S,Youn YN,YiG,et al.Long Term Results of ST-Segment Elevation Myocardial Infarction versus Non-ST-Segment Elevation Myocardial Infarction after Off-Pump Coronary Artery Bypass Grafting:Propensity Score Matching Analysis.JKorean Med Sci,2012,27(2):153-159.
2.Berger JS,Herout PM,Harshaw Q.Bleeding-associated outcomes w ith preoperative clopidogrel use in on-and off-pump coronary artery bypass.Thromb Thrombolysis,2012,34(1):56-64.
3.Choi AH,Barnholtz-Sloan JS,Kim JA.Effect of radiation therapy on survival in surgically resected retroperitoneal sarcoma:a propensity score-adjusted SEER analysis.Ann Oncol,2012,23(9):2449-2457.
4.W isnivesky JP,Halm EA,Bonom i M,et al.Postoperative radiotherapy for elderly patientswith stage III lung cancer.Cancer,2012,118(18):4478-4485.
5.Oh KH,Hwang YH,Cho JH,etal.Outcome of early initiation of peritoneal dialysis in patientswith end-stage renal failure.JKorean Med Sci,2012,27(2):170-176.
6.王永吉,蔡宏偉,夏結來,等.第二講傾向指數常用研究方法.中華流行病學雜志,2010,31(5):584-585.
7.王永吉,蔡宏偉,夏結來,等.第一講傾向指數的基本概念和研究步驟.中華流行病學雜志,2010,31(3):99-100.
8.SAS 9.2 Macro Language Reference,SAS Institute Inc,2008.
9.Art Carpenter.Carpenter′s Complete Guide to the SASMacro Language(2nd Edition)SASPublishing,2004.
10.Walsh P,Shanholtzer L,Loewen M,et al.A matched case control study w ith propensity score balancing exam ining the protective effect of paracetamol against parentally reported apnoea in infants.Resuscitation,2010,83(4):440-446.
11.Apolone G,Deandrea S,MontanariM,etal.Evaluation of the comparative analgesic effectivenessof transdermal and oral opioids in cancer patients:A propensity score analysis.Eur JPain,2012,16(2):229-238.
(責任編輯:劉 壯)
The Application of Propensity Score M atching in Evaluating Chemotherapeutic Effect of Lung Carcinoma
Lyu Juncheng,Wang Suzhen.(Health Statistics Department,School of Public Health,Weifang Medical University)
ObjectiveThe clinical observation data of lung Carcinoma patient were divided into two groups:NP group and TP group according to clinical chemotherapymethod.Compared and evaluate treatmenteffectof two chemotherapy after using propensity score matching method to balance the confounding factors between groups.MethodsCalculated each patient′s propensity score by logistic regressionmodel,and made calipermatching according to the propensity score.The Kaplan-Meiermethod was applied tomake the survival analysis.ResultsThe survival ratewas not statistically significantbetween groups beforematching(P=0.0516),and themedian survival time of two groups were 2.360Y and 2.100Y.The survival rate was statistically significant after matched by the Propensity Score(P=0.0134),and themedian survival time of two groupswere 2.560 Y and 2.180 Y.ConclusionPropensity scorematchingmethod can effectively reduce the confounding bias of non-random ized clinical observational data,and help us evaluate the therapeutic effect of Lung Carcinoma patients correctly.
Propensity Score;Matching Method;Lung Carcinoma;Survival Analysis
*國家自然科學基金資助項目(81141112);山東省自然科學基金資助項目(ZR2013HM045)。
△通信作者,王素珍,E-mail:wangsz@w fmc.edu.cn。