葉曉勤,楊 偉,謝雁鳴△,王永炎
(1.中國中醫科學院中醫臨床基礎醫學研究所,北京 100700;2.中國人民大學統計學院,北京 100872)
基于傾向性評分的中醫復雜干預臨床療效評價*
葉曉勤1,楊 偉2,謝雁鳴1△,王永炎1
(1.中國中醫科學院中醫臨床基礎醫學研究所,北京 100700;2.中國人民大學統計學院,北京 100872)
臨床研究的成功與否,與是否有效控制偏倚有關。在非隨機化的觀察性研究中,傾向性評分能減少對比組間的差異,縮小偏倚。與試驗設計階段進行配比控制偏倚相比,傾向性分析法不受試驗設計(隨機對照試驗設計)方法的限制,無須在試驗設計階段進行隨機,其結果更接近“真實世界”的實際干預效果而非臨床試驗的效果。因此,傾向性分析應用于中醫個性化治療的復雜干預療效評價是適合的,具有重要的研究前景和使用價值。
傾向性分析;混雜因素;中醫復雜干預;療效評價
傾向評分法(propensity score method)是由Rosenbaum 和 Rubin 于 20 世紀 80 年代提出[1,2],是一個可在缺乏隨機化處理分配的情況下增加治療組可比性的創新性統計方法。2000年之后,這一方法日益受到人們的關注。國際上越來越多的研究者將傾向評分法應用到流行病學、健康服務研究、經濟學以及社會科學等諸多領域[3~7]。
臨床研究的成功與否,與其是否有效控制偏倚有關。只有從設計、實施到統計處理等各個環節嚴格把關,減少和消除偏倚的影響,才能得出真實的結果,臨床研究才具有價值。隨機對照試驗通過隨機分組而避免混雜因素的影響。然而,隨機對照試驗不可能代替其他的研究策略,各種觀察性研究均不可避免地存在著混雜因素。
當在兩種因素混在一起或相互影響時,可能錯誤地將其中之一當成某一結果的原因[8],這種引起和產生混雜的因素稱為混雜因素(confounder)。此種偏倚的影響是在評價因果關系、治療效果、預后因素時,由于受到可以引起相同結果而同時存在的其他某些因素(混雜因素)的干擾,導致夸大或縮小了最后結果的錯誤結論。混雜偏倚僅靠嚴密設計和準確操作還不能完全避免,它還要求科研人員有嚴密的科學思維和適當的調整混雜因素的統計學知識[9]。混雜偏倚的控制,根據研究階段不同可采用不同的方法[1]。在研究設計階段,可以采取諸如嚴格限制研究對象、配對、分層抽樣、直接隨機抽樣等方法。在混雜偏倚不可避免地產生后,控制混雜偏倚的方法主要有分層分析法、校正分析法、配對法及Logistic回歸等。
辨證論治的個體化綜合干預治療是中醫藥防病治病的特色與優勢,特別是一些病因復雜、病情較重、預后較差的疾病,如惡性腫瘤、血液病、免疫性疾病、腦血管意外以及一些嚴重的感染性疾病,往往累及多個系統。對于這些疾病,單一的防治手段難以獲得滿意療效,需要給予復雜或綜合性的防治方案,復雜或綜合干預體現了這種治療理念。
復雜干預貫穿于中醫診療過程的始終,中醫復雜或綜合干預反映了中醫臨床實踐過程中的實際情況,而復雜干預是由多個要素或干預措施組成的。要準確界定一個復雜干預中“起作用的積極因素”不是一件容易的事情。復雜干預比單純對某種藥物的研究具有更多的變數,這使得辨識、驗證和重復某個復雜干預的臨床療效變得極為艱難。如何評價臨床實際過程中“起作用的積極因素”或不同組合中醫干預措施的療效,需要尋找合適的評價方法對其進行嚴格評價。傾向性評分是一個可在缺乏隨機化處理分配的情況下增加治療組可比性的一種統計方法。該方法盡量將所有可能的混雜因素綜合為一個變量即傾向評分(Propensity Score,PS),從而使組間具有可比性,因此該方法應用于中醫實際情況下的復雜干預療效評價是恰當和適合的。
與隨機對照研究相比,觀察性研究給出了干預效果的實際情形而非臨床試驗的效果,所以觀察性研究對于健康結果產出研究十分重要。研究者們依賴于非干預的觀察,描述不同個體接受不同照料的各種類型(水平)治療方式的效果[10]。如何利用非隨機化的研究資料探索不同干預措施或水平治療方式的效果,一直是臨床研究中需要探討的問題。控制混雜偏倚的方法包括在研究設計階段進行配比,或在數據分析階段按照混雜因素分層,或采用多因素數學模型進行調整等。但這些方法的局限性是同時調整的變量數不能太多。傾向評分法能夠將多個混雜變量綜合為一個變量即傾向評分(Propensity Score,PS),通過平衡兩對比組的傾向評分而有效地均衡混雜變量(也稱協變量)的分布,從而達到控制混雜偏倚的目的。
傾向性評分的分析方法是對控制混雜偏倚的一種有效的方法,當結局極其罕見以致于難以或不能實施RCTs時,也可為臨床試驗建立假設或提供足夠證據。
醫生在臨床實踐過程中,會根據疾病的不同發展階段隨著復雜病情和證候的動態變化而采用不同的治療方法,復雜的疾病使用單一的治療方法難以奏效,往往采用綜合方案的復雜干預方法。
缺血性中風是一種復雜的疾病,臨床上往往采用綜合方案進行干預。中國中醫科學院中醫臨床基礎醫學研究所在“十一五”期間承擔了國家高新技術研究發展(863)計劃生物醫藥專題下“缺血性中風早期康復和避免復發中醫方案研究”課題,該方案由中藥辨證湯劑、中藥注射劑、針刺、推拿綜合干預措施組成。經專家反復論證的干預方案總框架確定下,醫生會根據患者病情的輕重、個體的差異等不同的情況,選用不同的干預介入時間和持續時間、治療頻次和強度。
中醫通過整體與個體化相結合的復雜干預手段,對患者進行符合臨床實際的干預被認為是產生療效的依據所在。然而這樣的診療模式既是中醫取得較好臨床療效的優勢和特色,同時也給臨床療效的評價造成了困難。針對中醫復雜干預診療模式,如何進行療效評價是廣大中醫藥臨床科研工作者必須面對的問題。
中醫復雜干預模式更接近于臨床“真實世界”的干預模式。近年來,真實世界研究(real-world study,RWS)越來越受到廣大醫學科研工作者的重視,認為其研究結果更接近臨床實際。但這也給我們帶來一個問題,在回答中醫綜合方案整體療效的同時,我們能否回答中醫綜合方案中不同干預措施哪種組合效果更好?是否每種干預措施都是有效的?哪種干預措施對整體療效貢獻度更大?要回答這些問題,僅僅比較中西醫2組的總體療效是不夠的,如果根據臨床實際情況如醫囑或針刺、推拿記錄單的記錄將中醫組所用具體方法根據實際使用情況進行評價,就會出現依據不用的介入時間、不同的中醫康復使用頻次、不同的使用持續時間,乃至根據病情在方案總框架下所使用的中醫康復措施的取舍等所形成的若干亞組,并造成樣本量的分散,在評價上很難達到預期的目的。
傾向評分法適合于所有非隨機化研究的資料,或者說存在混雜偏倚研究資料的處理。利用傾向評分降低混雜偏倚的方法主要有傾向評分配比、傾向評分分層、傾向評分回歸調整和傾向評分加權。各種方法對于傾向評分的計算是相同的,只是在如何使用傾向評分進行偏倚調整方面有所不同[11]。本研究所采用的統計分析方法是Generalized Boosted Models(GBM)加權傾向評分法,它是一種用于估計傾向評分的多元非參數回歸技術,其優勢在于可以估計關注變量和大量的協變量之間的非線性關系[12]。
本研究是以國家863計劃“缺血性中風早期康復和避免復發中醫方案研究”為依托。前期研究表明,中醫綜合康復方案相對于現代康復在整體上是有效的,能顯著降低患者病死率、復發率、致殘率,提高患者生存質量,改善患者早期(21d)神經功能缺損(NIHSS)評分及肢體運動功能(FMI)評分。但是中醫綜合康復方案中“起作用的積極因素”到底是什么?是否整體方案拆分后繼續有效?這是大家都很關心的問題,也為下一步繼續研究及中醫綜合康復方案的優化提供依據。
本研究中醫綜合康復措施主要由針刺(A)、推拿(B)、中藥注射劑(C)及中藥湯劑(D)組成。研究采取實用性隨機對照試驗設計,在方案執行過程中,研究者可以根據患者的實際情況如患者病情的輕重給予不同的干預措施或頻次。為了研究中醫綜合康復方案拆分后不同干預措施組合是否對缺血性中風早期康復繼續有效,本研究根據專家經驗將各干預措施≥7次作為符合方案,按此方案共得到拆分后干預措施組合針刺(A)+推拿(B)+中藥注射劑(C)290例。以神經功能缺損(NIHSS)評分和肢體運動功能(FMI)評分是否改善為療效評價指標,根據專業知識確定需要平衡的混雜因素有性別、年齡、病程、主要合并病、主要并發病、基線 NIHSS評分、基線mRS評分、基線 FMI評分(FMI1)、基線 BI評分、中醫證候和基線中醫癥狀評分。
針對中醫復雜干預的診療過程,傾向性分析可用于臨床不同治療方案的綜合評價分析,用于干預措施(治療方案)的優化。傾向性分析能夠評價并比較“真實世界”條件下中醫復雜干預不同治療方案的相對效率,挑選最佳治療方案,使分析結果更加真實、可靠,有利于臨床醫生和衛生決策者客觀地選擇醫療方案,達到合理化、規范化治療的目的。
但是,傾向性分析自身亦存在較多的問題,有嚴格的假設條件,即前提是盡可能地納入所有的混雜因素,然而由于未在方案設計階段實施隨機化,因此無法消除未知混雜因素的影響。傾向性分析作為中醫復雜干預臨床療效評價的一種新嘗試,還需要在今后大量的臨床試驗工作去驗證、探索并加以完善。
[1]Rosenbaum,PR.and Rubin,DB.The central role of the p ropensity score in observational studies for causal effects [J].Biometrika,1983,70:41-55.
[2]Rosenbaum PR,and Rubin DB.Constructing a control group using multivariate matched sampling methods that incorporate the propensity score[J].American Statistician,1985,39:33-38.
[3]D'Agostino RB.Propensity score methods for bias reduction in the comparison of a treatment to a nonrandomized control group[J].Statistics in Medicine,1998,17(19):2265-2281.
[4]Austin PC.A critical appraisal of propensity score matching in the medical literature between 1996 and 2003[J].Statistics in Medicine,2008,27(12):2037-2049.
[5]Rubin DB,Thomas N.Matching using estimated propensity scores:Relating theory to practice[J].Biometrics,1996,52:249-264.
[6]李智文,劉建蒙,張 樂,等.傾向評分配比在流行病學設計中的應用[J].中華流行病學雜志,2009,30(5):514-517.
[7]BaserO. Too much ado aboutpropensity score models?Comparing methods of propensity score matching[J].Value Health,2006,9(6):377-385.
[8]王家良.臨床流行病學-臨床科研設計、衡量與評價[M].上海:上海科學技術出版社,2001.
[9]姚才良,徐耀初.偏倚及其控制[J].中國公共衛生,1990,6(6):279-282.
[10]Alex Z Fu,唐 艷,陳 剛.傾向得分法綜述[J].中國藥物經濟學,2008,(2):27-34.
[11]李智文,任愛國.傾向評分法概述[J].中國生育健康雜志,2010,21(1):62-64.
[12]McCaffrey DF, Ridgeway G, MorralAR. PropensityScore Estimation with Boosted Regression for Evaluating Causal Effects in Observational Studies[J].Psychol Medthods,2004,9(4):403-425.
Propensity score-based clinical efficacy evaluation of TCM complex interventions
YE Xiao-qin1,YANG Wei2,XIE Yan-ming1△,WANG Yong-yan1
(1.Institute of basic research in clinical trial,China Academy of Chinese Medical Sciences,Beijing100700,China;2.School of Statistics,Renmin University of China,Beijing100872,China)
The success of clinical research,depends on the ability to control the bias.In the non-randomized observational study,propensity score can reduce the contrast differences between groups and narrow bias.Compared with design stage through matching control bias,propehsity analysis frees from experimental design(randomized controlled trial design)approach limits,with no need for rahdomization in the design stage.The result is closer to“real world”aitual effectiveness rather than the clinical trial results.Therefore,propehsity analysis applying to personalized medicine treatment efficacy evaluation of complex interventions is appropriate,has an important prospects and use value.
propensity score analysis;Confounding factors;TCM complex intervention;clinical efficacy evaluation
R969.4
A
1006-3250(2012)02-0218-03
國家高新技術研究發展計劃(863計劃)“缺血性中風早期康復和避免復發中醫方案研究”(2007AA02Z4B2);中國中醫科學院自主選題研究項目“基于傾向性分析的缺血性中風早期康復中醫復雜干預療效評價研究”(Z02108)
葉曉勤(1972-),男,主治醫師,博士后,從事中醫臨床療效評價方法學研究。
△通訊作者:謝雁鳴(1959-),女,研究員,博士研究生導師,從事中醫臨床評價方法學研究,E-mail:zhinanb2010@yahoo.com.cn。
2011-07-17