姜棋予 孫麗君 畢京峰



[摘要] 通過對敏感性分析新方法E-value的解讀,向讀者介紹一種簡單實用的觀察性研究敏感性分析方法。該方法以相對危險度(RR)作為主要研究指標,構建了RR敏感性分析的統計學模型,從而預測能夠將研究結果(RR值)解釋掉的,未知混雜因素與暴露因素及結局的最小關聯強度。該方法還通過統計學轉換,將RR推廣到優勢比、風險比及結局變化的均值的敏感性分析。該方法為觀察性研究的敏感性分析提供了一種簡單、可靠的分析方法,建議在以后的觀察性研究報告及論文發表中提供相應的敏感性分析結果,但須注意,該敏感性分析并不能替代嚴謹的科研設計。
[關鍵詞] 觀察性研究;敏感性分析;E-value;解讀
[中圖分類號] C81 ? ? ? ? ?[文獻標識碼] A ? ? ? ? ?[文章編號] 1673-7210(2020)04(b)-0181-06
Sensitivity analysis of observational studies: “E-value” interpretation
JIANG Qiyu ? SUN Lijun ? BI Jingfeng▲
Clinical Research Management Center, the Fifth Medical Center, Chinese PLA General Hospital, Beijing ? 100039, China
[Abstract] Through the interpretation of the new sensitivity analysis method E-value, a simple and practical sensitivity analysis method for observational research is introduced to readers. In this method, Relative Risk (RR) was used as the main research index to construct a statistical model of RR sensitivity analysis, so as to predict the minimum correlation strength of unknown confounders with exposure factors and outcomes that can explain away the research results (RR values). The method also extended RR to sensitivity analysis of Odds ratio, Hazard ratio and mean of outcome changes through statistical transformation. This method provides a simple and reliable method for sensitivity analysis of observational research, and it is suggested to provide corresponding results of sensitivity analysis in future observational research reports and papers, but it should be noted that this sensitivity analysis cannot replace rigorous scientific research design.
[Key words] Observational study; Sensitivity analysis; E-value; Interpretation
在觀察性研究中,臨床研究的結局可能受多種因素的影響,即使研究者已經根據前期調研結果采集到了足夠的影響因素,但仍可能存在未知的混雜因素影響結果的可靠性。從流行病學的角度,研究者更希望知道研究結果的穩定性或可靠性有多高,即假如存在一個或幾個未知的影響因素,這些影響因素需要有多大的“效力”可以完全解釋掉該研究結果。國外的學者已經提出了多種探索敏感性分析的分析方法[1-19],但這些分析方法在學術界也引起了一定的爭議,部分技術被認為太過主觀,研究者往往通過選擇更為靈敏的參數,使結果相對于未知混雜因素的影響更為穩健[20]。其他批評包括,假設通常規定未測量的混雜因素是二元的[3],或者只有一個未測量的混雜因素[4-5],或者未測量的混雜因素與治療結果之間沒有相互作用[2-5]。
加州大學伯克利分校統計系丁鵬博士與哈佛大學公共衛生學院流行病學系博士Tyler J. VanderWeele利用混雜因素與暴露因素及結局的關聯性,提出并構建了觀察性研究的敏感性分析理論[14,20-21],并組織編寫了名為“EValue”的R包,為觀察性研究的敏感性分析提供了一種簡單、可靠的分析方法。本文將針對該方法進行介紹,以期為國內研究者提供觀察性研究敏感性分析的新思路。
1 基本原理
1.1 統計學原理
設暴露因素為E,已經獲得的協變量(混雜因素)為C,結局變量(二分類)為D,未測量的混雜因素為U(可以為兩分類,多分類,連續變量,U=1,2……k)。將未測量混雜因素U與暴露因素E的關聯強度稱之為RREU,將未測量混雜因素U與結果D的關聯強度稱之為RRUD。RREU、RRUD與暴露因素、結局以及已經獲得的協變量的關系見圖1[21]。
2.2 E-value分析的3個擴展
在觀察性研究中,針對不同研究設計和結果數據,logistic回歸、Cox比例風險模型、多重線性回歸是最為常用的多因素統計分析方法,其輸出的統計結果分別是優勢比(odds ratio,OR)、風險比(hazard ratio,HR)、結局變化的均值及其置信區間。E-value也通過RR的統計學轉換為上述結果提供了敏感性分析方法。
2.2.1 OR值的敏感性分析 ?如前所述,E-value的敏感性分析主要針對的是RR指標,關于OR值的敏感性分析則是基于RR值與OR值的相關性統計學理論取近似值,在E-value中,當結局事件的發生率<15%或>85%時,按RR=OR計算,當結局事件的發生率介于15%~85%時,按如下公式計算[21,23]RR=■,將OR近似地替換為RR,從而可以利用該RR的近似值進行敏感性分析。如在“基于劑量-反應關系的體力活動對血清肌酐水平的影響及其性別差異”[25]中,能量代謝當量大于821.50MET-min/week組(肌酐異常發生率35.24%)發生肌酐水平異常的OR值為1.47, 95%的置信區間為(1.13~1.92),肌酐異常總發生率為(192+216)/(804+613)×100%=28.79%(介于15%~85%)。其E-value的R軟件實現:在R軟件EValue包中,可直接利用以下函數進行估算:evalues.OR(X,low,high,rare =0或1),其中X表示觀察性研究結果OR值,low表示OR值置信區間的下限,high表示OR值置信區間的上限,rare即結局事件的發生率是否在15%~85%之間,當在這個區間時rare=0,當<15%或>85%時,rare=1。將上述值代入EValue包“evalues.OR(1.47,1.13,1.92,rare =0)”,得到E-value=1.72,其值置信區間的低限為1.32,即如果存在某種未測量(未知)的混雜因素,其與暴露因素及結局的RR各達到1.32時(RREU=RRUD=1.32),就可以完全解釋掉原研究結果RR=1.47。
2.2.2 HR值的敏感性分析 ?Cox比例風險模型輸出的主要統計結果是HR值,同OR值相似,當結局事件的發生率<15%或>85%時,按RR=HR計算,當結局事件的發生率介于15%~85%時,E-value[21]按如下公式計算:RR≈[1-0.5sqrt(HR)]/[1-0.5sqrt(1/HR)]。R軟件實現:同OR值敏感性的計算一樣,在R軟件EValue包中,可直接利用以下函數進行估算:evalues.HR(X,low,high,rare =0或1),其中X表示觀察性研究結果HR值,low表示HR值置信區間的下限,high表示HR值置信區間的上限,rare即結局事件的發生率是否在15%~85%之間,當在這個區間時rare =0,當<15%或>85%時,rare =1。
2.2.3 結局指標變化均值及其置信區間的敏感性分析 ?多重線性回歸分析結果輸出的是回歸系數及其標準誤。回歸系數是指當調整了其他協變量后,研究變量每變化一個單位,結局指標的變化平均值。如Reinisch等[25]研究了苯巴比妥宮內暴露對男性智力的影響,暴露組為母親在懷孕期間應用過苯巴比妥的男性,對照組為母親在懷孕期間未應用過苯巴比妥的男性,經對家庭社會經濟狀況、教育、母親是否嘗試墮胎、母親婚姻狀況等協變量調整后。苯巴比妥對智力影響的估計值均數為-4.77,95%的置信區間為(-7.96~-1.58),標準誤差為1.63,所有樣本的總方差為11.83。研究者沒有獲得關于父母智力的數據,這可能是一個未測量的混雜因素。與OR、HR屬于分類資料不同,上述研究中對智力影響的估計值屬于連續性計量資料,首先需要將其轉化為RR,才能夠進行敏感性分析。E-value基于方差分解的統計學理念,通過計算結局指標變化均值占總方差的比例來獲得RR,具體方法是:用對智力影響的估計值均數和標準誤除以總樣本的標準差,得到D=-4.77/11.38=-0.42和SD=1.63/11.38=0.14的結果。然后應用公式[21,22,26-27]:RR≈exp(0.91×d),置信區間:exp(0.91×d-1.78×sd),exp(0.91×d+1.78×sd),計算得到RR≈1.46,95%置信區間約為(1.14~1.88),再利用公式2即可以獲得E-value值及其95%的置信區間,結果E-value=2.29,其95%的置信區間的下限為1.54。之所以在計算RR的估計值時,代入公式的是0.42而不是-0.42,是因為-0.42僅代表苯巴比妥對智力影響的估計值降低了0.42,“-”在這兒僅表示一個方向。R軟件EValue包同樣提供了相應的函數:evalues.MD(D,SD),如本例,evalues.MD(0.42,0.14),即可獲得上述結果。
2.3 關于E-value幾個需要說明的問題
2.3.1 RR值應>1 ?許多研究獲得的RR往往<1,E-value一般要求如果RR<1,則應取該值的倒數使之>1。其實這不矛盾,RR本身是一個相對概念,一般代表的是暴露組與對照組的發病率之比,其倒數代表的是對照組與暴露組的發病率之比,在結果解釋上是相同的。
2.3.2 E-value值代表什么? ?E-value值可用于估算未測量的混雜因素能夠將研究結果解釋掉的,需要與結局指標相關聯的最小關聯強度,從而可以評估暴露因素與結局指標之間關聯的穩健程度,并且當在E-value值比較大情況下,可能提供支持因果關系的有力證據。然而,在沒有確鑿證據的情況下,不能以E-value值的大小來判斷原研究結果的對與錯。從公式2中可以看出,E-value值與研究結果RR值(或由OR、HR等推導出的RR值)的大小是密切相關的,當RR值較小時,E-value值也較小。不能因為RR值較小,同時E-value值也較小就認為研究結果可能是錯誤的,因為暴露與結局的相關性事實上可能就是這個結果。
2.3.3 E-value需不需要確定一個固定的域值? ?既然獲得了E-value,研究者可能會問,能不能象P值(P < 0.05被公認為有統計學差異)一樣確定一個固定的域值,當E-value>該值時研究結果可認為更穩健,而當<該值時被視為不夠穩健?“推薦Evalue”[22]認為,不應該設置這樣一個域值。因為E-value值僅表示,假如有未測量的混雜因素能夠解釋掉研究結果RR,其與暴露因素及結局指標最小的關聯程度。如上所述,可能在事實上,暴露與結局的相關性本身就是這個結果。
2.3.4 E-value還可以用于評估研究結果被低估的關聯強度 ?E-value值除了可用于估算未測量的混雜因素能夠將研究結果解釋掉的,需要與結局指標相關聯的最小關聯強度外,也可以評估由未測量的混雜因素導致的,暴露因素與結局指標相關聯的被低估的關聯強度。二者的方法學原理是相似的。例如“血清白蛋白對心力衰竭患者院內死亡的影響”[23]研究中,RR=2,當我們想知道未測量的混雜因素需要具備多大的RREU和RRUD,會導致RR=3時,則RR′=2/3,然后利用公式2,將RR′替換RR即可獲得相應的E-value值。
2.3.5 有了E-value還需要進行多因素分析嗎? ?答案是肯定的。E-value評價的是觀察性研究結果可能被未測量混雜因素解釋掉的程度,多因素分析的結果無疑將更加穩健,其可能存在的未測量混雜因素的范圍將更小,所獲得的E-value值也更加確切。
2.4 E-value的局限性
如同任何一種統計學方法都有其局限性一樣,E-value學說的發表也引起了一些爭議,JPA等[28]認為,E-value方法在觀察性研究中很容易被誤用。E-value提供的是一個具有線性關系性質的一個比較簡單的值[28],是在假設未測量的混雜因素對暴露因素與結局具有相同的關聯度的前提下獲得的,代表的是一種最小關聯強度。在醫學實踐中,這種關聯程度未必相同,因此E-value值僅僅且只能作為一個參考指標,其是否反應了臨床實際值得商榷。
E-value僅僅提供了一種敏感性分析結果,不能替代觀察性研究所必須的,嚴謹的科研設計。E-value是在科學、嚴謹的設計,實施,統計,分析基礎上所建立的一種相對簡單、線性的敏感性分析方法,只能對假設的未知混雜因素能夠將研究結果(RR值)解釋掉的最小關聯強度進行預測。由于這僅僅是一種未知的假設,其在評價過程中只能起一定的輔助作用,不能因為獲得了較大的E-value值就認為結果一定是穩健的,也不能因為獲得了較小的E-value值就認為結果不可靠。觀察性研究結果的科學性決定于必須按照流行病學的研究原理,進行科學、嚴謹的設計,實施,統計,分析,并進行規范的報告[29],方能得出令人信服的結論。準確地說,觀察性研究結果的科學性和可靠性只與科學、嚴謹的設計,實施,統計,分析相關,E-value值只是為該研究結果提供了一種補充信息。
3 致謝
在本文的成文過程中,得到了E-value方法的原創者,加州大學伯克利分校統計系丁鵬教授的大力支持,并對文章進行了悉心指導和修改,在此謹表示衷心感謝并致以崇高的敬意。
[參考文獻]
[1] ?Bross ID. Spurious effects from an extraneous variable [J]. J Chronic Dis,1966,19(6):637-647.
[2] ?Schlesselman JJ. Assessing effects of confounding variables [J]. Am J Epidemiol,1978,108(1):3-8.
[3] ?Rosenbaum PR,Rubin DB. Assessing sensitivity to an unobserved binary covariate in an observational study with binary outcome [J]. J R Stat Soc Series B,1983,45:212-218.
[4] ?Lin DY,Psaty BM,Kronrnal RA. Assessing the sensitivity of regression results to unmeasured confounders in observational studies [J]. Biometrics,1998,54(3):948-963.
[5] ?Imbens GW. Sensitivity to exogeneity assumptions in program evaluation [J]. Amer Econ Rev,2003, 93:126-132.
[6] ?Vanderweele TJ,Arah OA. Bias formulas for sensitivity analysis of unmeasured confounding for general outcomes,treatments,and confounders [J]. Epidemiology,2011,22(1):42-52.
[7] ?Bross ID. Pertinency of an extraneous variable [J]. J Chronic Dis,1967,20(7):487-495.
[8] ?Lee WC. Bounding the bias of unmeasured factors with confounding and effectmodifying potentials [J]. Stat Med,2011,30(9):1007-1017.
[9] ?Robins JM,Rotnitzky A,Scharfstein DO. Sensitivity analysis for selection bias and unmeasured confounding in missing data and causal inference models [M]// Statistical Models in Epidemiology, the Environment, and Clinical Trials. Springer New York,2000:1-94.
[10] ?McCandless LC,Gustafson P,Levy A. Bayesian sensitivity analysis for unmeasured confounding in observational studies [J]. Stat Med, 2007,26(11):2331-2347.
[11] ?Brumback BA,Hernán MA,Haneuse SJ. Sensitivity analyses for unmeasured confounding assuming a marginal structural model for repeated measures [J]. Stat Med,2004,23(5):749-767.
[12] ?VanderWeele TJ. Explanation in Causal Inference:Methods for Mediation and Interaction [M]. New York:Oxford University Press,2015,Chapter 3.
[13] ?VanderWeele TJ. Sensitivity analysis for contagion effects in social networks [J]. Sociol Methods Res,2011,40(2):240-255.
[14] ?Ding P,VanderWeele TJ. Sensitivity analysis without assumptions [J]. Epidemiology,2016,27(3):368-377.
[15] ?Gilbert PB,Bosch RJ,Hudgens MG. Sensitivity analysis for the assessment of causal vaccine effects on viral load in HIV vaccine trials [J]. Biometrics,2003,59(3):531-541.
[16] ?Chiba Y,VanderWeele TJ. A simple method for principal strata effects when the outcome has been truncated due to death [J]. Am J Epidemiol,2011,173(7):745-751.
[17] ?Huang TH,Lee WC. Bounding formulas for selection bias [J]. Am J Epidemiol,2015,182(10):868-872.
[18] ?Robins J,Orellana L,Rotnitzky A. Estimation and extrapolation of optimal treatment and testing strategies [J]. Stat Med,2008,27(23):4678-4721.
[19] ?Hernán MA,Lanoy E,Costagliola D. Comparison of dynamic treatment regimes via inverse probability weighting [J]. Basic Clin Pharmacol Toxicol,2006,98(3):237-242.
[20] ?Ding P,VanderWeele TJ. Sharp Sensitivity Bounds for Mediation Under Unmeasured Mediator-Outcome Confounding [J]. Biometrika,2016,103(2):483-490.
[21] ?VanderWeele TJ,Ding P. Sensitivity Analysis in Observational Research:Introducing the E-Value [J]. Ann Intern Med,2017,167(4):268-274.
[22] ?于彤彤,宋嬌磊,劉雙雙,等.基于傾向性評分匹配法探討血清白蛋白對心力衰竭患者院內死亡的影響[J].中華內科雜志,2015,54(11):959-964.
[23] ?VanderWeele TJ. On a square-root transformation of the odds ratio for a common outcome [J]. Epidemiology,2017, 28(6):e58-e60
[24] ?許春杰,劉曉宇,尹素鳳,等.基于劑量-反應關系的體力活動對血清肌酐水平的影響及其性別差異[J].鄭州大學學報:醫學版,2018,53(2):225-229.
[25] ?Reinisch JM,Sanders SA,Mortensen EL. In utero exposure to phenobarbital and intelligence deficits in adult men [J]. JAMA,1995,274(19):1518-1525.
[26] ?Hasselblad V,Hedges LV. Meta-analysis of screening and diagnostic tests [J]. Psychol Bull,1995,117(1):167-178.
[27] ?Borenstein M,Hedges LV,Higgins JPT,et al. Introduction to Meta-Analysis [M]. Wiley:2009,Chapter 7.
[28] ?JPA I,Tan YJ,Blum MR. Limitations and Misinterpretations of E-Values for Sensitivity Analyses of Observational Studies [J]. Ann Intern Med,2019,170(2):108-111.
[29] ?von EE,Altman DG,Egger M,et al. The Strengthening the Reporting of Observational Studies in Epidemiology(STROBE)statement:guidelines for reporting observational studies [J]. Lancet,2007,370(9596):1453-1457.
(收稿日期:2019-09-02 ?本文編輯:顧家毓)