李靜
臨床研究系列講座
臨床試驗解讀常見誤區
李靜
正確解讀臨床試驗結果是臨床合理決策的重要基礎。作為療效與安全性評價的金標準,隨機對照臨床試驗在臨床實踐中發揮的作用日益廣泛。個體化醫療要求醫生根據具體患者的特征情況,以及已有的循證醫學證據(最主要的是臨床試驗的結果),做出合理的治療決策。臨床醫生在解讀臨床試驗結果時有三個常見誤區。一是混淆相對危險度和絕對危險度這兩個概念;二是用亞組分析的結果指導臨床實踐;三是把大規模臨床試驗和新藥注冊試驗這兩組試驗混為一談。在此,簡單闡述針對這三個誤區,所對應的概念原則。
臨床試驗結果通常有兩種表現形式:一是事件曲線或生存曲線,反映組間絕對危險度差異;二是森林圖,反映組間相對危險度差異。以PLATO[1]研究結果為例,圖1是事件曲線,比較直觀,橫坐標是隨訪時間長,縱坐標是累計發生的事件數量。氯吡格雷組1年事件發生率為11.7%,替格瑞洛組1年事件發生率為9.8%。因此,替格瑞洛與氯吡格雷相比,事件率減少1.9%,也就是絕對危險度下降1.9%。圖2是森林圖,中間的豎線對應橫軸尺度為1,稱為無效線。每個組別的危險比(hazard ratio, HR或risk ratio, RR)都是用一個方塊加一條橫穿方塊的橫線表示。方塊中心點所對應的橫軸坐標就是HR的點估計值,橫線的左右兩端對應的橫軸坐標分別是HR的95%可信區間(confidence interval, CI)的下限和上限。因此橫線長短直觀地表示可信區間的范圍大小。方塊大小反映樣本量的大小。匯總的結果用菱形塊來表示,菱形塊中心點所對應的橫軸坐標就是HR的點估計值,菱形塊的左右兩端對應的橫軸坐標分別是HR的95%可信區間的下限和上限。HR值是治療組的事件率比上對照組的事件率,因此,當HR<1時,表示治療組事件發生風險小于對照組,可以認為治療組療效更好。反之,當HR>1時,認為對照組療效更好。但只有當橫線不與無效線相交時,也就是HR的95% CI不跨越1時,才認為兩組的差異具有統計學意義,也就是我們通常說的P值<0.05。PLATO[1]研究中,HR值是9.8%比11.7%,等于0.84,就意味著治療組與對照組相比,事件風險下降16%,即1~0.84。16%就是相對危險度的下降幅度。
通常臨床試驗的結論講到某治療與對照相比,是終點事件風險降低或升高百分之多少,都是指的相對危險度的降低或升高。相對危險度反映的是治療組與對照組之間的差異的相對大小,而非絕對大小。而臨床醫生最關心的還是兩組間絕對差異有多大。因此,臨床試驗結果報告時,通常會用更直觀的方式報告絕對危險度。例如每治療1000例患者,可以減少多少例事件,或者每減少1例事件,需要治療多少例患者。以PLATO[1]研究結果為例,絕對危險度下降1.9%,就意味著每治療1000例患者,約可以減少19例事件,或者每減少1例事件,約需要治療53例患者。

圖1 替格瑞洛與氯吡格雷療效比較生存曲線[1]

圖2 替格瑞洛與氯吡格雷療效比較森林圖[1]
很多醫生會根據亞組分析的結果決定是否采用某種治療。這是一個很大的誤區。實際上,亞組分析的結果只是探索性的,并不是可靠的證據,不能依據其進行臨床決策。在閱讀臨床試驗研究結果時,我們可能會碰到以下情況:總研究結果無效,但對某些亞組患者有效;或者反之,總研究結果有效,但對某些亞組患者無效。這種情況并不能確切證明特定亞組的患者與其他組別的不同。
為了證明亞組分析不可靠,容易受到偶然誤差的影響,牛津大學的研究者曾經做過一個非常特別的亞組分析。他們對著名的ISIS-2[2]研究進行亞組分析。ISIS-2證實了阿司匹林能夠顯著降低急性心肌梗死患者的1個月內死亡率。研究者按照星座把受試者分到12個亞組。結果顯示在天秤座或雙子座中,阿司匹林組和對照組的死亡率分別為11.1%和10.2%,差異無統計學意義(表1)。大家一定不會相信星座與人的生理病理及藥物代謝反應機制有關,從而影響阿司匹林的療效。但如果是按照性別、年齡、病史等常見因素分組,大家通常就不會懷疑結果的可靠性。其實道理是一樣的,無論根據何種因素,亞組分析都不可靠,容易受到偶然誤差的影響,得出錯誤結論。

表1 ISIS-2研究星座亞組分析結果
為什么這樣說呢?從統計學而言,通常假設檢驗設定P<0.05,是說明得出錯誤結論的概率<5%,由于這個概率很小,我們就認為這樣的情況不大可能發生。盡管每一次犯錯誤的概率都很小,但分析做得越多,錯誤結果的累加數量就會越多。如果研究者帶有某種傾向性,很容易從大量分析中找出一些符合這種傾向性的結果。亞組分析做得越多,由于偶然誤差得到錯誤結果的可能性就越大。
這個例子非常清楚地顯示,即使在ISIS-2這樣樣本量超過17 000例的大型研究中,亞組分析的結果也未必反映真實的效果。因此,在指導臨床實踐時,一定要以研究總結果為準,而亞組分析結果是探索性的,可為進一步研究提供線索,但切不可將它當作明確的結論。亞組的設定不宜過多,且須在研究設計階段確定,并在臨床試驗注冊信息中清楚報告。
新藥上市之前須完成臨床試驗。這種為滿足法規的要求而開展的試驗被稱為注冊臨床試驗。注冊臨床試驗的首要目標是能夠讓藥物盡快上市,往往只是滿足法規的最低要求。在重要學術期刊上發表的臨床試驗很多是以回答科學問題為驅動而開展的,其中產生最重要影響的就是以臨床結局為評價終點的臨床試驗。這兩類臨床試驗的研究目的、規模以及影響力等方面都存在較大的差別,總結見表2,不應混為一談。

表2 替代終點研究和臨床結局終點研究比較
[1] Wallentin L, Becker RC, Budaj A, et al. Ticagrelor versus clopidogrel in patients with acute coronary syndromes. N Engl J Med, 2009, 361:1045-1057.
[2] Collins R, MacMahon S. Reliable assessment of the effects of treatment on mortality and major morbidity, I: clinical trials. Lancet, 2001, 357:373-380.
100037 北京市,中國醫學科學院 北京協和醫學院 國家心血管病中心 國家心血管疾病臨床醫學研究中心 心血管疾病國家重點實驗室中國牛津國際醫學研究中心
李靜 教授 博士研究生導師 主要從事心血管領域大規模隨機對照臨床試驗和醫療結果評價研究 Email:jing.li@fwoxford.org
R54
C
1000-3614(2017)12-1235-02
10.3969/j.issn.1000-3614.2017.12.024
2017-10-16)
(編輯:寧田海)