李靜
臨床研究系列講座
臨床試驗設計:隨機對照
李靜
隨機對照臨床試驗對于評價治療措施的療效與安全性是金標準,而療效和安全性是臨床醫生最關心的問題。因此,臨床研究者應學習如何科學設計隨機對照臨床試驗。此外,在循證醫學時代,正確解讀臨床試驗結果應該成為臨床醫生的一項基本功,就像醫生要會看化驗單、讀X線胸片一樣。正確解讀臨床試驗也離不開對科學設計原則的了解。
一項好的臨床試驗必須滿足兩個條件,一是回答重要的臨床問題,能夠指導臨床實踐;二是結論科學可靠,有效控制誤差。因此好的臨床試驗必須是起源于臨床實踐,依托流行病學的方法。科學的設計目的就是要合理控制誤差,保證研究結果的準確可靠。誤差分為系統誤差和偶然誤差,系統誤差是指結局指標的差異由其他因素造成,而非由待評價的治療所致,又稱偏倚。系統誤差是觀察性研究常見的問題,可能高估或者低估療效,但很難確定其方向和程度。隨機誤差是機會所致,見于觀察性研究和臨床試驗,但可以量化。只有當真實療效明顯大于誤差產生的影響時,研究結論才是可靠的。隨機對照與合理的樣本量分別能夠有效地控制系統誤差和隨機誤差,是臨床試驗研究設計的重要原則。
隨機對照是消除系統誤差的唯一途徑,科學的隨機分組方法能夠確保治療組和對照組具有真正的可比性。隨機是提供一個時間點,從此開始研究各組分開,受試者分到各組的機會相等,而且不能預知分組的情況。既然是通過隨機的分組,理論上能夠確保所有的因素在各組之間都是均衡分布的。這一點較觀察性研究具有無可比擬的優越性。因為觀察性研究雖然可以通過分層、匹配等方法使已知對結局指標有影響的因素在各組之間達到平衡,但完全無法平衡未知的影響因素。根據隨機的定義,我們可以判斷一個研究是否真正做到了隨機。有些研究號稱“隨機”分組,但實際上并不能滿足隨機的定義,例如,根據患者就診日期的奇偶數分組、 根據生日的奇偶數分組、根據患者參加研究順序的奇偶數分組,就都不是真正的隨機。因為這些情況下,研究者都可以在隨機前預知受試者將分到哪個組別,如果研究者帶有傾向性,希望受試者分到某個特定的組別,他就有可能采取措施干預受試者的分組,例如如果是根據研究順序分組,研究者可以讓受試者等到下一個受試者之后再隨機入組,就會被分到另一個組別。一旦研究者可以干預分組,那就破壞了隨機,無法保證各組間的均衡。
一項臨床試驗的結果發表時,一定要報告各組受試者的基線特征比較,通常是用表來展示。如果各組之間某些基線特征存在明顯差異,往往是由于隨機的設計存在缺陷或執行過程中出了問題。這會讓人質疑結論的可靠性。
隨機分組是雙盲設計的前提條件。1948年現代流行病學的鼻祖英國人Austin Bradford Hill開展了世界上第一項隨機對照臨床試驗,評價鏈霉素治療肺結核的療效。這項試驗大獲成功,終結了肺結核作為不治之癥的權勢。但這項試驗更重要影響在于確立了隨機對照臨床試驗的設計原理,他也首次提出雙盲的原則,以及評價指標應客觀簡單。
為了保證隨機對照不被破壞,臨床試驗的分析要遵循意向治療分析原則(intention to treat, ITT)。ITT原則是指分析時應包含所有被隨機分組的受試者,而且按照隨機分配組別進行分析,不考慮受試者是否符合入選標準,是否違背研究方案,也不考慮受試者實際接受了何種治療。舉個極端的例子,如果一名受試者隨機后,當天就因意外死亡了,一片研究藥物都沒吃,按照ITT原則,也應該納入分析,而不能被排除。同樣,所有失訪的受試者也應納入分析。正是出于這條原則,目前臨床試驗結果報告所必須遵循的CONSORT原則要求以流程圖(圖1)的方式,清楚報告受試者隨機及隨訪的過程,具體到每一步驟、每一組別和每一種情況所對應的受試者人數[1]。有了這些信息,就能夠清楚判斷作者是否遵循了ITT原則。
舉2個例子,SPARCLE研究[2]評價阿托伐他汀預防腦卒中的療效, 2 365例受試者分到治療組,2 366例分到安慰劑組,治療組有78例撤回知情同意,其中63例生存狀態不明,此外,還有15例失訪。對照組與之相似。最后分析時,治療組的2 365例和安慰劑組的2 366例受試者全部納入療效分析和安全性分析,一個都沒少。再看另外一個例子,是評價美托洛爾治療心衰療效的MERIT-HF研究[3],隨機分組后,治療組有1 995例受試者,安慰劑組有2 001例。隨訪做得非常好,沒有失訪的。但研究結束時,治療組和安慰劑組分別有228例和242例沒有接受研究治療的。最后也是所有受試者都納入分析。
為什么設立ITT原則?分析時為什么不能排除停藥的受試者?為什么不能排除失訪的受試者?首先從統計學角度而言,ITT分析是對隨機的保證,研究隨機分組的時候,分開的各組是平衡的,但隨機分組之后各個組之間出現任何差異,都有可能是由于各組采取的干預措施不同而導致的,如果排除某些受試者,就會破壞原本隨機分組時建立的平衡,導致偏倚。按照隨機分配的組別,對所有隨機的受試者進行分析,就是為了保證隨機不被破壞,是對隨機最大程度的尊重。其次,從臨床角度而言,停藥往往是由于受試者不耐受研究治療,如果排除停藥的受試者,就有可能掩蓋研究治療的不良反應。與之類似,失訪有可能是由于死亡,或者由于不耐受研究治療而不再配合隨訪,這也是與研究治療的療效或安全性直接相關的,如果排除此類患者,勢必抹殺了研究治療與對照之間的差異。

圖1 CONSORT流程圖
因此,ITT分析是隨機對照臨床試驗的首要分析方法,在此基礎上,可以考慮對符合方案的受試者進一步分析,補充安全性方面的信息。采用ITT分析,是為了避免系統誤差,但不依從研究方案和失訪者都會導致研究的統計學把握度大大降低,使隨機誤差增加。因此臨床試驗實施管理的一個重點就是盡量避免失訪和不依從方案的情況發生。如何避免呢?首先是從研究設計的角度考慮,其次是加強隨訪的管理,與受試者建立良好的溝通和彼此的信任。
合理的樣本量是減少隨機誤差的有效方法。科學的設計包含對樣本量的合理估計。樣本量不足是臨床研究中常見的問題,將導致研究無法給出明確結論,說不清楚到底是研究治療無效,還是假陰性。相反,樣本量也不是“韓信點兵,多多益善”,因為樣本量增加意味著人力、物力和時間成本的增加,以及納入更多的中心,質量控制的難度增加、隨訪質量的下降等。不適當的樣本量也是不倫理的,過大的樣本量會延緩研究結果的產生和發布,延誤有效治療在臨床實踐中的廣泛應用。過小的樣本量不足以得出科學結論,會影響受試者的獲益。
計算樣本量的公式比較復雜,可使用專門的軟件,按照提示輸入相應的參數,軟件就能給出計算結果。通常影響樣本量的參數是四個,其中兩個是統計學參數,包括統計學顯著度和把握度。如果用α和β分別表示Ⅰ型錯誤率(假陽性率)和Ⅱ型錯誤率(假陰性率),則顯著度是α值,統一規定為0.05。把握度是1-β值,由研究者來決定,越大越好,但把握度越大就意味著需要的樣本量越大。還有兩個參數與研究要回答的問題本身有關。一個是對照組終點事件發生的頻率,另一個是預期的療效,也就是治療組與對照之間的差異。確定對照組終點事件發生的頻率是根據既往研究或預試驗的結果。預期的療效只能是估計值,因為如果已經確知效果就不需要開展這項臨床試驗了。這幾項參數中,療效的不確定性最大,其估計的準確性對于樣本量計算的影響也最大。估計療效的根據是既往同類研究結果或待評價治療的作用機制及流行病學數據[4]。
根據公式算出來的只是理論上所需的樣本量,臨床試驗實施過程也會影響到最終實際需要的樣本量。研究實施中未必全部受試者都能依從研究方案的要求接受研究治療,依從者在所有受試者中所占的比例是依從率。實際所需的樣本量是理論樣本量除以依從率的平方。因此,如果依從率是70%,實際所需樣本量就是理論樣本量的2倍。這一點再次說明臨床試驗的設計必須考慮研究實施的合理性,而實施質量對于保證科學設計得以實現是至關重要的[5]。
總而言之,隨機對照是臨床試驗設計的精髓,因為其能有效控制系統誤差,從而使得隨機對照臨床試驗成為療效評價的金標準。為了保證隨機的效果不被破壞,臨床試驗的首要分析是ITT分析。預先計算合理的樣本量能夠減少偶然誤差。
[1] CONSORT Group.CONSORT 2010[EB/OL].http://www.consortstatement.org/, 2017-09-22.
[2] Amarenco P, Bogousslavsky J, Callahan 3rd A, et al. High-dose atorvastatin after stroke or transient ischemic attack. N Engl J Med,2006, 355: 549-559.
[3] Hjalmarson A, Goldstein S, Fagerberg B, et al. Effects of controlledrelease metoprolol on total mortality, hospitalizations, and well-being in patients with heart failure: the Metoprolol CR/XL Randomized Intervention Trial in congestive heart failure (MERIT-HF). MERITHF Study Group. JAMA, 2000, 283: 1295-1302.
[4] Schulz KF, Grimes DA. Sample size calculations in randomised trials:mandatory and mystical. Lancet (London, England), 2005, 365: 1348-1353.
[5] 陳錚鳴, 邵永孚. 臨床隨機試驗原理和方法. 中華腫瘤雜志, 1994,16: 234-236.
2017-09-20)
(編輯:寧田海)
100037 北京市,中國醫學科學院 北京協和醫學院 國家心血管病中心 國家心血管疾病臨床醫學研究中心 心血管疾病國家重點實驗室中國牛津國際醫學研究中心
李靜 教授 博士研究生導師 主要從事心血管領域大規模隨機對照臨床試驗和醫療結果評價研究 Email:jing.li@fwoxford.org
R54
C
1000-3614(2017)11-1126-02
10.3969/j.issn.1000-3614.2017.11.022