[摘要] 概括介紹了統(tǒng)計學(xué)在臨床試驗中的主要應(yīng)用。介紹了臨床試驗中主要統(tǒng)計學(xué)分析人群和臨床試驗中顯著性檢驗:優(yōu)效性檢驗、非劣性檢驗、等效性檢驗以及優(yōu)效性與非劣性檢驗之間的轉(zhuǎn)化;統(tǒng)計學(xué)在安全性分析的應(yīng)用;統(tǒng)計學(xué)差異與臨床意義差異的異同點。
[關(guān)鍵詞] 臨床試驗;統(tǒng)計學(xué);GCP
[中圖分類號] R195[文獻(xiàn)標(biāo)識碼] B[文章編號] 1673-9701(2011)25-75-02
Statistical Applications in Clinical Trials
LI Lin
Beijing Rongchang Drug Research Institute,Beijing 100078,China
[Abstract] An overview of statistics in clinical trials. Describes the main statistical analysis of clinical trials and clinical trials group significance test:test of superiority,non-inferiority testing, equivalency testing and switching between superiority and non-inferiority. Statistical applications in the safety analysis. Statistically significant and clinically differences in the similarities and differences.
[Keywords] Clinical trials;Statistics;GCP
在藥物臨床試驗研究中,受試者是人。人是具有變異性的生物體,而研究具有變異性的事物或現(xiàn)象的變化規(guī)律,需要應(yīng)用統(tǒng)計學(xué)的思維方法和技術(shù)手段。統(tǒng)計學(xué)是在收集、歸類、分析和解釋大量數(shù)據(jù)的過程中完成使命的。
1統(tǒng)計在藥物臨床試驗中的重要作用
在臨床試驗設(shè)計階段就要考慮統(tǒng)計原則,否則所獲得的試驗數(shù)據(jù)結(jié)果將非常糟糕。新藥的有效性和安全性需要按照藥品臨床試驗管理規(guī)范(GCP)的原則實施臨床試驗來加以確證[1]。GCP對臨床試驗統(tǒng)計學(xué)的要求包括四個方面:統(tǒng)計學(xué)設(shè)計、統(tǒng)計分析計劃、數(shù)據(jù)管理和處理以及臨床和統(tǒng)計學(xué)報告。統(tǒng)計人員要與臨床試驗其他專業(yè)人員密切合作,以確保在藥物臨床試驗中能恰當(dāng)?shù)貞?yīng)用統(tǒng)計原則。
2統(tǒng)計學(xué)與試驗設(shè)計
臨床試驗按其目的大體可分“驗證性(Confirmatory)”試驗和“探索性(Exploratory)”試驗。驗證性試驗是控制良好的試驗,總是預(yù)先定義與試驗?zāi)康闹苯佑嘘P(guān)的關(guān)鍵假設(shè),并且在試驗完成后對此進(jìn)行檢驗;驗證性試驗必須提供療效和安全性的可靠證據(jù)。新藥臨床試驗中大部分是驗證性試驗,驗證性試驗包括所有的Ⅲ期試驗、大多數(shù)Ⅳ期試驗以及一些晚期的Ⅱ期試驗。但一個臨床試驗常具有驗證性和探索性兩方面。
對于每一個支持上市申請的臨床試驗,所有關(guān)于設(shè)計、實施和統(tǒng)計分析的要點應(yīng)當(dāng)于試驗開始前在試驗方案中寫明。試驗方案中的統(tǒng)計學(xué)設(shè)計包括試驗設(shè)計、樣本量的確定和為避免偏差而采用的技術(shù)。試驗樣本量的確定有很多種計算方法,其中驗證性試驗大多都是建立在假設(shè)檢驗基礎(chǔ)上的研究設(shè)計,因此對其樣本量的計算主要基于檢驗假設(shè)、顯著性水平及把握度等。試驗中為避免偏差而采用的隨機(jī)化、對照原則技術(shù)。
3臨床試驗中統(tǒng)計學(xué)分析人群[2]
3.1PP人群(per-protocol)
一般定義為所有按方案要求完成相關(guān)觀察并符合下列條件者構(gòu)成PP人群:①依從性在80%~200%者;②試驗期間未服禁止藥物;③符合入選標(biāo)準(zhǔn)不具有任何一項排除指標(biāo);④完成全部計劃訪視且完成CRF規(guī)定填寫內(nèi)容。
3.2FAS人群(全分析集)
主要療效指標(biāo)的最終評價同時進(jìn)行FAS人群分析。FAS人群為根據(jù)ITT(intention-to-treat analysis,意向性分析)分析原則確定的理想受試者人群。所有經(jīng)隨機(jī)化入組,至少服用過一次研究藥物的人群,并至少有一次療效評估的人,都將計入ITT人群。主要療效指標(biāo)的缺失,將采用最后一次觀察結(jié)果轉(zhuǎn)結(jié)的方法,即LOCF(Last Observation Carry Forward,簡稱LOCF)法,使各組在終點時評價療效的受試者數(shù)與試驗開始時保持一致。
3.3安全性分析(Safety人群)
指所有經(jīng)隨機(jī)化入組,至少服用過一次研究藥物的人群,用于安全性評估。所有來自受試者的安全信息記錄都會予以評估,包括不良事件和實驗室檢查結(jié)果。
4臨床試驗中顯著性檢驗
臨床試驗?zāi)康氖桥袛嘣囼灲M的有效性時,首先要對試驗組與對照組的療效差異進(jìn)行顯著性檢驗。
4.1優(yōu)效性假設(shè)檢驗
當(dāng)對照采用的是安慰劑對照或空白對照時,臨床試驗的目的主要是確定試驗組的療效是否比對照組好,或者當(dāng)采用標(biāo)準(zhǔn)對照,研究者想了解試驗藥物療效是否優(yōu)于對照藥物,這時兩組療效差異的顯著性檢驗需用優(yōu)效性檢驗(傳統(tǒng)的假設(shè)檢驗)。通常優(yōu)效性試驗取的都是雙側(cè)0.05顯著水平。可通過雙側(cè)0.05顯著水平或雙側(cè)95%可信區(qū)間兩種方法來實現(xiàn),當(dāng)然優(yōu)效性試驗要求P<0.05或兩組療效(治療-對照)之差的95%可信區(qū)間的下限大于0。
a.建立檢驗假設(shè)
以T代表試驗組的療效,以S代表標(biāo)準(zhǔn)對照組的療效。
H0:μT=μS,即實驗組與對照組療效相同。
H1:μT≠μS,即實驗組與對照組療效不同。
b.計算統(tǒng)計量。
c.確定P值,做出結(jié)論。
4.2非劣效性假設(shè)檢驗
如果臨床試驗時對照組采用的是肯定有效的傳統(tǒng)藥物進(jìn)行治療(稱標(biāo)準(zhǔn)對照或陽性對照),試驗的目的是考察新的治療方法的療效是否不比“標(biāo)準(zhǔn)”治療方法差,以便確定是否能用新的治療方法替代傳統(tǒng)的治療方法,則兩組的療效比較要用非劣效性假設(shè)檢驗(non-inferiority test)。
a.確定非劣效性界值:非劣效性界值,用δ表示。當(dāng)新藥與標(biāo)準(zhǔn)藥物療效的差值在此范圍內(nèi)時,我們認(rèn)為新藥療效不比標(biāo)準(zhǔn)藥物差,否則,認(rèn)為新藥療效不如標(biāo)準(zhǔn)藥物。δ值根據(jù)專業(yè)知識由臨床專家來確定[3],一般把專業(yè)上或公認(rèn)有臨床實際意義的差值作為δ值。
b.建立檢驗假設(shè):以T代表試驗組的療效,以S代表標(biāo)準(zhǔn)對照組的療效。
H0:μT-μS≤-δ,即試驗組療效不如標(biāo)準(zhǔn)對照組。
H1:μT-μS>-δ,即試驗組的療效不比標(biāo)準(zhǔn)對照組差。
c.計算檢驗統(tǒng)計量。
4.3等效性假設(shè)檢驗
如果對照組采用的是標(biāo)準(zhǔn)對照,試驗的目的是考察新的治療方法的療效是否與“標(biāo)準(zhǔn)”治療方法相等,則兩組療效的比較要用等效性假設(shè)檢驗。
a.確定等效性界值:新的治療方法與標(biāo)準(zhǔn)治療方法的療效相比,最低不能低于多少以及最高不能超過多少才可認(rèn)為是“等效”,稱為等效性界值。
b.建立檢驗假設(shè):T代表試驗組的療效,S代表標(biāo)準(zhǔn)對照組的療效。
c.計算檢驗統(tǒng)計量。
4.4非劣效性假設(shè)檢驗與優(yōu)效假設(shè)檢驗的轉(zhuǎn)化[4](圖1)
從非劣效性試驗向優(yōu)效性試驗轉(zhuǎn)換是可行的,前提是:
a.試驗要按照非劣效性試驗的嚴(yán)格要求正確地設(shè)計和執(zhí)行。
b.提出優(yōu)效性的實際P值以獨立評價證據(jù)的力度。
c.最大限度地強(qiáng)調(diào)按照ITT原理分析。
圖1非劣效性轉(zhuǎn)換為優(yōu)效性
4.5優(yōu)效性試驗轉(zhuǎn)化為非劣效性試驗[4]
如果優(yōu)效性試驗未能檢測出治療組間顯著性差異,可以再證實非劣效。國外指導(dǎo)原則建議在所有優(yōu)效性試驗設(shè)計中,設(shè)計期間就在方案中事先指定非劣效性邊界。當(dāng)研究方案含有一個可接受的、前瞻性確定的非劣效性邊界-Δ時,下調(diào)目的在方法上不會有很大的問題。見圖2。一定要注意有些醫(yī)學(xué)領(lǐng)域內(nèi),與陽性對照相比的非劣效性不能作為唯一的或主要的療效證據(jù),還需要安慰劑對照的試驗。
圖2優(yōu)效性轉(zhuǎn)換為非劣效性
我國目前新藥研發(fā)情況是自主創(chuàng)新藥品較少,而仿制國外已上市藥品占多數(shù),對于國內(nèi)尚未上市的藥品,無論是創(chuàng)新藥還是仿制藥,如選安慰劑為對照則應(yīng)證實其優(yōu)效性,如選國內(nèi)已上市的同一治療領(lǐng)域的藥物作為陽性對照藥,則應(yīng)至少驗證其具有非劣效性。
5安全性分析
臨床試驗中需要常規(guī)地進(jìn)行實驗室檢查,一是作為基線測量,再是考察有無實驗室指標(biāo)上的療效和毒性。從安全性評價考慮,常規(guī)的實驗室數(shù)據(jù)綜合包括①根據(jù)一組參考值范圍制定實驗室指標(biāo)的等級;②構(gòu)建從基線等級到最嚴(yán)重等級或治療結(jié)束時等級的變化表;③對均數(shù)或均數(shù)百分?jǐn)?shù)變化進(jìn)行統(tǒng)計學(xué)檢驗;④繪制反映實驗室指標(biāo)變化的統(tǒng)計圖。對實驗室指標(biāo)在不同中心測量的結(jié)果,必須考慮各實驗室測量單位或參考值范圍不同的情形。
許多臨床試驗中更多是關(guān)心從正常變化為異常的情況。所以經(jīng)常將實驗室指標(biāo)分為正常、異常無臨床意義和異常有臨床意義。統(tǒng)計學(xué)人員缺少不良事件判斷的醫(yī)學(xué)知識,而醫(yī)生受過醫(yī)學(xué)專業(yè)訓(xùn)練 ,對安全性考慮更切合實際。因此統(tǒng)計學(xué)人員需要與醫(yī)療同事密切協(xié)作以便進(jìn)行臨床意義上安全性分析。
6統(tǒng)計學(xué)差異與臨床差異[5]
統(tǒng)計學(xué)差異是指該差別不大可能單純由偶然因素導(dǎo)致,臨床專業(yè)差異則指從專業(yè)角度判斷兩者差別有意義。二者概念上的區(qū)別在于前者與隨機(jī)性(概率)有關(guān),后者則主要與藥物的具體特性相關(guān)。若專業(yè)上與統(tǒng)計學(xué)上均顯著或均不顯著,作出的結(jié)論就很明確,沒有理解上的歧義。然而,臨床專業(yè)上與統(tǒng)計學(xué)上結(jié)論不一致的情形也不少見,試驗因素的變異度較大及樣本含量不足,可能是試驗結(jié)果不一致的原因。
[參考文獻(xiàn)]
[1] 國家食品藥品監(jiān)督管理局. 藥品臨床試驗管理規(guī)范[S]. 2003-8-6.
[2] 國家食品藥品監(jiān)督管理局. 化學(xué)藥物和生物制品臨床試驗生物統(tǒng)計學(xué)技術(shù)指導(dǎo)原則[S]. 2005-3.
[3] EMEA Guideline on the choice of the non-inferiority margin London[S]. 27 July 2005CPMP/EWP/2158/99.
[4] EMEA Points to consider on switching between superiority and non-inferiority London[S]. 27 July 2000 CPMP/EWP/482/99.
[5] 劉玉秀,洪立基. 新藥臨床研究設(shè)計與統(tǒng)計分析[M]. 南京:南京大學(xué)出版社,1999:14-19.
(收稿日期:2011-07-08)