段鴻飛 初乃惠
目前,結核病仍是人類健康的重大威脅,有效地遏制疫情迫切需要能縮短療程和有效解決耐藥結核病問題的新藥和新方案。由于結核分枝桿菌在體內存在著多種不同的生長狀態,抗結核藥品治療既需要具備快速殺死快生長細菌的殺菌能力,也需要消滅緩慢繁殖細菌的滅菌能力。目前的抗結核藥品療效評價方法還缺乏能準確預測殺菌效果和滅菌效果的方法,迫切需要優化抗結核藥品療效評價指標[1-4]。
自20世紀英國醫學研究會發起的東非結核病短程化療研究后,包括隨訪期的“治愈且無復發”成為公認的抗結核藥品療效評價終點指標,這意味著除標準抗結核藥品療程外,新藥研究還要經歷≥1年的隨訪期評價復發率,進一步增加了新藥研究的成本。因此,研究者探索能在早期反映抗結核藥品療效的替代指標,以期能盡早反映療效。一個好的替代指標應該與公認的療效評價指標有很好的相關性,而且具有可重復性和可行性。如果一個替代指標敏感度低,則可能得出治療無效的結論,導致一個原本有效的藥品或方案被棄用,而替代指標特異度低則會高估治療效果,使一個原本無效的藥品進入后期的臨床試驗,造成資源浪費。
目前在抗結核藥品的臨床研究中,以早期殺菌活性 (early bactericidal activity,EBA)作為Ⅱa期療效標準,以治療后痰培養陰轉作為Ⅱb期療效評價標準,而以治愈后無復發作為Ⅲ期療效標準,這些標準的制定對抗結核藥品的研發起到巨大推動作用,但是,也存在不足之處。
(一)Ⅱa期的療效評價指標
EBA是美國食品藥品監督管理局(FDA)批準的抗結核藥品Ⅱa期臨床試驗療效評價標準。最早由Jindani等[5]在20世紀70年代提出,他們研究了26組不同的藥品組合,每種藥品組合納入4例患者。搜集患者治療前和治療過程中12 h過夜痰,用每天每毫升log菌落形成單位(CFU) log值的下降來代表EBA,其單位為 log 10 CFU·ml-1·d-1,反映抗結核藥品對細菌的殺菌作用,一般觀察0~14 d細菌量的下降程度。EBA0~2表示使用藥品前2 d的細菌量下降程度,異煙肼的EBA0~2最大,EBA0~2為1意味著在用藥2 d痰細菌量下降90%。
但是,EBA也存在缺陷。如吡嗪酰胺EBA很弱,如果使用EBA為療效替代指標評價吡嗪酰胺的抗結核活性,可能吡嗪酰胺會被棄用,而且,EBA只能反映早期殺菌活性,而不能反映滅菌活性。在TMC207(即Bedaquiline,貝達喹啉) Ⅱa期臨床試驗,使用TMC207的患者細菌量開始下降的時間晚于使用異煙肼和利福平,7 d內細菌量下降的程度也小于使用異煙肼和利福平的患者,導致TMC207在Ⅱa期臨床試驗結果欠佳,幾乎被放棄[6]。由于痰標本采集方法和痰標本中唾液的比例不同,同一藥品在不同患者中EBA也可能有差別,解釋EBA結果時也需要注意這種方法上的缺陷。
(二)Ⅱb期的療效評價指標
分枝桿菌培養長期被用于抗結核藥品的Ⅱb療效評價。美國FDA也認可痰培養陰轉作為抗結核藥品療效評價的可靠性,盡管這個療效評價指標并不完美。美國FDA指出“痰培養陰轉在較大程度上可以預測治愈”,據此,在完成Ⅱb期臨床試驗后,貝達喹啉2012年被美國FDA批準上市,德拉馬尼在2013年被歐洲藥品管理局批準上市。
1.第2個月的痰分枝桿菌培養陰轉預測治療敏感肺結核的預后。20世紀90年代,Mitchison[7]最早提出在抗結核藥品臨床試驗中以第2個月痰分枝桿菌培養陰轉作為療效評價的指標;以后在相當長一段時期,治療第2個月痰分枝桿菌培養陰轉成為評價抗結核藥品療效的重要標準。但是,患者痰培養陰轉也受患者肺結核的病變范圍、是否并發HIV感染等因素影響,存在痰培養陰轉慢但最終又臨床治愈的患者。另一方面,第2個月痰培養陰轉并不能預測復發。以REMoxTB(rapid evaluation of moxifloxacin in the treatment of sputum smear positive tuberculosis)為代表的縮短治療敏感肺結核療程的臨床研究顯示,第2個月末痰分枝桿菌培養陰轉并不能很好地預測復發。盡管含莫西沙星的短療程治療方案在治療第2個月后有更高的痰分枝桿菌培養陰轉率,但由于復發率較高,非劣性分析并不支持其替代標準的6個月治療方案[8]。一項匯集28項初治肺結核治療的Meta分析顯示:以第2個月分枝桿菌培養陰轉預測復發的敏感度和特異度分別為40%(95%CI:25%~56%)和85%(95%CI:77%~91%)[9],作者指出,該研究所納入的研究結果高度相似,提示以第2個月分枝桿菌培養陰轉預測復發的準確性欠佳,還需要有更好的替代指標來預測抗結核藥品治療的預后。
2.第6個月的痰分枝桿菌培養陰轉預測治療耐多藥結核病(MDR-TB)的預后。由于MDR-TB缺乏有效的抗結核藥品,痰分枝桿菌培養陰轉速度更慢,顯然以第2個月的痰培養陰轉作為療效評價指標其敏感度偏低。研究者對不同時間點痰培養陰轉作為預測療效的準確性進行了研究。Kurbatova等[10]對1712例MDR-TB的療效研究顯示,以第2個月痰培養陰轉預測MDR-TB治愈率的敏感度僅27.3%(95%CI:16.6%~41.4%),特異度為89.8%(95%CI:82.3%~94.4%),但以第6個月痰培養陰轉預測MDR-TB治愈率的敏感度可達91.8%(95%CI:85.9%~95.4%),特異度為57.8%(95%CI:42.5%~71.6%)。因此,對MDR-TB患者,選擇相對較晚期的分枝桿菌培養結果作為療效評價標準準確性更高。但是,應該注意到以6個月痰培養陰轉作為療效評價指標不利于在較早期預測預后。目前已完成的貝達喹啉、德拉馬尼、利奈唑胺的Ⅱb臨床試驗研究終點為治療后2~6個月不等[11-13]。
以固體培養基培養陰轉還是液體培養基培養陰轉作為研究終點,是預測療效的另一個重要問題。液體培養基自動化程度高,能檢測出少量的細菌。在德拉馬尼的Ⅱb期臨床試驗,治療8周后痰固體培養基培養陰轉率為53.8%(德拉馬尼 200 mg/d)和65.2%(德拉馬尼 400 mg/d),明顯高于自動化液體培養基培養陰轉率(德拉馬尼 200 mg/d組為45.4%,德拉馬尼 400 mg/d組為 41.9%)[12]。在目前已發表的Ⅱb期臨床試驗,利奈唑胺的研究以固體培養基培養陰轉作為主要研究終點,德拉馬尼和貝達喹啉均以液體培養基培養陰轉作為主要研究終點[11-13]。
(三)Ⅲ期臨床試驗療效評價指標
世界上第一個隨機對照臨床試驗研究鏈霉素治療結核病的效果,研究終點為特定時間點患者的死亡率,在對氨基水楊酸(PAS)問世后研究終點調整為患者癥狀減輕;隨著利福平應用于臨床,患者的治愈率大大提高,從東非臨床試驗結束后,臨床試驗的研究終點轉變為隨訪期無復發的治愈率,即排除治療失敗和隨訪期復發后的患者治愈率。新發表的Nix-TB(new investigational drugs for XDR-TB)研究,則以治療結束6個月后不利結局為主要終點,即治療失敗和復發等情況,可以認為是另一種方式研究無復發的治愈率[14]。
療效評價指標不利結局包括治療失敗和復發。對于治療失敗WHO有明確的定義,即在療程結束時患者痰菌仍未陰轉,往往與治療方案不合理、患者依從性不佳及患者的個體差異相關;復發患者應區分內源性復發和外源性再感染,臨床試驗如果不加區分內源性復發和外源性再感染會低估抗結核藥品治療的效果。一般認為,內源性復發是由于未能徹底清除持留菌;持留菌可能位于壞死區,其代謝不活躍或對抗結核藥品不敏感。在結核病高負擔國家,結核病再感染相對常見。南非一項研究回顧性分析了1996—2008年間開普敦市復發的結核病患者,對130例獲得匹配DNA的患者進行分析,發現其中64例(49%)屬于內源性復發,66例(51%)屬于再感染,而且在第一年中有20.5%(9/44))再次感染[15]。中國高謙團隊報道,在復發肺結核患者中,再感染者占59.3%~80%[16-17]。因此,尤其是在結核病高負擔國家,抗結核藥品Ⅲ期臨床試驗療效評價應排除療程結束隨訪過程中外源性再感染的患者。在STREAM(standard treatment regimen of anti-tuberculosis drugs for patients with MDR-TB)的研究中,以隨機化分組132周后的無復發治愈率作為療效評價標準,而且主要分析[即修改后的意向性分析(modified intention-to-treat)]排除了療程結束后隨訪過程中再感染的患者[18]。
研究者也一直致力于優化抗結核藥品的療效評價標準,尤其是近年來,隨著影像學技術和分子生物學技術的進步,對新技術用于預測抗結核藥品療效進行了大量有價值的探索。
1.培養陰轉速度: 痰培養陰轉速度可以反映殺菌能力,也曾作為抗結核藥品臨床試驗的療效評價標準。在REMoxTB 的研究中發現,與對照組相比,含莫西沙星方案組痰培養陰轉速度更快,但是各組患者在治療2個月痰培養陰轉率差異無統計學意義。如果僅從2個月痰培養陰轉率分析,含莫西沙星組的結果無疑是令人失望的,似乎使用莫西沙星并不像動物試驗和早期殺菌活性研究顯示的那么有效,然而,莫西沙星可早期更快地殺滅細菌,有可能成為縮短療程方案的一個重要組成藥品。但是,部分需要更長時間才能痰培養陰轉的患者可能并不能從使用莫西沙星中獲益[8]。在貝達喹啉的臨床試驗中,由于貝達喹啉的Ⅱa期臨床試驗未能發現其良好的EBA,所以Ⅱb期的臨床試驗分為2個時期;在第1期的臨床試驗,以痰培養陰轉時間作為主要療效觀察指標,發現含貝達喹啉的試驗組較不含貝達喹啉的對照組具有更快的痰菌陰轉速度,在此基礎上才開展了第2期的臨床試驗[19]。在德拉馬尼獲批上市后的臨床試驗,比較了試驗組和對照組痰分枝桿菌陰轉速度的差別,發現兩組之間差異無統計學意義。可能由于該研究背景方案中抗結核藥品的作用較強,增加德拉馬尼并不能明顯縮短培養陰轉的時間[20]。
2.CT 和正電子發射體層攝影(positron emission tomography,PET)-CT病灶定量分析:在過去的幾十年里,研究者一直認為早期影像學改變可以預測肺結核治療效果。研究發現,并發肺部空洞和病變廣泛往往與預后不良相關。有報道在抗結核藥品治療過程中治療有效往往伴隨樹芽征和胸腔積液的消失,以及纖維病灶出現等變化。但是,基于肺癌等疾病的研究顯示,對于患者影像學特點的描述,相同研究者不同時間和不同研究者相同時間的描述存在差異。Chen等[21]使用軟件對病灶硬病變(即HU<-100的病灶)容積進行定量分析,以硬病變容積變化作為療效評價標準,發現2個月的CT改變(敏感度為79%,特異度為75%)和6個月的CT改變(敏感度為96%,特異度為75%)較2個月時培養陰轉(固體培養基敏感度為79%,特異度為50%;液體培養基敏感度為58%,特異度為50%)更能準確預測最終治療效果,但是由于該研究治愈的患者為24例,治療失敗的患者僅4例,還需要更大的樣本來評價其效果。
胸部CT掃描可以提供基于不同CT值(HU值)的病變結構性數據,PET-CT除了結構性數據外,還可以提供哺乳動物炎癥細胞(結核病主要是巨噬細胞和中性粒細胞)攝取2-脫氧-2-氟-D-葡萄糖(FDG)的功能性數據,作為治療緩解的早期指標和治療結束后的復發指標。在對獼猴的相關研究中,PET-CT改變與結核活動和治療好轉相關[22-24]。多數耐藥結核病患者病程較長,肺部出現相對陳舊的病灶,基于CT值的分析病灶在抗結核藥品治療后變化不大,但經過有效的治療后PET檢測會較早出現變化。Chen等[21]分析了甲硝唑治療耐多藥肺結核隨機臨床試驗的PET-CT檢測數據,包括治療前和治療第2個月PET-CT檢測數據,治療前、治療第2和6個月的高分辨率CT檢測數據,將病灶變化定量分析后與治療30個月(即治療結束后6個月)時的最終療效對比。發現2個月的PET改變(敏感度為58%,特異度為75%)和6個月時CT改變(敏感度為96%,特異度為75%)較2個月痰培養陰轉(固體培養基敏感度為79%,特異度為50%;液體培養基敏感度為79%,特異度為50%)更能預測最終療效,但是差異沒有統計學意義。作者也指出,考慮到在治療2個月PET-CT和固體培養基痰培養陰轉敏感度的差異,以他們研究的樣本量,檢驗效能只有32%,而如果治愈的患者例數增加到60例,則相同結果的檢驗效能可以達到90%。PET-CT作為臨床試驗中的療效替代終點還需要大樣本隊列研究予以驗證。
3.GeneXpert MTB/RIF(簡稱“GeneXpert”)的循環閾值:培養進行療效評價需要時間長達6周,GeneXpert作為一種可以快速進行療效評價的方法也進入研究者視線。該檢測基于聚合酶鏈反應,同時診斷標本是否存在結核分枝桿菌DNA和利福平耐藥基因,可以在2 h內直接獲得檢測結果,并記錄獲得陽性所需的循環閾值。早在GeneXpert用于結核病診斷時,有研究者就報道GeneXpert的循環閾值與細菌量相關。Friedrich等[25]研究顯示, GeneXpert檢測結果與痰涂片和培養結果相關,在治療期間痰GeneXpert檢測陰轉較痰涂片和培養結果下降更緩慢。以涂片結合培養的檢測結果為金標準, GeneXpert檢測預測療效的敏感度高達 97.0%(95%CI:95.8%~97.9%),但特異度只有48.6%(95%CI:45.0%~52.2%),主要由于無法區分活菌和死菌[26]。
在南非開普敦,有108例敏感肺結核患者參加的研究中,在6個月治療期間采集痰標本后,使用液體培養基培養,并采用GeneXpert檢測,記錄GeneXpert檢測循環閾值[27]。與Friedrich等[26]研究類似,GeneXpert檢測多次陰性(GeneXpert 循環閾值≥30)與相同時間點的分枝桿菌生長指示管(Mycobacteria Growth Indicator Tube,MGIT)培養陰性相關。以培養為金標準,第24周GeneXpert檢測循環閾值為30時預測治愈的敏感度和特異度分別為89%和88%,優于第8周MGIT培養陰性(敏感度為61%,特異度為50%)。這些結果提示,稍后期的GeneXpert檢測循環閾值可能比較早期的分枝桿菌培養,能夠更有效地預測療效。與培養相比, GeneXpert的主要優勢在于只需2 h即可獲得結果,而培養則需要6周。因此,GeneXpert檢測的循環閾值可能有一定應用價值。
但是,使用GeneXpert不能區分死菌和活菌,對療效判定造成一定不利影響。Malherbe等[28]在南非進行的研究對一組敏感肺結核療程結束后進行了1年的隨訪,發現在治療6個月后,8例治療失敗的患者7例GeneXpert檢測陽性,12例復發的患者6例陽性,即便治愈的76例患者仍有16例GeneXpert檢測陽性,意味著GeneXpert預測治療失敗或復發存在一定局限性。
目前的抗結核藥品療效評價方法有待優化,尤其是目前的Ⅱ期臨床試驗不能很好地預測治療失敗和復發。主要原因可能是EBA和痰培養陰轉等方法只能檢測易于咳出體外病變處的細菌,而不能檢測肉芽腫、結節和空洞壁的細菌,而清除這樣的細菌有賴于治療方案有良好的藥代動力學特性。未來的臨床試驗可能通過病灶定量分析和細胞因子的變化,結合傳統的療效評價指標,提供新的抗結核藥品療效評價方法。