張潔 任怡宣 潘麗萍 張宗德
在全球范圍內,結核病是導致死亡的十大原因之一,據估計每年新增的結核病患者超過1000萬例[1]。越來越多的新發及復發結核病患者對一線抗結核藥品利福平和異煙肼產生了耐藥性(即耐多藥結核病)[1]。在過去的幾十年中,分子生物學方法已經被廣泛應用于結核病的診斷和結核分枝桿菌(Mycobacteriumtuberculosis,MTB)的耐藥性分析。基因分型技術為許多低發病率國家的結核病分子流行病學研究提供了重要的幫助,有助于發現疫情[2]。隨著生物信息的發展,測序技術的日益成熟,且成本逐漸降低。以基因組DNA為基礎、計算機技術為輔助的全基因組測序技術已經廣泛應用于對MTB的研究中,并迅速從實驗室研究轉向臨床和公共衛生應用, 為解決MTB的傳播和耐藥問題提供了很大的幫助。
高收入且結核病低流行國家的結核病監測系統中,重要的一個環節是接觸者追蹤,針對的對象是接觸傳染性結核病的人群,以便確定應接受預防性治療的接觸者,并減少進一步的傳播[3]。但是流行病學調查耗費時間長,勞動強度大,患者之間通過短期或臨時接觸而產生的流行病學聯系不容易被發現。而分子流行病學整合了現有的流行病學數據和分子分型結果,在結核病傳播鏈的研究中起到了極其重要的作用。
在過去的20年里,分子分型方法極大地提高了大家對結核病流行病學的認識。目前有3種主要的基因分型方法:即IS6110限制性片段長度多態性(restrictionfragment length polymorphism,RFLP)分型法、間隔區寡核苷酸分型(Spoligotyping)和多位點數目可變串聯重復序列 (variable number of tandem repeats,VNTR)分型。這些常規的基因分型方法在評估同源性方面價值有限。全基因組測序(whole-genome sequencing,WGS)方法是利用DNA測序平臺重新構建生物體基因組的完整DNA序列。瑞士Stucki等[4]在一項全國性的研究中,對520例結核病患者分離出來的標本進行了標準分子分型(Spoligotyping和VNTR分型),鑒定出來的35個傳播簇中的18個被WGS證明大于12個單核苷酸多態性(singlenucleotide polymorphisms,SNPs),這表明常規的基因分型方法可能會高估MTB在瑞士這種發病率較低的國家的傳播[4]。而也有研究認為當使用常規基因分型工具時,外源性再感染而引起的結核病由于與第一次疾病發作間期出現的菌株基因型相似,可能會被錯誤地歸類為復發。這些錯誤分類低估了MTB在高發病率環境中的傳播[5]。由于不同的MTB菌株SNPs發生相同突變的可能性很小,因此,基于鑒定SNPs的WGS基因分型較其他分子分型方法具有更高的分辨率。
有研究認為,MTB最有可能起源于非洲,而在全球的傳播主要受人類活動的推動,即人類的探索、遷徙、貿易和戰爭等活動均可推動MTB在全球的傳播[6-7]。人感染的MTB具有高度的克隆性,根據SNP的差異和缺失可以將MTB復合群分為7個主要的適應人類的系統發育譜系,即第1譜系至第7譜系。而東亞地區占主導地位的是第2譜系,其中“北京家族”菌株是在全球傳播和流行最為廣泛的菌株之一[8]。WGS證實了東格陵蘭及加拿大魁北克省努納維克分離的MTB菌株大多來自第4譜系(歐美系)[9-10],越南的研究表明,長期潛伏性感染的MTB第1譜系以及最近引進傳播的“北京家族”和第4譜系菌株,導致了該地區結核病傳播的復雜性[11]。上海的結果研究表明,雖然我國結核病患者數多,但MTB的遺傳多樣性卻不大,我國MTB 99.4%屬于第2譜系和第4譜系的3個子譜系[12]。
結核病患者發病主要有兩種途徑,一種是既往感染過,之后經過較長時間的潛伏而發病,稱為內源性復燃[13];另一種為近期傳播導致的結核病。MTB產生耐藥可能是兩種機制造成的:一是治療不足引發的獲得性耐藥;二是感染耐藥MTB(原發耐藥)。WGS可以通過比較不同患者分離出來的菌株基因型是否相同以及同一患者前后兩次發病時分離出來的菌株基因型是否相同從而判斷結核病發病原因及耐藥原因。而區分患者的發病模式對結核病控制策略的制定具有非常重要的意義,如果一個地區由于近期傳播導致的結核病患者比例較高,說明結核病正在傳播,應該將主動迅速發現傳染源、切斷傳播途徑作為防治工作的重點;而如果大部分患者是由于內源性復燃引起的,證明結核病的傳播發生在過去,應該將對患者進行規范化治療和管理作為防治工作的重心,可以對既往感染者中的高危人群進行篩查和采取預防性干預措施[13]。
結核病高負擔國家的結核病暴發調查往往僅限于調查家庭成員和其他密切接觸者,而在結核病發病率較低的國家,結核病控制的目是制止結核病的傳播,因此,除了結核病的早期診斷和治療外,調查結核病暴發情況也是非常重要的[14]。越來越多的研究表明WGS在MTB疫情控制方面發揮著重要的作用[15]。在一項對倫敦廣泛耐藥結核病(XDR-TB)暴發的調查中,采用WGS后證實了患者之間的關聯性,并指導了對早期患者的治療[16]。使用WGS進行全國疫情調查被越來越多的國家使用,WGS也被應用于國際跨境疫情的調查[17]。
在缺乏廣泛的流行病學數據的情況下,基于WGS的系統發育樹可以用來識別可能的傳染源、超級傳播者和確定傳播方向。上海的一項研究表明,大約1/3的耐多藥結核病患者歸因于最近的傳播,與傳統的基因分型方法相比,WGS目前在區分臨床MTB分離株基因型方面具有許多優勢,并且可以有效地研究MTB分離株的傳播動力學。WGS可提供更明確的證據,證明耐藥突變是沿傳輸鏈出現和固定的[18]。
據WHO報道,2017年全世界有55.8萬例結核病患者對一線抗結核藥品利福平耐藥,其中82%的患者為耐多藥結核病患者;而這些耐多藥結核病患者中,大約有8.5%為XDR-TB[1]。基于培養的傳統技術方法仍然是耐藥結核病診斷和藥物敏感性試驗(簡稱“藥敏試驗”)的參考標準,但是這些方法耗時長,并且對實驗室的生物安全要求較高。近幾年,在全球以GeneXpert MTB/RIF技術為代表的快速分子學方法檢測MTB及利福平耐藥已經普及。WGS技術已經鑒定出與MTB耐藥相關的許多突變,其中一些突變與適應性相關,而另一些突變與額外的代償性突變有關,這些突變可能增加適應性并能進行傳播[19]。
WGS完整地描述了MTB耐藥株的基因組特征,填補了我們對經典抗結核藥品和新的抗結核藥品是如何起作用的認識上的空白,并確定了使MTB能夠逃避這些藥物影響的特定突變。一些耐藥基因的存在是眾所周知的,例如,rpoB和rpoC基因突變導致利福平耐藥、KatG和inhA基因的突變導致異煙肼耐藥,dfrA-thyA雙缺失與對氨基水楊酸耐藥性相關[20-21]。WGS確認外排泵導致的藥物外流是MTB對氯法齊明和貝達喹啉的耐藥機制,這一方法仍然是鑒定正在開發的抗結核藥物的作用機制的主要途徑[22]。WGS還揭示了藥物聯合化療如何能夠有效地防止結核病治療期間出現耐藥。Trauner等[23]使用WGS 證明了多種活性藥物的聯合作用下,能阻止暫時性突變體在菌株種群內的固定而避免成為耐藥優勢菌;使用的藥物越少,耐藥性就越有可能產生并固定下來。
一些將基因組數據和其他功能數據結合起來的SNP數據庫已經建立,MTB耐藥株相關基因突變的一些開拓性數據庫也在不斷完善[24],基于軟件和網絡的工具,如MTB復合群綜合分析服務器(the comprehensive analysis server for theMycobacteriumtuberculosiscomplex,CASTB)[25],能夠從WGS數據網絡中推斷菌株的耐藥性。有研究比較了這些工具在預測耐藥性方面的敏感度和特異度,發現上述工具對一線抗結核藥品有很好的效果;但對于二線藥物則不太理想[26-27]。數據集和數據庫的創建需要實施“大數據”分析方法(例如機器學習方法)[28],非參數機器學習方法,如分類樹(CTs)和梯度提升樹(GBTs)以全基因組關聯(GWAS)為基礎,從復雜數據集中提取信息,通過精密的計算和分析,在預測耐藥性和發現新的基因突變方面將發揮重要作用。
臨床上從同一患者體內分離出來的MTB樣本中同時存在敏感菌株和耐藥菌株的情況越來越引起重視,這種由于敏感和耐藥菌株共感染或敏感菌株部分亞群通過微進化而發生的耐藥突變稱之為異質性耐藥[29]。結核感染中的微進化現象比較復雜,宿主體內多個MTB亞克隆同時存在和發生微進化導致的異質性耐藥,必將影響患者的治療方案和監測,并使得推斷傳播鏈的工作復雜化[30-31]。WGS不僅可以區分患者是否為混合感染,還可以用來掌握MTB的耐藥性形成過程,從而對MTB的變異程度進行更詳盡的分析, 還能夠在傳輸鏈中觀察到變異性, 從而提高我們對MTB感染動力學的理解[32]。及時發現異質性耐藥現象,有利于及時調整治療方案并進行有效的臨床治療。
雖然WGS技術在MTB的傳播檢測中敏感度較高,但是用WGS構建傳播網絡的細節是很困難的。傳播網映射高度依賴于采樣范圍、對疫情的全面抽樣,以及宿主內環境的多樣性。不同患者的菌株基因成簇,但卻沒有其他任何直接的流行病學聯系,說明這種傳播很大程度上是在社區環境中的偶然接觸引起的[33]。傳播網絡的系統發育重建特別具有挑戰性,因為菌株之間關系非常密切,但是MTB的進化速度很慢[24]。
WGS的操作流程還需統一化、標準化。工作流程的所有步驟,從DNA提取到測序、數據分析和報告,都應該標準化,并有良好的文檔記錄,還應該建立一個外部質量評估方案。2016年,美國食品和藥物管理局發布了基于測序的傳染病診斷指南草案,WHO和歐洲疾病預防控制中心等機構正在采取措施,實現MTB WGS的國際標準化[34-35]。
WGS用于MTB的檢測結果及數據共享目前仍沒有國際標準。報告應具有足夠的靈活性,以解決最終用戶對基因組數據解釋的差異,并允許針對特定地區的治療準則和格式要求進行定制。報告單的設計要避免使用縮寫,重要信息使用加底色、粗體和其他方式標記,必要時納入簡要說明解釋關鍵結果[36-37]。
WGS起源于一項基礎科研技術,現在慢慢成為現代臨床微生物學實驗室的一部分,有望快速、更好地防控和診斷結核病,并對結核病暴發疫情進行詳細、實時的流行病學研究。