朱向星,文健聰,林子盛,陳彩悅,吳耀冰,林曉微,羅靖維,鐘 斐,田壯壯,龔道元,翁閃凡(通信作者)
(佛山科學技術學院醫學院醫學檢驗系 廣東 佛山 528000)
CRISPR 基因編輯技術是過去十多年來全球生物科技領域的重大突破。1987 年,日本科學家石野良純在研究堿性磷酸酶同工酶相互轉化機理時,意外發現了5 個具有高度同源性的間隔重復序列[1]。這一序列的主要結構特征是:重復序列與非重復序列交替排列,并且二者大小在21 ~37 bp 不等。進一步研究發現重復序列普遍存在于細菌和古細菌基因組中[2],這種間隔重復序列在2002 年被統一命名為“成簇的規律間隔的短回文重復序列”(Clustered regularly interspaced short palindromic repeats, CRISPR)。通過比對不同原核生物CRISPR 序列兩側的基因,發現了4 種具有同源性的CRISPR 相關蛋白(CRISPR-associated protein, Cas)編碼基因。2005 年,發現CRISPR 序列中的間隔序列與噬菌體和接合質粒內的序列具有相似性[3-4]。后續研究表明CRISPR 序列及Cas基因與細菌抵抗噬菌體入侵有關,并且發現CRISPR/Cas系統能夠限制細菌的水平基因轉移[5-6]。2012 年,CRISPR/Cas 系統最終被闡釋為一種在細菌和古細菌中抵抗噬菌體和質粒入侵的適應性免疫系統[7]。
經過近幾年的研究,大多數CRISPR/Cas 系統已經被明確,利用不同類型系統的生物學特征開發出了許多CRISPR 工具。基于CRISPR/Cas 原理的新型核酸檢測技術在傳染性病原微生物核酸快速檢測中具有重要。結合快速核酸提取技術、等溫擴增技術等體外診斷技術,使得CRISPR/Cas 系統在病原微生物核酸快速檢測領域有了更加廣泛的應用[8]。
研究表明,由于CRISPR 系統進化迅速,因而其分類體系異常復雜。為了更好地展示CRISPR 分類面貌,科學界設計了一種特殊的分類方法,該方法多方面考慮了CRISPR 系統的亞型Cas 基因特征、多個同源Cas 蛋白之間的序列相似度、最保守的Cas1 蛋白的系統發育、CRISPR/Cas 基因座中基因的結構以及CRISPR 序列自身的結構[9-10]。這些標準的綜合應用使得CRISPR 系統被劃分為2 個不同的大類別,進一步細分為6 種類型和48 個亞型[11]。第一大類別約占已鑒定的CRISPR 系統約90%,最常見于細菌和古細菌,包括類型Ⅰ、Ⅲ、Ⅳ,共22 個亞型。這3 個類型的共同特點是具有異聚體多蛋白效應復合物。第二大類別約占已鑒定CRISPR 系統約10%,幾乎只存在于細菌中,以具有單個多結構域效應蛋白為特征,包括類型Ⅱ、Ⅴ、Ⅵ,共26 個亞型[12]。
由于第2 大類別效應器復合體具有相對更簡單的結構,使得其能夠被開發成核酸檢測技術[13]。應用最為廣泛的Ⅱ型系統即CRISPR/Cas9 系統被研究開發成各種工具。Cas9 效應蛋白具有HNH 和RuvC 兩種核酸酶結構域,HNH 活性位點負責切割與CRISPR RNA(crRNA)結合的(+)鏈上,RuvC 活性位點則切割另一條鏈,造成靶序列發生雙鏈斷裂(double-strand break,DSB)[14-15]。CRISPR/Cas9 系統中存在一個額外的小非編碼RNA,稱為反式激活核糖核酸(trans-activating crRNA,tracrRNA),與crRNA 上的重復序列互補,形成成熟的crRNA[16]。成熟的crRNA 指導Cas9 蛋白切割含有20 個互補核苷酸(nt)和相鄰PAM 的靶序列[17]。屬于Ⅴ型系統的Cas12 蛋白只包含一個RuvC 樣核酸酶結構域,不存在tracrRNA,是由單個crRNA 引導的核酸內切酶[18]。屬于Ⅵ型系統中的Cas13 蛋白具有兩個HEPN 結構域[19],同樣也是利用crRNA 指導實現干擾靶向目標序列,同時也具有靶識別效應觸發的非特異性核糖核酸酶活性的特性[20]。以上這些生物學特性很好地被應用到病毒核酸體外診斷技術上[21]。
CRISPR/Cas 免疫反應包括適應、表達和干擾3 個主要階段[22]。在適應階段,Cas 蛋白復合物在識別出一個獨特的短基序(Protospacer-adjacent motif, PAM)后,與靶DNA 結合并切割出靶DNA 的一部分,即原間隔序列[22]。然后原間隔片段插入CRISPR 陣列中,使成為間隔序列的其中一員。適應階段由Cas1 和Cas2 蛋白的復合物介導,是已知的CRISPR-Cas 系統所共有的,有時還會涉及額外的Cas 蛋白,例如幾個亞型中的Cas4 核酸酶、Ⅱ-A 亞型中的Csn2 蛋白和許多Ⅲ型系統中的逆轉錄酶[23]。
在表達階段,CRISPR 陣列大多情況下被轉錄為單個轉錄物——pre-crRNA,然后pre-crRNA 再被加工成為成熟的crRNA,每個轉錄物都包含間隔序列和部分側翼重復序列[22]。在不同的CRISPR/Cas 衍生體中,pre-crRNA加工由Cas 蛋白復合物的不同亞基、單結構域、多結構域Cas 蛋白或非Cas 的宿主核糖核酸酶(RNases)介導。在第一大類CRISPR/Cas 系統中,根據類型和亞型有不同的組合,效應模塊由多種Cas 蛋白組成,已知有Cas3、Cas5、Cas6、Cas7、Cas8、Cas10 和Cas11。相比之下,在第二大類CRISPR/Cas 系統中,通過單一的大蛋白質Cas9、Cas12 或Cas13 中的功能結構域發揮作用[23]。在干擾階段,成熟crRNA 識別噬菌體或質粒入侵基因組中的原間隔區,募集Cas 核酸酶或多種核酸酶切割外源基因而使其沉默[23-24]。
寨卡病毒是一種節肢動物傳播的RNA 病毒,其引發的寨卡熱的臨床表現并無特異性,易誤診為其他傳染病,例如登革熱等蟲媒病毒引起的傳染病[25]。傳統診斷依賴于病毒分離或ZIKV 特異性RNA 的檢測。由于黃病毒屬成員之間的交叉反應使血清學診斷變得復雜起來,因此開發一種更加快速高效、靈敏、重復性好的新型檢測方法很有必要[26]。2016 年Collins 團隊開發了一種用于檢測寨卡病毒的便攜式低成本診斷平臺,靈敏度達到fM 水平[27]。Collins 團隊利用生物分子傳感器和基于CRISPR/Cas9 的診斷平臺,允許在實驗室外快速、特異和低成本地檢測寨卡病毒。使用依賴核酸序列的擴增技術將提取的病毒RNA 進行擴增,利用設計好的Cas9-sgRNA 復合體特異性結合病毒RNA 的原理,結合凍干紙基傳感器,寨卡病毒RNA 檢測便可通過紙基的顏色轉變判斷。2017 年Zhang 實驗室將等溫擴增技術和CRISPR/Cas 系統相結合,建立了全新的核酸檢測技術——SHERLOCK(Specific High-sensitivity Enzymatic Reporter unLOCKing)[28]。該研究通過重組聚合酶擴增(Recombinase Polymerase Amplification, RPA)技術進行核酸預擴增,再通過T7 RNA 聚合酶轉錄以得到大量RNA拷貝,而后用Cas13-靶特異性crRNA 復合體識別擴增產物,激發Cas13 非特異性核酸內切酶活性,連接淬滅基團和熒光報告基團的雙鏈DNA 被切割,從而產生熒光信號。一年后,該團隊進一步開發了新版本SHERLOCKv2,相比第一代技術顯著降低了反應體系引物濃度,并增加多種熒光信號同時可檢測多個靶序列,對于寨卡病毒檢測限低至2aM(2×10-18mol/L)[29]。同年該團隊繼續推進SHERLOCK 在病毒快速檢測領域的應用,采取患者的尿液或唾液經HUDSON(Heating Unextracted Diagnostic Samples to Obliterate Nucleases)處理,無需提取步驟即可在復雜現環境下部署快速檢測,達到2 h 內從患者樣本中直接進行無儀器寨卡病毒檢測的目的,進一步設計還可以區分區域特異性毒株[30]。
宮頸癌是由人乳頭瘤病毒(Human papilloma virus,HPV)感染所引起的一種可傳染性癌癥[31]。大部分人感染HPV 是無臨床癥狀的并且會被免疫系統所清除,但是感染高風險人乳頭瘤病毒(尤其是16 型)會導致宮頸癌、外陰癌和口咽癌等各種上皮癌癥。HPV 檢測對于低級別細胞學分診的二級預防和治療后治愈的檢測具有良好的臨床價值[32]。2018 年東南大學王進科團隊開發了一種基于Cas9 核酸酶檢測和分型的方法,被命名為CRISPR 分型PCR(CRISPR-typing PCR, ctPCR)[33]。該技術可以簡單、快速、特異、靈敏地檢測和分型目標基因。該技術主要步驟如下:使用一對通用引物對目標DNA 進行擴增;Cas9/sgRNA 復合體特異性切割擴增產物;切割產物加上A 加尾和T 接頭;而后通過一對通用特異性引物擴增處理后的DNA;對處理后的產物進行電泳,從而判斷是否感染人乳頭瘤病毒。在該方法中,進行第一次PCR以確定檢測到的DNA 樣本是否包含目標DNA,而執行第二次PCR 則可以區分檢測到的DNA 樣本中存在哪些病毒亞型。該研究提供了一種新的基于CRISPR/Cas9 系統的DNA 檢測和分型方法。
不久后,王進科團隊又開發了ctPCR2.0 版本,即Cas9/sgRNAs 相關反向PCR(Cas9/sgRNAs-associated reverse PCR, CARP)[34]。該技術主要步驟如下:靶DNA首先在含有兩種特異性sgRNA 的復合物中被Cas9 核酸酶切割。用T4 DNA 連接酶連接Cas9 切割的靶DNA,最后用PCR 擴增。由于擴增所選的是一對反向引物,方向相反導致無法擴增靶DNA。然而,一旦靶基因被Cas9/sgRNA 復合體切割,連接后形成分子間相接的線性或分子內環形DNA,反向引物就會變成正常引物,這樣靶基因就可以通過PCR 擴增。為了進一步簡化流程,該團隊很快又開發了ctPCR3.0 版本,這項技術只需一個步驟就能檢測到目標DNA:定量聚合酶鏈反應(qPCR)擴增Cas9/sgRNA 復合體切割的DNA 樣本。在整個檢測流程中無需打開檢測管,就可以像傳統的qPCR 檢測一樣檢測目的基因。該技術同樣得到了人乳頭瘤病毒檢測分型實驗充分驗證[35]。2018 年,諾獎得主Doudna JA 的實驗室創立了一種DNA 核酸內切酶靶向CRISPR 的反式報告方法(DNA Endonuclease Targeted CRISPR TransReporter,DETECTR)[36]。Cas12a 蛋白是RNA 引導的DNA 靶向酶。當RNA 引導Cas12a 與DNA 結合時,就會觸發Cas12a 切割單鏈DNA(ssDNA)活性,能夠完全降解線性和環狀ssDNA 分子。為了提高檢測靈敏度,進一步結合了重組聚合酶擴增(RPA)技術。通過熒光基團-ssDNA-淬滅基團復合物在反應過程中釋放的熒光信號來達到檢測目的。在一小時內,DETECTR 準確地識別了25 個患者樣本中是否存在HPV16 和HPV18,PCR 的強度和DETECTR 熒光信號之間具有良好的相關性,并且相比ctPCR 技術在時間上有了很大的提升。
2020 年,賓夕法尼亞州立大學Guan 團隊開發了一種利用CRISPR/Cas12a 輔助納米孔序列特異性地識別HIV-1 基因的技術[37]。固態納米孔傳感器由于其對單分子的高靈敏度和可重復使用性,在檢測單分子方面顯示出巨大的潛力。當帶電荷的生物大分子(如DNA)被電場驅動通過納米孔,這暫時妨礙了離子的通過,導致電流下降。通過對電流的下降幅度、形狀、持續時間和速率的分析可以解析出分子的長度、形狀、電荷。該技術使用玻璃納米孔可對單鏈環狀DNA 進行準確的定量,Cas12a 在crRNA 的引導之下特異性地結合目標DNA,激發Cas12a 切割單鏈環狀DNA 的活性,線性和環狀的DNA分子通過玻璃納米孔時產生特異性的電流信號,以此來檢測HIV。大多數CRISPR 介導的檢測技術使用熒光來產生信號。在此之前需要報告基團的額外設計和合成,如熒光/猝滅劑報告復合物。總之,該團隊將Cas12a 依賴靶DNA 激活的非特異性核酸內切酶特性和玻璃納米孔傳感器的高靈敏度結合到一個電子傳感平臺上,用于序列特異性HIV-1 檢測,為在檢測點開發快速和低成本的核酸檢測提供了一種可靠的方法[37]。
CRISPR/Cas 系統由于具備特異性識別和切割核酸序列的能力,基于其開發的核酸檢測技術具備高靈敏度、高特異性和簡便快速等諸多優點,因而在病原微生物核酸體外診斷行業有著巨大的發展潛力。目前CRISPR/Cas體外診斷技術尚處于基礎研發階段,在廣泛用于臨床之前,還需要不斷改進。隨著等溫擴增技術、SHERLOCK、DETECTR、SHINE 等技術不斷更新應用,將極大推動CRISPR/Cas 體外診斷技術在更廣闊的領域得到普及。