王渭霞 朱廷恒 賴鳳香 萬品俊 魏琪 傅強
(1 中國水稻研究所/水稻生物育種全國重點實驗室,杭州 310006;2 浙江工業大學 生物工程學院,杭州 310014;第一作者:wangweixia@caas.cn;*通信作者:thzhu@zjut.edu.cn;fuqiang@caas.cn)
成簇規律間隔短回文重復序列(clustered regularly interspaced shorted palindromic repeats, CRISPR)及其相關蛋白(CRISPR-associated protein, Cas 蛋白) 系統CRISPR/Cas 是古細菌等微生物在長期進化過程中形成的一種抵御外來DNA 入侵的保護機制[1-2],通過該系統將初次入侵生物的部分保守DNA 短序列剪切后作為間隔序列整合到重復序列之間形成記憶庫。整合的外源生物DNA 轉錄的crRNA(CRISPR RNA)可精準識別再次入侵生物DNA,并啟動該系統的核酸切割功能,從而保護自己不被侵染裂解死亡[3-4]。基于CRISPR系統精準識別和切割基因組的功能發展而成的基因編輯技術像一把“魔剪”,不僅能“剪切”基因,還能用于“修補”基因。該技術在生命科學和技術領域顯示出強大的生命力,可以對靶標基因進行敲除、插入和堿基定點替換等精準編輯,在物種基因組修飾、基因工程等方面顯示出廣闊的應用前景。在農業領域可用來提高作物產量、增加抗性、改良品質以及創制雄性不育和固定雜種優勢[5-6]。
CRISPR/Cas 系統的開發應用越來越廣泛,除了crRNA 引導的靶標DNA 區精準編輯,部分Cas 蛋白還會通過Cas 蛋白/crRNA/靶DNA 三元復合物啟動非特異性降解單鏈DNA(ssDNA)/單鏈RNA(ssRNA),也被稱為反式切割。基于此,CRISPR/Cas 系統也被廣泛應用于快速分子檢測,包括病原微生物、單核苷酸突變等檢測領域,展現出特異性高、靈敏度高、無需特殊儀器、快速準確等突出優勢[7-9]。本文綜述了CRISPR 系統在轉基因以及基因編輯產品檢測中的應用進展。
1987 年,ISHINO 等[10]在對K12 大腸桿菌中的堿性磷酸酶基因測序時發現,其附近有許多串聯間隔的重復序列,2002 年JANSEN 等[11]將其命名為CRISPR 序列。進一步發現CRISPR 的間隔序列與噬菌體的某些序列存在著高度同源性[1],隨后證實細菌可利用CRISPR 系統抵御噬菌體入侵和外源質粒的轉移[12-13]。CRISPR 的保守重復序列長度為25~50 bp,間隔片段長度為26~72 bp,二者間隔串聯而成[14],這些串聯重復序列源于不同時間、不同噬菌體的感染整合,存在于40%的細菌和90%的古細菌中[12]。自2011 年起,CRISPR/Cas 系統介導的免疫機理不斷被揭示,CRISPR/Cas 系統由CRISPR 基因座、Cas 蛋白和tracrRNA(trans-activating RNA)三部分組成。CRISPR 的前導序列轉錄為前體crRNA(pre-CRISPR-derived RNA),pre-crRNA經RNA 內切酶切割生成含有與噬菌體靶標序列匹配的成熟CRISPR RNA ( crRNA),crRNA 通過堿基配對與tracrRNA 結合形成tracrRNA/crRNA 復合物,此復合物引導Cas 蛋白實現對靶標序列的識別和切割[15]。Cas 蛋白對靶標序列的識別必須依賴于間隔序列毗鄰基序( Protospacer adjacent motif,PAM)。tracrRNA 的功能主要是連接crRNA 和Cas 蛋白。后來通過人工設計將crRNA 和tracrRNA 改造合并成一條具有引導作用的sgRNA(single guide RNA),可同樣實現引導Cas 蛋白對目標DNA 的定點切割[16]。
CRISPR/Cas 系統根據其組成和功能可分為兩大類群:第一類由多個Cas 組成的效應復合體行使功能;第二類則由單個多結構域的Cas 組成,包括Ⅱ型的Cas9、Ⅴ型的Cas12 和Ⅵ型的Cas13[17]。第二類系統簡單,蛋白分子量小,操作方便,是目前主要應用的基因編輯系統。其中,通過融合胞嘧啶脫氨酶和尿嘧啶糖基化酶抑制劑的Cas 蛋白可高效地對靶向位點內的特定堿基進行替換,進一步提高了定點基因精準編輯的功能[18-19]。
在Cas 蛋白切割靶標DNA 的同時,發現某些Cas蛋白會啟動其附帶“切割活性”,完成對其他非靶標DNA 或RNA 的任意切割。這一特性為檢測樣品是否含有某目的DNA/RNA 序列提供了可行性。例如,合成含特異性識別靶標序列(目標序列)的sgRNA 和切割非特異性序列(熒光報告核酸)的檢測系統,一旦sgRNA 檢測到目的序列,系統將啟動,熒光報告核酸也會被降解,從而釋放出熒光信號。截至目前,CRISPR/Cas系統里有三類單一效應蛋白(Cas12、Cas13 和Cas14)被報道具有非特異性切割核酸特性,可用于分子診斷檢測[20-24]。基于不同Cas 的核酸切割功能,開發出了SHERLOCK (Cas13a/RNA)、DETECTR [Cas12a/dsDNA(雙鏈DNA)或Cas14a/ssDNA]等核酸檢測系統(圖1),并成功應用于SARS-CoV-2、寨卡病毒、埃博拉病毒、HPV 和結核分枝桿菌等的檢測[9,25]。

圖1 三種Cas 蛋白附屬切割活性進行分子診斷的示意圖[9]
Cas13a 屬于第二類中VI 型CRISPR-Cas 蛋白,可在gRNA 的引導下靶向單鏈RNA,激活單鏈RNA 酶活性,并啟動非特異性切割RNA 特性[26]。DOUDNA 團隊設計了一端帶有熒光素另一端帶有淬滅集團的熒光報告RNA,Cas13a 在匹配到靶標RNA 后即可非特異性切割環境中的熒光報告RNA,釋放熒光素并發出熒光,從而實現目標RNA 檢測。采用該技術成功檢測了噬菌體RNA,靈敏度達0.01 nM[20]。基于此,重組酶聚合酶擴增(recombinase polymerase amplificatin,RPA)相結合設計出SHERLOCK(specific high-sensitivity enzymatic reporter unlocking)技術,使得樣本中低濃度的靶標分子DNA 首先通過RPA 擴增后轉錄或RNA 分子通過逆轉錄重組酶聚合酶擴增(RT-RPA)得到指數級擴增,再采用Cas13a-gRNA 與熒光報告RNA 檢測,大幅提高了檢測靈敏度。可在2 h 內直接從患者樣本(如血清、尿液和唾液)中以低至每1 μL 1 個拷貝的濃度直接檢測寨卡病毒(ZIKV)和登革熱病毒(DENV)[27]。在升級版的SHERLOCKv2 中,使用4 種不同的Cas13和Cas12 酶的組合,在單個反應中可檢測到4 種靶標核酸序列,并通過使用CRISPR 相關酶Csm6 提高Cas13 活性,使檢測靈敏度提高了約3.5 倍[28]。
Cas12a 是第二類V 型CRISPR-Cas 蛋白,含有RuvC 催化結構域可識別富含T 的靶向序列,在sgRNA的引導下特異性切割雙鏈DNA(dsDNA)或單鏈DNA(ssDNA)并產生附屬的ssDNA 酶活性[21,23]。基于此,通過將CRISPR/Cas12a 系統與RPA 相結合,開發了一種新的DNA 內切酶靶向CRISPR 反式報告器DETECTR(DNA endonuclease-targeted CRISPR trans reporter)用于核酸檢測(圖1)。該技術被成功應用于HPV 病毒的分型檢測[21],DNA 病毒pseudorabies virus (PRV) 和RNA 病毒Japanese encephalitis virus (JEV)的檢測[23]。與SHERLOCK 相比,該技術體系減少了從擴增后的DNA轉錄到RNA 這一步,其熒光報告分子為DNA 探針,易于保存。隨著類似于Cas12a 活性的其他Cas 蛋白如Cas12b 等的發現,基于Cas12 的核酸檢測系統得到了一系列改進,集成了多種擴增方法(包括PCR、RPA、LAMP)和單一讀數形式(例如熒光檢測器、裸眼觀察和側向流動分析),使該方法更靈敏、準確、便攜且更易于使用[25,29]。
古細菌中發現一種具有400~700 個氨基酸組成的屬于第二類系統Ⅴ型的Cas14 蛋白,具有典型的RuvC核酸酶結構域,可靶向ssDNA,在激活后剪切靶ssDNA和非特異性地剪切環境中的ssDNA[22]。Cas14 對靶標序列沒有前間區序列鄰近基序的限制,所以可以靶向任何序列,但對識別序列中間的堿基的要求很嚴格,有1個錯配就不能結合,特異性能達到單堿基。但由于Cas14-sgRNA 只識別ssDNA,因此在檢測應用中需要對靶序列擴增的引物進行修飾,如使用含硫代磷酸(phosphorothioate oligonucleotide,PT)的引物擴增DNA底物,以保護一條鏈不被核酸外切酶降解。擴增產物加入T7 核酸外切酶后,帶有未修飾引物的鏈被降解,留下一條可被Cas14a 檢測的ssDNA 底物。利用該系統成功區別了與人類眼睛顏色有關的HERC2基因SNP(圖2),首先通過設計一條與藍色眼睛的目標序列嚴格互補sgRNA,與sgRNA 互補鏈的引物含有PT,對唾液樣本中HERC2基因進行擴增。擴增產物經T7 核酸外切酶酶切后,得到的藍色眼睛ssDNA 與sgRNA 互補并啟動Cas14a 的ssDNA 切割活性,隨后啟動其非特異切割活性,使熒光報告探針釋放出熒光得到檢測,而僅有1個堿基之差的(G-T)的褐色眼睛的ssDNA 得不到檢測。而Cas12 系統則無法區別這種單堿基突變的樣本。因此,通過將Cas14 的非特異性ssDNase 切割活性與等溫擴增法相結合(DETECTR-Cas14),可用于高保真度DNA 單核苷酸多態性基因分型,可能在傳染性和非傳染性疾病的CRISPR 診斷領域獲得指數級擴展[30]。

圖2 利用Cas14 系統檢測人類HERC2 基因單堿基突變的示意圖
根據檢測對象不同,基于核酸的植物轉基因檢測技術包括對常用的轉基因元件啟動子(CaMV35S、FMV35S)、終止子(NOS、E9’3、T-CaMV35S)、選擇標記基因(NPTII、HPT)及目的基因(Bt、Bar、Pat、EPSPS)篩選檢測,對載體構建的構建特異性檢測,以及對插入受體基因組的邊界序列的轉化體特異性檢測。檢測通常采用定性PCR、熒光定量PCR 和數字PCR 等方法。常規PCR 需要在擴增儀上經過變性、退火、延伸三個步驟來完成擴增。環等溫擴增技術(loop-mediated isothermal amplification, LAMP)和RPA 反應最適溫度分別為65 ℃和37 ℃,不需要復雜的溫控設備,可以真正實現便攜式快速核酸檢測,從而替代PCR 檢測技術[31-32]。CRISPR/Cas 檢測結合LAMP 或RPA 技術有望實現轉基因產品的現場快速檢測。其中,Cas12 檢測靶標為雙鏈DNA 分子,與轉基因靶標的雙鏈DNA 一致,因此,Cas12 最有望應用于轉基因產品的檢測。
結合RPA 技術,通過合成sgRNAs 引導Cas12a 蛋白結合到RPA 擴增產物和單鏈DNA 報告探針(5-FAM-TTATT-Quencher-3),對轉Cry1C基因水稻實現高效檢測[33]。設計了4 種與Cry1C不同位置互補的sgRNA(1-4)引導Cas12a,檢測了對RPA 擴增產物和報告探針的切割活性。結果發現,Cas12a 的靶標DNA切割活性獨立于單鏈DNA 報告探針切割活性,檢測能力主要依賴于gRNA,其中sgRNA1 和sgRNA3 對靶標DNA 的切割活性可達100%,sgRNA1 對DNA 報告探針的切割活性顯著高于其他sgRNA。
該體系只需要合成長度為30~35 nt 的RPA 擴增用引物,基因組DNA 與擴增酶在緩沖液中37 ℃溫浴10 min 獲得RPA 擴增產物,隨后添加1 μM Cas12a、100 ng sgRNA 和1 μL 單鏈DNA 報告探針,37 ℃溫浴10~60 min。反應產物通過膠體金試紙條就可以在5~10 min 內獲得檢測結果(圖3)。該技術體系要點:RPA擴增產物需含有Cas12a 蛋白切割識別的PAM 序列TTTG;其次緊隨PAM 序列后的sgRNA 序列與目標序列的一致性是檢測特異性的關鍵,錯配1 個堿基都會影響Cas12a 蛋白的切割活性。sgRNA 序列包含有引導序列和保守的莖環序列。以sgRNA1 為例:RPA 擴增引物分別設計在Cry1C基因序列(GenBank 登錄號:HM107006.1)的156~185 bp 和506~537 bp 處,擴增產物位于156~537 處,長度328 bp。sgRNA1 則設計在227~250 bp處,序列為5’-TCGTTCAGATCGAACAGCTCATCA-3’,上游PAM 序列為223-TTTC-226。首先合成寡核苷酸序列sgDNA:5’-tgatgagctgttcgatctgaacgaATCTACAACAGTAGAAATTCCCTATAGTGAGTCGTATTAATTTC -3’,其中小寫字母為靶標序列(227~250 bp)的互補序列,大寫字母為T7 啟動子互補序列,大寫斜體為形成sgRNA莖環結構的核心序列,該序列通過與T7 啟動子序列退火合成雙鏈后即可利用體外轉錄試劑盒轉錄獲得sgRNA1(圖4)。

圖3 基于Cas12a 的側向流動檢測示意圖[33]

圖4 Cry1Ac 的sgRNA1 序列合成示意圖(A)和二級結構(B)
結合LAMP,對轉基因植物的外源啟動子CaMV35S(GenBank 登錄號GU734659.1)的644~934 bp處進行擴增。擴增片段中需含有可以激活Cas12a 活性的PAM 序列即富含T 的TTTN,單鏈DNA 報告探針為5’6-FAM-TTATT-3’BHQ1 和可引導Cas12a 蛋白靶向LAMP 擴增產物中CaMV35S擴增子的sgRNA。sgRNA 包括可以形成莖環結構的核心序列UAAUUU CUACUAAGUGUAGAU 和目標序列CUUUAUCGCAA UGAUGGCAUU。目標序列DNA 位于GU734659.1 717~737 bp 處,序列為CTTTATCGCAATGATGGCATT,上游為PAM 序列TTTC。在sgRNA 中只是“T”被“U”取代(圖5)。在37 ℃下CRISPR/Cas12a 系統與擴增產物溫浴5 min 就可在紫外光下肉眼快速識別檢測結果。所建立的方法能顯著區分特異性擴增和非特異性擴增。檢測限可達轉基因含量0.05%[34]。將LAMP 反應和Cas12a 檢測試劑混合在1 個反應管中可有效防止源頭污染,無需額外試劑,使操作過程更加快捷方便。

圖5 CaMV35S 的sgRNA 序列二級結構和CaMV35S 擴增子的對應靶標DNA 序列示意圖
轉基因檢測中,開發低成本、準確、高效和快速的檢測方法非常重要。相較于PCR 為基礎的檢測技術,CRISPR/Cas 系統顯示出其優越性,有助于實現多種基因修飾產品的高靈敏度、高精度檢測,包括現場快速檢測。
CRISPR/Cas 檢測系統顯著拓寬了可檢測對象核酸種類。充分利用Cas 蛋白的附屬切割活性多樣性功能,可對不同種類和構象的靶標核酸進行精準檢測。Cas12 擅長識別雙鏈DNA,Cas13 擅長識別單鏈RNA,而Cas14 則擅長識別單鏈DNA。這對提高不同基因修飾產品及其不同核酸樣品的準確率提供技術保障。
CRISPR/Cas 檢測技術在基因修飾產品的檢測應用中才剛剛起步。通常,針對不同轉基因產品,可開發一套常用元件的基因編輯檢測技術以及身份特異性快速檢測,應用于現場快速檢測對轉基因產品的監管有重要意義。目前已經開發出的針對Cry1C和CaMV35s啟動子的CRISPR/Cas 檢測技術為轉基因植物的篩選檢測開啟了先河。針對每一個市場化轉基因產品的身份特異性快速檢測可為育種者知識產權保護以及杜絕假種行為提供支撐,該技術的關鍵是合成特異性強、可誘導強切割活性的sgRNA。因此,針對特定檢測的靶標序列對比研究獲得靈敏度高、特異性高的sgRNA 是實現不同轉基因植物快速現場檢測的先決條件。
相比于轉基因技術即將異源物種DNA 導入到目標物種內并隨機整合到目標物種染色體上的技術,利用CRISPR/Cas 的基因編輯技術是對物種自身靶基因實施的定點修飾,在此過程中會有載體序列等外源DNA 序列殘留。與傳統轉基因植物被插入大片段外源基因序列的情況不同,基因組編輯技術在改造的受體生物體內留下的痕跡較少,已有的轉基因產品檢測方法不能完全適用,給基因組編輯植物及其產品的檢測帶來新的挑戰[35]。對于含有外源短片段DNA 的基因編輯產品可借助于第二代測序技術和FED(foreign element detection)網絡大數據庫實現外源DNA 成分的檢測識別[36]。FED 已經內置了24 種植物和13 種動物的參考基因組信息,整理歸類了美國國立生物技術信息中心(National Center for Biotechnology Information)和addgene(https://www.addgene.org)等生物數據庫收集的各國科研人員遞交的不同物種的各類載體序列信息,并依此建立了外源成分數據庫。而對于無外源DNA 引入的基因編輯修飾產品,尤其是單核苷酸改變的情況,主要依賴DNA 測序、限制性內切酶分析法、T7 核酸內切酶分析法、單鏈構象多態性分析方法、高分辨率熔解曲線分析法和熒光探針PCR 檢測等極為復雜的檢測手段[37-38]。這些檢測方法耗時長、需要昂貴的儀器設備,且檢測的準確率也有待提高。基于基因編輯系統的sgRNA 與靶序列的準確識別功能有望實現對單核苷酸突變的基因編輯產品的準確識別和檢測。