吳偉鑫 , 蓋新娜 , 周 磊
(中國農業大學動物醫學院 , 北京 海淀 100193)
有規律成簇間隔短回文重復序列(Clustered regularly interspaced short palindromic repeats, CRISPR)廣泛存在于絕大多數細菌和古細菌中,其轉錄產生的crRNA(CRISPR-RNA)與反式激活的tracrRNA(trans-activating CRISPR RNA)共同構成引導RNA(guide RNA, gRNA),gRNA可引導核酸內切酶Cas蛋白(CRISPR associated protein)對噬菌體的基因片段進行切割,構成細菌的CRISPR-Cas免疫防御系統。人們發現可以通過人工合成的gRNA模擬自然的tracrRNA和crRNA結構,與Cas蛋白一起特異性識別和剪切核酸序列,構成新一代的基因編輯技術。2013年,2個團隊[1-2]首次使用嗜熱鏈球菌和化膿性鏈球菌構建Ⅱ型CRISPR-Cas9系統,隨后該系統日趨成熟,并被廣泛用于哺乳動物細胞的基因組編輯。 2015年,該家族內的另一系統CRISPR-CasC2c2[3](現稱Cas13)被成功鑒定,與Cas9不同, Cas13結合和切割的對象為RNA。目前科學家們已經從Leptotrichiabuccalis(Lbu)、Leptotrichiawadei(Lwa)、Leptotrichiashahii(Lsh)以及Lachnospiraceaebacterium(Lba)等多種細菌中解析出了Cas13a結構,根據其來源不同分別稱為LbuCas13a[4]、LwaCas13a[5]、LshCas13a[6]和LbaCas13a[7]。
目前CRISPR-Cas系統分為2類、6型和30多種亞型[8]。其中1類系統(包括Ⅰ型、Ⅲ型和Ⅳ型)具有多個亞單位效應復合物,包括多個Cas蛋白;而2類系統(包括Ⅱ型、Ⅴ型和Ⅵ型)中效應物是種類單一、體積較大、多結構域的蛋白分子[9](見中插彩版圖1)。研究表明,所有的CRISPR-Cas系統可能來源于同一個祖先,1類系統在進化過程中變為具有單一功能的Cas基因,同時丟失其他的Cas基因從而形成2類系統[10]。CRISPR-Cas13系統屬于2類CRISPR系統的Ⅵ型,根據結構還可再細分為a、b、c、d四個亞型。

圖1 兩類CRISPR-Cas系統的結構差異及主要組成[9]
以CRISPR-Cas13a系統為例,高分辨率結構分析[4]顯示細菌Leptotrichiabuccalis(Lbu)中解析出的LbuCas13a屬于“雙瓣葉”球狀蛋白質結構,由1個crRNA識別瓣葉(Recognition lobe, REC)和1個核酸酶瓣葉(Nuclease lobe, NUC)組成,其NUC上有2個高等真核生物和原核生物核苷酸結合域(Higher eukaryotes and prokaryotes nucleotide-binding, HEPN)。

圖2 LbuCas13a、crRNA、靶RNA復合物的復合結構[4]
Cas13a效應蛋白在識別靶RNA上的前間區序列鄰近基序(Protospacer adjacent motif, PAM)(在Cas13a中稱為Protospacer flanking site,PFS)并與其結合的過程中可發生構象變化,HEPN1結構域在靶RNA結合后向HEPN2方向移動,形成一個活化的HEPN催化位點?;罨腍EPN催化位點表現出兩種核糖核酸酶(Ribonuclease, RNase)活性,一種可將自身的pre-crRNA處理為crRNA,令一種表現為HEPN-RNase活性,對靶RNA或游離RNA進行切割[4]。

圖3 Cas13a構象改變和HEPN活化以及表現RNase活性的過程[4]
Cas13a的催化位點位于外表面,所以一旦Cas13a被靶標RNA結合激活,就可以發揮非特異性RNA酶功能,裂解任何可觸及的單鏈RNA(single-stranded RNA, ssRNA),而不論它們是否與crRNA同源或是否存在PFS,這種效應稱為附帶切割效應(Collateral effect)。相比之下,Cas9和Cas12只能在其HNH或RuvC兩個核酸酶催化位點的引導鏈(gRNA)上切割靶標雙鏈DNA(double-stranded DNA, dsDNA)[4]。Cas13b同樣包含2個HEPN結構域,因此有類似Cas13a的功能,Cas13d在大多數方面表現與先前研究的Cas13類似,而Cas13c相關研究較少[11]。
自2015年C2c2(現稱Cas13)系統被發現以來,其研究突飛猛進,并于2017年被《Nature Methods》評為2016年度革新技術[12]。該靶向RNA的核酸編輯技術在多個領域均有所應用。
4.1 RNA示蹤 Cas13a蛋白的HEPN 結構域中Arg(精氨酸)和His(組氨酸)突變可形成核酸酶活性缺失的dCas13a(dead Cas13a),其能夠結合目標RNA但不切割,因此成為一個可編程的RNA結合蛋白(RNA binding protein, RBP),利用其與特定RNA序列的結合特性,配合熒光標記技術可對胞內特定RNA片段進行示蹤[13]。
4.2 臨床診斷 通過設計與目標核酸互補的gRNA,并與Cas13蛋白組裝可組成RNA檢測報告系統。其報告基因通常一端為熒光基團,另一端是化學猝滅劑,當報告基因與樣品中的特異性靶標核酸結合時,Cas酶將對報告基因進行裂解,從猝滅劑中釋放熒光基團發出熒光,且信號可量化。利用該技術可對待測基因進行精確測量或定性分析[14]。

圖4 應用報告基因reporter進行核酸檢測[14]
利用Cas13在靶識別時表現出的附帶切割效應,Gootenberg[15]等通過設計報告基因并結合恒溫核酸依賴性擴增檢測技術(Nuclear acid sequence-based amplification, NASBA)建立了基于CRISPR的診斷系統(CRISPR-based diagnostic, CRISPR-dx)。其可提供渺摩爾級(attomolar, aM, 10-8mol/L)的具有單堿基錯配敏感性和特異性的快速核酸(DNA或RNA)檢測方法。該方法既可用于基因組中單核苷酸多態性(Single nucleotide polymorphisms, SNPs)分析,也可用于監測血液中極少量的腫瘤 DNA。鑒于其高敏感性,該系統被稱為SHERLOCK(Specific high sensitivity enzymatic reporter unlocking),可被用于檢測寨卡和登革熱病毒的特定毒株以及區分不同的其他病原菌。其后,該團隊繼續研究出了進一步優化的SHERLOCK version2(SHERLOCK v2)[16]。
近期,河南農業大學常亞飛[17]等利用SHERLOCK系統,通過結合LwCas13a附帶切割效應和重組酶聚合酶擴增(Recombinase polymerase amplification, RPA)技術,建立一種可以在37 ℃下恒溫進行豬繁殖與呼吸綜合征病毒核酸檢測的方法。該方法具有恒溫反應、靈敏、特異、結果直觀、利于現場操作的特點。同時,由于SHERLOCK高度的錯配敏感性,該技術可對序列高度同源的病毒株進行區分。
4.3 基于CRISPR-Cas13的抗病毒研究 與Cas9 系統對DNA 病毒核酸的切割破壞效應相似,Cas13的RNA特異性靶向切割能力可用于拮抗RNA病毒,以及復制過程中有RNA中間體的DNA病毒。Rashid Aman[18]以及Xiaohui Zhan[19]等人最早用LshCas13a系統干擾蕪菁花葉病毒(TuMV)以及馬鈴薯Y病毒(Potato virus Y, PVY)等植物病毒的復制增殖。近期Freije等[20]證明Cas13可被用于靶向和破壞多種感染哺乳動物的ssRNA病毒的基因組。該研究通過生物信息學技術對數百種可能感染人類的ssRNA病毒進行分析,并預測了數千個Cas13 crRNA的潛在靶點,同時經實驗證實Cas13可拮抗淋巴細胞脈絡叢腦膜炎病毒(Lymphocytic choriomeningitis virus, LCMV)、甲型流感病毒(Influenza A virus, IAV)和水皰性口炎病毒(Vesicular stomatitis virus, VSV)這3種不同的ssRNA病毒的增殖和復制。此外,該研究還分析了介導Cas13靶向作用的影響因素,確定了crRNA設計標準,進一步優化了該抗病毒方法,為后期該技術在抗病毒領域的廣泛應用奠定了重要基礎。
基于CRISPR-Cas13系統的核酸檢測以及抗病毒技術將在獸醫研究領域大有可為,原因有三:(1)SHERLOCK檢測系統具有高靈敏度、特異性、可恒溫反應、結果直觀、利于現場操作的特點,非常利于開發可在養殖場和動物醫院現場使用的核酸檢測試紙條,這為開發輕量化、便捷的檢測技術提供了重要思路;(2)SHERLOCK具有高度的錯配敏感性,該技術可對序列高度同源的病毒株進行區分;(3)基于CRISPR-Cas13的抗病毒策略在動物疫病的預防治療研究中較人類有更低的試錯成本。同時,該技術還可與轉基因抗病育種技術相結合,以培育對某種疾病具有天然抗性的動物。
雖然CRISPR-Cas13技術的發展突飛猛進,但目前該技術仍有諸多不足有待解決。首先,sgRNA對靶位點的正確識別需要特定PAM序列,降低了靶區選擇和相應sgRNA設計的靈活性,也使sgRNA的設計更加復雜化。其次,crRNA與目標核酸序列的結合可容忍一定程度的錯配,進而導致脫靶效應(off-target effect),阻礙了 CRISPR-Cas系統在生產實踐中的使用。當前主要通過sgRNA和PAM序列的設計以及CRISPR系統的優化(Cas的構象和Cas-sgRNA的用量等)3個方面進行降低脫靶效率的研究來提升其作用的準確性。再者,基因編輯效率(efficiency of genome editing)的提高對于CRISPR-Cas基因編輯技術的開發應用同樣重要。此外,由于RNA酶的廣泛存在,核酸的檢測和編輯很容易受到影響,因此,在CRISPR-Cas系統中偏向使用更長的sgRNA來放大核酸檢測信號,以確保sgRNA沒有被RNase消化變短或降解,從而有效避免假陰性結果[21]。而CRISPR-Cas13技術若想真正用于臨床開發,其Cas13 蛋白以及gRNA在體內的精確遞呈、代謝消除、免疫激活反應以及其他安全性相關指標均需要系統評估。若能解決以上諸多問題,將有利于Cas13技術的進一步完善,為傳染病快速、準確的診斷以及抗病毒藥物的開發提供新的思路和技術。