楊 莎,郝海生,杜衛華,龐云渭,趙善江,鄒惠影,朱化彬,楊宇澤,趙學明
(1.中國農業科學院北京畜牧獸醫研究所,北京100193;2.北京市畜牧總站,北京 100101)
CRISPR/dCas9(nuclease-dead Cas9)是由CRISPR/Cas9 (clustered regularly interspaced short palindromic repeats/CRISPR-associated genes)衍生而來的遺傳操作工具。CRISPR/Cas9是成簇的規律間隔的短回文重復序列及相關基因的簡稱,是繼鋅指核酸內切酶(zinc finger endonuclease,ZFN)和類轉錄激活因子效應物核酸酶(transcription activator-like effector nuclease,TALEN)之后的第三代基因編輯技術[1]。CRISPR系統最早由日本科學家于1987年在大腸桿菌中發現[2],它是細菌和古細菌等原核生物中的一種獲得性免疫系統,不僅可以保護自身免受噬菌體感染,而且還可以防止其他染色體外元件入侵細菌[3-4]。2012年,Jinek等[5]體外證實Cas能夠實現對DNA進行切割。2013年,Cong等[6]首次發現CRISPR/Cas系統能夠用于哺乳動物的基因編輯。隨著研究的深入,CRISPR/Cas9系統除了被用于編輯目標DNA或RNA外,還發展出了CRISPR/dCas9系統,該系統被廣泛用于基因表達調節、表觀遺傳修飾調控、單堿基編輯以及細胞內活體成像等研究中。
CRISPR/dCas9是在CRISPR/Cas9基礎上發展而來的,而CRISPR/Cas9系統由單向導RNA(single guide RNA,sgRNA)和Cas9蛋白兩部分組成[5]。sgRNA是通過將tracrRNA的5′-末端與CRISPR RNA(crRNA)的3′-末端相雜交嵌合而成[1]。而Cas9蛋白是由NUC核酸酶結構域和REC結構域2部分組成[7]。而NUC結構域又包含了RuvC結構域、PAM結構域、HNH結構域和WED結構域[7-8]。Cas9蛋白則利用HNH結構域、RuvC結構域的核酸酶活性行使切割功能[5]。在實際應用中,sgRNA首先識別出基因中的特定序列,由此引起一系列變化使得自身與靶DNA彼此發生堿基互補配對,形成RNA-DNA異源雙鏈體[9]。同時,sgRNA與Cas9核酸酶形成復合物結合到靶序列處,行使切割功能并產生雙鏈斷裂(double strand breaks,DSB)[10-11]。該斷裂可誘導DNA損傷反應并通過各種內源性機制刺激DNA的修復,進而達到基因編輯的目的[12]。
2013年,Qi等[13]制備了失活的Cas9蛋白(dCas9),將Cas9蛋白結構中的HNH域中引入H840A突變,在RuvC域中引入D10A突變,使得蛋白活性發生缺陷,喪失了原有的切割功能,但仍可以相同精度結合DNA。同時,sgRNA中負責與Cas9結合的序列同樣負責dCas9復合物的形成[14],由此,dCas9蛋白成為了能夠兼容多種效應蛋白(如轉錄抑制子或激活子、表觀遺傳修飾子和熒光團)的融合蛋白[15],能在sgRNA的引導下實現對基因目標位點的靶向調節作用,可被用于改變基因表達和改寫表觀遺傳標記,而不產生DSB[16]。
目前,CRISPR/dCas9系統主要通過CRISPR激活(CRISPR activation,CRISPRa)或CRISPR干擾(CRISPR interference,CRISPRi)系統來實現基因表達的調控。
CRISPRa是指當dCas9蛋白與sgRNA共表達時,會產生DNA識別復合物,同時dCas9蛋白所攜帶的效應子域會通過招募RNA聚合酶或內源性轉錄激活因子的方式來促進轉錄進程,從而達到激活靶基因的目的[17]。最初,研究人員在真核生物中將dCas9與激活子域進行簡單融合,通過單個或多個sgRNA靶向啟動子區域來實現目標報告基因和內源基因的激活[18-20]。這些研究雖然不同程度上實現了目標基因表達的激活,但都存在著各自的局限性,因此第二代工具應運而生。
新一代工具旨在將更多激活子效應域融合到dCas9中,以放大作用效果,能更為準確、高效地實現目的基因的激活。這些工具包括SunTag、VP64、VPR、SAM、MS2、scRNA或它們的組合(圖1[21])。dCas9-SunTag系統通過肽重復序列GCN4和單鏈可變片段scFv(single-chain variable fragment)連接dCas9蛋白與多個激活子效應域從而有效激活目的基因[22]。而VPR系統由VP64、轉錄激活蛋白 (p65)和反式激活蛋白(RTA)三者組成,三者串聯融合后,相較于dCas9-VP64系統或dCas9-VP64- p65/RTA系統,可誘導目標基因高效激活[23]。與上述系統通過改造實行編輯功能的效應域來提高激活效率不同,SAM系統通過對sgRNA進行改造實現CRISPRa系統對基因激活效率的增強。SAM系統包括dCas9-VP64融合復合物和MCP融合的p65-HSF1,與dCas9-VP64系統相比也顯示出更高的基因表達激活效力[24]。

圖1 不同CRISPRa系統示意圖[21]Fig.1 Schematic diagram of different CRISPRa systems[21]
CRISPRi是指當dCas9蛋白與sgRNA共表達時,會產生DNA識別復合物,同時dCas9所攜帶的效應域通過阻止RNA聚合酶的結合或是破壞轉錄因子結合從而干擾轉錄延伸來抑制轉錄過程,進而達到抑制或沉默基因表達的目的[25-26]。當單獨使用dCas9將CRISPRi導入哺乳動物細胞時,其抑制效率較低,因此研究人員們一直致力于提高真核細胞中靶向基因調節的效率。他們將諸如Krüppel關聯框(Krüppel-associated box,KRAB)之類的抑制域與dCas9融合,發現可以提高抑制效率[27]。自Gilbert等[27]首次利用dCas9-KRAB融合蛋白以增加CRISPRi沉默的效率后,其他研究人員也利用該融合蛋白靶向5′-非翻譯區域[28]以及增強子元件[29-30],有效使目的基因沉默或抑制。
雖然在上述研究中dCas9-KRAB融合蛋白確實提高了CRISPRi系統的效率,但仍存在許多問題有待解決。 于是,Amabile等[31]通過將dCas9-KRAB與DNA甲基轉移酶(DNA methyltransferase,DNMT)結合使用,結果證明其在多達78%的細胞中穩定地誘導了目的基因沉默,提高了系統的作用穩定性。Yeo等[32]將KRAB-MeCP2阻遏結構域與dCas9蛋白相結合,其作用效果與單獨使用dCas9或dCas9-KRAB相比較,對目的基因表現出更強的抑制作用。Alerasool等[33]研發出了新一代KRAB結構域——ZIM3 KRAB,通過驗證表明,它與KRAB-MeCP2相比作用效果又提高了,是現存的CRISPRi系統中最為有效的一種。
表觀遺傳學是一門對基因可遺傳變化進行研究的學科,這種可遺傳變化能夠使相同基因、來源和生長環境的細胞在不改變DNA序列的情況下產生不同的功能[34]。表觀遺傳修飾主要包括組蛋白修飾、DNA甲基化、非編碼RNA調控等[35]。這些表觀遺傳修飾過程對基因的表達起著至關重要的作用,和許多癌癥疾病的發生存在著密切的聯系[36],所以利用CRISPR/dCas9系統探索新的疾病和癌癥治療方法也成為了研究的趨勢,不同研究人員在此基礎上進行了各種各樣的嘗試。
組蛋白是存在于染色質中起調節基因表達作用的蛋白成分,各種基團能與其N-末端共價結合而發生修飾作用[37]。組蛋白修飾主要包括組蛋白乙酰化、磷酸化、甲基化和泛素化等,這些修飾能夠影響染色質的結構松緊程度,進而對基因的表達起到修飾作用[38]。
3.1.1 調控組蛋白乙酰化 在組蛋白乙酰化修飾方面,2015年,Hilton等[39]將人乙酰基轉移酶p300與dCas9蛋白相融合,并將其用于催化啟動子和增強子上組蛋白H3 Lys27的乙酰化,結果表明這種乙酰基轉移酶能夠促進靶基因的轉錄激活。2017年,Bohnsack等[40]在Gabra1基因啟動子上成功驗證了該系統的效果,增加組蛋白乙酰化并防止了Gabra1基因表達降低,為治療因Gabra1基因表達異常而引起的各種疾病打下了基礎,證明了該系統可應用于疾病治療。
在組蛋白去乙酰化修飾方面,2017年,Kwon等[41]設計將dCas9-HDAC3靶向啟動子組蛋白脫乙酰化,成功抑制了幾種候選基因轉錄,展示了該類系統的作用效果,為后續相關應用研究提供了有力的工具。KRAS是癌癥中最易發生突變的癌基因之一,Liu等[42]將dCas9-HDAC1用于修飾KRAS啟動子上的組蛋白乙酰化,結果有效沉默了癌癥基因KRAS,提供了一種有效可行的抗KRAS突變的癌癥療法,為相關癌癥治療提供了一種新的可能性。
3.1.2 調控組蛋白甲基化 在組蛋白甲基化修飾方面,2019年Chen等[43]將組蛋白甲基化酶與dCas9融合,構建了CRISPR/dCas9-EZH2系統,將其靶向前體脂肪細胞中的C/EBPα啟動子,發現該系統能夠精準實現組蛋白H3第27位賴氨酸(histone H3 lysine 27,H3K27)甲基化,下調C/ebpα基因的表達,成功抑制了細胞的成脂分化,就此為組蛋白甲基化修飾和靶向操作提供了強大的工具。 同年,Fukushima等[44]將dCas9-olEZH2 mRNA與sgRNA共同注射到單細胞階段的日本鳉魚(Oryziaslatipes,Medaka)胚胎中,發現特定位置出現了組蛋白H3第27位賴氨酸三甲基化(histone H3 lysine 27 trimethylation,H3K27me3)積累,其失調與癌癥等疾病有關,并導致了相關基因表達的下調,成功在胚胎中建立了H3K27me3的體內表觀基因組編輯,擴展了基于dCas9的體內表觀基因組編輯的應用范圍,同時該組蛋白甲基化系統還為疾病的治療提供了模型。
在組蛋白去甲基化修飾方面,Kearns等[29]將dCas9-LSD1系統運用到小鼠胚胎干細胞中,結果顯示dCas9-LSD1會誘導Tbx3上游增強子標記組蛋白H3第4位賴氨酸二甲基化(histone H3 lysine 4 dimethylation,H3K4me2)減少,成功導致增強子失活,Tbx3轉錄減少,證明了該技術的作用效果,同時表明該技術有能力幫助剖析遠端順式調控元件對發育和疾病的影響。 為了了解H3K4me3在調節α-突觸核蛋白在帕金森氏病中的重要作用,Guhathakurta等[45]開發了靶向H3K4me3去甲基化系統dCas9 SunTag-JARID1A,該系統作用于α-突觸核蛋白基因(α-synuclein gene,SNCA)啟動子后,顯著降低了H3K4me3,影響了α-突觸核蛋白的表達,證明對啟動子SNCA的組蛋白的調控可以通過影響α-突觸核蛋白的表達,進而影響帕金森氏病表現。
DNA甲基化是指通過DNA甲基轉移酶在CpG二核苷酸中胞嘧啶的第5個碳原子上添加1個甲基基團生成5-甲基胞嘧啶的過程[46-47]。甲基化對許多哺乳動物生物過程(如細胞周期調控、基因印跡、胚胎發育等過程)具有重要意義,是維持細胞或組織基因表達的重要機制[48]。因其會阻礙轉錄因子與DNA的結合,所以DNA甲基化一般會導致基因沉默或下調[49]。而基因啟動子的低甲基化會導致染色體結構的不穩定、轉座因子的再激活和基因組印跡喪失,從而引起基因的過表達,造成癌癥疾病的發展[21]。
3.2.1 CRISPR/dCas9系統用于DNA甲基化精準調增 DNA甲基化是由DNMT催化完成的,哺乳動物細胞中已知的DNMT主要有3種:DNMT1、DNMT3a和DNMT3b。DNMT1主要負責維持DNA的甲基化狀態[50];DNMT3a和DNMT3b主要負責催化DNA的從頭甲基化,它們以未甲基化的DNA為模板,在DNA建立新的甲基化位點[51]。2016年,McDonald等[52]和Vojta等[53]首先開發出一種基于CRISPR/dCas9的工具,都將DNMT3a與dCas9蛋白相融合(dCas9-DNMT3a),并將其用于誘導啟動子中特定位點的DNA甲基化,同時Vojta等[53]還證明該工具可以允許同時利用多個gRNA靶向多個相鄰位點,達到啟動子大片段甲基化的目的。同年,Rudolf- Jaenisch研究小組成功在小鼠體內印證了這一工具的效果,將其應用領域擴展到哺乳動物體內[54]。后來,Wei等[55]又利用顯微注射的方法將gRNA與dCas9-DNMT3a mRNA導入小鼠GV期卵母細胞中,有效地提高了MⅡ期卵母細胞中目標基因的DNA甲基化水平,并成功產生了后代。以上研究證明了dCas9-DNMT3a系統在實際應用中的效果顯著,同時為探究體內DNA甲基化狀態與疾病和發育之間關系的相關研究奠定了基礎。
為了提高靶向基因組位點的DNMT3a水平,進而高效、有針對性地進行甲基化,有研究者將dCas9蛋白與SunTag序列相融合,在靶位點招募多個抗體融合的DNMT3a(dCas9-SunTag-DNMT3a),試驗結果均表明與先前的系統(dCas9-DNMT3a)相比,改造后的系統明顯提高了目標位點的甲基化狀態,同時降低了脫靶現象的發生[56-58]。同時Stepper等[59]采用了dCas9-DNMT3a-DNMT3L在不同基因啟動子處將DNA甲基化引入人的基因組中,在單個gRNA的引導下,實現了啟動子的有效且廣泛的甲基化。
3.2.2 CRISPR/dCas9系統用于DNA甲基化精準調減 DNA去甲基化過程則是由Tet(ten-eleven translocation)雙加氧酶家族負責,它們可以將5-甲基胞嘧啶(5mC)逐步氧化為5-羥甲基胞嘧啶(5hmC)、5-甲酰胞嘧啶(5fC)和5-羧基胞嘧啶(5caC),最后達到消除甲基化印跡的目的[60]。2016年有研究者首先利用dCas9-Tet1系統分別對腦源性神經營養因子(brain-derived neurotrophic factor,BDNF)啟動子Ⅳ和肌源性決定因子(myogenic differentiation,MyoD)遠端增強子靶向去甲基化,成功誘導了有絲分裂后神經元中BDNF的表達和MyoD的激活,就此證明了dCas9-Tet1系統在表觀遺傳研究方面的重要用途[54]。而后,Liu等[61]使用dCas9-Tet1/sgRNA系統對脆性X綜合征(fragile X syndrome,FXS)誘導性多能干細胞(induced pluripotent stem cell,iPSC)進行編輯,成功恢復了脆性X智力障礙1號(fragile X mental retardation 1,FMR1)基因的表達,并且在植入小鼠大腦后,相應神經元的FMR1表達得到了維持,為相關醫療技術繼續深入研究打下了堅實的基礎。
為了實現更大作用范圍內有效和高效去甲基化,2016年Xu等[62]將2個MS2 RNA元件插入到sgRNA中構建出了sgRNA2.0,將其與dCas9-Tet1催化結構域(dCas9-Tet1 catalytic domain,dCas9-Tet1CD)共同作用,成功募集了更多DNA去甲基化酶,實現了對一定范圍內靶基因的有效去甲基化。同年,Morita等[56]利用改造以后的dCas9-SunTag系統成功在靶位點招募了更多的scFv-GFP-Tet1CD,實現了遠距離去甲基化,并在小鼠胚胎的活體大腦中實現了內源性基因的去甲基化。Xu等[63]報道了一種高保真催化系統dHFCas9-Tet3CD,該系統能有效降低脫靶概率,成功優化了系統的作用效果。
CRISPR/dCas9技術在動物、植物研究方面都有著重要應用意義,并且其應用不再拘泥于簡單的基因編輯,而是在基因表達調控、表觀遺傳修飾、細胞成像、單堿基編輯、基因診斷等多個方向發揮著日益重要的作用,促進著生物學研究的發展。許多資料表明,疾病和癌癥的發生都與表觀遺傳狀態有著直接聯系,而利用CRISPR/dCas9技術對相關疾病基因進行表觀遺傳修飾將為一些癌癥疾病的治療帶來新的契機。