李志遠+熊東彥+慕昕
摘 要:CRISPR技術是近年來興起的繼鋅指核酸酶和TALENs技術的第三代基因編輯技術,相比于之前的兩種人工核酸酶,其具有許多無可替代的優勢,并已在多種動植物中應用。文章就CRISPR系統的發現、分類、作用機制以及其優缺點和對外來應用的展望做綜述介紹。
關鍵詞:CRISPR機制;結構;脫靶
前言
基因編輯指對目標基因進行敲除、替換和插入的遺傳操作。最近幾年來基因組定點編輯技術包括人工核酸酶即鋅指核酸酶、TALENs[1]、CRISPR/Cas系統。鋅指核酸酶是非特異性核酸酶ForkI的切割結合域與有串聯鋅指結構的鋅指蛋白融合成的人工核酸酶,串聯鋅指結構可特異性的結合DNA序列前者使DNA雙鏈斷裂,產生雙鏈斷裂。TALENs可以與DNA特異性的識別。其也由非特異性核酸酶Fork I和TALE融合而成。要指出的是,以上二者均會產生雙鏈斷裂,而基因組雙鏈斷裂時,會發DNA損傷修復機制,包括DNA雙鏈斷裂末端直接連接,其常常會造成連接處堿基突變,如果人為的將缺失部位設置在外顯子上,可造成移碼突變,實現基因敲除;若利用同源重組,人為加入含同源臂外源DNA,經同源重組,將外源同源片段添加到基因組上,即引入了外源基因片段。
CRISPR系統是新興起來的一種基因編輯技術,它存在于細菌,類似獲得性免疫。并在多種動植物中得到了應用,本文主要從其歷史、機理、發展和應用前景作出綜述。
1 CRISPR/Cas系統的發現和發展
最早日本科研組于1987年發現大腸桿菌堿性磷酸酶基因附近存在串聯間隔重復,之后發其廣泛存在于細菌和古細菌基因組[2],零二年首次將其命名為CRISPR。零五年,發現CRISPR的間隔序列和細菌內一些染色體外的遺傳物質高度同源,因此推測,這可能與細菌抵抗外源基因入侵有關。零六年,利用生物信息學分析,其可能以類似RNAi的方式行使功能。零七年,發現細菌可能利用其抵抗噬菌體的入侵,零八年,又發現細菌可以利用其抵抗外源質粒的轉化。至今其功能越來越清晰,重要性也越來越清晰。
2 CRISPR的結構和分類
其首先包含間隔序列和重復序列,其中,間隔序列高度可變,主要來源于噬菌體和質粒,長度在20~70bp,不同的基因座之間的間隔序列的數目不同,這樣,我們或許可以分析基因座中間隔序列的種類及時間序列,來考慮不同菌的親緣關系。而重復序列,也非保守,其長度一般為20~50bp,但是其兩端相對保守,間隔序列與重復序列間隔排列,且重復序列中還存在保守回文結構。
之后,人們發現,在其基因座附近還有一些保守的蛋白質基因,即Cas基因,這些基因編碼了包括核酸酶、解旋酶、聚合酶以及與RNA結合的結構域。并非每一個CRISPR基因座附近都有相應的Cas基因,但這種產物也可以通過和其他位置的Cas基因編碼的蛋白質結合,從而發揮作用。
現目前應用最多的為兩類,其中,前者含有Cas3蛋白,它具有解旋酶和核酸酶的功能,此系統中多個Cas蛋白與成熟的crRNA結合形成病毒防御復合體,結合外源DNA,形成R環結構,Cas3的核酸酶活性識別R環結構后切開互補鏈,再通過解旋酶活性和核酸酶活性將非互補鏈切開。后者含有Cas9蛋白,其參與crRNA的成熟和外源質粒的降解。其存在于細菌中,因為只需要一個Cas參與外源基因剪切,故更為方便。
3 作用機制
其作用機制可以分為三個步驟[3]:
(1)獲取新的間隔序列。
(2)將新引入的原間隔轉錄。
(3)和Cas蛋白形成復合物精準作用入侵基因座。最后一種應用最多,因為其只需要Cas9參與剪切。其有2個核酸酶結構域:氨基端結構域和中間位置的核酸酶結構域,核酸酶結構域可以切割與前轉錄物互補配對的模板鏈,切割位點位于PAM上游,氨基端結構域可對另一條鏈進行切割,切點位于PAM上游。在前轉錄物與tracr RNA形成的雙鏈RNA的指導下,Cas9蛋白將靶點切割[4]。
4 脫靶問題
脫靶即對基因組非特異性切割。理論上該系統脫靶的概率會較高,特別是最近有科研組發現在人類中,最多存在五個錯誤堿基的情況下,系統仍然會對該位點進行切割,造成脫靶。因此系統特異性的提高十分重要,主要有以下措施[5]:
(1)突變核酸酶的氨基端結構域或中間核酸酶結構域,使其變為切口酶,在不引起非同源末端連接修復機制前提下激活同源重組修復機制,降低細胞毒性。
(2)利用生物信息學手段對其同源蛋白進行預測,尋找高特異性核酸酶。
5 優勢及應用前景
(1)靶向精準性高,其可以經改造為切口酶,不會引起非同源末端連接,但同源重組機制仍可被激活,故可以作為切口酶來實現目的基因的定點敲入或點突變,大大降低非同源末端連接的風險和脫靶效應。
(2)可對靶基因多個位點同時敲除:其靶位點很短,故可串聯若干向導RNA,以同時編輯同一個基因不同位點,這可以用于研究同一基因家族不同基因功能以及基因之間的相互作用。
(3)在基因編輯上有靈活性,在Cas9蛋白末端添加其它功能性蛋白,如添加轉錄激活域,則可激活靶基因表達;若添加甲基化酶,可以進行靶位點甲基化調控,有助于表觀遺傳學調控研究。
(4)靶點在基因組中數量眾多,在平均間隔8bp。
6 結束語
綜上,CRISPR/Cas9技術是一種強大的基因編輯工具,將在基因功能注釋、基因治療、靶向藥物、人類疾病動物模型創制起到強大作用,且其具有設計簡單、耗時短、節約成本、實驗操作性強等優勢,故必將成為普通生物學實驗室的常用技術。
參考文獻
[1]Huang P, et al. Heritable gene targeting in zebrafish using customized TALENs. Nat Biotechnol, 2011,29(8):699-700.
[2]Jansen R, et al. Identification of a novel family of sequence repeats among prokaryotes. Omics: a Journal of Integrative Biology, 2002,6(1):23-33.
[3]Wiedenheft B, et al. RNA-guided complex from a bacterial immune system enhances target recognition through seed sequence interations. Proc Natl Acad Sci USA, 2011,108(25):10092-10097.
[4]李君,張毅.CRISPR/Cas系統:RNA 靶向的基因組定向編輯新技術[J].遺傳,2013,35(11):1265-1273.
[5]方銳,暢飛,孫照霖,等.CRISPR/Cas9介導的基因組定點編輯技術[J].生物化學與生物物理進展,2013,40(8):691-702.
作者簡介:李志遠,就讀于東北農業大學生命科學學院,研究方向:分子生物學。