邵任
摘 要:傳統以同源重組為技術基礎的基因打靶技術的效率很低,基因編輯技術能對基因組進行定點的精確改造, ZFN、TALENs、CRISPR/Cas 9三項基因編輯技術的發展,使得基因編輯的使用成本降低,應用范圍更廣。
關鍵詞:基因編輯;ZFN;TALEN;CRISPR/Cas 9
中圖分類號:Q819 文獻標識碼:A 文章編號:1671-2064(2017)22-0217-03
現在基因編輯技術主要是通過能特異性識別DNA序列的核酸酶對DNA進行切割,產生DSB(double-strand break),接著通過非同源末端鏈接機制(non-homologous end joining,NHEJ)或者同源重組修復機制(homology-directed repair,HDR)來修復斷裂的DNA位點。如圖1所示,當存在外源的同源DNA時,HDR會導致單個或者多個轉基因的引入來矯正或者替換已經存在的基因,不存在外源同源序列時,基因組的修復過程仍然會產生突變。當不存在外源的同源基因時,NHEJ介導的修復在目的基因處會產生小的插入或者缺失突變,當有外源模板存在時,外源DNA能借此插入到斷裂序列中最長可達14Kb。
1 ZFN技術
1983年在非洲爪蟾中第一次發現轉錄因子TFⅢA。鋅指結構是一個必須依賴Zn+存在的四面體結構,該四面體是由多個Cys或者是His與鋅離子鰲合組成。1993年Desjarlaris和Berg等得到能夠識別特定DNA位點的鋅指蛋白。1996年Kin和Cha等的研究表明,將鋅指蛋白與內切酶Fox Ⅰ中的無特異性DNA清楚結構域連接,可以組合成鋅指嵌合核酸酶。其后通過無數科學家對ZFN的特異性DNA切割功能進行優化和效率提升,使得ZFN在基因編輯中占有重要作用。鋅指蛋白鋅指核糖核酸酶(ZFN)包含兩個結構單元,一個是具有特異性識別DNA序列的DNA識別域,另一個是非特異性識別的核酸內切酶的DNA切割域。DNA識別域是有一系列鋅指蛋白motif組成,一個ZFN包含的鋅指蛋白motif的個數一般是3~6個,其中每個鋅指蛋白特異性地識別并且結合一個三聯體堿基。每個鋅指蛋白motif由30左右個氨基酸組成,其中保守的氨基酸殘基是和鋅離子結合的氨基酸殘基,它們是4Cys-或者是2Cys2His-。如圖2所示。
每個鋅指蛋白motif是由一個α螺旋和兩個反向的β折疊結構組成,根據每個鋅指蛋白motif中α螺旋的第1、3、6位氨基酸殘基的不同特異性地識別DNA中三個連續的堿基。所以一個鋅指結構單元(通常包含3~6個鋅指蛋白)能夠特異性得識別18~36bp的雙鏈DNA序列。而具有核酸內切酶功能的DNA切割域來源于ⅡS型核酸內切酶Fox Ⅰ,ⅡS型核酸內切酶具有識別和切割核酸的功能,但是每項功能由不同的結構域來執行,利用該酶的這一特點進行人工改造,保留非特異性的內切酶的功能,將它與人工合成的DNA特異性識別結構域如鋅指結構域相連,就產生了具有針對特定的DNA序列進行識別并切割的人工核酸酶ZFN。
ZFN的基因編輯效率相對于傳統的同源同組效率來講有所提高,但也只停留在30%左右。而且由于上下文依賴(即ZFN的各個鋅指結構單位單位并不是完全獨立的而是存在相互影響)脫靶效應很嚴重,對細胞而言會產生很大的毒性。加之掌握ZFN關鍵技術只有少數公司,所以新的一代基因編輯技術應運而生。
2 TALEN技術
Transcription activator-like effectors(TALE)TALEs是自然界本來存在的,1989年第一次發現是在一種植物致病菌黃單胞桿菌屬Xanthomonas中。2007年,發現TALE能特異性結合DNA序列。2009年,TALE氨基酸序列與核算靶序列的對應關系被破譯。TALE包含的DNA結合結構域由一系列的33到35個氨基酸組成的重復的結構組成,每個結構可以識別一個bp的核酸。TALE能特異性識別DNA能力是有兩個高度可變的氨基酸殘基決定的,這兩個氨基酸被稱為RVDs(the repeat-variable diresidues),TALE的DNA結合域的氨基酸序列與其結合的DNA序列之間有著相對恒定的對應關系。
如圖3所示,TALE蛋白的第12、13位氨基酸殘基的不同的排列組合對應識別不同的核苷酸,NN識別G或者A,HD識別C,NG識別T,NI識別A。和鋅指蛋白一樣,TALE蛋白可以被連接起來識別連續的DNA序列。然而,與鋅指蛋白不一樣的是,在構建長的TALAs模塊排列時,TALE在理論上具備定位到基因組上的單一位點,無需對模塊之間的連接進行改造。而且TALE能對DNA上的單位點進行識別,與鋅指蛋白識別DNA上的三聯體堿基相比,在設計DNA識別區域是有更大的靈活性。將一系列的TALE蛋白進行組裝在一起,在與FolⅠ核酸內切酶進行連接就可以形成具有特異性識別剪切DNA片段的TALEN(Transcription Activation Like Effector Nuclease)。FolⅠ核酸內切酶只有在形成二聚體時才會具有活性。如圖3所示,兩個TALEN分別位于正反義鏈上靶標位點,FolⅠ形成二聚體,在spacer處切割DNA。
TALENs技術相對于ZFN提高了基因編輯的效率,且成功率高,設計周期短。但與此同時另外一種更加方便簡單的基因編輯技術也正在迅速發展。
3 CRISPR技術
1987年日本學者在大腸桿菌中發現了一些重復序列,這些重復序列被一些序列類似但不同的片段隔開,但當時并不清楚這些序列的意義。到2007年,研究才發現CRISPR/Cas與細菌的獲得性免疫有關,而且這種獲得性免疫在細菌和古細菌很常見。隨后發現CRISPR/Cas系統的組成包含必要的三個部分—trancrRNA,CrRNA和Cas9核酸酶。接下來Jiang等的研究展示了,CRISPR/Cas 9系統發揮作用的具體過程。
CRISPR/Cas 9系統:CPISPR是多個成簇的,規律間隔的短回文重復序列,在細菌和古細菌中提供獲得性免疫。CRISPR依賴于crRNA和tracrRNA來進行序列特異性的插入外源基因來進行基因沉默。CRISPR/Cas有三種系統存在,在第Ⅱ種系統中,Cas9作為一種有RNA指導的DNA內切酶來切除DNA。
如圖4所示,CRISPR/Cas 9系統工作的原理是,外源的病毒或者質粒侵入細菌中被宿主體內的核酸酶消化成短的DNA片段,部分消化之后的片段被整合到宿主的基因組中,形成了CRISPR基因座中的spacer,spacer之間被序列保守的repeat間隔,附近的cas genes為CRISPR相關基因,CRISPR-Cas表達期,CRISPR陣列轉錄出crRNA前體以及tracrRNA前體以及cas genes轉錄翻譯產生Cas蛋白。crRNA前體以及tracrRNA前體以部分堿基互補配對的方式形成部分雙鏈RNA而結合在一起,其莖環結構被識別后與Cas9蛋白結合,在RNA酶的作用下,crRNA前體以及tracrRNA前體被切割形成成熟的crRNA和tracrRNA,成熟的crRNA和tracrRNA作為guide RNA與Cas9蛋白作為復合物識別切割外源基因,該復合物尋找PAM位點并識別,Cas9啟動其解旋功能,同時guide RNA與目的基因片段互補,Cas9啟動切割功能,由Cas9蛋白的N端RuvC核酸酶結構域以及肽鏈中間的HNH核酸酶結構域共同識別雙鏈DNA并切割。識別在識別外源基因的過程中PAM(proto spacer adjacent motif)序列發揮重要作用,cas9識別的特異性PAM序列為5端的NGG,PAM序列作為細菌識別外源基因的異己標志,是大部分噬菌體基因中帶有的序列,通過分子生物學手段了解到,絕大多數人類基因的附近都有GG序列,因此Cas9能識別人類的大多數基因。CRISPR/Cas 9操縱子雖然也有與gRNA配對的序列,但配對序列附近缺乏PAM序列因此能逃脫被CRISPR/Cas 9切割。
根據CRISPR/Cas 9系統的作用機制,可以將CRISPR/Cas 9系統的基本元件導入到真核細胞中,完成對真核細胞中特定基因的雙鏈DNA的切割,激活細胞內的DNA修復機制,造成非3的倍數的堿基的缺失即可敲掉該基因。CRISPR/Cas 9系統的基本元件包括gRNA、Cas9蛋白。人為設計出sgRNA(single guide RNA)替代crRNA-trancrRNA復合體的gRNA, sgRNA是將crRNA、trancrRNA的DNA連接在一起轉錄出來,轉錄出來的sgRNA能發生自身堿基配對形成與crRNA-trancrRNA復合體結構相同的部分RNA雙鏈以及莖環結構。sgRNA能結合Cas9蛋白并能結合特定的DNA序列。研究表明,人工設計的sgRNA位于PAM位點上游13的堿基以內不能發生突變,否則切割位點無法識別。Cas9蛋白上的HNH和RuvC兩個內切酶同源的結構域,中,HNH結構域特異性切割與CrRNA互補的核酸序列,RuvC結構域則是切割非互補序列,在應用過程中會產生脫靶效應。通過突變RuvC結構域形成只有HNH活性的切割酶,其脫靶率大大降低且切割的效率增加。
目前已經能成功地應用CRISPR/Cas 9系統對斑馬魚、老鼠、線蟲、水稻、擬南芥、果蠅、體外培養的人體細胞等進行定點的基因敲除。其敲除方法為,構建可以轉錄出gRNA的質粒以及可以表達Cas9蛋白的質粒,通過一系列的方法比如轉染,注射等導入到細胞體內,對目的基因進行DNA雙鏈切割,切割之后體內的修復機制被啟動,根據修復的機制不同以及是否提供DNA供體來對基因進行定點的編輯以及敲除。此外有研究針對Cas9蛋白的兩個結構域HNH和RuvC進行相關的點突變,得到dCas9,這種失活的突變體能夠結合sgRNA從而識別靶基因,但失去了內切酶的功能,不能對雙鏈DNA進行酶切。dCas9可應用在基因表達調控上,例如設計能特異識別編碼區上游的sgRNA,引導dCas9蛋白結合到目的DNA序列上,由于蛋白的空間位阻效應,相關轉錄調控蛋白無法結合,從而敲低特定的基因。
4 基因編輯的應用前景
基因編輯作為一項迅猛發展的技術,在各個領域都有廣闊的應用前景。在基因功能研究、基因治療上都有很好的應用。基因敲除是實驗室研究基因功能的一個常規手段,ZFN已經能在大鼠、果蠅、斑馬魚等模式生物中已經成功地實現了內源基因的定點突變而且或者了穩定遺傳的突變體。TALENs技術已經能在斑馬魚、大鼠、水稻、斑馬魚等模式生物中進行了定點突變、置換、刪除等操作。已經有研究成功運用TALENs技術定點突變水稻感病基因,提高了水稻的抗病能力以及運用TALENs于酵母以及哺乳動物細胞中。Hockemeyer等用TALENs技術把轉基因盒成功插入iPSC的靶位點上。CRISPR/Cas 9技術已經成功得對線蟲、果蠅、斑馬魚進行了遺傳學改造,獲取了表型改變明顯的突變體,表明了CRISPR/Cas 9技術在動物基因改造的巨大潛能。在基因治療方面,運用ZFN技術在成肌細胞中對基因進行移碼突變研究杜氏肌營養不良癥,在小鼠肝臟細胞中通過敲除基因對乙型肝炎進行研究,在iPSC細胞中對基因進行替換研究帕金森癥等等;運用TALEN技術,在iPSC中進行Lys342Glu的點突變來研究代謝性肝病等;運用CRISPR/Cas 9技術在CD4+T中對HIV的LTR區域進行破壞來研究艾滋病等表明基因編輯技術在基因治療方面有遠大的前景。
參考文獻
[1]C Wyman,R Kanaar. DNA double-strand break repair: alls well that ends well[J]. Annual Review of Genetics,2006,40(1):363.
[2]D Carroll.Genome engineering with zinc-finger nucleases[J]. Genetics,2011,188:773-782.
[3]MJ Moscou,AJ Bogdanove.A simple cipher governs DNA recognition by TAL Effectors[J].Science,2009,326(5959):1501.
[4]M Christian,T Cermak,EL Doyle,C Schmidt,F Zhang,等.Targeting DNA double-strand breaks with TAL effector nucleases[J].Genetics,2010,186(2):757-761.
[5]F Zhang,L Cong,S Lodato,S Kosuri,GM Church,等.Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription[J].Nature Biotechnology,2011,29(2):149-153.
[6]D Reyon,SQ Tsai,C Khayter,JA Foden,JD Sander,等.FLASH assembly of TALENs for high-throughput genome editing[J].Nature Biotechnology,2012,30(5):460-465.
[7]朱玉昌,鄭小江,胡一兵.基因編輯技術的方法,原理及應用 Methods, Principles and Application of Gene Editing[J].Hans Journal of Biomedicine,2015,5(03):32.