尹玉偉,代 靜,茆安婷,馬世宏,郭曦堯,張林波,李月紅
(1.吉林農業大學動物科學技術學院,吉林 長春130118;2.內蒙古烏蘭察布市獸醫監察所,內蒙古 烏蘭察布012000)
1987 年,Ishino[1]等人在大腸桿菌中發現了一個串聯間隔重復序列,但這些序列的生物學意義尚不清楚。隨后,Mojica[2]等人發現了類型的重復序列,即規律成簇間隔短回文重復序列。2002 年,Jansed[3]等將其命名為CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)。到2012 年科學家開發利用CRISPR[4],使其成為生物醫學史上第一種可高效、精確、程序化的修改細胞基因組包括人類基因組的工具。CRISPR 存在于90%的古細菌及40%的細菌中[5]。CRISPR/Cas9 是細菌和古細菌在長期選擇壓力中形成的一種適應性免疫防御,可用來有效抵御病毒及外源DNA 的入侵。CRISPR/Cas9 系統可以識別出外源DNA,并將它們剪斷,沉默外源基因的表達,利用細胞的非同源性末端(Non-homologous end joining,NHEJ)連接或同源重組(Homologous recombination,HR)修復機制對斷裂的DNA 進行插入缺失、修復、替換[6]。這與真核生物中RNA 干擾(RNAi)原理是相似的[7]。2012年和2015 年,CRISPR 基因組編輯技術連續被Science 公布為十大突破[8]。本文將從CRISPR/Cas9的結構,特點和在斑馬魚中的研究闡述。
CRISPR 序列由眾多短而保守的重復序列區(Repeat)、間隔區(Spacer)和前導區(Leader)組成。重復序列區含有部分回文序列,可以形成發卡結構,這段序列一般存在1 ~3 個堿基差異,這種差異被稱為退化重復(DR)[9]。重復序列被間隔序列隔開,間隔序列一般沒有相似或相同的序列,間隔區可以識別被細菌俘獲的外源DNA 序列,這相當于動物的二次免疫,當這些外源遺傳物質再次入侵時,CRISPR/Cas 系統就會予以精確剪切。上游的前導區是一段富含AT 的序列,是CRISPR 系統的啟動子所在區。另外,CRISPR 系統還有一個重要的多態性的家族基因,該基因編碼的蛋白均可與CRISPR序列區域共同發生作用。因此,該基因被命名為CRISPR 關聯基因(CRISPR associated,Cas)。Cas 蛋白一般位于CRISPR 位點下游,或者分散在基因組的其他地方。目前為止,已有40 多種伴隨CRISPR位點的Cas 蛋白被鑒定[10]。Makarova[11]等根據其Cas 蛋白類別和作用的不同,將CRISPR/Cas 系統分為I 型,Ⅱ型,Ⅲ型,Ⅳ型和Ⅴ型,Shmakov[12]等人發現了CRISPR 系統Ⅴ型的另外兩個亞型及Ⅵ型新系統。CRISPR 的Ⅱ型因其蛋白單一,結構簡單被廣泛應用于基因工程,即CRISPR/Cas9。中插彩版圖1 為目前發現的CRISPR/Cas 系統。
CRISPR/Cas9 它包含Cas9,pre-crRNA(pre-CRISPRderived RNA),tracrRNA(Trans-activating crRNA)[14],pre-crRNA 是由整個CRISPR 序列轉錄而成的大型RNA 分子,在Ⅱ型系統中pre-crRNA 的加工由Cas9 單獨參與。Cas9 含有在氨基末端的RuvC 和蛋白質中部的HNH2 個獨特的活性位點,在crRNA成熟和雙鏈DNA 剪切中發揮作用。此外,precrRNA 轉錄的同時,與其重復序列互補的反式激活crRNA(Trans-activating crRNA,tracrRNA)也轉錄出來,并且激發Cas9 和雙鏈RNA 特異性RNaseⅢ核酸酶對pre-crRNA 進行加工。 加工成熟后,crRNA、tracrRNA 和Cas9 組成復合體,識別并結合于crRNA 互補的序列,然后解開DNA 雙鏈,形成R-loop,使crRNA 與互補鏈雜交,另一條鏈保持游離的單鏈狀態,然后由Cas9 中的HNH 活性位點剪切crRNA 的互補DNA 鏈,RuvC 活性位點剪切非互補鏈[15],最終引入DNA 雙鏈斷裂(DSB),進而實現基因的敲除和插入[16](見中插彩版圖2)。其中crRNA 含有能夠識別20 bp 靶向互補序。
CRISPR/Cas 系統基因編輯技術已經是生物領域中熱門研究。該技術已經廣泛用于小鼠、大鼠、斑馬魚、果蠅等多種模式動物的研究,包括基因功能研究、基因治療、疾病模型研制等[18]。斑馬魚因其繁殖周期短并與人類的器官高度相似等特點成為重要的模式生物,斑馬魚已經成為大量的人類疾病研究模型。而相比于小鼠等模式生物,斑馬魚具有它們所不具有的特點[19],斑馬魚的胚胎在顯微鏡下觀察是透明的,可以看到各個器官和血管的發育;體外受精,試驗周期短。早在1930 年,斑馬魚就成為生物醫學研究的一個經典的發育和胚胎模型[2]。
干擾素γ 誘導蛋白30(ifi30)參與機體病毒免疫、腫瘤免疫,曹頂臣[21]等通過CRISPR/Cas9 系統敲除了斑馬魚ifi30 基因后胚胎死亡,證明ifi30 基因是胚胎發育過程中不可缺少的蛋白。劉菁[22]等通過CRISPR/Cas9 系統敲除了斑馬魚faf1 基因,faf1 基因參與早期胚胎的神經嵴細胞遷移分化,通過顯微注射敲除該基因后斑馬魚的色素沉積延遲及尾部肌節部位出現“結節樣”變化。黃紅輝[23]等敲除了斑馬魚atp1a1a.1,atp1a1a.2, atp1a1a.3,atp1a1a.4,atp1a1a.5,pkd2,aqp3a,bmper,is12a 和tbx2a10 個前腎表達基因,經過三代的篩選發現只有atp1a1a.2 和pkd2 致斑馬魚胚胎發育缺陷。dync1h1 基因是細胞質動力蛋白復合體的核心結構,而細胞質動力蛋白在神經系統中起著重要作用,錢亭[24]等敲除了斑馬魚dync1h1 基因,導致斑馬魚脊髓腫脹,脊髓神經細胞數目顯著減少,背部血管存在發育畸形,并于受精后5 ~6 d 死亡。造血干細胞是一群具有高度的自我復制及多項分化潛能的最原始的造血細胞。hoxb4 基因在造血干細胞有重要的調控作用,袁夢[25]等通過上調和下調hoxb4 基因發現hoxb4 基因上調后導致原始造血干細胞數量增加;抑制hoxb4 基因可看到心包增大、心腔壁變薄及血細胞減少。
基因敲入(Knockin,K I)技術是指利用隨機整合、轉座子系統、同源重組等方式將外源功能基因插入到基因組中,使其在細胞內進行表達的基因編輯技術。研究人員[26]已經利用CRISPR 系統通過非同源重組方式將Gal4 和EGFP 插入斑馬魚中,在此基礎上,杜久林[27]團隊設計了內含子靶向介導和同源重組(HR)高效獨立的替換方法,通過非同源重組方式和CRISPR/Cas9 將內含子靶向基因敲入斑馬魚中而不破壞目標性內源基因,相比于HR,利用非同源性末端接合(Non-homologous end joining,NHEJ)在斑馬魚中實現非HR 基因敲入有兩個優勢。第一,在斑馬魚早期發育中NHEJ 比HR 的活性至少高10 倍。第二,不同于HR,NHEJ 不需要親本斑馬魚基因組序列與靶向供體之間具有精確的同源性,避免了對親本斑馬魚耗時的篩選和基因分型。
近兩年CRISPR 技術迅速發展,隨著CRISPR 系統和相關蛋白的研究越來越多,不斷的完善和優化,推動人類疾病和動物模型的研究。CRISPR 系統相對于之前的鋅指核酸酶和類轉錄激活因子效應物核酸酶基因編輯技術操作簡單,周期短,應用范圍大。但是CRISPR 技術存在著脫靶的問題,研究人員也在解決這一問題,如在設計sgRNA 時增加幾個核苷酸可以減少錯配率[28],較長的PAM 序列可以減少脫靶問題的發生[29]。
斑馬魚廣泛應用于遺傳學、發育生物學和神經生物學的研究,結合斑馬魚幼時全身透明的特點,基因組編輯技術在斑馬魚中將會提供更多更好的研究思路。